Alev takil yc Ln Zi Jg3 Ts unsplash

02/04/2024

Qu'est-ce qui affecte la qualité des données ?

L'exactitude, la précision et la résolution spatiale et temporelle

Thomas Eldridge - Tech Evangelist.jpg
Thomas Eldridge
Partagez:

Il existe de nombreuses API météorologiques et il peut être difficile de savoir laquelle choisir. Chez Meteomatics, nous pensons que la considération la plus importante lors du choix d'une API météorologique devrait être la qualité des données. Dans cet article, nous explorerons divers critères permettant de définir la qualité des données météorologiques, tout en mettant en lumière les raisons pour lesquelles nous croyons que l'API Météo de Meteomatics se démarque de manière exceptionnelle sur tous ces fronts.

Qualité des données : Un terme aux multiples facettes

La qualité des données est un terme à multiples facettes. Les données peuvent être excellentes sur certains aspects et moins satisfaisantes sur d'autres, ce qui est particulièrement vrai pour les données météorologiques, étant donné les exigences spécifiques liées à leur dimension spatiale et temporelle. Plusieurs facteurs influent sur la qualité des données fournies par une API météorologique. Certains de ces facteurs sont généraux et s'appliquent à toutes les données, tels que l'exactitude et la précision, tandis que d'autres sont spécifiques aux données météorologiques, comme la résolution spatiale et temporelle.

Exactitude et précision

Les deux termes clés que sont l'exactitude et la précision sont les descripteurs les plus importants de tout ensemble de données, qu'il s'agisse de données météorologiques ou autres. Bien qu'ils soient souvent utilisés de manière interchangeable, chacun d'entre eux a en fait une signification très spécifique.

Exactitude

L'exactitude se réfère à la mesure de la justesse d'une prédiction ou d'une observation. Prenons l'exemple simple d'un lancer de pièce : le résultat peut être soit pile, soit face. Si j'annonce pile et que le résultat est pile, ma prédiction est correcte. Dans un ensemble de 10 lancers comme

HTHTTTHTHH

si j'ai prédit

HTTHTTHTTH

j'ai eu raison dans 7 cas sur 10, ce qui correspond à une exactitude de 70%. Lorsque nous traitons des données numériques, évaluer l'exactitude ne se résume pas à simplement classifier les données comme correctes ou incorrectes. La précision est plutôt mesurée par la différence moyenne entre les prédictions et les observations, où une moyenne de zéro (atteinte lorsque chaque différence est nulle) indique une exactitude parfaite.

Précision

La précision peut également être envisagée sous l'angle de la confiance. Imaginons que vous me demandiez où se trouvent vos clés et que je réponde qu'elles sont "quelque part dans cette pièce". Bien que ma réponse puisse être correcte, elle ne témoigne pas d'une grande assurance quant à l'emplacement exact des clés. En revanche, si je vous indique qu'elles sont sous les papiers, dans le coin arrière gauche de la table où vous êtes actuellement assis, ma réponse est nettement plus précise. Un outil de mesure précis fournit des réponses plus spécifiques. Par exemple, si ma règle ne comporte des marques qu'à chaque centimètre, je ne pourrai mesurer qu'en centimètres. En revanche, une règle avec des divisions en millimètres offre une précision dix fois supérieure. Dans le contexte d'un ensemble de données, la précision est une mesure de la dispersion des résultats.

Un Exemple

Imaginons que je veuille déterminer la température réelle d'une pièce, supposons qu'elle soit de 21,1 °C (mais je n'en ai pas connaissance au départ). J'effectue quatre mesures avec mon thermomètre et calcule la moyenne. Initialement, mon thermomètre n'est précis qu'au degré près. Les mesures que j'obtiens sont : 20, 22, 21, 21. Leur moyenne est de 21°C, avec un écart de 2°C.

Ce résultat n'est pas mal, mais on m'a récemment offert un thermomètre avec des graduations de 0,1 °C. Curieux de sa précision, je décide de l'utiliser pour mesurer la température de l'eau. Je réalise les mêmes quatre mesures : 24,8, 24,9, 24,7, 24,8. Cela me donne une moyenne de 24,8 °C, avec un écart de 0,2 °C seulement.

Bien que cette mesure soit beaucoup plus précise, elle est moins exacte, car la différence entre ma valeur mesurée et la valeur réelle est plus significative.

Accuracy vs precision

Qu'est-ce qui est le plus important ?

En dehors du domaine météorologique, dans certains scénarios d'utilisation, il peut suffire d'avoir des données soit exactes, soit précises.

Dans le cas où vous avez un processus très précis mais pas exact, vous pouvez être en mesure d'identifier un biais systématique et de le corriger dans les données. Pour illustrer cela avec la métaphore du tir à l'arc, imaginez une machine qui frappe toujours le même point dans la cible, mais pas nécessairement le point visé. Dans cette situation, vous pourriez déplacer manuellement la cible ou la machine pour compenser ce décalage. Cela pourrait également expliquer la situation que vous avez rencontrée lors de votre deuxième mesure de température.

Le second thermomètre pourrait être sujet à un biais systématique, peut-être dû à un étalonnage incorrect de l'échelle. Ce biais pourrait être corrigé en étalonnant le thermomètre par rapport à une référence de température connue. De même, il existe des situations où une précision limitée ne pose pas de problème, tant que l'exactitude reste satisfaisante. Par exemple, pour évaluer l'affluence dans un restaurant, compter le nombre de tables occupées plutôt que le nombre exact de personnes à chaque table peut suffire.

Cependant, les méthodes pour compenser une exactitude ou une précision réduite peuvent parfois être complexes à mettre en place. Dans l'ensemble, des données de moindre qualité conduiront généralement à des résultats moins fiables.

Résolution spatiale et temporelle

En plus des aspects abordés précédemment, les données météorologiques sont encore plus complexes en raison de leur nature spatiale et temporelle. En effet, l'état de l'atmosphère évolue selon l'espace et le temps. Chacune de ces dimensions est caractérisée par une résolution, qui influe sur la pertinence des données pour différents types de problèmes.

Résolution spatiale

Les données de prévisions météorologiques de Meteomatics sont organisées selon une grille régulière. La résolution spatiale d'une prévision météorologique se réfère à la distance entre les points de données sur cette grille. Par exemple, un modèle prévoyant la température tous les 1 km sur la surface terrestre bénéficie d'une résolution spatiale plus fine qu'un modèle qui ne fait cette prévision que tous les 10 km.

Spatial resolution 12 09 23

Résolution temporelle

Les données relatives aux prévisions météorologiques sont également publiées à des intervalles réguliers. Certaines prévisions sont mises à jour toutes les heures, tandis que d'autres sont mises à jour toutes les trois ou six heures. Cette fréquence de mise à jour représente la résolution temporelle des ensembles de données. En général, plus l'intervalle entre les prévisions est court, plus la résolution temporelle est élevée.

La figure 1 présente une série temporelle de données de température prévues à Saint-Gall par le modèle EURO1k de Meteomatics. Elle met en évidence la différence entre l'interrogation des données à la résolution temporelle native du modèle (20 minutes) et une résolution moins fine de 3 heures. Il est important de noter que les données à haute résolution à 7 heures indiquent une température d'environ 5°C. Cependant, si vous deviez interpoler entre les points de données de 6 heures et 9 heures, vous obtiendriez un résultat très différent.

Figure 1

Un Exemple

Supposons que vous soyez arrivé à la gare de Greenwich, à Londres, et que vous vouliez savoir s'il pleuvra à midi. Vous êtes situé aux coordonnées 51.4779N, -0.0132E, environ 800 m à l'ouest du méridien de Greenwich. Deux modèles sont à votre disposition : l'un avec une résolution de 1 km et l'autre avec une résolution de 10 km.

Le modèle à 1 km prévoit 2 mm de précipitations à l'observatoire de Greenwich et 0 mm à un point environ 200 m à l'ouest. En prenant en compte la proximité de ces points par rapport à vous, vous estimez que les précipitations à votre emplacement seront d'environ 0,4 mm.

L'autre ensemble de données indique également 2 mm de précipitations à l'observatoire de Greenwich, mais ne fournit aucune information sur le point situé à 200 m à l'ouest, car le point de données le plus proche dans cette direction se trouve à 9,2 km. En extrapolant, vous estimez que les précipitations à votre emplacement seront d'environ 1,843 mm.

Maintenant, vous êtes à l'observatoire de Greenwich à midi et il pleut. Vous vous demandez s'il pleuvra encore dans 90 minutes. Le choix entre les deux prévisions n'a pas d'incidence spatiale puisque les deux fournissent une prédiction pour votre emplacement actuel. Cependant, l'une a une résolution temporelle d'une heure et l'autre de trois heures.

La prévision à une heure indique qu'il pleuvra à un taux de 1 mm à 13 heures et cessera à 14 heures, donc vous estimez qu'il pleuvra à un taux d'environ 0,5 mm à 13h30. La prévision à trois heures ne fournit aucune information pour 13 heures ou 14 heures, mais à 15 heures, elle prévoit 1 mm de précipitations. Vous estimez donc qu'il pleuvra à un taux d'environ 1,5 mm à 13h30.

En examinant la prévision à une heure pour 15 heures, vous constatez qu'elle prévoit également des précipitations à ce moment-là et est en accord avec la prévision à trois heures quant à la quantité de pluie.

Précision et résolution

La résolution d'un ensemble de données, qu'elle soit dans la dimension temporelle ou spatiale, représente une sorte de limite intrinsèque à la précision des informations fournies. Dans l'exemple précédent, nous avons constaté que nos deux ensembles de données étaient en accord aux points de la grille. Ils étaient aussi précis l'un que l'autre à ces emplacements, que ce soit à tort ou à raison. Cependant, lorsqu'on examine ce qui se passe entre ces points de grille, l'ensemble de données à plus haute résolution offre davantage d'informations : l'ensemble de données à une heure prévoyait, par exemple, une accalmie temporaire de la pluie dans les trois heures à venir, un détail non pris en compte par l'ensemble de données à trois heures. De même, les deux ensembles de données indiquaient qu'il pleuvrait à midi à l'observatoire de Greenwich, tandis qu'à l'ouest, il ne pleuvait pas. Ce n'est qu'en examinant l'ensemble de données à plus haute résolution spatiale que nous pouvons distinguer que la zone près de la station de Greenwich marque la limite du nuage de pluie à ce moment-là.

Compromis entre résolution spatiale et temporelle

Il existe souvent un compromis entre la résolution spatiale et la résolution temporelle, car les deux se multiplient pour donner le nombre total de points de données dans un ensemble de données. Ce compromis est en partie motivé par les besoins des utilisateurs - ils ne souhaitent pas que des fichiers occupent toute la mémoire de leur ordinateur si une haute résolution ne se traduit pas par une amélioration des résultats. Cependant, il est également motivé par la nécessité de produire des prévisions dans un délai raisonnable.

Chaque point de données d'une prévision météorologique nécessite des calculs complexes à l'aide de modèles informatiques, et chaque calcul prend du temps. Plus la résolution de votre modèle est élevée, plus l'ordinateur devra effectuer de calculs et plus il faudra de temps pour produire les prévisions. Par conséquent, il existe une limite naturelle à la résolution de nos modèles : si la prévision ne peut pas être produite suffisamment longtemps avant les événements météorologiques qu'elle tente de prédire, elle perd en utilité pour la prise de décision.

Bien que les méthodes informatiques modernes facilitent le calcul plus rapide des données des modèles météorologiques, pour accélérer réellement la production des données du modèle, certains raccourcis internes peuvent être utilisés. Ainsi, un modèle qui produit rapidement des données à haute résolution spatiale et temporelle peut être basé sur une physique de modèle moins rigoureuse, ce qui peut compromettre la qualité de la prévision.

05 Meteomatics Bildmarke RGB negative background
Meteomatics

Parlez à un expert

Trouvons la solution parfaite pour votre problème. Parlez à un expert.

Découvrez nos services

Nous fournissons les données météorologiques les plus précises pour n'importe quel endroit, à tout moment, afin d'améliorer votre activité.

Icon on Picture api large
Avec notre API Météo, vous bénéficiez d'un accès permanent à des données météorologiques, océaniques, environnementales et climatiques mondiales de haute résolution, ainsi qu'à des données historiques, des données en temps réel, des prévisions et des scénarios climatiques jusqu'en 2100.
Découvrez l'API Météo
Icon on picture alerts large 2
Vous seul savez quels types de conditions météorologiques présentent les plus grands risques pour votre entreprise. C'est pourquoi nous avons mis au point un système d'alerte météo hautement personnalisable, garantissant que chaque notification que vous recevez est pertinente pour vos activités.
En savoir plus
Icon on Picture EURO1k v5 large
Obtenez des prévisions météorologiques précises dans toute l'Europe grâce au modèle météorologique européen à une résolution de 1 km, et prenez des décisions plus judicieuses.
Découvrez EURO1k
Icon on Picture datashop large v2
Notre Boutique de données météorologiques vous offre un accès facile et rapide aux données météorologiques dont vous avez besoin pour des usages ponctuels. Vous y trouverez une sélection complète de données météorologiques actuelles et historiques ainsi que des paramètres météorologiques spécifiques à votre secteur.
Découvrez la Boutique
Rough Mountain 02
Combler le manque de données météorologiques dans la basse atmosphère terrestre grâce aux Meteodrones. Conçu et assemblé en Suisse.
Découvrez les Meteodrones
Icon on Picture metx large v1
Visualisez tous les événements météorologiques sur une carte de haute résolution grâce à notre outil de visualisation météorologique MetX, basé sur l'API météo.
Visualisation météorologique MetX
Icon on Picture solar forecast large
Prévisions énergétiques pour l'énergie solaire, éolienne et hydroélectrique - basées sur les données météorologiques les plus précises au monde.
Prévisions énergétiques
Icon on Picture rainy cloud large
Grâce à des technologies uniques et des compétences poussées, nous créons une base solide pour que vous puissiez travailler efficacement avec les données météorologiques.
Données météo et climatiques