On a souvent l’impression qu’avec l’avance rapide des connaissances scientifiques et des technologies, qu’il ne vaut pas la peine de conserver les vieilles données, car de nouvelles deviendront rapidement disponibles. Or, cette perception est fausse, car même les données les plus anciennes peuvent resservir.

Les astronomes sont probablement les plus grands utilisateurs de données anciennes. Il faut dire que l’astronomie est probablement la plus ancienne des sciences et que son intérêt pratique pour la production des calendriers a fait que les événements astronomiques ont été soigneusement colligés au cours du temps. Jusqu’où les astronomes sont-ils prêts à remonter dans le temps? La réponse est: aussi loin que possible. Ainsi, la plus ancienne comète répertoriée par Gary Kronk dans sa Cometography a été observée en 625 avant notre ère. L’étude des changements dans la vitesse de la rotation de la Terre par l’observation des éclipses de Soleil remonte jusqu’en 700 avant notre ère. L’étude des supernovas historiques remonte jusqu’en 185 de notre ère. Alors que celle des taches solaires remonte jusqu’en 1610.

Mon record personnel était une demande pour des données que j’avais utilisées pour faire ma thèse de doctorat, formulée 7 ans après ma soutenance et près de 10 ans après leur analyse initiale. Record qui est maintenant battu, car on m’a demandé récemment mes calculs initiaux pour la conception de la réserve de ciel étoilé du Mont Mégantic, près de 20 ans après les avoir faits. Il est à noter que dans les deux cas, j’avais encore l’information en main, même s’il a fallu faire un peu d’archéologie numérique.

Depuis quelques années, ce sont les climatologues qui ont développé un appétit pour les anciennes données dans le contexte des changements climatiques. En effet, il est possible aujourd’hui d’extraire grâce aux moyens informatiques modernes beaucoup plus d’information de ces anciennes observations que les observateurs de l’époque auraient cru possible.

Par exemple, il est possible de combiner des mesures de températures de différents sites afin d’obtenir une mesure de température globale. On peut ainsi évaluer avec une précision raisonnable la température de la Terre au XIXe siècle, et même jusqu’en 1750 avec des incertitudes monstrueuses.

Cependant, les avancées les plus importantes sont dues à la prise de conscience qu’avec seulement les valeurs de pression atmosphérique au niveau du sol, il est possible de calculer l’état de l’atmosphère d’une façon semblable à celle des prédictions météorologiques modernes. De plus, le processus permet une homogénéisation des données afin de corriger les biais que pourraient introduire des mesures erronées.

Ces réanalyses sont essentielles pour calculer l’évolution et la variabilité des événements météorologiques extrêmes. La première de ces réanalyses est le 20CR. Cette réanalyse remonte jusqu’en 1871 et produit une estimation de l’état de l’atmosphère toutes les 6 heures avec une résolution spatiale de 2°, ainsi qu’une estimation des erreurs associées. Dans l’état actuel de la technique, les données disponibles permettent d’avoir une capacité de prévision de la météo jusqu’à un horizon de 3 jours. Une autre réanalyse du XXe siècle (1900-) est présentement en cours (ERA-20C). Elle devrait être rendue disponible d’ici la fin de l’année. Cette réanalyse aura une résolution temporelle et spatiale plus grande que celle du 20CR. De plus, elle n’assimile pas uniquement la pression, mais aussi la vitesse et la direction des vents en mer. De plus, elle bénéficie de nouvelles données historiques récupérées des archives. Des comparaisons préliminaires indiquent que les deux réanalyses sont globalement semblables, mais qu’elles présentent tout de même des différences significatives dans l’Ouest du continent américain et dans la région de l’Australie et de la Nouvelle-Zélande.

Les performances de ces réanalyses étant meilleures que ce qui était initialement prévu, la limite temporelle de leur utilisation semble reculer. En effet, le projet 20CR prévoyait à l’origine que la limite opérationnelle se situait vers 1850 alors que les premiers services météos furent mis en place et que la prise de mesure par les marines du monde entier fut standardisée. Maintenant, retourner jusqu’en 1800 semble très possible, alors que 1750 apparait plausible pour le bassin nord-atlantique si on assimile la pression, le vent et la température au sol.

Le plus grand défi de ces travaux est de rendre les mesures historiques disponibles aux chercheurs. En effet, il y a des millions de données disponibles qui pourraient être inclues dans les réanalyses, mais qui ne le sont pas, car elles sont cachées dans des cahiers de notes, livres de bord et rapports d’observatoires stockés dans les bibliothèques du monde entier. L’exploitation de cette masse de données dépend du travail des historiens pour retracer les ouvrages manquants, mais aussi d’un travail de transcription des données originales en un format pouvant être lu par les ordinateurs. Or, ce travail est extrêmement fastidieux quand les données sont des notes manuscrites, qui ne peuvent être déchiffrées par des méthodes automatiques.

C’est là que le travail des amateurs devient essentiel. En effet, une fois numérisées, les données peuvent être rendues publiques afin de les rendre disponibles au public qui peut aider ainsi la communauté scientifique (voir mon billet de 2011). Le plus connu de ces projets est Old Weather qui récupère les données provenant des livres de bord des navires. Il y a aussi le projet Data Rescue@home qui récupère des données de radio-sondes.

De tous ces projets, c’est le projet Historical canadian climate data qui me tient le plus à cœur . En effet, ce projet porte sur le climat canadien. Les données les plus anciennes sont celles de Jean-Francois Gaulthier obtenues à Québec entre 1742 et 1756. Les résultats préliminaires de ce projet seront bientôt publiés. Mais ce n’est pas tout. Victoria Slonosky a littéralement des caisses d’archives à numériser. Un coup de pouce de la part de volontaires supplémentaires serait bienvenu.

La morale de cette histoire? Ne jetez pas vos vieilles données et, surtout, conservez vos cahiers de notes, car ils peuvent encore servir.