En 2009, une nouvelle réjouissante arrivait de Google: le moteur de recherche permettrait apparemment de prédire avec quelques jours d’avance une épidémie de grippe dans une population. On s’est réjoui trop vite: on en est à présent à 100 échecs sur 108 semaines.

Les auteurs qui sont revenus en arrière sur les données de Google Flu Trend depuis 2011, y voient, dans la revue Science , un cas-type des problèmes nés de l’explosion du «Big Data» ces dernières années. Ce n’est pas parce qu’on a soudain une masse de données qu’on va nécessairement y découvrir quelque chose.

Abonnez-vous à notre infolettre!

Pour ne rien rater de l'actualité scientifique et tout savoir sur nos efforts pour lutter contre les fausses nouvelles et la désinformation!

En l’occurrence, on fait face à deux problèmes de taille: d’une part, les internautes n’utilisent pas tous les mêmes mots-clefs pour en savoir plus sur leurs symptômes; et d’autre part, beaucoup de gens entretiennent une confusion entre «grippe» et «rhume», de sorte qu’une recherche sur la grippe peut provenir d’une personne qui a un simple rhume.

Résultat: entre 2011 et 2013, le taux de réussite des prévisions de Google Flu Trend n’a guère dépassé celui d’une tireuse de cartes.

Je donne