Le Big Data est passé à côté de l'épidémie Ebola et ne se révèle pas encore plus performant que les médias traditionnels.

Imaginons le scénario suivant. D'un côté de l'écran, un médecin urgentiste relate sur son blog sa journée : un de ses patients et deux membres de sa famille sont victimes d'une fièvre subite. Il y a quelques jours, ils se sont rendus au village des grands-parents pour un mariage. Dans ce village, quelques personnes sont déjà décédées suite à une fièvre hémorragique ! Le blog est suivi par une petite centaine de personnes qui relayent les nouvelles du docteur sur les réseaux sociaux. Le cyber tam-tam fait son travail.

De l'autre côté de l'écran, des algorithmes et des épidémiologistes sont chargés de collecter les informations pertinentes concernant les maladies contagieuses. But du jeu : détecter et signaler le plus vite possible les flambées de maladies. Les nouvelles du docteur sont collectées au moment même de leur publication, parmi une foule d'autres données, une méga quantité de données, du « big data » : coups de téléphone, statut Facebook, tweets, déplacement de personnes à risque. Les algorithmes se chargent de trier les données pertinentes, les épidémiologistes analysent, HealthMap est en marche et est en train de faire ses preuves. Et sur le coup de l'Ebola en mars 2014, même l'Organisation mondiale de la santé (OMS) s'est fait devancer !

Rappel des faits. Sur sa ligne du temps Ebola, HealthMap signale le 14 mars 2014 une « mystérieuse fièvre hémorragique se déclare à Macenta» en Guinée et qui a fait 8 victimes mortelles. Le 19 mars, HealthMap tire la sonnette d'alarme, l'épidémie d'Ebola est repérée alors que l'annonce officielle de l'OMS ne se fera que 9 jours plus tard...

L'OMS était-elle vraiment hors du coup ? Voici un autre rappel des faits. Le 13 mars 2014, suite à la confirmation de résultats sur des patients suspects, le Dr Sakoba Keita, directeur de la Division prévention des maladies du département de santé guinéen annonce lors d'une conférence de presse retransmise à la télévision la mort de 8 personnes suite à une fièvre hémorragique. L'OMS est informée. La Guinée ne disposant pas de labo spécialisé, une équipe de chercheurs se rend sur place pour faire des analyses et estimer s'il est nécessaire ou non de lancer l'alerte. Pendant ce temps, les algorithmes de HealthCare détectent une amplification médiatique le 14 mars mais cela passe à côté de la conférence de presse du Dr Keita. Tout cela est expliqué ici en détails. Le Big Data n'est pas plus efficace qu'une agence de presse chinoise, un média "traditionnel" qui publie le 14 mars également "Guinée, une étrange fièvre fait huit morts à Macenta" sur la base de la fameuse conférence de presse.

Pourquoi HealthMap n'a-t-il pas été plus efficace qu'un média traditionnel ? Parce que le « Big Data » ne parle pas français ! GDELT project traduit de manière randomisée des articles de la presse non anglophone et est utilisé comme source par HealthMap. Puisque tout n'est pas traduit, parfois on pêche la bonne info, mais cette fois, HealthMap est passé à côté de la conférence de presse du Dr Keita.

Pas extraordinaire alors l'analyse de méga-données ? La technique est en train de faire ses preuves, et a pas mal de potentiel, à condition de faire quelques ajustements. La langue ne doit pas être un obstacle, les données doivent être collectées à un niveau local. Les médias traditionnels, même papier, ne doivent pas être négligés, pour la collecte de donnée ou diffusion d'information. On ne peut pas tout le temps être connecté à Internet, il ne faut pas l'oublier.

Rock'n'Science!