Quand les données de Wikipédia prédisent les épidémies de grippe share
back to to

Quand les données de Wikipédia prédisent les épidémies de grippe

7 novembre 2014

Prévoir les épidémies de grippe à partir du trafic de Wikipédia ? C’est le projet mené par une équipe scientifique américaine du Nouveau-Mexique et rapporté par la MIT Technology Review. Le but ? Améliorer considérablement le niveau de préparation des services de santé en vue d’épisodes contagieux. Des prédictions essentielles dans un pays où l’on estime chaque année entre 3 000 et 49 000 décès dus à la maladie.

L’idée prend forme suite à un appel à projet lancé par le Centers for Disease Control and Prevention d’Atlanta (l’agence gouvernementale américaine de protection de la santé publique) afin de prévoir les caractéristiques de l’épidémie de grippe à partir de données collectées sur Internet.

La méthode actuelle pour mesurer l’épidémie est peu efficace et manque de précision : les personnels des services de santé rapportent le pourcentage de patients qu’ils voient chaque semaine avec des symptômes de la grippe (toux, température supérieure à 38° et dont rien d’autre que la grippe n’en semble être la cause). Il faut ensuite attendre deux semaines pour que les données soient traitées, soit un laps de temps trop long pour qu’elles soient encore à jour.

La méthode mise en place par l’équipe de recherche suggère donc d’utiliser les variations des nombres de personnes accédant aux articles Wikipédia concernant la grippe pour évaluer l’étendue de l’épidémie. Une technique rendue possible puisque les données sont rendues publiques par l’encyclopédie participative. En utilisant un algorithme de machine learning – ou apprentissage statistique en français -, les chercheurs peuvent par la suite prédire la diffusion de l’épidémie. Kyle Hickmann, membre de l’équipe de recherche explique :

« Le nombre d’accès aux articles Wikipédia se révèle fortement corrélé avec les données historiques de syndrome grippal, et permettent une prédiction précise des syndromes grippaux plusieurs semaines avant leur disponibilité ».

Pour le moment, l’algorithme ne pêche que dans la prédiction de la fin de l’épidémie, une fois le pic passé. La raison avancée : les internautes ne retournent pas nécessairement sur la page Wikipédia lorsqu’ils ont été réinfectés par une autre souche de la grippe en fin de saison.

Pour retrouver en détails les résultats de l’étude, rendez-vous sur MIT Technology Review.

Chaque semaine,
recevez les immanquables
par email