Twitter pour analyser l'humeur des Américains

22 juillet 2010

Les Américains seraient plus heureux à Los Angeles qu’à New York, et plus enclins à sourire le matin et le soir plutôt que pendant les heures de bureau. C’est en tout cas ce que suggère l’étude que viennent de publier cinq chercheurs des universités d’Harvard et de Northeastern. L’originalité de la démarche réside dans l’utilisation qu’ils ont faite de Twitter.

Réalisée entre septembre 2006 et août 2009, l’étude porte sur plus de 300 millions de messages. Si elle n’est pas nécessairement représentative de l’ensemble de la population américaine, elle apporte un éclairage sur les variations de moral chez l’Oncle Sam et montre surtout les possibilités d’utilisation des données de Twitter.

En bons communicants, les auteurs ne se sont pas contentés d’un tableau rébarbatif pour publier leurs données, mais ont modélisé leurs résultats dans une vidéo fascinante.

Le protocole de collecte des données est relativement simple, chaque utilisation d’un mot appartenant à la liste une liste baptisée ANEW était comptabilisé dans une base de données :

« L’ANEW fournit un ensemble de classements des émotions normatives, pour un grand nombre de mots anglophones. Ces déclarations, qui appartiennent au registre de la communication verbale, est classée en fonction du plaisir, de l’excitation, et de la sentiment prévalent, et se veut un standard utilisé dans l’étude de l’émotion et de l’attention. »

Pour que la carte reste cohérente, la taille des Etats s’adapte en fonction du nombre de messages mais également de son nombre d’habitants, pour éviter une sur représentation des zones les plus peuplées.
L’analyse des variations heure par heure montre une côte ouest significativement plus heureuse que la côte est.
 
Sans surprise, le dimanche en fin de matinée apparaît comme le moment le plus heureux de la semaine alors que le jeudi soir reste le pire.
 
Au delà de l’intérêt pour les données en elles-mêmes,
l’utilisation de Twitter est intéressante, en tant qu’extracteur de données sociales : elles permettent ensuite la détermination de tendances à grande échelle, la réalisation d’une photographie d’une certaine population à un moment donné ou, comme ici, sur une période plus étendue.

Cette exploitation de données collectées dans des environnements numériques n’est pas nouvelle : comme il est techniquement et technologiquement extrêmement délicat d’enregistrer et de traiter des données sociales à grande échelle dans le monde physique, de nombreux chercheurs se tournent de plus en plus vers des univers numériques voire alternatifs, à l’image des mondes virtuels.

L’exemple de la propagation d’une épidémie de peste dans World of Warcraft avait ainsi, dès 2007, fait date en montrant les perspectives d’intégration de critères sociaux et comportementaux non prédéfinis dans des modèles de propagation purement mathématiques.

Offrir de nouvelles perspectives de recherche aux universitaires et aux utilisateurs : qui sait, c’est peut-être dans cette voie que Twitter, souvent décrié comme un gadget futile et pour son microcosme fermé, gagnera une partie de ses lettres de noblesse ?
 
> Pour aller plus loin

– Une autre utilisation des données de Twitter : La ville redessinée par les réseaux sociaux

The untapped potential of virtual worlds to shed light on real world epidemics (PDF)

Chaque semaine,
recevez les immanquables
par email