Une équipe d’étudiants de l’université de Rochester a mis au point un système de machine learning capable de détecter si un tweet a été envoyé alors que l’auteur était en état d'ivresse. Le système d’apprentissage automatique permet également de géolocaliser les auteurs de ces tweets. Les étudiants l’ont fait savoir dans un article scientifique paru le 10 mars dernier. Dans le document, l’équipe de chercheurs explique la procédure d’apprentissage automatique utilisée pour arriver à ce résultat.
Avant de commencer à implémenter un algorithme, l’équipe a tout d’abord procédé à une phase de collecte de données sur Twitter, des données publiques comportant une information de géolocalisation et qui ont été envoyées sur le réseau social entre janvier et juillet 2014, dans le comté de Monroe et dans la ville de New York. Après cette phase de collecte, l’équipe de chercheurs a procédé à un affinement des données en ne conservant que les messages contenant les mots clés : « alcool », « bière », « saoul », « bourré », etc. grâce à un système de filtre. Les messages retenus après avoir appliqué le filtre ont été ensuite analysés par des internautes indépendants, sur la plateforme Amazon Mechanical Turk, pour dire si le message fait référence à l’alcool et si l’auteur était en état d'ivresse au moment où il l’envoyait. Avec les résultats obtenus, les chercheurs ont pu déterminer les zones de consommation d’alcool en fonction des tweets associés à l’alcool. Les zones de forte consommation d’alcool sont représentées par la couleur rouge comme sur la figure suivante.
À la fin de ces différentes étapes, les étudiants de l’université de Rochester ont pu construire une base de données avec quelque onze mille messages qui vont être ensuite utilisés pour entrainer le moteur d’inférence qui permet de détecter un tweet publié en état d'ivresse. Les messages ont ensuite été étudiés une deuxième fois pour déterminer cette fois, la localisation des personnes ainsi que le moment de la journée pendant lequel elles étaient en train de boire. Un deuxième filtre a ainsi été appliqué aux messages avec comme mots clés : « maison », « enfin rentré », « canapé », « TV », « douche », « bain », etc. Ces résultats ont été couplés à la géolocalisation ainsi que le pourcentage de messages envoyés dans une même zone afin de déterminer avec une précision à 100 mètres près la localisation de l’individu au moment d’envoyer le tweet. L’équipe de chercheurs composée de quatre informaticiens et d’un psychiatre affirme que les résultats ainsi obtenus sont fiables à 80 %.
Le système de machine learning développé par les étudiants de l’université de Rochester a pour but de fournir des données qui sont destinées aux municipalités ainsi qu’aux services de santé publique pour que ces derniers mettent en place des politiques de prévention. D’après les auteurs de l’étude, leur système va aider dans la compréhension et la lutte contre les questions de santé publique en relation avec l’alcool. Par ailleurs, l’équipe indique que leur système d’apprentissage automatique peut être utilisé avec d’autres variables pour étudier d’autres comportements.
Source : arxiv.org
Et vous ?
Que pensez-vous de ce système mis en place par les étudiants de l'université de Rochester ?
Voir aussi
le forum Intelligence artificielle
Un système de machine learning mis en place par des étudiants détecte les tweets publiés en état d'ivresse
Et permet de géolocaliser leurs auteurs
Un système de machine learning mis en place par des étudiants détecte les tweets publiés en état d'ivresse
Et permet de géolocaliser leurs auteurs
Le , par Victor Vincent
Une erreur dans cette actualité ? Signalez-nous-la !