
des chercheurs mettent en évidence ses lacunes
Dans le cadre de la lutte contre les propos haineux ou déplacés en ligne, Google a récemment annoncé une intelligence artificielle, baptisée Perspective, qui permet via une API de détecter les propos « toxiques ». Nous avons toutefois constaté que Perspective n’est pour le moment pas bonne à attribuer un score de toxicité fiable à du contenu rédigé en langue française. L’application occupe actuellement le centre des débats dans les milieux où elle est censée apporter la solution au problème des propos déplacés en ligne. C’est fort de cela que des chercheurs de l’université de Washington (UW) se sont penchés avec attention sur ce cas. Ils n’ont pas manqué d’apporter des éléments nouveaux à ce que nous avions déjà commencé à tracer comme pistes de réflexion. Il ressort de leurs travaux qu’un texte « toxique » rédigé en langue anglaise peut passer les mailles du filet à condition d’être correctement travaillé.
D’après Radha Poovendran, Hossein Hosseini, Baosen Zhang et Sreeram Kannan de l’UW, les systèmes d’intelligence artificielle ont en commun un talon d’Achille : un choix approprié d’une entrée dite perturbatrice permet de « prendre le contrôle » du résultat obtenu. D’après leurs développements, Perspective n’aurait pas été suffisamment entrainé à prendre en compte ce type d’entrées, ce qui conduit aux résultats qu’ils ont rendus publics sur le site de l’université de Washington. Deux constats majeurs :
- L’insertion de ponctuation/la modification d’orthographe dans du contenu rédigé en langue anglaise permet de réduire drastiquement le score de toxicité attribué.
- La négation d’une phrase toxique ne reçoit pas le score adéquat qui, en principe, devrait être bas.
De toutes évidences, Perspective s’avère être une application embryonnaire. Elle requiert encore beaucoup d’améliorations. Les équipes de Google ont cependant des pistes de réflexion qui leur ont été tracées par notre équipe de chercheurs de l’UW. Elles sont bien évidemment basées sur les failles répertoriées ci-dessus. Il s'agira pour les équipes de Google de : intégrer un vérificateur orthographique en amont du module d’IA et faire usage d'un nombre plus important d’entrées perturbatrices pour entrainer le système.
Source: UW
Et vous ?

Voir aussi :


Vous avez lu gratuitement 22 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.