Dans une salle de conférences à San Francisco, la technologie est apparue représentée par un panneau noir ayant la hauteur d’un homme pour affronter les champions israéliens des débats : Noa Ovadia et Dan Zafrir.
Bien que la machine a éprouvé des difficultés devant plusieurs points, cet événement sans précédent a offert un aperçu sur l’état des lieux de la technologie et comment les ordinateurs s’efforcent à assimiler la façon avec laquelle les humains prennent des décisions.
Lors du débat (il y a eu deux débats courts), chaque participant a dû préparer une introduction de quatre minutes pour défendre son opinion. Ensuite, il devait prendre la parole pendant une autre quatre minutes pour tenter de contrecarrer les arguments étayés par le premier. Enfin, chaque participant a eu droit à deux minutes pour présenter sa conclusion. Les deux débats ont été : 'Les autorités doivent-elles subsidier l'exploration de l’espace ?' et 'Devrait-on télécommander davantage de technologies dans le domaine des soins médicaux ?'
Lors des deux débats, le public a jugé que Project Debater a été moins bon lorsqu’il s’agit de transmission, mais en termes de la quantité d’informations communiquées, il a battu ses deux adversaires humains. L’IA a été également votée plus persuasive que son adversaire humain Zafrir lors du second débat, et ce malgré de nombreux faux pas. Mais il faut néanmoins savoir que de nombreux membres du staff d’IBM étaient présents dans la salle, et il pourrait qu’ils auraient favorisé leur création.
Avant la tenue de ces débats, Project Debater avait reçu une liste d’une centaine de sujets possibles, et avait préalablement analysé 300 millions d’infos et de pages Wikipédia. À travers Project Debater, IBM cherche à montrer la capacité de sa technologie à traiter de larges quantités de données, incluant des millions d’articles de news couvrant plusieurs sujets, puis transformer des extraits d’arguments en une véritable prose, une tâche fastidieuse pour un ordinateur.
IBM espère développer un assistant virtuel plus sophistiqué capable d’absorber des quantités massives d'informations, pour présenter des arguments persuasifs et prendre de bonnes décisions, et non pas seulement répondre à de simples questions et commandes.
Lors des débats, l’IA d’IBM a parlé avec une voix féminine adoptant une cadence naturelle, mais elle lui manquait la précision linguistique et la clarté argumentative. Par exemple lors du premier débat, l’IA a continué à répéter l’argument que l’exploration de l’espace est bénéfique pour l’économie plusieurs fois en changeant légèrement les mots. Quelquefois, le sens d’une phrase ne correspondait pas vraiment au sens d’une phrase précédente. Et des fois, l’IA a choisi d’énoncer des anecdotes et des citations d’une façon qui n’était pas entièrement naturelle.
À un certain moment, au milieu d’une phrase, l’IA a mentionné l’astronaute Scott Kelly puis elle a dit “voiceover”, suggérant que l’extrait de texte utilisé pour argumenter a été pris d’une transcription vidéo.
Un autre point faible de la machine, l’absence du gestuel ou d’expressions du visage a fait qu’il était beaucoup plus difficile pour l’audience de rester concentrée lorsque le robot prenait la parole.
Pendant six années, IBM a travaillé sur les capacités de Project Debater incluant la rédaction et la transmission de discours orientée données, la compréhension auditive pour identifier les principaux points dans un discours, et la capacité à formuler de bons arguments. L’IA s’est basée sur les capacités de Watson, le superordinateur développé par IBM.
Ce n’est pas la première fois qu’une compétition est organisée par IBM entre la machine et des humains. En 1997, le programme Deep Blue de la firme a battu Gary Kasparov en échecs. Et en 2011, Watson gagne lors d’un quiz télévisé américain contre des adversaires humains.
Mais contrairement aux duels précédents, tenir un débat constitue une tâche beaucoup plus compliquée.
« Les règles des échecs ne sont pas nombreuses. L’échiquier est très petit et le nombre de pièces est minime. Même pour le jeu de Go, qui est plus large, on parle toujours d’un espace extrêmement délimité et bien défini, » a dit Chris Reed, professeur de l’Université de Dundee qui était présent lors du duel.
« Avec le langage, ce n’est pas aussi clair, » dit-il. « Il y a beaucoup plus de flexibilité dans ce qui constitue un tour et les règles du jeu. »
Une fois l’IA sera capable d’émettre des arguments persuasifs, elle pourra être utilisée en tant qu’outil d’aide à la prise de décision pour les humains.
« Nous pensons qu’il y a un grand potentiel pour l’intelligence artificielle capable de comprendre les humains, » a dit Arvind Krighna, directeur d’IBM Research.
Un exemple de cette application pourrait être les salles de conférences des entreprises où se prennent les décisions importantes et où il y a plusieurs points de vue conflictuels. Le système IA pourrait sans émotion écouter attentivement la conversation, prendre en considération toutes les preuves et les arguments et mettre en défi le raisonnement des humains s’il le faut. Le système pourrait aussi être utilisé pour contrer le terrorisme, en identifiant les individus représentant une menace.
Project Debater pourrait paraitre comme un bon coup de pub, mais il dénote aussi les limites actuelles de l’intelligence artificielle selon Reed.
« Cela aide le public à comprendre où on en est, ce qui signifie que la panique au sujet de l'apocalypse imminente de robots pourrait être tempérée un peu, » dit-il.
Source : The Guardian
Et vous ?
Que pensez-vous de l'état actuel de développement de l'intelligence artificielle ?
Êtes-vous d'accord que la panique au sujet des risques liés à l'IA sont exagérés ?
Voir aussi :
Le ministère australien de la défense investit 4 millions de dollars sur trois ans dans IBM Watson pour ses besoins d'intelligence artificielle
IA : un guide éthique en développement chez Google pour répondre aux protestations contre la participation de l'entreprise à un projet du Pentagone
Secteur bancaire américain : 70 % des emplois en front office seront dévolus à l'intelligence artificielle, mais qu'en est-il des limites ?