
Les joueurs humains devaient affronter l’IA de Carnegie Mellon simultanément dans un face à face (heads-up) sur 20 jours. Dès le début, Libratus a commencé à dominer ses adversaires, et la fin du tournoi n’a rien changé. Après 20 jours de jeu dans un casino de Pittsburgh, l’intelligence artificielle a battu ces quatre joueurs qui sont parmi les meilleurs au monde. Libratus a dépassé ses adversaires humains de plus de 1,7 million de dollars en jetons.
« La capacité de la meilleure IA à faire des raisonnements stratégiques avec des informations imparfaites a maintenant dépassé celle des meilleurs humains », s’est réjoui Tuomas Sandholm, professeur d’informatique dans ladite université et chef du projet.
Rendant témoignage des capacités de Libratus, Daniel McAulay, l’un des quatre joueurs ayant affronté l’IA explique que le programme est capable de « répartir ses mises en trois, quatre, cinq différentes tailles », ce dont « aucun humain ne serait capable ». Les quatre pros du Poker estiment également que Libratus s’améliorait jour après jour, le soupçonnant donc d’apprendre de ses erreurs et corriger chaque faiblesse qu’ils découvraient dans le programme ; ce qui serait bien le cas d’après les créateurs du programme.
« Après le jeu terminé chaque jour, un méta-algorithme analysait les faiblesses que les pros avaient identifiées et exploitées dans la stratégie de Libratus. Il va ensuite prioriser les faiblesses et patcher les trois premières en utilisant le supercalculateur chaque nuit, » explique Sandholm. « C'est très différent de ce que l'apprentissage a utilisé dans le passé dans le poker. « Typiquement, les chercheurs développent des algorithmes qui tentent d'exploiter les faiblesses de l'adversaire. En revanche, ici l'amélioration quotidienne est sur l'algorithmique de correction des faiblesses dans notre propre stratégie ».
Pour chacun des jeux où l’IA s’est invité ces dernières années, ce n’est pas une simple évidence d’une éventuelle supériorité de la machine sur l’Homme qui est recherchée. Les développeurs de ces programmes ont un objectif bien précis, et dans le cas de Libratus, c’est de « créer une intelligence artificielle qui peut aider les humains à négocier ou à prendre des décisions dans des situations où ils ne peuvent pas connaître tous les faits ;».
Le poker s’avère donc être un terrain d’expérimentation assez intéressant, car il pose de grands défis. Il exige en effet qu’une machine prenne des décisions extrêmement compliquées basées sur des informations incomplètes tout en faisant face à des bluffs, entre autres stratagèmes, avait indiqué Sandholm.
La théorie de jeu exposée par Libratus pourrait aider dans beaucoup de choses, comme dans les négociations financières ou politiques, estime Michael Wellman, un professeur de l'Université de Michigan, spécialisée en théorie des jeux. Dans le Texas hold 'em poker no-limit, les joueurs n'essaient pas nécessairement de gagner chaque petite main. Ils cherchent à gagner le plus d'argent, et cela nécessite de développer des stratégies de paris sur des dizaines de mains. Wellman est donc convaincu qu’une machine qui maîtrise le Texas hold 'em no-limit imite le genre d'intuition humaine nécessaire dans ces stratégies.
D’après Frank Pfenning également, chef du département d'informatique à l’université Carnegie Mellon, cette nouvelle étape dans l'intelligence artificielle a des implications pour n'importe quel domaine dans lequel l'information est incomplète et où les opposants sèment la désinformation. Au-delà de la négociation en affaires, il pense que la stratégie militaire, la cybersécurité et bien d'autres domaines pourraient tous bénéficier d'une prise de décision automatisée à l'aide d'une IA de type Libratus.
Sources : Carnegie Mellon University, Wired
Et vous ?

Voir aussi


