En 2015, quatre des meilleurs joueurs de poker au monde ont affronté dans un tournoi une IA développée Carnegie Mellon University dans ce jeu de stratégie à information imparfaite. À la fin du tournoi, trois des joueurs humains ont été meilleurs que le programme d'intelligence artificielle. L'université Carnegie Mellon est donc revenue en ce début d'année pour tenter de prendre sa revanche, et cette fois, avec une meilleure IA. Depuis le 11 janvier, la nouvelle IA baptisée Libratus a affronté quatre joueurs de poker de haut niveau. C’est le Texas hold 'em poker –- et dans sa forme no-limit -- qui a été choisi. Le Texas hold 'em poker est la variante de poker la plus jouée. Dans le no-limit, les mises et les relances sont libres, ce qui favorise le bluff.
Les joueurs humains devaient affronter l’IA de Carnegie Mellon simultanément dans un face à face (heads-up) sur 20 jours. Dès le début, Libratus a commencé à dominer ses adversaires, et la fin du tournoi n’a rien changé. Après 20 jours de jeu dans un casino de Pittsburgh, l’intelligence artificielle a battu ces quatre joueurs qui sont parmi les meilleurs au monde. Libratus a dépassé ses adversaires humains de plus de 1,7 million de dollars en jetons.
« La capacité de la meilleure IA à faire des raisonnements stratégiques avec des informations imparfaites a maintenant dépassé celle des meilleurs humains », s’est réjoui Tuomas Sandholm, professeur d’informatique dans ladite université et chef du projet.
Rendant témoignage des capacités de Libratus, Daniel McAulay, l’un des quatre joueurs ayant affronté l’IA explique que le programme est capable de « répartir ses mises en trois, quatre, cinq différentes tailles », ce dont « aucun humain ne serait capable ». Les quatre pros du Poker estiment également que Libratus s’améliorait jour après jour, le soupçonnant donc d’apprendre de ses erreurs et corriger chaque faiblesse qu’ils découvraient dans le programme ; ce qui serait bien le cas d’après les créateurs du programme.
« Après le jeu terminé chaque jour, un méta-algorithme analysait les faiblesses que les pros avaient identifiées et exploitées dans la stratégie de Libratus. Il va ensuite prioriser les faiblesses et patcher les trois premières en utilisant le supercalculateur chaque nuit, » explique Sandholm. « C'est très différent de ce que l'apprentissage a utilisé dans le passé dans le poker. « Typiquement, les chercheurs développent des algorithmes qui tentent d'exploiter les faiblesses de l'adversaire. En revanche, ici l'amélioration quotidienne est sur l'algorithmique de correction des faiblesses dans notre propre stratégie ».
Pour chacun des jeux où l’IA s’est invité ces dernières années, ce n’est pas une simple évidence d’une éventuelle supériorité de la machine sur l’Homme qui est recherchée. Les développeurs de ces programmes ont un objectif bien précis, et dans le cas de Libratus, c’est de « créer une intelligence artificielle qui peut aider les humains à négocier ou à prendre des décisions dans des situations où ils ne peuvent pas connaître tous les faits ;».
Le poker s’avère donc être un terrain d’expérimentation assez intéressant, car il pose de grands défis. Il exige en effet qu’une machine prenne des décisions extrêmement compliquées basées sur des informations incomplètes tout en faisant face à des bluffs, entre autres stratagèmes, avait indiqué Sandholm.
La théorie de jeu exposée par Libratus pourrait aider dans beaucoup de choses, comme dans les négociations financières ou politiques, estime Michael Wellman, un professeur de l'Université de Michigan, spécialisée en théorie des jeux. Dans le Texas hold 'em poker no-limit, les joueurs n'essaient pas nécessairement de gagner chaque petite main. Ils cherchent à gagner le plus d'argent, et cela nécessite de développer des stratégies de paris sur des dizaines de mains. Wellman est donc convaincu qu’une machine qui maîtrise le Texas hold 'em no-limit imite le genre d'intuition humaine nécessaire dans ces stratégies.
D’après Frank Pfenning également, chef du département d'informatique à l’université Carnegie Mellon, cette nouvelle étape dans l'intelligence artificielle a des implications pour n'importe quel domaine dans lequel l'information est incomplète et où les opposants sèment la désinformation. Au-delà de la négociation en affaires, il pense que la stratégie militaire, la cybersécurité et bien d'autres domaines pourraient tous bénéficier d'une prise de décision automatisée à l'aide d'une IA de type Libratus.
Sources : Carnegie Mellon University, Wired
Et vous ?
Qu'en pensez-vous ?
Voir aussi
Jeu de Go : les développeurs s'imposent face à Lee Sedol, l'IA de Google terrasse la star du Go par un score de 4-1
Un mystérieux joueur de Go en ligne reste invincible sur 50 matchs face aux champions mondiaux, derrière lui se cache une nouvelle version d'AlphaGo
Des programmes IA pourraient battre les humains au jeu de Doom après avoir appris à jouer en regardant d'autres joueurs
Jeu de poker : l'IA de l'université Carnegie Mellon terrasse ses quatre adversaires humains
Une victoire historique face à des joueurs de haut niveau
Jeu de poker : l'IA de l'université Carnegie Mellon terrasse ses quatre adversaires humains
Une victoire historique face à des joueurs de haut niveau
Le , par Michael Guilloux
Une erreur dans cette actualité ? Signalez-nous-la !