Jeu de poker : l'IA meilleure que l'homme ?
Des chercheurs déclarent avoir battu des professionnels avec l'IA DeepStack et l'IA Libratus est en tête

Le , par Olivier Famien, Chroniqueur Actualités
Depuis quelques jours, le tournoi de poker opposant Libratus, le programme d’intelligence artificielle (IA) de Carnegie Mellon University (CMU), à quatre des meilleurs joueurs professionnels de poker au monde a débuté. Alors que l’on a les regards fixés sur ce tournoi qui est retransmis en direct afin de savoir qui de l’homme ou l’IA est meilleur au jeu de poker professionnel, une publication vient d’être faite par un groupe de chercheurs de plusieurs universités notamment l’université d’Alberta au Canada, et les universités Charles et Czech Technical de Prague en République tchèque afin d’informer qu’une IA conçue par leurs soins a affronté des douzaines de professionnels (33 au total provenant de 17 pays) dans un tournoi de poker de 44 000 mains à l’issue duquel cette IA est sortie vainqueur des différentes confrontations avec les humains. Cette IA a été baptisée DeepStack et est considérée par ses auteurs comme la première machine à avoir battu l’homme dans un jeu d’information imparfaite.

En général, les jeux comme Go, Jeopardy, les jeux d’échecs, etc. impliquent une symétrie de l’information, c’est-à-dire supposent que tous les joueurs humains ou machine en liste partagent la même information de l’état du jeu en cours. Mais pour ce qui concerne le poker, nous sommes dans un cas d’information imparfaite, car les acteurs n’ont pas accès aux informations détenues par l’autre. De plus, une dose de complexité est ajoutée au jeu avec les intervenants qui peuvent tromper l’adversaire par le bluff et bien d’autres stratagèmes.

Pour permettre aux programmes IA de battre des professionnels à ce jeu en prenant en compte toutes ces variables, les scientifiques expliquent que généralement l’algorithme soutenant les IA raisonne globalement en prenant en compte le jeu entier pour produire une stratégie complète avant de jouer. Mais une telle approche montre ses limites lorsque le jeu est trop large pour être résolu dans sa globalité. La solution utilisée par les développeurs de DeepStack a été de décomposer le jeu de poker heads-up no-limit Texas hold’em qui implique 10 160 situations en 1014 situations. Bien que cette approche suppose des pertes d’informations, les chercheurs ont utilisé le raisonnement récursif qui permet d’adapter la stratégie des programmes IA face aux itérations successives de chaque partie afin de ne pas se concentrer sur tout le jeu, mais plutôt sur chaque situation qui survient tout en faisant des estimations approximatives.

Selon les chercheurs, ces estimations peuvent être perçues comme de l’intuition affichée par DeepStack. Aussi, en forgeant cette intuition à travers différents exemples dérivés des situations aléatoires du poker, les chercheurs affirment que DeepStack est le premier programme IA qui a battu des professionnels au poker heads-up no-limit Texas hold’em avec un taux de victoire moyen supérieur à 450 mbb/g (milli-big-blinds par jeu). La milli-big-blind est utilisée pour mesurer les performances au poker avec 1 milli-big-blind correspondant un millième de la taille du montant de la grosse blind. Les blinds en elles-mêmes sont des mises obligatoires faites avant les distributions de cartes.

Lors du jeu, 11 des 33 joueurs ont pu atteindre les 3 000 matches demandés. De manière générale, DeepStack a remporté remarquablement les matches avec une nette avance à l’exception d’un seul où la différence de gain était de 70 mbb/g.

En attendant que toute la lumière soit faite sur les potentialités de DeepStack, le tournoi de poker opposant l’IA de Carnegie Mellon University à quatre des meilleurs joueurs de poker professionnel au monde est toujours en cours et à l’IA de CMU conserve une longueur d’avance après avoir battu les hommes les premiers jours de l’ouverture du tournoi.

Source : Rapport pour DeepStack (PDF), Fortune, Casino Rivers

Et vous ?

Qu’en pensez-vous ?

Voir aussi

Jeu de Go : les développeurs s'imposent face à Lee Sedol, l'IA de Google terrasse la star du Go par un score de 4-1
Un mystérieux joueur de Go en ligne reste invincible sur 50 matchs face aux champions mondiaux, derrière lui se cache une nouvelle version d'AlphaGo
Des programmes IA pourraient battre les humains au jeu de Doom après avoir appris à jouer en regardant d'autres joueurs

La Rubrique Algorithmique, Forum Intelligence artificielle, Cours et tutoriels Algorithmique, FAQ du langage


Vous avez aimé cette actualité ? Alors partagez-la avec vos amis en cliquant sur les boutons ci-dessous :


 Poster une réponse

Avatar de Matthieu Vergne Matthieu Vergne - Expert confirmé https://www.developpez.com
le 16/01/2017 à 14:47
En bref, comment l'annonce du CMU a poussé d'autres à annoncer que trop tard, c'était déjà fait. {^o^}
Après, faut voir les résultats des autres. J'ai pas regardé.
Avatar de Bigb Bigb - Membre actif https://www.developpez.com
le 16/01/2017 à 18:07
Incroyable la vitesse de progression de l'IA dans les différents domaines !
Avatar de marsupial marsupial - Membre éprouvé https://www.developpez.com
le 16/01/2017 à 19:18
Explication :
Combinaisons possibles remplissent une base
analyse en fonction de ces données/informations et règles immuables du poker
temporisation inclue pour bluffer

affaire conclue

Ils ne savaient pas que c'était impossible alors ils l'ont fait - Mark Twain
Avatar de Michael Guilloux Michael Guilloux - Chroniqueur Actualités https://www.developpez.com
le 01/02/2017 à 17:05
Jeu de poker : l’IA de l’université Carnegie Mellon terrasse ses quatre adversaires humains
une victoire historique face à des joueurs de haut niveau

En 2015, quatre des meilleurs joueurs de poker au monde ont affronté dans un tournoi une IA développée Carnegie Mellon University dans ce jeu de stratégie à information imparfaite. À la fin du tournoi, trois des joueurs humains ont été meilleurs que le programme d'intelligence artificielle. L'université Carnegie Mellon est donc revenue en ce début d'année pour tenter de prendre sa revanche, et cette fois, avec une meilleure IA. Depuis le 11 janvier, la nouvelle IA baptisée Libratus a affronté quatre joueurs de poker de haut niveau. C’est le Texas hold 'em poker –- et dans sa forme no-limit -- qui a été choisi. Le Texas hold 'em poker est la variante de poker la plus jouée. Dans le no-limit, les mises et les relances sont libres, ce qui favorise le bluff.

Les joueurs humains devaient affronter l’IA de Carnegie Mellon simultanément dans un face à face (heads-up) sur 20 jours. Dès le début, Libratus a commencé à dominer ses adversaires, et la fin du tournoi n’a rien changé. Après 20 jours de jeu dans un casino de Pittsburgh, l’intelligence artificielle a battu ces quatre joueurs qui sont parmi les meilleurs au monde. Libratus a dépassé ses adversaires humains de plus de 1,7 million de dollars en jetons.

« La capacité de la meilleure IA à faire des raisonnements stratégiques avec des informations imparfaites a maintenant dépassé celle des meilleurs humains », s’est réjoui Tuomas Sandholm, professeur d’informatique dans ladite université et chef du projet.

Rendant témoignage des capacités de Libratus, Daniel McAulay, l’un des quatre joueurs ayant affronté l’IA explique que le programme est capable de « répartir ses mises en trois, quatre, cinq différentes tailles », ce dont « aucun humain ne serait capable ». Les quatre pros du Poker estiment également que Libratus s’améliorait jour après jour, le soupçonnant donc d’apprendre de ses erreurs et corriger chaque faiblesse qu’ils découvraient dans le programme ; ce qui serait bien le cas d’après les créateurs du programme.

« Après le jeu terminé chaque jour, un méta-algorithme analysait les faiblesses que les pros avaient identifiées et exploitées dans la stratégie de Libratus. Il va ensuite prioriser les faiblesses et patcher les trois premières en utilisant le supercalculateur chaque nuit, » explique Sandholm. « C'est très différent de ce que l'apprentissage a utilisé dans le passé dans le poker. « Typiquement, les chercheurs développent des algorithmes qui tentent d'exploiter les faiblesses de l'adversaire. En revanche, ici l'amélioration quotidienne est sur l'algorithmique de correction des faiblesses dans notre propre stratégie ».

Pour chacun des jeux où l’IA s’est invité ces dernières années, ce n’est pas une simple évidence d’une éventuelle supériorité de la machine sur l’Homme qui est recherchée. Les développeurs de ces programmes ont un objectif bien précis, et dans le cas de Libratus, c’est de « créer une intelligence artificielle qui peut aider les humains à négocier ou à prendre des décisions dans des situations où ils ne peuvent pas connaître tous les faits ».

Le poker s’avère donc être un terrain d’expérimentation assez intéressant, car il pose de grands défis. Il exige en effet qu’une machine prenne des décisions extrêmement compliquées basées sur des informations incomplètes tout en faisant face à des bluffs, entre autres stratagèmes, avait indiqué Sandholm.

La théorie de jeu exposée par Libratus pourrait aider dans beaucoup de choses, comme dans les négociations financières ou politiques, estime Michael Wellman, un professeur de l'Université de Michigan, spécialisée en théorie des jeux. Dans le Texas hold 'em poker no-limit, les joueurs n'essaient pas nécessairement de gagner chaque petite main. Ils cherchent à gagner le plus d'argent, et cela nécessite de développer des stratégies de paris sur des dizaines de mains. Wellman est donc convaincu qu’une machine qui maîtrise le Texas hold 'em no-limit imite le genre d'intuition humaine nécessaire dans ces stratégies.

D’après Frank Pfenning également, chef du département d'informatique à l’université Carnegie Mellon, cette nouvelle étape dans l'intelligence artificielle a des implications pour n'importe quel domaine dans lequel l'information est incomplète et où les opposants sèment la désinformation. Au-delà de la négociation en affaires, il pense que la stratégie militaire, la cybersécurité et bien d'autres domaines pourraient tous bénéficier d'une prise de décision automatisée à l'aide d'une IA de type Libratus.

Sources : Carnegie Mellon University, Wired

Et vous ?

Qu'en pensez-vous ?

Voir aussi

Jeu de Go : les développeurs s'imposent face à Lee Sedol, l'IA de Google terrasse la star du Go par un score de 4-1
Un mystérieux joueur de Go en ligne reste invincible sur 50 matchs face aux champions mondiaux, derrière lui se cache une nouvelle version d'AlphaGo
Des programmes IA pourraient battre les humains au jeu de Doom après avoir appris à jouer en regardant d'autres joueurs
Avatar de GPPro GPPro - Membre éprouvé https://www.developpez.com
le 01/02/2017 à 17:07
Comme je l'avais dit au début de la discussion, ce n'est pas franchement une surprise... Accessoirement ça annonce la fin du poker en ligne.
Avatar de RyzenOC RyzenOC - Membre émérite https://www.developpez.com
le 01/02/2017 à 18:14
le gain finale est effectivement favorable à l'IA, mais si on regarde uniquement le nombre de victoire dans les manches, le guerre homme/machine et quasi égale.
La conclusion : l'homme gagne autant que l'ia mais gagnait peu d'argent. Ce qui contraste quand même la conclusion de l'université à mon sens.

Une étape intéressante serait de voir une IA contre des hommes dans des jeux faisant appelle aux émotions+manipulations+fourberie. un jeu comme "Les Loups-garous de Thiercelieux" par exemple sa serait marrant car comment quantifier cela ?
Avatar de sham59 sham59 - Futur Membre du Club https://www.developpez.com
le 10/02/2017 à 16:12
Maintenant qu'ils ont cassé tout les jeux ultra connus, l'IA devrait s'attaquer au vrai jeux...
A Blood Bowl on aimerait bien avoir des bonnes IA par exemple

Pour ceux qui ne connaissent pas, c'est du football américain fantastique:
- Plateau 26*15
- 1 vs 1
- 11 joueurs à jouer par tour
- 20 équipes différentes avec évolution des compétences des joueurs
- des résolutions par jet de dés (donc de la prise de risque mesuré)
- 2 * 8 tours de jeu
- des évènements aléatoires aux coups d'envoi à prendre en compte.
- etc.

1 joueur ayant la possibilité de bouger en moyenne de 6 cases (diagonale incluse), de frapper, passer ou transmettre le ballon.
Il y a environ 50 compétences disponibles. Et en fonction du niveau de l'équipe chaque joueur en possède de 0 à 6 supplémentaires en plus de celle de base du joueur.

On est dans des jeux un peu différents de ce qui est traité en général par les IA. Et de part mon expérience du jeu et l'IA, je penses qu'il y a un vrai challenge dans ces jeux la.
Blood Bowl n'est pas le seul jeu de ce type mais son avantage est qu'il existe des versions plateaux et jeux vidéo et que c'est un jeu qui évolue depuis environ 30 ans grâce à la communauté de joueur car il reste une référence en la matière...
Avatar de Malick SECK Malick SECK - Community Manager https://www.developpez.com
le 18/04/2017 à 3:08
Jeu de poker : Lengpudashi, une autre IA de l’université Carnegie Mellon terrasse ses six adversaires humains,
qui ont perdu globalement 792 327 $ en jetons virtuels

Aujourd'hui, force est de constater que l'intelligence artificielle est en train de progresser d'une manière incroyable dans différents domaines d'activités. Le domaine relatif aux jeux, et particulièrement le poker, n'est pas en reste. En effet, un robot joueur dénommé Lengpudashi et créé par des chercheurs de l'université de Carnegie Mellon vient de battre au jeu de poker six joueurs professionnels d'origine chinoise. D'après les informations que nous avons recueillies, le tournoi qui a opposé l'IA de l'université Carnegie Mellon et ses adversaires humains s'est déroulé au Texas en 36 000 mains et a duré cinq (5) jours. Les parties qui se jouaient en Texas hold 'em poker no-limit se sont globalement soldées par la victoire finale de l'IA en l'occurrence Lengpudashi ; par conséquent l'équipe des joueurs chinois aurait perdu au total la somme de 793 327 dollars en jetons virtuels.

Rappelons que dans le Texas hold 'em poker en no-limit, le principal objectif des joueurs c'est de gagner le plus d'argent possible en mettant en place diverses stratégies de paris sur plusieurs dizaines de mains.

Selon le communiqué, le nouveau robot joueur à savoir Lengpudashi est une version améliorée du célèbre programme d'intelligence artificielle dénommée Libratus. Ces deux programmes sont créés par Tuomas Sandholm, professeur d'informatique à l'université Carnegie Mellon sise aux États-Unis et par le doctorant Noam Brown.

Pour rappel, Libratus est une IA dont les exploits ont récemment fait la une des médias. En effet, dans un tournoi qui aura duré vingt jours (début le 11 janvier 2017) et qui a opposé Libratus à quatre joueurs humains et de surcroît des professionnels au jeu de poker, nous vous annoncions la victoire de l'IA qui a fini par battre ses adversaires humains. Libratus a dépassé ces derniers de plus de 1,7 million de dollars en jetons. On se souvient même des propos du professeur Tuomas Sandholm qui affirmait que « la capacité de la meilleure IA à faire des raisonnements stratégiques avec des informations imparfaites a maintenant dépassé celle des meilleurs humains. »

Selon les créateurs des deux robots joueurs, il y a eu d'importantes améliorations dans le domaine de l'intelligence artificielle, ce qui justifie la puissance de Lengpudashi comparé à son prédécesseur Libratus. Les chercheurs de l'université de Carnegie Mellon soutiennent que lors du tournoi en 120 000 mains qui a opposé Libratus à ses quatre adversaires, l'IA gagnait 147 milli-big-blindes par partie. Quant à Lengpudashi, il a gagné 220 milli-big-blindes par partie. Au poker, on appelle blind la ou les mises obligatoires faites avant toute distribution de cartes.

Les six joueurs professionnels chinois s'en seraient bien sortis, car la somme de 793 327 dollars qu'ils ont perdus est de l'argent fictif. Toutefois, il aurait été prévu que le vainqueur recevra la somme de 290 000 dollars. Par conséquent, c'est la société Strategic Machine Inc., créée par le professeur Tuomas Sandholm et Noam Brown, qui devrait empocher la mise.

Source : Université de Carnegie Mellon

Et vous ?

Que pensez-vous de cette nouvelle victoire de l'IA sur les humains ?

Voir aussi

Quatre professionnels du poker affronteront l'IA de Carnegie Mellon University le 11 janvier prochain, entre l'homme et l'IA, qui sera le vainqueur ?

Jeu de poker : l'IA de l'université Carnegie Mellon terrasse ses quatre adversaires humains, une victoire historique face à des joueurs de haut niveau
Offres d'emploi IT
Responsable de lot / architecte fpga H/F
Safran - Ile de France - Éragny (95610)
Ingénieur produit (FADEC militaire) H/F
Safran - Ile de France - 100 rue de Paris 91300 MASSY
Chef de projet technique H/F
Safran - Ile de France - Melun (77000)

Voir plus d'offres Voir la carte des offres IT
Contacter le responsable de la rubrique Accueil