Homme vs IA au jeu de go : AlphaGo mène désormais deux manches à zéro
Lee Sedol n'a plus droit à l'erreur s'il veut remporter la partie

Le , par Stéphane le calme

60PARTAGES

5  0 
Depuis hier, AlphaGo, un programme développé par la filiale DeepMind (une entreprise britannique créée en 2010 et qui a été rachetée en 2014 par Google), affronte Lee Sedol, le joueur professionnel considéré comme le meilleur joueur international des années 2000.

Hier, à l'issue d'une partie qui a duré trois heures et que les commentateurs ont estimé être serrée, Lee Sedol s'est incliné face aux assauts du programme. La seconde manche qui a eu lieu aujourd'hui s'est encore achevée en faveur de l'IA. Après plus de quatre heures, le programme a tout de même remporté la partie de deux points, lui donnant une avance de deux manches sur son adversaire. Désormais, le joueur n'a plus droit à l'erreur.

Trois autres manches sont prévues, les 12, 13 et 15 mars. En octobre 2015, AlphaGo avait déjà battu par 5 parties à 0 le joueur professionnel français Fan Hui, 2e dan (sur 9 au maximum) et meilleur joueur d’Europe. DeepMind avait comparé le jeu de go à l'« Everest » de l'IA en raison du grand nombre de combinaisons possibles.

« AlphaGo a remporté le deuxième match et prend une avance par 2 à 0 ! Difficile pour nous d’y croire. AlphaGo a joué quelques beaux mouvements créatifs dans ce jeu. C’était mégatendu », a commenté sur Twitter Demis Hassabis, le directeur de DeepMind.


Source : YouTube

Une erreur dans cette actualité ? Signalez-le nous !

Avatar de dlewin
Membre averti https://www.developpez.com
Le 16/03/2016 à 15:31
Citation Envoyé par BufferBob Voir le message
"aujourd'hui, Lee Sedol n'est plus que l'ombre de lui-même, carburant aux antidépresseurs et soumis à de violentes poussées d'urticaires, celui que l'humanité toute entière surnomme désormais « l'homme par qui le scandale est arrivé » vit reclus, passant ses journées à regarder des émissions de Cyril Hanouna emmitouflé dans une couette sale.
Dans un accès de rage incontrôlée, alors que des enfants de son quartier lui jetaient des cailloux, il aurait dit-on lancé d'un ton vindicatif mêlé de désespoir cette phrase avant de rentrer chez lui pour tenter de se faire sepuku avec un couteau à beurre : « monde de merde ! »"
Lorsque la police est entré dans l'appartement de "LeeSer", comme il était surnommé sur Facebook et Twitter ,celle-ci à découvert avec horreur que Lee Sedol bien qu'ayant déjà raté son 1er sepuku à pourtant faillit réussir sa seconde tentative. Sans l'intervention d'un voisin alerté par le bruit, M. Sedol ne serait plus vivant. En effet, vers 2h du matin, un énorme fracas aurait réveillé le voisin du dessous, mais c'est surtout la musique qui l'à alerté. En pénétrant de force dans les locaux, les policiers ont en effet découvert que cette inquiétude était justifiée puisque dans un acte insensé M. Sedol voulait en finir avec ses jours par pendaison en s’élevant symboliquement sur une montagne de jetons de go (5650 au total) qu'il aurait retiré par la suite avec les pieds après s'être passé la corde au cou. Fort heureusement, la corde étant de fabrication Chinoise, celle ci n'a pas tenu longtemps et M. Sedol est donc violemment tombé au sol causant le fracas.
Après avoir été interrogé par la police sur la raison d'avoir passé du Céline Dion en boucle, M. Sedol à déclaré
j'avais ainsi toutes les chances d'en finir
Ironie du sort ? Pour une raison encore indéterminée, le lecteur audio se serait bloqué suite à une faille dans le code du firmware: "Grâce au cas Sedol nous avons pu trouver un correctif"
à alors déclaré le responsable des développements chez Google ...
8  1 
Avatar de pascal-od
Membre habitué https://www.developpez.com
Le 13/03/2016 à 9:51
AlphaGo vient d'abandonner pour la 4ème partie. Le score est donc de 3-1 en faveur de AlphaGo.

Ce qui fut le plus intéressant en fin de partie c'est le fait que le niveau de jeu de AlphaGo une fois qu'il ne trouvait plus de coups pouvant renverser la situation sur le goban a considérablement chuté, avec des mauvais coups qu'on ne voit que dans des parties de débutants. Même si l'avancée de Deepmind est impressionnante je pense qu'on est encore loin d'avoir affaire à une "intelligence" artificielle.
6  0 
Avatar de BufferBob
Expert éminent https://www.developpez.com
Le 16/03/2016 à 8:40
Citation Envoyé par Michael Guilloux Voir le message
Avant d’affronter AlphaGo, Lee Sedol était très optimiste et se voyait battre le programme d’IA face auquel il ne pensait pas perdre plus d’une manche sur la série de cinq.
"aujourd'hui, Lee Sedol n'est plus que l'ombre de lui-même, carburant aux antidépresseurs et soumis à de violentes poussées d'urticaires, celui que l'humanité toute entière surnomme désormais « l'homme par qui le scandale est arrivé » vit reclus, passant ses journées à regarder des émissions de Cyril Hanouna emmitouflé dans une couette sale.
Dans un accès de rage incontrôlée, alors que des enfants de son quartier lui jetaient des cailloux, il aurait dit-on lancé d'un ton vindicatif mêlé de désespoir cette phrase avant de rentrer chez lui pour tenter de se faire sepuku avec un couteau à beurre : « monde de merde ! »"
8  2 
Avatar de pascal-od
Membre habitué https://www.developpez.com
Le 13/03/2016 à 10:48
Cela soulève quand même un point important. Lors des 3 premières parties il y a eu des coups "non conventionnels" joués par Alphago qui ont été qualifiés d'innovants ou de créatifs par les professionnels. Aujourd'hui ne suis pas totalement sûr que ce soit encore le cas. Il peut s'agir d'erreurs de jeu de la part d'Alphago que l'humain ne sait pas exploiter (pour l'instant) dans le déroulement de la partie.

D'autre part AlphaGo a fait une erreur au coup 79 mais ne s'est "rendu compte" de son erreur qu'au coup 87 voir https://twitter.com/demishassabis/st...28006400581632

Le go n'est qu'un jeu, cela ne prête pas à conséquence. Utiliser une IA dans un autre domaine soulève des questions (Deepmind veut développer des IA dans le domaine de la santé), ce type d'erreur qui n'est découvert que plus tard peut être catastrophique. Je pense qu'il y a encore beaucoup de travail et d'avancées à faire avant qu'on puisse se fier à une IA.
5  0 
Avatar de GPPro
Membre éprouvé https://www.developpez.com
Le 13/03/2016 à 10:14
Citation Envoyé par pascal-od Voir le message
AlphaGo vient d'abandonner pour la 4ème partie. Le score est donc de 3-1 en faveur de AlphaGo.

Ce qui fut le plus intéressant en fin de partie c'est le fait que le niveau de jeu de AlphaGo une fois qu'il ne trouvait plus de coups pouvant renverser la situation sur le goban a considérablement chuté, avec des mauvais coups qu'on ne voit que dans des parties de débutants. Même si l'avancée de Deepmind est impressionnante je pense qu'on est encore loin d'avoir affaire à une "intelligence" artificielle.
Oui comme l'expliquait très bien Redmond, on voit des résurgences des défauts des algos basés sur MC : on joue des coups qui ont une meilleure probabilité de gagner lorsque l'adversaire a oublié de répondre ou ne sait plus jouer... Mais bon, pour moi c'est anecdotique, c'est juste que quelque part il y a besoin d'une meilleure évaluation de l'abandon. (et un peu de tunning sur les possibilités qui remontent en fin de parties uniquement sur la base d'une absence de réponse de l'adversaire mais ça semble être typiquement le genre de cas qui importent peu en cours de développement : on se fout d'améliorer la façon dont perd l'algo...).
4  0 
Avatar de Shepard
Membre éprouvé https://www.developpez.com
Le 13/03/2016 à 22:32
La question qui se pose est : Maintenant que Lee Sedol a gagné une fois contre alphago, a-t-il en quelque sorte "compris" comment jouer contre cette IA et peut-t-il la battre à chaque fois ? (au moins quand il joue Blanc)
4  0 
Avatar de BufferBob
Expert éminent https://www.developpez.com
Le 18/03/2016 à 22:08
Citation Envoyé par Matthieu Vergne Voir le message
C'est rare les sujets qui flanchent autant dans la parodie. {°.°}~
c'est pas faux, il est bien plus courant de voir des discussions qui tournent au combat de coq bien codifié, si on pouvait rester sur des terrains connus et éviter de flancher svp...

Est-ce que c'est l'obsolescence de la question titre du sujet qui fait que tout le monde s'en fout maintenant ? Où il y a d'autres facteurs en jeux ?
l'obsolescence de la question titre du sujet je sais pas, perso c'est juste que sorti de l'info en elle-même ("machin a perdu" ben je vois pas grand chose de transcendant à dire, y'a même plus de pronostic d'expert à émettre puisque le match est terminé

après chacun voit midi à sa porte, y'en a probablement qui adorent discourir longuement en tournant autour d'un pot qui n'existe plus, il en faut pour tous les gouts, j'espère simplement qu'on me tiendra pas rigueur d'une poignée de lignes sur un ton qui se prend moins au sérieux

et puis faut avouer, le champion humain qui se fait ramasser et après coup cherche des excuses en expliquant que la machine, elle, ne se fatigue pas, ne ressent pas le stress etc. comme si il ne le savait pas avant le match, comme si il avait besoin de se justifier, comme si son honneur était en jeu, bref ça m'a fait marrer :p

note-à-moi-même: l'IA parviendra-t-elle en premier à remplacer les développeurs ou à comprendre une blague ?
5  1 
Avatar de pascal-od
Membre habitué https://www.developpez.com
Le 10/03/2016 à 21:08
Citation Envoyé par f-leb Voir le message
Est-ce qu'il y a des bibliothèques d'ouvertures au jeu de Go, comme aux échecs ?

Je crois qu'aux Échecs, les joueurs humains tentaient de faire sortir les ordinateurs des sentiers battus avec des ouvertures peu conventionnelles. C'est pareil au jeu de Go ? Y a-t-il des bibliothèques d'ouvertures ?
On ne peut pas vraiment comparer le go et les échecs. On part d'un plateau (goban) vide au go, alors qu'aux échecs toutes les pièces sont sur l'échiquier en début de partie. Ensuite aux échecs, l'échiquier a tendance à se vider au cours de la partie, alors qu'au go le goban se remplit. Les pièces se déplacent sur un échiquier, sur un goban les pierres posées ne bougent pas.

Cette introduction pour dire qu'il n'y a pas de bibliothèques d'ouvertures au jeu de go. Il y a des "styles" de début de partie (le début de partie est appelé fuseki), mais au niveau professionnel chaque joueur a généralement son propre style, et au niveau amateur il n'y a souvent pas de style du tout
Il y a des séquences jouées principalement dans les coins qu'on appelle joseki et qui sont considérées comme équivalentes en résultat au niveau local sur le goban, mais un joseki peut être une véritable catastrophe au niveau global du jeu. Ensuite pour jouer un joseki il faut que l'adversaire accepte de jouer la même séquence, une simple pierre posée sur une autre intersection change toute la donne. Il faut aussi savoir qu'une pierre posée à un bout du goban peut menacer un groupe de pierres à l'autre bout du goban, tout en ayant bien sûr une influence locale à l'endroit où l'on pose la pierre.

Ayant suivi les deux parties en direct, et malgré mon modeste niveau amateur, j'ai été impressionné par la manière de jouer de AlphaGo. Et aujourd'hui c'est AlphaGo qui est sorti des sentiers battus en surprenant les meilleurs professionnels à plusieurs reprises. Certains on parlé de "créativité" de la part d'AlphaGo.

Il y avait une intervention très intéressante d'un des membres de l'équipe de AlphaGo ce matin durant le début de la partie (à partir de la minute 35 sur la vidéo ci-dessus)
3  0 
Avatar de dlewin
Membre averti https://www.developpez.com
Le 21/03/2016 à 12:28
Citation Envoyé par Matthieu Vergne Voir le message
C'est rare les sujets qui flanchent autant dans la parodie. {°.°}~

Est-ce que c'est l'obsolescence de la question titre du sujet qui fait que tout le monde s'en fout maintenant ? Où il y a d'autres facteurs en jeux ?
En parler ce n'est jamais "s'en foutre", puisqu'on n'ignore pas le sujet. Au contraire, l'histoire s'est arrêtée avec la victoire de la machine et nous la continuons avec une fiction partie de BufferBob que je trouve très drôle et bien plus sympa que les trolls habituels qui eux dévient sur un sujet différent et de façon désagréable.

Cela n'enlève en rien cette avancée de l'IA que je trouve déterminante car le GO est resté le bastion bien gardé de la recherche : la compléxité du jeu rend difficile le déterminisme des algorithmes (stocastique), d’où le reinforcement learning qui à l'avantage de se baser sur très peu de valeurs (30 millions de déplacements) mais est largement autonome, puisque nous sommes dans un apprentissage non supervisé. N'en déplaise il y à eut un après Deep blue, il y maintenant un après AlphaGo.

Par ailleurs je rappelle juste que c'est la course aux données est le nouvel eldorado : big data, deep learning, machine learning . ... tous les empires industriels sont à 200% dessus : NVIDIA, Amazon[1], Facebook, Microsoft (incluant IA+Win10), Google et même Elon musk qui à une attitude bien ambiguë puisqu'il à quand même lancé son IA. D'ailleurs il est révélateur de voir que les jobs qui arrivent en dev. concernent bien Hadoop, le load balancing, clustering, les containers (Docker,Lxc, etc), les réseaux de neurones principalement, etc etcc
Bref tout un ecosystème bien complet qui à donné déjà raison à Philp K. Dick plusieurs fois.

En reprenant donc ces 2 points, il y à un schéma global qui se dessine : les données - l'interprétation de ces données : Google n'est pas un philanthrope et est suffisamment subtile pour rester en veille technologique (google labs) je vois donc dans cette vitrine technologique qu'est ALphaGo un coup dur pour les autres majors et surtout un pas énorme pour l'IA.

Cependant, on parle souvent de sentiments dans les tests de Turing, mais je rejoins Jankelevitch où l'humour et l'ironie font parties intégrantes de notre humanité car cela n’a aucune utilité (cela ne crée rien aucun process, produit, etc) à part mieux vivre, je trouve donc qu'en rire parfois nous amène notre humanité face aux machines.

On peut, après tout, vivre sans le je-ne-sais-quoi, comme on peut vivre sans philosophie, sans musique, sans joie et sans amour.
Mais pas si bien.

[1]A ce propos: je conseille cette trés bonne introduction
3  0 
Avatar de patewing
Membre à l'essai https://www.developpez.com
Le 05/01/2017 à 16:27
L'équipe de deep mind a bien précisé qu'ils se concentraient sur le jeu de stratégie en temps réel : Starcraft II.
ça ne veut pas dire pour autant qu'ils arrêtent tous les processus antérieur comme AlphaGo.

A ce que je sache, la "pratique culturelle du go" c'est de chercher à s'améliorer pour trouver le coup divin (la séquence parfaite du début jusqu'à la fin de la partie).
Même AlphaGo ne l'a pas encore trouvé malgré son niveau extrêmement élevé. Vu le caractère asymptotique de sa progression ce n'est pas pour demain.
3  0 
Contacter le responsable de la rubrique Accueil

Partenaire : Hébergement Web