AlphaStar, la nouvelle IA de DeepMind, a écrasé des joueurs pro de Starcraft II,
Un jeu vidéo conçu pour défier l'intellect humain

Le , par Bill Fassinou

160PARTAGES

16  0 
L’IA, c’est le sujet qu’on ne présente plus. Son intrusion dans nos vies quotidiennes et cela dans tous les domaines ou presque choque certains. Des futuristes y voient une menace pour la démocratie telle que nous l’a connaissons, certains craignent que tous les emplois de demain ne soient destinés qu’aux machines intelligentes, et d’autres nous mettent en garde contre une époque où l’intelligence artificielle pourra s’améliorer d’elle-même, dépassant ainsi l’homme. Cependant, malgré toutes ces critiques dont elle est victime, les entreprises qui développent cette technologie acclament chaque succès et progrès qu’elles accomplissent.

L’intelligence artificielle semble de jour en jour prête à relever tous les défis que l’homme aura à lui lancer. C’est le cas peut-être de AlphaStar, une IA conçue par DeepMind, une filiale de Google pour tenter de rivaliser avec des professionnels de jeux tels que StarCraft II. DeepMind est une entreprise britannique spécialisée dans l'intelligence artificielle fondée en 2010. Elle est rachetée le 26 janvier 2014 par Google pour plus de 628 millions de dollars américains. L’objectif de DeepMind est de résoudre l'intelligence. Pour atteindre ce but, l'entreprise essaie de combiner les meilleures techniques de l'apprentissage automatique et des neurosciences des systèmes pour construire de puissants algorithmes d'apprentissage généraliste.

L'entreprise souhaite non seulement doter les machines d'une intelligence artificielle performante, mais aussi comprendre le fonctionnement du cerveau humain. Pour les entreprises qui développent des outils dotés d’intelligence artificielle, il faut trouver la meilleure manière de rendre sa solution plus performante. Pour cela, la complexité retrouvée dans les jeux de stratégie en temps réel (RTS) constitue un atout important comme l’explique DeepMind sur son site Web.


« Les jeux sont utilisés depuis des décennies comme un moyen important de tester et évaluer les performances des systèmes d’intelligence artificielle. Au fur et à mesure que les capacités de l’IA augmentent, la communauté des chercheurs a recherché des jeux de plus en plus complexes qui capturent différents éléments d’intelligence nécessaires à la résolution de problèmes scientifiques et réels. Ces dernières années, StarCraft est considéré comme l'un des jeux de stratégie en temps réel les plus difficiles et l'un des jeux les plus joués de tous les temps. Il s'est imposé par consensus comme un “grand défi” pour la recherche sur l'IA ».

AlphaStar répond aux mêmes critères de construction que les précédentes solutions de DeepMind. Il base son apprentissage essentiellement sur un réseau de neurones qui reçoit des données d'entrée de l'interface de jeu brute (une liste d'unités et de leurs propriétés) et génère une séquence d'instructions constituant une action dans le jeu. Des informations plus utiles et plus détaillées sur sa conception et son mécanisme de fonctionnement sont présentées par DeepMind sur son site Web. Cependant, AlphaStar a, peut-on dire, réussi la mission qui est la sienne à savoir battre des joueurs professionnels du très célèbre StarCraft II.

Il est donc devenu la première intelligence artificielle à réaliser cet exploit. Connaissez-vous ce jeu de stratégie publié pour la première fois sur PC en 2010 ? Sinon, pour un petit rappel, StarCraft II est créé par Blizzard Entertainment. Il s'inscrit dans un univers fictif de science-fiction et propose un gameplay riche et multi-couches conçu pour défier l'intellect humain. A ce jeu, l’IA de DeepMind a battu à plusieurs reprises, dans une série de matchs, des joueurs professionnels tels que Grzegorz Komincs et Dario Wünsch classés respectivement 13e et 42e sur la liste des joueurs professionnels dans le monde sur un référentiel centralisé des wikis de Liquipedia.


DeepMind a tenu à expliquer que le choix s’est porté sur ce jeu compte tenu de sa complexité et que son IA a obtenu ce résultat notamment grâce son réseau de neurones qui lui confère les capacités d’un apprentissage supervisé et d’un apprentissage par renforcement. En intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome (robot, etc.), à apprendre à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps. L'agent est plongé au sein d'un environnement et prend ses décisions en fonction de son état courant.

En retour, l'environnement procure à l'agent une récompense, qui peut être positive ou négative. L'agent cherche au travers d'expériences itérées, un comportement décisionnel (appelé stratégie ou politique, et qui est une fonction associant à l'état courant l'action à exécuter) optimal, en ce sens qu'il maximise la somme des récompenses au cours du temps. Pour finir son argumentaire, DeepMind a indiqué que l’objectif premier d’un tel travail n’est pas simplement de réussir à battre des humains dans un jeu de stratégie, mais de mesurer à quel point les techniques de conception et les algorithmes de l’intelligence artificielle ont évolué. Grâce à cela, l’entreprise estime qu’à l’avenir, il sera possible de concevoir des agents d’IA capables d’exécuter des tâches intelligentes comme un être humain ainsi que d’autres tâches selon l’environnement dans lequel elle se trouvera.

Rappelons qu'en 2016, après AlphaGo, l’IA de Google DeepMind qui avait terrassé Lee Sedol, l’un des meilleurs joueurs de Go au monde, la filiale de Google, voulait déjà tester ses recherches en intelligence artificielle dans des domaines plus complexes, et c’est celui des jeux vidéo qui a été choisi. Le 4 novembre, lors de l’événement BlizzCon 2016 du studio Blizzard Entertainment, DeepMind avait annoncé une collaboration avec la société de développement de jeux vidéo basée en Californie pour ouvrir le jeu StarCraft II aux chercheurs en IA et en apprentissage automatique partout dans le monde.

En d’autres termes, StarCraft II était devenu le nouveau domaine dans lequel DeepMind avait décidé de tester ses recherches en intelligence artificielle. Les compétences acquises dans cet environnement plus complexe pourront ensuite être transférées dans le monde réel. En effet, « StarCraft est un environnement de test intéressant pour la recherche actuelle en IA, car il fournit un pont utile pour la complexité du monde réel », explique Google DeepMind. Et d’ajouter que : « les compétences nécessaires à un agent pour progresser dans l'environnement et bien jouer à StarCraft pourraient finalement être transférées à des tâches réelles ».

Sources : DeepMind, Liquipedia

Et vous ?

Qu'en pensez-vous ?

Voir aussi

L'intelligence artificielle menace-t-elle la démocratie dans le monde ? Oui, selon un conseiller principal à la Commission européenne

Après le jeu de Go, Google DeepMind veut tester une intelligence artificielle dans StarCraft II, un jeu vidéo de stratégie en temps réel

Google absorbe l'unité de santé de DeepMind pour transformer son application mobile Streams en assistant boosté à l'IA pour infirmières et médecins

70 % des projets d'IA dans le commerce numérique sont couronnés de succès d'après un sondage réalisé par Gartner

Des chercheurs du MIT créent la première intelligence artificielle psychopathe pour illustrer le problème de biais des données nourries aux IA

Une erreur dans cette actualité ? Signalez-le nous !

Avatar de codec_abc
Membre confirmé https://www.developpez.com
Le 26/01/2019 à 13:16
J'ai regardé les parties et il faut encore relativiser sur les capacités de la machine. Pour faire simple, sur Starcraft II un joueur compétent doit maitriser 2 aspects:

Le "macro game": C'est la capacité à gérer ses workers, développer ses bases, scouter l'ennemie, analyser la situation et prendre des décisions en fonctions.
La "micro game": C'est la capacité à gérer les unités par petits groupes (voire de manière individuelle) lors des combats pour maximiser leur efficacité. Par exemple, lors d'un combat si un missile arrive dans vos unités et que vous n'avez pas le temps de l’éviter: Vous avez tout intérêt a faire reculer toutes les unités immédiatement. Puis vous prenez une unité, idéalement peu couteuse, pour l'envoyer dans le missile pour la sacrifier et ne pas prendre de dégâts sur les autres.

Pour avoir regardé certaines games, l'IA de DeepMind a une macro game correcte (bien qu'en dessous de ce que font les joueurs humains) et une micro game largement meilleur que tout humain. Et cela se prouve par le nombre d'actions par minutes (APM). C'est une moyenne flottante qui décrit le nombre d'actions qu'un joueur fait sur un intervalle de temps donné. L'humain étant physiquement limité, les meilleurs pro montent (souvent lors des combats) autour de 600-800 APMs dans les situations les plus tendues. DeepMind grâce à ses capacités de machine est arrivé jusqu'à 1500 APMs. De plus, il faut voir que sur l'intégralité des actions exécutés par un humain il en aura certaines qui ne seront pas efficaces (clics ratés, mauvaise touche, etc...) la ou l'IA de DeepMind fera exactement ce qu'elle veut.

Bref, l'IA de DeepMind a montré un comportement intéressant mais a gagné grâce à ses habilitées sur-humaines (temps de réaction, précision, exécution parfaite et immédiate, etc...) et non pas grâce à son intelligence.
Avatar de melka one
Membre éprouvé https://www.developpez.com
Le 26/01/2019 à 13:23
un jour on verra un article avec un titre du genre l'IA l'arnaque publicitaire du moment.
Avatar de Uther
Expert éminent sénior https://www.developpez.com
Le 26/01/2019 à 13:31
Citation Envoyé par codec_abc Voir le message
L'humain étant physiquement limité, les meilleurs pro montent (souvent lors des combats) autour de 600-800 APMs dans les situations les plus tendues. DeepMind grâce à ses capacités de machine est arrivé jusqu'à 1500 APMs. De plus, il faut voir que sur l'intégralité des actions exécutés par un humain il en aura certaines qui ne seront pas efficaces (clics ratés, mauvaise touche, etc...) la ou l'IA de DeepMind fera exactement ce qu'elle veut.
Tu es sur de ce que tu avances ?
Autant je suis d'accord qu’au niveau efficacité l'IA n'étant pas l'imité par l'IHM, elle a probablement 100% de ses actions efficace. Par contre j'avais lu que le nombre d'APM était bien en dessous d'un joueur humain pro.
Avatar de Jex974
Membre à l'essai https://www.developpez.com
Le 26/01/2019 à 15:11
Oui, ils ont annoncé qu'ils ont volontairement bridé les APM justement pour ne pas que ce soit un biais. Après c'est clair qu'il y a un max de marketing et d'effets d'annonce derrière. Toujours est-il qu'on progresse et qu'on arrive à faire aujourd'hui ce qu'on pensait impossible il y a 10 ans (gagner au Go et aux jeux "stratégiques". Le terme IA est biaisé et à la fin ce ne sont que des algo. Mais entre la puissance des ordi de maintenant et l'amélioration de ces algo, les champs des possibles sont plutôt sympa je trouve
Avatar de codec_abc
Membre confirmé https://www.developpez.com
Le 26/01/2019 à 19:00
Citation Envoyé par Uther Voir le message
Tu es sur de ce que tu avances ?
Autant je suis d'accord qu’au niveau efficacité l'IA n'étant pas l'imité par l'IHM, elle a probablement 100% de ses actions efficace. Par contre j'avais lu que le nombre d'APM était bien en dessous d'un joueur humain pro.
Elle est en dessous en moyenne. Sur les moments clés elle monte bien à

D'ailleurs, il y a un passage ou un joueur pro dit "It's micro [NDLR:AlphaStar] starts to get ridiculous" ce qui veut dire que son micro management d'unités est tellement bon que ça en devient ridicule/risible.
Avatar de arond
Membre expérimenté https://www.developpez.com
Le 28/01/2019 à 10:49
après il serait important de préciser que l'IA a fait deux types de matchs premier type de match l'IA a accès à une vision de toute la carte l'humain c'est fait rouler dessus.

Deuxième type de match ou le broullard de guerre était en place la l'ia a perdu un match sur 5
Avatar de darklinux
Membre actif https://www.developpez.com
Le 28/01/2019 à 14:24
Citation Envoyé par codec_abc Voir le message
Elle est en dessous en moyenne. Sur les moments clés elle monte bien à

D'ailleurs, il y a un passage ou un joueur pro dit "It's micro [NDLR:AlphaStar] starts to get ridiculous" ce qui veut dire que son micro management d'unités est tellement bon que ça en devient ridicule/risible.
Google à limité ces APM ... AlphaStar à de la marge , il peux encore grimpé , pas un coréen de 22 ans s ' entraînant 18 heures sur vingt quatre , une IA ne connais ni la fatigue , ni la faim , ni l '' envie de sexe ... l ' IA gagne au finish . Je ne pense pas que l ' IA finisse en buzzwords à la mode blockchain .
Avatar de CoderInTheDark
Membre expérimenté https://www.developpez.com
Le 30/01/2019 à 0:33
Pardon, je suis quand même curieux de savoir comment il joue.
Moi j'avai joué à Starcraft et broodwar.

Et si sa méthode c'est de prendre les zerg et de produire un max dd'unité et d'attaquer dès le début c'est pas forcément glorieux.
Moi ça m'agaçait ce jeu sans finesse stratégique
Avatar de Uther
Expert éminent sénior https://www.developpez.com
Le 30/01/2019 à 14:16
Se limiter au rush zergling ultra-rapide, ça marche bien contre les débutants, mais ça ne peut pas marcher sur des professionnels. Au contraire, une fois que tu as appris a gérer ça, et que tu t'y attend, c'est une victoire facile.

Ce genre de technique d'attaque rapide (on appelle ça un cheese) peut éventuellement être utilisé à haut niveau pour surprendre un adversaire imprudent. Mais un humain, comme une IA, qui jouerait avec une seule stratégie est plutôt facile a contrer.

En l’occurrence, l'IA a joué des parties plutôt classiques avec des valeurs d'armées moyennes.
Avatar de Matthieu Vergne
Expert éminent https://www.developpez.com
Le 02/02/2019 à 22:40
Je n'ai jamais joué à Starcraft (bien que je connaisse le principe par d'autres jeux du même style). Ce n'est d'ailleurs pas mon style de jeu donc je n'ai aucune compétence pour juger de la qualité de jeu autrement qu'en disant qui a battu qui. Cela dit, j'ai lu l'article et regardé la vidéo, et plusieurs points sont à relever.

Tout d'abord, un résumé du contexte :
- le jeu s'est déroulé avec 1 seule race (les Protoss)
- le jeu s'est déroulé sur 1 seule map (Catalyst LE)
- l'IA a été entraînée au préalable
- 5 parties ont d'abord été jouées contre un pro Zerg, qui a accepté de jouer Protoss
- l'IA a encore été entraînée
- 5 parties ont ensuite été jouées contre un pro Protoss

De là on peut déjà en tirer plusieurs points :
- aucun avantage particulier lié à des choix avant partie (e.g. choix des races, de la carte, etc.) et tout est connu à ce niveau là, à contrario d'une partie typique j'imagine. On enlève donc des inconnues des deux côtés, joueur comme IA.
- l'IA est par contre hyper spécialisée pour 1 race et 1 carte. Il y a fort à parier qu'à quantité d'entraînement équivalent, elle aurait été moins performante si elle avait dû apprendre sur plusieurs maps et pour plusieurs races (surtout avec la combinatoire). Est-ce que ça aurait fait une différence dans qui gagne à la fin, ça par contre on ne peut pas le savoir.
- le pro Zerg avait un handicap alors que le pro Protoss n'en avait pas, on pouvait donc s'attendre à un meilleur résultat humain dans le second cas mais, avec l'entraînement supplémentaire entre parties, rien n'était moins sûr.

Les résultats ont été les suivants :
- AlphaStar a battu le pro Zerg 5-0
- AlphaStar a battu le pro Protoss 5-0

Dans les faits, c'est donc une victoire écrasante.

Cependant, la vidéo annonce bien des subtilités d'AlphaStar :
- AlphaStar avait une vision d'ensemble de la map, pas une vision caméra. Les actions de l'IA sont montrés avec un "équivalent caméra", où ils plaçaient la caméra là où l'IA jouait pour faire comme si, et on pouvait voir par exemple que l'IA faisait des allers retours extrêmement brefs entre un combat et sa base.
- Bien qu'on parle d'AlphaStar au singulier, le fait est que chacune des 5 parties était une instance différente d'AlphaStar. En l'occurrence, les gens de DeepMind savait qu'ils allaient faire 5 parties, et ils ont donc pris 5 instances parmi leur top, une pour chaque partie. De fait, le seul joueur humain a joué contre 5 joueurs IA, chacun spécialisé dans une stratégie différente.
- L'entraînement d'AlphaStar était équivalent à 200 ans de jeu avant le pro Zerg. Il a été poursuivi avant de jouer contre le pro Protoss.
- L'IA a montré par moment une micro-gestion qu'un humain n'aurait sans doute pas pu faire (si j'en crois les commentateurs), tel qu'encercler un groupe d'unités ennemies en l'attaquant sur 3 fronts à la fois, avec une micro-gestion très efficace sur les 3 fronts en même temps.
- Une dernière partie a été jouée en bonus contre le pro Protoss, où ils ont repris une version entraînée depuis zéro et avec la caméra en plus à gérer. DeepMind affirme que, selon leur méthode d'évaluation, elle a atteint le même niveau que les autres, mais se ils refusent à affirmer que ce soit une preuve de performance équivalente. L'humain a gagné, mais impossible donc de dire si c'était une exception, si c'était à cause de la remise à zéro, ou si c'était à cause du "fardeau" supplémentaire de la caméra.

Ce que j'en retiens :
- des avantages machines restent à retirer pour la rendre comparable à un humain
- l'hyper spécialisation de l'IA (race, map, stratégie) était clairement en sa faveur.
- la quantité d'entraînement de l'IA est sans commune mesure avec celle d'un humain.

En bref, AlphaStar est ici un joueur hyper spécialisé de 200 ans d'expérience, avec encore des avantages machine. Il n'y a donc aucune honte à perdre contre un monstre pareil.

Que dire quant aux avancées en IA ?
- Par ces résultats, DeepMind montre qu'une IA est capable d'obtenir une expertise de jeu de très bon niveau sur un jeu de type StarCraft.
- Néanmoins, avant de pouvoir dire qu'il bat l'humain à StarCraft, il y a de la combinatoire à rajouter. Notamment, il faudrait n'avoir qu'une seule instance, capable de jouer n'importe quelle race, contre n'importe quelle race, sur n'importe quelle map. C'est d'ailleurs leur objectif actuel.
- En terme d'intelligence par contre, ça ne montre rien du tout : faire jouer un humain de quelques dizaines d'années d'expérience contre un humain de plus de 200 ans cumulé, personne ne s'étonnerait de voir gagner le second. Il faudra gagner avec une quantité d'entraînement comparable avant de pouvoir dire que l'IA atteint un niveau humain.
Contacter le responsable de la rubrique Accueil

Partenaire : Hébergement Web