Developpez.com

Le Club des Développeurs et IT Pro

IA : DeepMind et Blizzard publient des outils open source pour la R&D autour d'agents d'apprentissage

Du jeu de stratégie StarCraft II

Le 2017-08-10 14:44:09, par Patrick Ruiz, Chroniqueur Actualités
On sait depuis novembre 2016 que Google DeepMind s’intéresse à StarCraft II, le jeu de stratégie de la société Blizzard. Les deux sociétés viennent de franchir le cap en publiant des outils permettant aux chercheurs en intelligence artificielle de lancer des agents d’apprentissage sur le jeu de stratégie et de les rôder.

« Tester nos agents sur des jeux qui n’ont pas été spécialement conçus pour la recherche en intelligence artificielle et que des humains jouent bien est crucial pour l’évaluation de leurs performances. C’est pourquoi, en partenariat avec Blizzard entertainment, nous sommes heureux d’annoncer la sortie d’un ensemble d’outils qui, nous l’espérons, vont accélérer la recherche dans le jeu de stratégie en temps réel StarCraft II », peut-on lire dans le communiqué de Google DeepMind.

Passé le succès avec l’intelligence artificielle AlphaGo qui a vaincu le champion du monde du jeu de Go à deux reprises, Google DeepMind s’attaque à plus lourd. Les défis à relever ici sont bien plus complexes. Lors de l’événement Blizzcon 2016, la société avait dressé un éventail des difficultés au-devant desquelles elle savait aller dans ce projet. Elle avait notamment fait état de l’observabilité partielle de l’environnement du jeu ou des aspects temps réel qu’une IA « joueuse de StarCraft » devrait être capable de prendre en compte.

Ce partenariat, annoncé il y a neuf mois, débouche donc sur un ensemble d’outils permettant d’améliorer les capacités de l’IA qui a vaincu le champion du monde du jeu de Go. L’équipe de Google DeepMind, mais également les chercheurs en intelligence artificielle de tous bords disposent désormais d’une API qui, comme l’annonce la société Blizzard, « va désormais fournir de puissants outils aux chercheurs, joueurs et amateurs, leur permettant d’utiliser le jeu comme une plateforme d’avancement de la recherche en matière d’intelligence artificielle ».

Les outils mis à la disposition de la communauté comprennent des exemples qui permettent de voir quelle est l’avancée des développements des deux sociétés. Les expériences menées par ces dernières ont été consignées sous la forme de sessions de jeu miniatures sur lesquelles les agents d’apprentissage sont évalués.

« Nos investigations initiales montrent que nos agents se comportent bien dans le cadre de ces sessions de jeu miniatures. Seulement, lorsqu’il s’agit du jeu en entier, même des agents plus sophistiqués comme A3C échouent dans une confrontation avec la plus simple des IA du jeu. Par exemple, la vidéo ci-dessous montre un agent non entraîné (à gauche) n'arrive pas à maintenir ses récolteurs pour miner des ressources, une tâche que les humains trouvent triviale », écrit l’équipe de Google DeepMind.


« Bien que nous ayons inclus des exemples de code et des bots, nous tenons à souligner que la mise à disposition de ces outils pose le premier jalon de la recherche sur l’intelligence artificielle dans StarCraft II. Au fil du temps, ce sont votre créativité, votre ingéniosité et votre labeur qui orienteront ce projet et ses résultats. Nous sommes impatients de voir dans quelle direction la communauté nous entraînera ! », a conclu Blizzard entertainment.

Sources : Communiqué DeepMind, Communiqué Blizzard

Et vous ?

Qu’en pensez-vous ?

Voir aussi :

DeepMind développe une intelligence artificielle capable d'apprendre à jouer à 49 jeux Atari 2600
  Discussion forum
39 commentaires
  • solstyce39
    Membre confirmé
    Une fois la machine bien rodée, elle sera intouchable par les humains, la micro fera facilement la différence, sans compter la partie scouting qui a déjà été abordée auparavant.
  • kopbuc
    Membre régulier
    Ça va être l'occasion d'évaluer l'IA dans un environnement en temps réel et non au tour par tour comme au Go sur un jeu assez complexe, on verra ce que ça va donner.
  • 10_GOTO_10
    Membre expérimenté
    L'IA a déjà gagné dans un jeu de stratégie temps réel contre des humains, c'était en ... 1981 (avec les ordinateurs de l'époque, bien sûr).

    EURISKO

    Le but de Doug Lenat et de son équipe, consistait à réaliser un logiciel d'heuristique générale, programme ambitieux capable de réaliser des apprentissages indépendants du domaine d'application. Traveller fut le premier domaine que l’on donna en pâture à Eurisko, avec un objectif : gagner !
  • RyzenOC
    Inactif
    Le problème avec ces IA c'est quelle ne sont pas au même niveau que l'hommes.

    Ces IA ont un accès directes aux données du jeu, l'homme lui doit regarder l'écran et utiliser l'ihm du jeu pour jouer et taper sur le clavier pour exécuter des actions, ce qui le ralentie et ne lui permet pas de voir toutes les données.
    Un exemple typique, si dans europa universalis 4 j'avais toutes les données en temps réel de mon empires enregistré dans un tableau excel avec des macro pour automatisé certaines actions, je serais 1000 fois plus efficace en jeu.

    Pour respecter l'équité il faudrait que l'ia soit externe à la machine, que se soit une caméra et 2 bras mécanique qui analyse l'écran et tape sur un clavier/souris.
  • Daïmanu
    Membre émérite
    Envoyé par RyzenOC
    Le problème avec ces IA c'est quelle ne sont pas au même niveau que l'hommes.
    Tout à fait, surtout si les APM (Actions Par Minutes) ne sont pas bridés. Apparemment l'IA serait capable de monter à 30 000 APM (500 par secondes !!) là où le meilleur joueur coréen arrive à peine à 600 APM en pointe et 200 / 300 en temps normal.

    Envoyé par RyzenOC
    Ces IA ont un accès directes aux données du jeu
    Non, l'IA a accès aux mêmes informations qu'un joueur, le brouillard de guère empêche l'accès à toutes les informations. Par contre l'IA sera certainement capable d'analyser les images beaucoup plus rapidement qu'un humain, et le scout (la recherche d'informations sur la stratégie de l'adversaire) sera facilité.

    Il faut absolument que DeepMind soit bridé en terme d'APM, de micro-gestion (gestion individuelle des unités) et de déplacement de caméra pour que l'affrontement soit viable !
  • Matthieu Vergne
    Expert éminent
    Envoyé par 10_GOTO_10
    L'IA a déjà gagné dans un jeu de stratégie temps réel contre des humains, c'était en ... 1981 (avec les ordinateurs de l'époque, bien sûr).

    EURISKO
    Je ne connaissais pas celui-là. Très intéressant. {^_^}

    Envoyé par RyzenOC
    Le problème avec ces IA c'est quelle ne sont pas au même niveau que l'hommes.

    Ces IA ont un accès directes aux données du jeu, l'homme lui doit regarder l'écran et utiliser l'ihm du jeu
    Comme l'a précisé Daïmanu, l'IA aussi utilise l'IHM du jeu, justement. Autrement cela perdrait tout son intérêt marketing car les joueurs auraient tôt fait de critiquer la différence monumentale d'accessibilité. Par contre, la machine va avec sa propre rapidité, elle n'est pas artificiellement bridée, mais cela me semble normal : on ne bride pas un expert humain si on souhaite le comparer à un novice, sous prétexte que le novice, lui, serait moins rapide. La rapidité de décision est un facteur de performance aussi. la machine a certes du gros CPU, mais nous aussi on fait du traitement hautement parallélisé au travers de notre cerveau. Brider les actions par minutes est donc discutable, tout dépend de ce qu'on souhaite vraiment évaluer.
  • RyzenOC
    Inactif
    Envoyé par Matthieu Vergne
    Je ne connaissais pas celui-là. Très intéressant. {^_^}

    Comme l'a précisé Daïmanu, l'IA aussi utilise l'IHM du jeu, justement. Autrement cela perdrait tout son intérêt marketing car les joueurs auraient tôt fait de critiquer la différence monumentale d'accessibilité. Par contre, la machine va avec sa propre rapidité, elle n'est pas artificiellement bridée, mais cela me semble normal : on ne bride pas un expert humain si on souhaite le comparer à un novice, sous prétexte que le novice, lui, serait moins rapide. La rapidité de décision est un facteur de performance aussi. la machine a certes du gros CPU, mais nous aussi on fait du traitement hautement parallélisé au travers de notre cerveau. Brider les actions par minutes est donc discutable, tout dépend de ce qu'on souhaite vraiment évaluer.
    l'ia déplace (logiciellement, pas physiquement) le curseur de la souris et insère des touches clavier ? et fait de la reconnaissance d'image avec ce qu'elle stream de l'écran ?
    si oui, dans ce cas je n'ai rien dit.
  • Matthieu Vergne
    Expert éminent
    La souris, je pense pas, plutôt une API équivalente (on va appeler une fonction correspondant au clic sur un bouton), par contre oui c'est du traitement d'image en entrée. Pas des accès BDD par exemple.
  • BufferBob
    Expert éminent
    dans le même genre on trouve un certain Elon Musk, qui 2h après avoir tweeté qu'il fallait prendre garde aux terminators tweetait les trucs cools qu'ils font chez OpenAI, sa société spécialisée en intelligence artificielle, et en l'occurrence autour du jeu Dota 2