
En 2017, OpenAI, une association de recherche à but non lucratif en intelligence artificielle dont le but est de promouvoir et développer une IA à visage humain, a développé une IA qui a battu Danylo Dendi, un des meilleurs joueurs de Dota 2. Le match opposant Danylo Dendi et le bot d'OpenAI s’est déroulé en un contre un puisque l’IA était dans le temps rodée pour gérer un seul « héro ». OpenAI déclarait alors que « la prochaine étape du projet est de créer une équipe de bots Dota 2 capable de rivaliser et collaborer avec les meilleures équipes d’humains ».
Cet exploit est réalisé presque un an plus tard quand les chercheurs de l’entreprise californienne ont réussi à intégrer cinq algorithmes différents dans une équipe qu’ils ont appelée « OpenAI Five » et de les faire travailler en équipe. Chaque algorithme a été doté d’un réseau de neurones lui permettant non seulement d’apprendre comment jouer, mais aussi comment coopérer et interagir avec les autres algorithmes. Le 5 août passé, OpenAI Five a réitéré de nouveau l'exploit en battant des joueurs professionnels à Dota 2.
Tout semble donc aller au mieux pour les travaux de recherche d'OpenAI. Cependant, les algorithmes auraient utilisé des approches complètement différentes des habitudes du jeu. Austin Walsh, l'un des joueurs professionnels déchus dit que les bots ont « juste joué différemment ». Les bots d'OpenAI ont passé 180 jours à s’entraîner à Dota 2 pour préparer le match et devaient jouer dans certaines limites très spécifiques. Dota 2 est un jeu compliqué avec plus de 100 héros et certains d'entre eux ont des capacités originales et changeantes. Mais pour ce combat, la réserve de héros était limitée à seulement 18. Ce qui constitue un handicap sérieux, car une grande partie de Dota 2 implique une équipe qui choisit la composition de groupe appropriée et qui réagit à ce que ses adversaires choisissent. Par conséquent, réduire le nombre de héros de plus de 100 à 18 a simplifié les choses pour l'IA.
Les bots OpenAI Five ont également joué à Dota 2 en lisant les informations du jeu directement à partir de son interface de programmation applicative (API) qui permet à d’autres programmes d’interfacer facilement avec le jeu. Cela a permis aux bots d'avoir une connaissance instantanée du jeu alors que les joueurs humains doivent interpréter visuellement un écran. Si un humain était capable de faire cela lors d'un match de compétition contre d'autres humains, ce serait probablement qualifié de tricherie. L'utilisation d'une souris programmable est aussi disqualifiable. Mais Open AI Five joue comme une équipe entière avec des souris programmables.
Pour la défense de Open AI Five, Mark Riedl, professeur associé d'IA et d'apprentissage automatique au Georgia Tech College of Computing dit que « l'API est conçue pour ne pas donner aux bots plus d'informations qu'un humain ». Il poursuit en disant que « ce qu’ils sont capables de savoir, ils le savent parfaitement et instantanément. Ils doivent être sur le même terrain que les humains qui utilisent également leurs yeux ».
Mais Walsh dit que les bots jouent avec une telle confiance, car dit-il, « ils savent exactement l'endroit où se trouve tout le monde, ils savent exactement combien de "pouvoir d'attaque" vous avez. Ils savent exactement combien de dégâts ils peuvent faire entre les trois ou quatre héros qu’ils ont et ils attaquent instantanément au moment où vous vous trouvez dans la mauvaise position ». Toutefois, Walsh pense que lui et son équipe pourraient éventuellement battre l'IA si les conditions étaient plus équitables même si des restrictions étaient imposées.
Source : Vice
Et vous ?




Voir aussi



