« Alors que la manipulation habile des objets est une tâche quotidienne fondamentale pour les humains, elle reste difficile pour les robots autonomes », déclarent les chercheurs dans leur rapport. « Les robots modernes sont généralement conçus pour des tâches spécifiques et sont pour la plupart incapables d'utiliser des effecteurs complexes. Dans ce travail, nous démontrons des méthodes pour former des stratégies de contrôle qui effectuent des manipulations et les déploient sur un robot physique », ont-ils ajouté.
Les chercheurs décrivent un système utilisant un modèle de renforcement où l'algorithme apprend (en essayant et en échouant) à diriger les mains d’un robot pour saisir et manipuler des objets avec une certaine précision. Le système a été formé de manière entièrement numérique dans une simulation informatique et n'a pas reçu de démonstrations humaines. En effet, les chercheurs se sont servis du moteur de MuJoCo pour simuler un environnement physique dans lequel un vrai robot pourrait fonctionner d’une part, et d’Unity pour rendre des images formant un modèle de vision par ordinateur pour reconnaître des poses d’autre part.
Une méthode qui, selon l’équipe de chercheurs, n’est pas parfaite puisque la simulation reste simplement une approximation de la configuration physique, ce qui pourrait rendre improbable la production de systèmes qui se traduit bien dans le monde réel. Ils ont résolu ce problème en randomisant certains aspects de l’environnement notamment sa physique (friction, gravite, limites des articulations, dimensions de l’objet) et son aspect visuel (conditions d’éclairage, poses des mains et des objets, matériaux et textures).
Partant de là, il restait à entraîner le système (un réseau de neurones récurrent). Et pour ce faire, les chercheurs ont utilisé 384 machines, chacune avec 16 cœurs de processeurs leur permettant de générer environ deux ans d'expérience simulée par heure. Ensuite, ils ont optimisé le système pour former un réseau de neurones à convolution qui aurait permis de prédire la position et l'orientation des objets dans la main du robot à partir de trois images simulées. Ils ont procédé par la suite à deux tests de validation. Ils se sont servis d’une Shadow Dexterous Hand, une main robotique avec cinq doigts et un total de 24 degrés de liberté, montée sur un cadre en aluminium pour manipuler des objets.
Deux ensembles de caméras de capture de mouvement et caméras RVB ont permis au système de suivre la rotation et l’orientation des objets. Bien que la Shadow Dexterous Hand ait des capteurs tactiles, l'équipe de chercheurs a délibérément choisi de n'utiliser que ses capacités de détection conjointe pour exercer un contrôle précis sur les positions des doigts. Dans le premier test, les algorithmes ont été chargés de réorienter un bloc étiqueté avec des lettres de l'alphabet. L'équipe a choisi un objectif aléatoire, et chaque fois que l'IA l'a atteint, elle en a défini un nouveau jusqu'à ce que le robot lâche le bloc, passe plus d'une minute à manipuler le bloc ou atteigne 50 rotations réussies. Dans le second test, le bloc a été remplacé par un prisme octogonal.
Les tests ont abouti à des résultats impressionnants. Les modèles ne se sont pas contentés de présenter des performances, mais ils ont également découvert des types de préhension observés chez les humains comme le trépied (une prise avec le pouce, l'index et le majeur), la prismatique (une prise dans laquelle le pouce et un autre doigt s’opposent) et la prise de pincement d'extrémité. Ils ont également appris comment faire pivoter et glisser les doigts de la main du robot et comment utiliser les forces de gravitation, de translation et de torsion pour insérer l'objet dans la position désirée.
« Notre système peut non seulement découvrir les préhensions trouvées chez les humains, mais les adapter pour mieux correspondre aux limites et aux capacités de son propre corps », ont déclaré les chercheurs. Cependant, le système est loin d’être parfait. Il n’est pas formé pour gérer plusieurs objets et les performances varient parfois de la simulation à la réalité. Mais pour les chercheurs, les résultats obtenus prouvent le potentiel des algorithmes contemporains de deep learning. « Ces algorithmes peuvent être appliqués à la résolution de problèmes complexes de robotique dans le monde réel qui sont hors de portée des approches non basées sur l'apprentissage », ont-ils conclu.
Source : Rapport de la recherche
Et vous ?
Qu’en pensez-vous ?
Quels pourraient être selon vous les domaines d'application de cette technologie ?
Voir aussi
OpenAI d'Elon Musk crée une IA capable de battre des humains sur Dota 2, un jeu vidéo de type arène de bataille en 3D
Cinq algorithmes d'IA font équipe pour écraser des humains au Dota 2, un jeu d'équipe connu pour être extrêmement compliqué
Les chercheurs en intelligence artificielle peuvent-ils gagner jusqu'à 1 million $ par an dans la Silicon Valley ? Un aperçu des salaires
OpenAI conçoit un algorithme basé sur l'IA qui permet à un robot d'imiter des tâches réalisées par des humains dans un environnement virtuel
Chicago choisit une startup d'Elon Musk pour créer son Express Loop, un système de transport souterrain à grande vitesse qui pourrait exploiter l'IA