Des chercheurs développent des algorithmes qui permettent à un robot d'apprendre de ses erreurs

Un peu comme le font les humains

Le 28 mai 2015 à 06:33, par Michael Guilloux

105PARTAGES

Des chercheurs développent des algorithmes qui permettent à un robot d’apprendre de ses erreurs
Un peu comme le font les humains

La recherche dans le domaine de l’intelligence artificielle (IA) a permis à des chercheurs de créer des robots capables d’exécuter des actions parfois impressionnantes, et dans certains cas, mieux que les humains. Mais l’intelligence artificielle reste toutefois limitée par le fait que les actions exécutées par ces automates sont préprogrammées. Par conséquent, il est impossible pour les robots d’exécuter des tâches en dehors d’un ensemble d’actions spécifiques ou lorsqu’ils sont confrontés à quelque de chose de nouveau.

Cette limite pourrait disparaître dans la prochaine décennie avec les récents travaux de chercheurs de l’Université de Californie, Berkeley. En effet, ces chercheurs ont développé des algorithmes pour permettre à un robot d’apprendre à réaliser des tâches en s’améliorant au fur et à mesure qu’il commet des erreurs, alors qu’il essaie d’accomplir les tâches. Il s’agit d’une avancée importante dans le domaine de l’IA, car cela signifie que les robots pourront apprendre à exécuter des tâches qui ne sont pas initialement programmées.

« Ce que nous rapportons ici est une nouvelle approche pour permettre à un robot d'apprendre », a expliqué le professeur Pieter Abbeel du département de génie électrique et sciences informatiques de l'UC Berkeley, dans un communiqué la semaine dernière. « La clé est que lorsqu'un robot est confronté à quelque chose de nouveau, nous ne devrons pas le reprogrammer ». Le même code qui dicte les actions à l’automate « a été utilisé pour permettre au robot d'apprendre toutes les différentes tâches que nous lui avons données », a-t-il ajouté.

Leurs travaux devraient donc permettre à des robots de s’adapter aux environnements en constante évolution et d’exécuter des tâches qui n’étaient pas prévisibles. « La plupart des applications robotiques sont dans des environnements contrôlés où les objets sont en positions prévisibles », a déclaré Trevor Darrell qui dirige le projet avec le professeur Abbeel. « Le défi de mettre des robots dans des situations réelles, comme les maisons ou les bureaux, est que ces environnements sont en constante évolution. Le robot doit être capable de percevoir et de s'adapter à son environnement. » L’équipe est également composée de Sergey Levine, chercheur postdoctoral et d’un étudiant en PhD, Chelsea Finn.

Dans les expériences, les chercheurs ont travaillé avec un robot surnommé BRETT (Berkeley Robot for the Elimination of Tedious Tasks). Pour modéliser l'apprentissage humain, l'équipe a eu recours au Deep Learning. Il s’agit d’un nouveau domaine de recherche en Machine Learning, qui a été introduit dans le but de rapprocher le Machine Learning de l'IA. Le Deep Learning utilise une approche qui permet à un réseau neuronal artificiel d'extrapoler, à partir d'une base de connaissances, l'apprentissage sans programmation supplémentaire par un humain.

Cette technique a permis à BRETT d’apprendre à réaliser certaines tâches motrices telles que mettre un cintre sur une grille, assembler un avion en jouet, visser un bouchon sur une bouteille d'eau et plus encore, sans pré-programmation.

Pour permettre au robot de Berkeley de s’améliorer, les chercheurs lui ont associé un système de notation qui attribue des points à BRETT selon que les mouvements qu’il exécute le rapprochent de l’accomplissement de la tâche ou non. BRETT essaie plusieurs mouvements, et aux meilleurs gestes, sont affectés des scores élevés. Ces scores sont communiqués au robot en temps réel de sorte qu’il puisse savoir que le mouvement qu’il vient d’exécuter est bon ou mauvais. BRETT peut ainsi procéder par élimination et n’exécuter que les mouvements qui le rapprochent de l’accomplissement de la tâche.

Avant d’exécuter une tâche, le robot doit pouvoir l’identifier dans un premier temps et localiser les objets nécessaires à l’accomplissement de la tâche. Si les informations sur la tâche et l’emplacement des objets lui sont fournies, les expériences montrent que BRETT peut réaliser chaque tâche en environ 10 minutes. Dans le cas où il doit lui-même identifier la tâche et localiser les objets, il lui faudra environ 3h. Mais les chercheurs pensent que le temps de réalisation d’une tâche peut être considérablement réduit avec un plus grand volume de données.

Les derniers développements seront présentés ce jeudi 28 mai à Seattle à la Conférence internationale sur la robotique et l'automatisation (ICRA). Les travaux ne sont qu’à leurs débuts, mais les chercheurs sont très optimistes quant à l’impact de leur recherche dans un futur proche.

« Nous avons encore un long chemin à parcourir avant que nos robots puissent apprendre à nettoyer une maison ou trier la lessive », a dit Abbeel ; « mais nos résultats initiaux indiquent que ces types de techniques de Deep Learning peuvent avoir un effet transformateur en termes de permettre aux robots d'apprendre des tâches complexes entièrement à partir de zéro. Dans les cinq à dix prochaines années, nous pourrions voir des progrès significatifs dans les capacités d'apprentissage des robots », a-t-il déclaré.

Source : Berkeley News Center

Et vous ?

Qu’en pensez-vous ?

Vous avez lu gratuitement 844 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :