Developpez.com

Plus de 2 000 forums
et jusqu'à 5 000 nouveaux messages par jour

LEVAN : un système informatique en mesure d'apprendre tout sur n'importe quoi
Un pas en avant pour l'IA grâce à la supervision par le web ?

Le , par Arsene Newman, Expert éminent sénior
Nombreux sont les domaines de l’informatique qui connaissent un essor important et une évolution continue grâce aux différents travaux de recherche. C’est le cas, par exemple, de l’intelligence artificielle, qui est portée par des projets innovants comme le projet LEVAN.

Ce dernier est un système informatique capable d’apprendre par lui-même différents concepts relevant de toutes les disciplines et thématiques. En clair, il est capable d’apprendre tout sur n’importe quoi, d’où son appellation fort éloquente, LEVAN, abréviation de Learn EVerything about ANything. Il a été développé par un groupe de chercheurs de l’institut Allen pour l’intelligence artificielle de l’Université de Washington.


LEVAN se base sur ses capacités d’indexation des moteurs de recherche et d’analyse de leurs données grâce à sa compréhension du langage naturel et à des techniques informatiques d’interprétation de l’imagerie.

Cette complexité pourrait faire dire par plus d’un que le projet est supervisé par un être humain. Toutefois, ce n’est pas le cas. Le projet est supervisé grâce à une nouvelle approche dite de supervision par le web (webly supervised).

Concrètement, cela implique le recours du système à différentes sources pour apprendre de nouveaux concepts. Un scénario d’apprentissage typique serait le suivant : LEVAN parcourt l’outil Google Books Ngrams à la recherche de phrases associées à un concept particulier. Par la suite, il effectue une recherche avec les précédents résultats en entrée sur différents portails web d’images, comme Google Images, Bing et Flickr.


Un tel scénario permet à LEVAN d’associer Mohamed Ali, Ring de boxe à un concept plus large qui est la boxe. Un autre exemple serait l’association dans un premier temps de Mohandas Gandhi et Mahatma Gandhi à Gandhi, puis dans un second temps, il serait en mesure de savoir que Mohandas Gandhi et Mahatma Gandhi représentent la même personne, le même concept, grâce à ses capacités d’interprétation de l’imagerie et à l’analyse d’une grande quantité de photos.

Pour l’heure, LEVAN a modélisé pas moins de 150 concepts différents regroupant plus de 50 000 sous-concepts et a analysé plus de 10 millions d’images. Néanmoins, ces chiffres pourraient rapidement augmenter car le projet est hébergé sur le Cloud Amazon AWS.

Source : site officiel du projet LEVAN

Et vous ?

Qu’en pensez-vous ?


Vous avez aimé cette actualité ? Alors partagez-la avec vos amis en cliquant sur les boutons ci-dessous :


 Poster une réponse

Avatar de Iradrille Iradrille - Membre expert http://www.developpez.com
le 27/05/2014 à 0:24
Intéressant, les premiers résultats ont l'air prometteurs en tout cas.

Pour les curieux, les sources sont dispos sur le site officiel.
Avatar de Zefling Zefling - Membre émérite http://www.developpez.com
le 27/05/2014 à 15:34
On aura peut-être bientôt de vrais résultats dans les recherches par images.
Avatar de Khopa Khopa - Membre à l'essai http://www.developpez.com
le 27/05/2014 à 16:13
On aura peut-être bientôt de vrais résultats dans les recherches par images.

Elle marche vachement bien pourtant la recherche par image de Google, j'obtiens "hatsune miku poireau" en soumettant ton image de profil, ce qui est une description satisfaisante à mon goût .
J'ai aussi pu dès fois retrouver des noms de films, de personnalités ou de jeux vidéos en soumettant des images, pour peu qu'elle soit suffisamment explicite.

En tout ce projet LEVAN est très intéressant !
Avatar de Zefling Zefling - Membre émérite http://www.developpez.com
le 27/05/2014 à 17:54
Citation Envoyé par Khopa  Voir le message
Elle marche vachement bien pourtant la recherche par image de Google, j'obtiens "hatsune miku poireau" en soumettant ton image de profil, ce qui est une description satisfaisante à mon goût .
J'ai aussi pu dès fois retrouver des noms de films, de personnalités ou de jeux vidéos en soumettant des images, pour peu qu'elle soit suffisamment explicite.

Il y a des millions d'images de Hatsune Miku, la probabilité de trouver plus plus grande, par contre sur des trucs plus confidentiels, t'as l'image de base et tout les résultats approchant n'ont rien à voir car il est pas fichu de savoir à quoi ça se rapport. Genre, mettre la couverture d'un livre, la probabilité qui te propose les autres, c'est pas gagné : le résultat n'a souvent pas rien à voir à par la gamme de couleur. Et quand, il ne connait pas... bha t'as juste n'importe quoi ou rien, car il ne sait que comparer pas analyser son contenu. Pour la comparaison (images similaires), ça reste quand même super pratique, pour le reste c'est très aléatoire.
Avatar de Veovis Veovis - Membre du Club http://www.developpez.com
le 28/05/2014 à 8:32
La première phrase de l'article ne veut absolument rien dire. Et on ne devrait pas parler ici d'intelligence artificielle mais de méthode d'apprentissage automatique.
Avatar de temoanatini temoanatini - Membre averti http://www.developpez.com
le 28/05/2014 à 10:12
La première phrase de l'article ne veut absolument rien dire. Et on ne devrait pas parler ici d'intelligence artificielle mais de méthode d'apprentissage automatique.

Faux. Si on en comprend le sens, c'est que ça ne veut pas rien dire.

Franchement, les posts qui commencent comme le tien ne donnent pas envie d'être lus jusqu'au bout.
Dommage, parce que la fin de ton message est plus intéressante (même si je ne suis pas vraiment d'accord avec non-plus).

D'où vient le mot "intelligence" ?

Wikipedia :
[...]Le terme est dérivé du latin intellegentia, « faculté de comprendre », dont le préfixe inter- (« entre »), et le radical legere (« choisir, cueillir ») ou ligare (« lier ») suggèrent essentiellement l'aptitude à lier des éléments entre eux.[...]

=> Avoir la capacité de faire des liens entre des choses ou des concepts, ou mieux encore, apprendre à le faire serait donc presque la définition-même de l'intelligence...
Avatar de valkirys valkirys - Membre expérimenté http://www.developpez.com
le 29/05/2014 à 10:18
Citation Envoyé par Arsene Newman  Voir le message
LEVAN : un système informatique en mesure d’apprendre tout sur n’importe quoi

Apprendre tout sur n'importe quoi? C'est pas la définition d'un développeur...
Avatar de ailereve ailereve - Futur Membre du Club http://www.developpez.com
le 30/05/2014 à 12:39
Petite remarque en passant : "Intelligence" n'a pas le même sens selon le cadre d’emploi du "mot".
De plus, les différents pays du monde qui l'emploient n'en n'ont pas la même approche, ne lui donnent pas le même sens ni le même fond. Aussi, prendre et donner une définition, du dico certes, donne une réalité à une considération mais ne lui donne pas son étendu ni sa subtilité et donc prive l’occurrence de sa "vérité", le concept de sa réalité.

C'est comme pour un test de QI qui donne un résultat sur une capacité mémorielle et l'usage qu'on est capable d'en faire ; On teste une capacité à raisonner sur une connaissance : est-ce pour autant de intelligence ?

On répondra ou ps... Mais une chose est sûre, c'est ce que fait l'IA : elle raisonne selon sa programmation et les donnée que cette programmation peut traiter. Hors de cela l'IA ne fonctionne pas.

Mais l'Intelligence, en terme fondamentale est une toute autre chose, tout comme savoir employer intelligemment cette apprentissage de l'Intelligence en est un autre. Exemple : L'enfant apprend à répéter des mots. Il mémorise ces mots. Puis il en apprend l'emploi. Et souvent après seulement il en comprend le sens. Résultat, l'axe intelligence de l'être ne peut être déterminé. En effet, ce qui permet de mémoriser sans compréhension est (en très gros) l'émotion (fixateur). La compréhension de ce qui est su (oui il y une différence) est une part majeure de l’Intelligence, c'est (en gros) ce qui différencie l'apprentissage de l'intelligence.

Une machine enregistre des éléments qui sont analysé en fonction d'un protocole particulier, plus ou moins élaboré, mais, sans conscience de ce qu'elle apprend. Comme l'enfant dans sa première phase.
Ensuite en fonction du protocole (de sa programmation), la machine va rendre des informations, sans qu'elle sache jamais, consciemment, de quoi elle traite. L'axe de fonctionnement de cet IA peut être définit, par exemple horizontal, transversal, etc. selon l'usage qu'on en a.

La différence entre Intelligence et l'IA, n'est pas que sémantique. Le premier fait entrer un monde entier dans un Résonnement Intellectuel Consciemment Compris (non ça ne veut pas dire qu'on sache pour autant ce qui se passe vraiment au niveau neuronal mais bien que l'on est conscient de son savoir comme de l'usage qu'on en fait ou peut en faire), lorsque la machine ne fait que suivre son protocole... Non l'Intelligence, avec un I majuscule, celle de l'être humain, fut-elle définie par un dico (qui plus est, généraliste dans sa définition donnée) ne peut être étendue, sans perte ni minimalisation de son sens profond, à ce que peut faire une machine... En tout cas aujourd'hui.

Quand à faire des lien entre les choses, le ficus de la moule le fait entre la moule et le bouchot : est-ce pour autant de intelligence ? NON. Et le fait que la guêpe ponde son œuf dans sa proie fait-il de l’emploie du dard de la dite guêpe un acte intelligent ? Toujours NON.

Sans conscience pas d'intelligence : BA Ba !

Donc nous parlons bien d'Apprentissage Automatique, que ces très conscient de leur capacités que sont les chercheurs en IA appellent justement IA (intelligence d'ailleurs sous le sens anglo-saxon du terme)
Avatar de Matthieu Vergne Matthieu Vergne - Expert confirmé http://www.developpez.com
le 01/06/2014 à 16:53
Non, désolé. Encore une fois, on utilise des termes purement marketing pour que les gens s'imaginent ce qu'on ne fait pas. Dans la recherche, il faut savoir rester critique, et ça commence par rester critique sur son propre travail. Petite analyse des mots chocs :

exhaustive vocabulary -> quand on est exhaustif, on le prouve. Tout au plus, ils sont exhaustifs sur ce que renvoie Google Books, vive la novlangue.

explains all variations -> idem, "all" = tout, pas la majorité, on parle encore d'exhaustivité. D'ailleurs dans l'abstract on est plus objectif (wide range of variations) mais en fait ils donnent des exemples dont on a cure au sein de l'approche : on ne fait pas la différence entre une action, une interaction, un attribut ou que sais-je. Tout comme on n'a aucune idée qu'un cheval soit un objet et Noël un événement.

fully-automated -> Alors qu'est-ce que contient l'approche ? Google books, Google image, Yahoo, Bing, si on va plus loin dans le papier Wordnet et Wikipédia, et à tout ça on applique quelques techniques pour construire des graphes et faire du nettoyage. À ce que je sache, Google image, Yahoo, Bing ne sont pas "fully-automated" puisqu'ils se basent aussi sur des correlations d'utilisation (donc basé sur des utilisateurs bien humain) pour faire leur clustering. On me dira que je pinaille, mais qu'en est-il de Wordnet et Wikipédia qui sont fait majoritairement à la main ? Ah c'est sûr que si on inclus dans l'"approche" tout ce qu'elle utilise en grosse boîte noire, alors oui c'est fully-automated. Moi aussi je mets mes petits chinois dans une cave et après je dis que ma production de chaussures est fully-automated, les petits chinois font partie du process. Mais là où on se fout de la gueule du monde, c'est quand je lis "Our online system has been queried by users to learn models for several interesting concepts". Donc en fait, ce sont les utilisateurs qui doivent dire quels concepts sont à apprendre (et au passage, ce qui est un concept pour l'utilisateur, au sein de l'approche on en a cure de la notion de concept), puis ce sont des outils encore une fois externes qui donnent des variations de ce concept (n-grams, donc attention, pas des termes ayant du sens, juste des compositions de mots qui apparaissent côte-à-côte), puis encore une fois des outils externes qui te disent quelles images correspondent à ces n-grams. L'approche en elle-même se contente de construire des graphes et de faire un peu de nettoyage.

Si je devais reprendre la citation de temoanatini, si l'intelligence est principalement la capcité de faire des liens, ben là les liens sont donnés par Google et consort, l'approche se contente de les représenter et de les organiser, pas de les faire.

Alors désolé, mais pour ceux qui pensent que ça peut améliorer la recherche par image, ben on compte dessus en fait pour avoir des résultats pertinents, donc c'est plutôt l'inverse actuellement. Il faudrait autrement avoir quelque chose qui tourne en boucle, comme le PageRank, mais ce n'est pas le but de cette approche, donc on oublie pour ce coup-là.
Avatar de bathrax bathrax - Membre à l'essai http://www.developpez.com
le 03/06/2014 à 12:20
N'importe quoi !!!
Offres d'emploi IT
Webmaster Wordpress Miami
MCG - Etats-Unis - MIAMI
Commando - développeur rapide H/F
Lunalogic - Ile de France - Ile-de-france
Technicien en télécommunications (H/F)
Links IT SERVICES - Provence Alpes Côte d'Azur - Côte d'azur/Marseille

Voir plus d'offres Voir la carte des offres IT
Contacter le responsable de la rubrique Accueil