Des chercheurs de Google créent un algorithme de reconnaissance de caractères
Avec un taux de réussite de 99,8% sur les textes de reCAPTCHA

Le , par Cedric Chevalier, Expert éminent sénior
Si pour un humain normal reconnaître des personnes ou du texte sur des photos est une tâche banale, pour un ordinateur c’est extrêmement difficile. Jusqu’ici, de nombreuses approches ont été expérimentées pour donner aux machines des capacités de perception visuelle proche de celles des humains. Pratiquement, on a toujours été loin du compte.

Des chercheurs ambitieux de Google, ont pris sur eux de relever ce défi. Traditionnellement, la reconnaissance des images implique trois étapes distinctes (localisation, segmentation et reconnaissance) qui sont implémentées avec des algorithmes différents.

Ian J. Goodfellow, Yaroslav Bulatov, Julian Ibarz, Sacha Arnoud et Vinay Shet ont combiné ces trois étapes dans un seul algorithme d’apprentissage, un réseau de neurones à convolution profond qui opère au niveau de chaque pixel d’image fourni en entrée.

L’algorithme a été testé avec les numéros de maison de la banque de données de Street View. Il s’en sort avec un taux de réussite de 96%. Et ce n’est pas tout ! Les chercheurs ont poussé le bouchon en soumettant leur algorithme au reCAPTCHA, là où échouent les systèmes de reconnaissance optique des caractères (OCR). Ils ont obtenu un taux de réussite de 99,8% (pratiquement la performance d’un sujet humain).


En termes de réussite, le nouvel algorithme de Google représente le « nec plus ultra » dans le domaine de la reconnaissance optique des caractères. On espère tout simplement que de nouvelles applications utilisant cet algorithme verront rapidement le jour.

Source: Rapport PDF de l'étude

Et vous ?

Qu'en pensez-vous ?


Vous avez aimé cette actualité ? Alors partagez-la avec vos amis en cliquant sur les boutons ci-dessous :


 Poster une réponse

Avatar de Jérôme_C Jérôme_C - Membre averti http://www.developpez.com
le 18/04/2014 à 18:26
Les chercheurs ont poussé le bouchon en soumettant leur algorithme au reCAPTCHA, là où échouent les systèmes de reconnaissance optique des caractères (OCR). Ils ont obtenu un taux de réussite de 99,8% (pratiquement la performance d’un sujet humain).

99,8 % de réussite au reCAPTCHA ! C'est un score inhumain, trop de réussite, c'est donc un bot !
Avatar de abriotde abriotde - Membre éclairé http://www.developpez.com
le 18/04/2014 à 18:29
Je sais quel est la première utilisation concrète de cet algorithme : l'identification précise de l'emplacement des numéro dans les rues "virtualisé" sur Google Street. Actuellement quand on cherche sur le GPS Google est le meilleur pour positionner un numéro mais cela ne veut pas dire qu'il soit bon...
Maintenant j'aurais envie de mettre cet Algo en Open Source, je pense que c'est l'intention de Google mais se pose un problème de sécurité profonde : les Captcha...

Quel sera le prochain test d'humanité? J'ai vu des tests ou il y a un question a comprendre du style : notez les caractère sous un petit rond. On en arrivera a de vrai test de QI
Avatar de Vlozer Vlozer - Membre habitué http://www.developpez.com
le 18/04/2014 à 18:30
Ils ont obtenu un taux de réussite de 99,8% (pratiquement la performance d’un sujet humain).

Ca me vexe un petit peu que vous disiez cela, parce que mon taux de réussite perso est plutot de l'ordre de 70%-80%...
Avatar de Omote Omote - Membre actif http://www.developpez.com
le 18/04/2014 à 19:35
Citation Envoyé par Vlozer  Voir le message
Ca me vexe un petit peu que vous disiez cela, parce que mon taux de réussite perso est plutot de l'ordre de 70%-80%...

Pas mieux! Des fois cela en est ridicule!
Avatar de PatteDePoule PatteDePoule - Membre éclairé http://www.developpez.com
le 18/04/2014 à 21:39
Bientôt échouer le test va être un signe d'humanité. Tu passes le test? Bot!
Avatar de ToTo13 ToTo13 - Modérateur http://www.developpez.com
le 18/04/2014 à 21:47
C'est juste un TRES GROS CNN + backprop+dropout, je ne sais pas si on peut vraiment parler d'algorithme à ce niveau.
Mais bon boulot !
Avatar de Afromaster Afromaster - Nouveau Candidat au Club http://www.developpez.com
le 19/04/2014 à 1:54
Ils ont crée le système captcha pour lutter contre les bots, et la il crée un bot qui parvient à passer à travers leur propre système (reCaptcha) si c'est pas idiot ça c'est quoi ?
Avatar de Fanvan Fanvan - Membre actif http://www.developpez.com
le 19/04/2014 à 8:37
Citation Envoyé par Afromaster  Voir le message
si c'est pas idiot ça c'est quoi ?

Le cours naturel de l'évolution technologique. En d'autres mots, le progrès.
Avatar de boced66 boced66 - Futur Membre du Club http://www.developpez.com
le 19/04/2014 à 9:58
C'est pas google qui détient le "meilleur" reCAPTCHA du marché ?

Ils ont donc créé un système qui contourne leur propre sécurité
Avatar de MacDev MacDev - Membre régulier http://www.developpez.com
le 21/04/2014 à 15:56
Je ne peux qu'encourager ces chercheurs. Je trouve que c'est quelque chose de très utile.
Offres d'emploi IT
Administrateur dba opensource postgresql h/f
EKXEL - Luxembourg - Luxembourg
Développeur php h/f
EXTIA - Rhône Alpes - Lyon (69000)
Gestionnaire de données h/f
Atos - Pays de la Loire - Angers (49000)

Voir plus d'offres Voir la carte des offres IT
Contacter le responsable de la rubrique Accueil