Une startup californienne annonce avoir battu le Captcha
Grâce à un algorithme basé sur un réseau de neurones artificiel multicouche

Le , par ToTo13, Modérateur
Vicarious, une startup californienne vient d'annoncer avoir battu le fameux test de Captcha.

Qui utilise internet et n'a jamais eu à affronter ce test ? Réponse : personne !
Captcha est ce fameux test que vous devez passer lorsque vous souhaitez créer un compte, faire une réservation, etc. sur un site internet.



Ce test (parfois même compliqué pour un humain, car les chiffres sont illisibles) créé par Luis von Ahn, permet de différencier automatiquement un humain d'une machine. En effet, lors de l'essor d'internet et de la multiplication des comptes emails, des robots créaient automatiquement des milliers de faux comptes chaque jour, afin d'être utilisés pour envoyer des spams.
Captcha a stoppé tout ceci, car les machines/robots n'arrivent pas à lire ces chiffres tordus/barrés/bruités/etc.

Seulement, voilà, Vicarious, une startup spécialisée en intelligence artificielle, vient de créer un algorithme qui battrait Captcha.
Celui-ci est basé sur un réseau de neurones artificiel multicouche.
  1. La première couche analyse de façon basique les pixels afin de déterminer s'ils peuvent être pertinents.
  2. La deuxième couche, analyse les agglomérations de pixels afin de voir s'ils forment un arrangement cohérent (un pixel isolé est par exemple rejeté).
  3. La troisième couche détermine si la forme est au moins partiellement connue (Captcha déformant les formes de base).
  4. Ces trois couches sont répétées plusieurs fois.


Au total, ce sont environ huit millions de neurones qui sont connectés afin de réaliser l'analyse. On devine alors la taille gigantesque de l'échantillon d'apprentissage qu'il aura fallu pour entrainer un tel réseau.

Source "New Scientist".


Vous avez aimé cette actualité ? Alors partagez-la avec vos amis en cliquant sur les boutons ci-dessous :


 Poster une réponse

Avatar de link66 link66 - Membre régulier https://www.developpez.com
le 04/11/2013 à 11:15
Je trouve la taille du réseau démesurée... A la fac on me disait de ne pas dépasser la cinquantaine de neurones pour éviter le sur-apprentissage, j'ai du mal à voir comment ce réseau réussi à généraliser.

Outre la taille gigantesque de l'échantillon de données qu'il aura fallu pour l'entrainer (et encore autant pour le valider), combien de temps faut il pour faire des calculs sur des matrices aussi grosses ?
Avatar de azias azias - Membre éclairé https://www.developpez.com
le 04/11/2013 à 12:40
En fait les Captcha ont déjà été contournés depuis longtemps: il suffit 1/ d'ouvrir un site porno, ou de partage de fichiers ou parfois de simples forum, 2/ recopier l'image à décoder pour la proposer aux visiteurs nombreux et intéressés de notre site ad hoc, 3/ et voilà!

On savait déjà déjà que le Captcha avait parfois tendance à éjecter de l'humanité des personnes bien réelles (Des associations australiennes de personnes invalides veulent le voir disparaître du Web), maintenant on est certain que des robots peuvent résoudre un Captcha.

La seule question qui reste c'est: mais pourquoi continuer à utiliser des Captcha?
Avatar de ToTo13 ToTo13 - Modérateur https://www.developpez.com
le 04/11/2013 à 19:49
Citation Envoyé par link66  Voir le message
Je trouve la taille du réseau démesurée... A la fac on me disait de ne pas dépasser la cinquantaine de neurones pour éviter le sur-apprentissage, j'ai du mal à voir comment ce réseau réussi à généraliser.

Outre la taille gigantesque de l'échantillon de données qu'il aura fallu pour l'entrainer (et encore autant pour le valider), combien de temps faut il pour faire des calculs sur des matrices aussi grosses ?

Des réseaux de plus de 50 neurones sont juste courants.
Tout dépend de la taille de l'échantillon d'apprentissage, qui doit être au moins trois fois supérieur au nombre de poids à évaluer.
Donc ici, ils ont certainement utiliser plusieurs millions d'images.

Citation Envoyé par olreak  Voir le message
En fait les Captcha ont déjà été contournés depuis longtemps: il suffit 1/ d'ouvrir un site porno, ou de partage de fichiers ou parfois de simples forum, 2/ recopier l'image à décoder pour la proposer aux visiteurs nombreux et intéressés de notre site ad hoc, 3/ et voilà!

Rien à voir.
On parle d'un logiciel capable de traiter l'image, pas d'une astuce pour faire traiter le problème par un autre humain.

Citation Envoyé par olreak  Voir le message
On savait déjà déjà que le Captcha avait parfois tendance à éjecter de l'humanité des personnes bien réelles (Des associations australiennes de personnes invalides veulent le voir disparaître du Web)

C'est une association de personnes "invalides" et notamment avec des problèmes de vue !
Avatar de MBAYE BABACAR GUEYE MBAYE BABACAR GUEYE - Membre régulier https://www.developpez.com
le 07/11/2013 à 12:16
Je trouve aussi 8 millions, c'est trop. Maintenant cela dépend de la taille de l'image (en nombre de pixels donc nombre de données). Je me demande aussi comment est-ce que cela serait mis en pratique?
Avatar de ToTo13 ToTo13 - Modérateur https://www.developpez.com
le 08/11/2013 à 6:51
Citation Envoyé par MBAYE BABACAR GUEYE  Voir le message
Je trouve aussi 8 millions, c'est trop. Maintenant cela dépend de la taille de l'image (en nombre de pixels donc nombre de données). Je me demande aussi comment est-ce que cela serait mis en pratique?

Dans l'article d'origine, les auteurs disent qu'ils ne souhaitent pas le mettre en pratique, cela n'aurait d'intérêt que pour les spameurs.
Le but était de tester la capacité des rdns qu'ils créent.
Avatar de CoderInTheDark CoderInTheDark - Membre éclairé https://www.developpez.com
le 12/11/2013 à 18:05
C'est l'enfer, pour les non voyants.
Et les catchas audios ne sont pas mieux
Offres d'emploi IT
Architecte électronique de puissance expérimenté H/F
Safran - Ile de France - Villaroche - Réau
Architecte technique des systèmes d'information H/F
Safran - Ile de France - Évry (91090)
Ingénieur conception en électronique de puissance H/F
Safran - Ile de France - Moissy-Cramayel (77550)

Voir plus d'offres Voir la carte des offres IT
Contacter le responsable de la rubrique Accueil