Developpez.com

Le Club des Développeurs et IT Pro

Google développe un algorithme qui peut dire avec précision où vos photos ont été prises

PlaNet n'utilise que très peu de mémoire RAM

Le 2016-02-29 12:10:25, par Stéphane le calme, Chroniqueur Actualités
Si vous prenez une photo sur internet et que vous essayez de deviner où elle a été prise, la tâche sera évidente si vous remarquez un bâtiment (tour Eiffel, tour de Pise) ou si vous avez un point de repère (chute du Niagara). Mais elle deviendra beaucoup plus compliquée si la photo manque de marqueurs spécifiques de localisation.

Une équipe de deux employés Google et d'un chercheur de l'Université RWTH Aachen en Allemagne ont mis sur pied un algorithme capable d'analyser une image et d'estimer où elle a été prise avec un très grand degré de précision. Cet algorithme a été développé dans le cadre du projet baptisé PlaNet.

Dans le monde de l'apprentissage automatique, leur méthode est assez simple : ils ont commencé par diviser le monde en 26 000 carrés de diverses tailles où la probabilité est élevée qu'un grand nombre de photos puissent être prises dans ces endroits. Par exemple, les grandes villes, qui sont susceptibles de générer plus de photos, avaient une structure de grille plus fine que celles des régions reculées où la probabilité de prendre des photos s'avère moins importante. D'ailleurs, l'équipe a décidé d'ignorer des régions comme les océans et les régions polaires où peu de photos sont susceptibles d'être prises.


Par la suite, l'équipe a créé une base de données d'images géolocalisées prises sur le web (plus de 91 millions d'images Flickr qui contenaient des données de géolocalisation) et s'est servie des données de géolocalisation pour déterminer le carré dans lequel chaque image a été prise. L'idée sous-jacente était de faire évoluer l'apprentissage de PlaNet afin qu'il puisse se servir de marqueurs subtils sur une image pour déterminer le carré dans lequel elle a été prise ou un ensemble de carrés dans lesquels elle aurait pu être prise.

Après avoir fini l'apprentissage de PlaNet, les chercheurs se sont servis de 34 autres millions d'images pour tester leur système afin de voir à quel point leur algorithme pouvait être précis. « PlaNet est en mesure de localiser 3,6 pour cent des images avec une précision qui va jusqu'au nom de la rue où elles ont été prises, et 10,1 pour cent des images avec une précision qui va jusqu'au niveau de la ville où elles ont été prises », ont indiqué les chercheurs. De plus, l'algorithme est capable de déterminer le pays d'origine sur 28,4 pour cent des photos et le continent sur 48,0 pour cent d'entre elles.

Pour montrer à quel point ces statistiques sont encourageantes, les chercheurs ont mis PlaNet à l'épreuve face à dix humains qui ont beaucoup voyagé de par le monde. Pour le test, ils ont créé GeoGuessR, un jeu en ligne dans lequel une image est tirée de façon aléatoire du Google Street View et le joueur est prié de repérer son emplacement sur une carte du monde.

« En tout, PlaNet a remporté 28 manches sur les 50 avec une erreur médiane de localisation de 1131,7 km, tandis que l'erreur médiane de localisation de l'homme était de 2320,75 km. Cette expérience à petite échelle montre que PlaNet atteint des performances surhumaines dans la tâche de repérer des paysages sur Google Street View », se sont réjouis les chercheurs.

Une question intéressante est de savoir comment PlaNet fait pour avoir un tel rendement sans se servir de marqueurs utilisés par les humains comme la végétation, le style architectural, etc. Ce à quoi les chercheurs ont répondu en disant « nous pensons que PlaNet a un avantage sur l'homme parce qu'il a vu bien plus d'endroits qu'un humain ne pourrait jamais visiter et il a noté des marqueurs subtils de différents paysages qui peuvent s'avérer très difficiles à distinguer même pour un humain qui a beaucoup voyagé ».

Tout ceci en se servant d'une petite quantité de mémoire contrairement aux services qui nécessitent de grosses quantités : « notre modèle n'utilise que 377 Mo de mémoire, ce qui peut même suffire dans la mémoire d'un smartphone ».

Essayer GeoGuessR

Source : Discovery News, papier blanc (au format PDF)
  Discussion forum
8 commentaires
  • Matthieu Vergne
    Expert éminent
    Je tiens à préciser que je n'ai pas lu l'article d'origine.

    Envoyé par Stéphane le calme
    Après avoir fini l'apprentissage de PlaNet, les chercheurs se sont servis de 34 autres millions d'images pour tester leur système afin de voir à quel point leur algorithme pouvait être précis. « PlaNet est en mesure de localiser 3,6 pour cent des images avec une précision qui va jusqu'au nom de la rue où elles ont été prises, et 10,1 pour cent des images avec une précision qui va jusqu'au niveau de la ville où elles ont été prises », ont indiqué les chercheurs. De plus, l'algorithme est capable de déterminer le pays d'origine sur 28,4 pour cent des photos et le continent sur 48,0 pour cent d'entre elles.
    En même temps, c'est dit dès le départ : la majorité des photos se concentrent sur des endroits spécifiques. Si les 3,6% à la rue près sont toutes des rues style champs Élysées, et que les 10,1% à la ville sont toutes des capitales... De même pour le continent, la majorité semble se concentrer sur l'Amérique du nord, l'Amérique du sud, l'Europe et l'Asie hors Russie. Un random ferait une chance sur 4, on en est à une chance sur deux, je trouve pas ça énorme comme succès, vu que l'amélioration est logarithmique en général (gagner 1% à partir de 50% est plus facile que gagner 1% à partir de 60%, qui est plus facile que gagner 1% à 70%, etc.).

    Envoyé par Stéphane le calme
    Pour montrer à quel point ces statistiques sont encourageantes, les chercheurs ont mis PlaNet à l'épreuve face à dix humains qui ont beaucoup voyagé de par le monde. Pour le test, ils ont créé GeoGuessR, un jeu en ligne dans lequel une image est tirée de façon aléatoire du Google Street View et le joueur est prié de repérer son emplacement sur une carte du monde.
    Et GSV, il a la même distribution ou pas ? Après, c'est toujours que 10 humains.

    Envoyé par Stéphane le calme
    « En tout, PlaNet a remporté 28 manches sur les 50 avec une erreur médiane de localisation de 1131,7 km, tandis que l'erreur médiane de localisation de l'homme était de 2320,75 km. Cette expérience à petite échelle montre que PlaNet atteint des performances surhumaines dans la tâche de repérer des paysages sur Google Street View », se sont réjouis les chercheurs.
    Oui donc l'humain en a remporté 22 sur 50, les résultats sont pas très différents, et pour un système qui a appris depuis une grosse BDD, je trouve ça pauvre, franchement. Ensuite si le fait de gagner la manche veut dire avoir une erreur plus petite, un humain ayant généralement bon mais toujours avec une bonne marge face à une machine qui peut t'en donner certains très bon et d'autres complètement à côté de la plaque, le "bon" est des plus interprétables.

    Envoyé par Stéphane le calme
    Une question intéressante est de savoir comment PlaNet fait pour avoir un tel rendement sans se servir de marqueurs utilisés par les humains comme la végétation, le style architectural, etc. Ce à quoi les chercheurs ont répondu en disant « nous pensons que PlaNet a un avantage sur l'homme parce qu'il a vu bien plus d'endroits qu'un humain ne pourrait jamais visiter et il a noté des marqueurs subtils de différents paysages qui peuvent s'avérer très difficiles à distinguer même pour un humain qui a beaucoup voyagé ».
    Qu'on ne vienne donc pas me dire que la comparaison est fiable : on demande à des humains de jouer à un jeu pour lequel ils n'ont pas les outils. C'est du même ordre que s'émerveiller que son PC calcul une formule en moins d'une seconde... l'humain n'a pas ce qu'il faut pour, évidemment qu'il va pas faire mieux. Alors les performances surhumaines... ouais ma calculatrice aussi elle en a. Et les pigeons voyageurs aussi si on se fit à leur capacité de navigation. {^o^}

    Envoyé par Stéphane le calme
    Tout ceci en se servant d'une petite quantité de mémoire contrairement aux services qui nécessitent de grosses quantités : « notre modèle n'utilise que 377 Mo de mémoire, ce qui peut même suffire dans la mémoire d'un smartphone ».
    Maintenant divise tes carrés, qu'on rigole {^_^}. Parce que bon, des zones aussi larges ça sert pas à grand chose en pratique.

    Marketing, quand tu nous tiens...
  • Christophe P.
    Membre expérimenté
    D'ailleurs, l'équipe a décidé d'ignorer des régions comme les océans et les régions polaires où peu de photos sont susceptibles d'être prises.
    Peut-être aussi parce qu'il leur est impossible de localiser une photo d'une étendue d'eau ou de neige.
  • nchal
    Membre expérimenté
    Tout ce que je retiens, c'est qu'ils ont accès à 91 millions de Flickr avec des données de géoloc. Est-ce que les propriétaires des 91 millions de photos savaient qu'elles pouvaient être utilisées à de telles fins ? Pas sûr...

    Sinon, bien évidemment que je salue l'exploit et leur travail, c'est clairement un beau projet.
  • Envoyé par TiranusKBX
    ils aurais pus aussi se pencher sur la lumière et son inclinaison sur les photos pour avoir des information précises
    Tout à fait. Et tant qu'on y est, ils auraient pu aussi mesurer l'écart entre les molécules d'air pour calculer la pression et comparer aux bases de données météo, pour avoir des informations précises.
  • Aurelien Plazzotta
    Membre extrêmement actif
    Google a aussi créé un algorithme pour pomper toute la banque de données de Flickr apparemment...
    Toutes ces inventions sont impressionnantes techniquement mais la vie privée est en passe de devenir une farce pour les nostalgiques.
  • a028762
    Membre confirmé
    Projet intéressant (et flippant).
    En tout cas, c'est intéressant de comprendre quels algorithmes sont utilisés, même si pour le moment, c'est un peu faible, mais pas tant que ça.
    J'aurais pensé qu'ils pouvaient utiliser les nuages, la couleur du ciel, de l'herbe ... mais ça, c'est encore de la science fiction ... ouf !
  • TiranusKBX
    Expert confirmé
    ils aurais pus aussi se pencher sur la lumière et son inclinaison sur les photos pour avoir des information précises
  • hotcryx
    Membre extrêmement actif
    Ils ont également l'heure de la photo