Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Google développe un algorithme qui peut dire avec précision où vos photos ont été prises
PlaNet n'utilise que très peu de mémoire RAM

Le , par Stéphane le calme

21PARTAGES

12  0 
Si vous prenez une photo sur internet et que vous essayez de deviner où elle a été prise, la tâche sera évidente si vous remarquez un bâtiment (tour Eiffel, tour de Pise) ou si vous avez un point de repère (chute du Niagara). Mais elle deviendra beaucoup plus compliquée si la photo manque de marqueurs spécifiques de localisation.

Une équipe de deux employés Google et d'un chercheur de l'Université RWTH Aachen en Allemagne ont mis sur pied un algorithme capable d'analyser une image et d'estimer où elle a été prise avec un très grand degré de précision. Cet algorithme a été développé dans le cadre du projet baptisé PlaNet.

Dans le monde de l'apprentissage automatique, leur méthode est assez simple : ils ont commencé par diviser le monde en 26 000 carrés de diverses tailles où la probabilité est élevée qu'un grand nombre de photos puissent être prises dans ces endroits. Par exemple, les grandes villes, qui sont susceptibles de générer plus de photos, avaient une structure de grille plus fine que celles des régions reculées où la probabilité de prendre des photos s'avère moins importante. D'ailleurs, l'équipe a décidé d'ignorer des régions comme les océans et les régions polaires où peu de photos sont susceptibles d'être prises.


Par la suite, l'équipe a créé une base de données d'images géolocalisées prises sur le web (plus de 91 millions d'images Flickr qui contenaient des données de géolocalisation) et s'est servie des données de géolocalisation pour déterminer le carré dans lequel chaque image a été prise. L'idée sous-jacente était de faire évoluer l'apprentissage de PlaNet afin qu'il puisse se servir de marqueurs subtils sur une image pour déterminer le carré dans lequel elle a été prise ou un ensemble de carrés dans lesquels elle aurait pu être prise.

Après avoir fini l'apprentissage de PlaNet, les chercheurs se sont servis de 34 autres millions d'images pour tester leur système afin de voir à quel point leur algorithme pouvait être précis. « PlaNet est en mesure de localiser 3,6 pour cent des images avec une précision qui va jusqu'au nom de la rue où elles ont été prises, et 10,1 pour cent des images avec une précision qui va jusqu'au niveau de la ville où elles ont été prises », ont indiqué les chercheurs. De plus, l'algorithme est capable de déterminer le pays d'origine sur 28,4 pour cent des photos et le continent sur 48,0 pour cent d'entre elles.

Pour montrer à quel point ces statistiques sont encourageantes, les chercheurs ont mis PlaNet à l'épreuve face à dix humains qui ont beaucoup voyagé de par le monde. Pour le test, ils ont créé GeoGuessR, un jeu en ligne dans lequel une image est tirée de façon aléatoire du Google Street View et le joueur est prié de repérer son emplacement sur une carte du monde.

« En tout, PlaNet a remporté 28 manches sur les 50 avec une erreur médiane de localisation de 1131,7 km, tandis que l'erreur médiane de localisation de l'homme était de 2320,75 km. Cette expérience à petite échelle montre que PlaNet atteint des performances surhumaines dans la tâche de repérer des paysages sur Google Street View », se sont réjouis les chercheurs.

Une question intéressante est de savoir comment PlaNet fait pour avoir un tel rendement sans se servir de marqueurs utilisés par les humains comme la végétation, le style architectural, etc. Ce à quoi les chercheurs ont répondu en disant « nous pensons que PlaNet a un avantage sur l'homme parce qu'il a vu bien plus d'endroits qu'un humain ne pourrait jamais visiter et il a noté des marqueurs subtils de différents paysages qui peuvent s'avérer très difficiles à distinguer même pour un humain qui a beaucoup voyagé ».

Tout ceci en se servant d'une petite quantité de mémoire contrairement aux services qui nécessitent de grosses quantités : « notre modèle n'utilise que 377 Mo de mémoire, ce qui peut même suffire dans la mémoire d'un smartphone ».

Essayer GeoGuessR

Source : Discovery News, papier blanc (au format PDF)

Une erreur dans cette actualité ? Signalez-le nous !

Avatar de Matthieu Vergne
Expert éminent https://www.developpez.com
Le 29/02/2016 à 23:34
Je tiens à préciser que je n'ai pas lu l'article d'origine.

Citation Envoyé par Stéphane le calme Voir le message
Après avoir fini l'apprentissage de PlaNet, les chercheurs se sont servis de 34 autres millions d'images pour tester leur système afin de voir à quel point leur algorithme pouvait être précis. « PlaNet est en mesure de localiser 3,6 pour cent des images avec une précision qui va jusqu'au nom de la rue où elles ont été prises, et 10,1 pour cent des images avec une précision qui va jusqu'au niveau de la ville où elles ont été prises », ont indiqué les chercheurs. De plus, l'algorithme est capable de déterminer le pays d'origine sur 28,4 pour cent des photos et le continent sur 48,0 pour cent d'entre elles.
En même temps, c'est dit dès le départ : la majorité des photos se concentrent sur des endroits spécifiques. Si les 3,6% à la rue près sont toutes des rues style champs Élysées, et que les 10,1% à la ville sont toutes des capitales... De même pour le continent, la majorité semble se concentrer sur l'Amérique du nord, l'Amérique du sud, l'Europe et l'Asie hors Russie. Un random ferait une chance sur 4, on en est à une chance sur deux, je trouve pas ça énorme comme succès, vu que l'amélioration est logarithmique en général (gagner 1% à partir de 50% est plus facile que gagner 1% à partir de 60%, qui est plus facile que gagner 1% à 70%, etc.).

Citation Envoyé par Stéphane le calme Voir le message
Pour montrer à quel point ces statistiques sont encourageantes, les chercheurs ont mis PlaNet à l'épreuve face à dix humains qui ont beaucoup voyagé de par le monde. Pour le test, ils ont créé GeoGuessR, un jeu en ligne dans lequel une image est tirée de façon aléatoire du Google Street View et le joueur est prié de repérer son emplacement sur une carte du monde.
Et GSV, il a la même distribution ou pas ? Après, c'est toujours que 10 humains.

Citation Envoyé par Stéphane le calme Voir le message
« En tout, PlaNet a remporté 28 manches sur les 50 avec une erreur médiane de localisation de 1131,7 km, tandis que l'erreur médiane de localisation de l'homme était de 2320,75 km. Cette expérience à petite échelle montre que PlaNet atteint des performances surhumaines dans la tâche de repérer des paysages sur Google Street View », se sont réjouis les chercheurs.
Oui donc l'humain en a remporté 22 sur 50, les résultats sont pas très différents, et pour un système qui a appris depuis une grosse BDD, je trouve ça pauvre, franchement. Ensuite si le fait de gagner la manche veut dire avoir une erreur plus petite, un humain ayant généralement bon mais toujours avec une bonne marge face à une machine qui peut t'en donner certains très bon et d'autres complètement à côté de la plaque, le "bon" est des plus interprétables.

Citation Envoyé par Stéphane le calme Voir le message
Une question intéressante est de savoir comment PlaNet fait pour avoir un tel rendement sans se servir de marqueurs utilisés par les humains comme la végétation, le style architectural, etc. Ce à quoi les chercheurs ont répondu en disant « nous pensons que PlaNet a un avantage sur l'homme parce qu'il a vu bien plus d'endroits qu'un humain ne pourrait jamais visiter et il a noté des marqueurs subtils de différents paysages qui peuvent s'avérer très difficiles à distinguer même pour un humain qui a beaucoup voyagé ».
Qu'on ne vienne donc pas me dire que la comparaison est fiable : on demande à des humains de jouer à un jeu pour lequel ils n'ont pas les outils. C'est du même ordre que s'émerveiller que son PC calcul une formule en moins d'une seconde... l'humain n'a pas ce qu'il faut pour, évidemment qu'il va pas faire mieux. Alors les performances surhumaines... ouais ma calculatrice aussi elle en a. Et les pigeons voyageurs aussi si on se fit à leur capacité de navigation. {^o^}

Citation Envoyé par Stéphane le calme Voir le message
Tout ceci en se servant d'une petite quantité de mémoire contrairement aux services qui nécessitent de grosses quantités : « notre modèle n'utilise que 377 Mo de mémoire, ce qui peut même suffire dans la mémoire d'un smartphone ».
Maintenant divise tes carrés, qu'on rigole {^_^}. Parce que bon, des zones aussi larges ça sert pas à grand chose en pratique.

Marketing, quand tu nous tiens...
5  1 
Avatar de Christophe P.
Membre expérimenté https://www.developpez.com
Le 01/03/2016 à 11:48
D'ailleurs, l'équipe a décidé d'ignorer des régions comme les océans et les régions polaires où peu de photos sont susceptibles d'être prises.
Peut-être aussi parce qu'il leur est impossible de localiser une photo d'une étendue d'eau ou de neige.
3  0 
Avatar de nchal
Membre expérimenté https://www.developpez.com
Le 29/02/2016 à 17:08
Tout ce que je retiens, c'est qu'ils ont accès à 91 millions de Flickr avec des données de géoloc. Est-ce que les propriétaires des 91 millions de photos savaient qu'elles pouvaient être utilisées à de telles fins ? Pas sûr...

Sinon, bien évidemment que je salue l'exploit et leur travail, c'est clairement un beau projet.
2  0 
Avatar de Aurelien Plazzotta
Membre extrêmement actif https://www.developpez.com
Le 29/02/2016 à 17:45
Google a aussi créé un algorithme pour pomper toute la banque de données de Flickr apparemment...
Toutes ces inventions sont impressionnantes techniquement mais la vie privée est en passe de devenir une farce pour les nostalgiques.
1  1 
Avatar de a028762
Membre confirmé https://www.developpez.com
Le 01/03/2016 à 13:32
Projet intéressant (et flippant).
En tout cas, c'est intéressant de comprendre quels algorithmes sont utilisés, même si pour le moment, c'est un peu faible, mais pas tant que ça.
J'aurais pensé qu'ils pouvaient utiliser les nuages, la couleur du ciel, de l'herbe ... mais ça, c'est encore de la science fiction ... ouf !
0  0 
Avatar de TiranusKBX
Expert confirmé https://www.developpez.com
Le 01/03/2016 à 14:58
ils aurais pus aussi se pencher sur la lumière et son inclinaison sur les photos pour avoir des information précises
0  0 
Avatar de
https://www.developpez.com
Le 01/03/2016 à 21:19
Citation Envoyé par TiranusKBX Voir le message
ils aurais pus aussi se pencher sur la lumière et son inclinaison sur les photos pour avoir des information précises
Tout à fait. Et tant qu'on y est, ils auraient pu aussi mesurer l'écart entre les molécules d'air pour calculer la pression et comparer aux bases de données météo, pour avoir des informations précises.
1  1 
Avatar de hotcryx
Membre extrêmement actif https://www.developpez.com
Le 02/03/2016 à 14:25
Ils ont également l'heure de la photo
0  0