Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Êtes-vous vraiment anonymes en ligne ? Il est possible de vous identifier par vos clics sur Twitter
D'après des chercheurs

Le , par Stéphane le calme

0PARTAGES

7  0 
Selon des chercheurs de Princetone et de Stanford, en faisant une corrélation entre l’historique des pages web visitées et les profils Twitter, il est possible d’identifier les internautes. Jessica Su, étudiante à Stanford qui a participé au projet, explique que leur approche est basée sur une simple observation : « chaque personne a un réseau social distinct, composé de membres de sa famille ainsi que des amis qu’il s’est fait à l’école, au travail et dans diverses étapes de sa vie. Par conséquent, l'ensemble des liens dans vos flux Facebook et Twitter est également très distinctif, et cliquer sur ces liens laisse une marque témoin dans votre historique de navigation ».

Selon elle, en « partant de la combinaison unique de pages Web qu’un individu a visitées, nous déterminons les fils de réseau social similaires à cet historique, calculant une liste d’utilisateurs qui ont toutes les chances d’avoir produit cette série de clics. De cette façon, nous pouvons relier l’identité réelle d’une personne à un jeu de liens visités, y compris les liens qui n’ont jamais été postés publiquement sur aucun réseau social. Cette méthode requiert un clic dans les liens apparaissant sur le flux de leurs réseaux sociaux, elle n’est pas tributaire du fait qu’un individu publie un contenu quelconque ».

Pour vérifier leur théorie, les chercheurs ont mis sur pied un outil baptisé Footprints qui se présente sous la forme d’une extension Chrome et vient collecter les liens sur lesquels les utilisateurs ont cliqué sur la plateforme Twitter. Les chercheurs précisent qu’une fois sa mission accomplie, l’extension va se désinstaller toute seule par la suite. De plus, après l’avoir installée et lancé le test, les utilisateurs ont la possibilité d’examiner les liens et de mettre fin à l’expérience avant qu’une quelconque information ne leur soit envoyée. « Ces mêmes informations peuvent être collectées à votre insu par des sites web et des annonceurs », indiquent les chercheurs.

Dans la phase de conception, ils ont dû faire face à deux défis : le premier, qui est d’ordre théorique, consiste à établir un modèle qui va servir à rapprocher un fil de réseau social d’un historique Web donné. Jessica Su affirme que l’approche la plus évidente, qui consiste à mesurer la fraction de liens communs dans les deux sources de données, fonctionne bien mais s’avère limitée une fois que les utilisateurs disposent d’un très large réseau sur Twitter. Aussi les chercheurs ont opté pour une approche différente qui s’appuie sur la conception d’un modèle probabiliste des comportements de navigation Web et le calcul de probabilité qu’un utilisateur de Twitter produise l’historique de navigation Web observé : « il s’est avéré que cette méthode est approximativement égale à mettre sur une échelle une fraction de l’historique des liens qui apparaissent sur le fil d’actualité ».

La seconde difficulté, qui est d’ordre technique, consiste à faire tourner l’algorithme en temps réel. Les chercheurs expliquent que pour la partie « réseau social » ils se sont tournés vers Twitter au lieu de Facebook par exemple parce que, contrairement au fil d’actualité de Facebook, celui de Twitter est public. Pourtant, bien que les flux soient publics, il n’était pas question de créer une copie locale de Twitter sur laquelle lancer les requêtes. Alors, les chercheurs se sont servis de méthodes de calcul heuristiques afin de réduire drastiquement le champ de recherche. Par la suite, ils ont associé différentes techniques pour concevoir le flux des candidats les plus prometteurs pour l’analyse. Sur ces résultats, la même méthode est appliquée pour produire le résultat final. « À partir d’un historique de navigation donné, nous pouvons typiquement mener à bien ce processus dans son ensemble en moins de 60 secondes », a affirmé Jessica Su.

Sharad Goel, professeur assistant à l’université de Standford, explique que l’objectif de cet outil est avant tout éducatif : « nous n’envisageons pas de rendre cet outil accessible à d’autres, il s’agit avant tout de réveiller les consciences ». Entre les mains d’une régie, un tel outil permettrait de tracer des utilisateurs pour leur délivrer des publicités plus ciblées et ce avec ou sans leur consentement.

tester Footprints

Source : billet Jessica Su

Voir aussi :

En quête de systèmes d'anonymat plus sûrs que Tor, MIT lance Riffle, un nouveau réseau anonyme

Tor Browser 6.0 : le navigateur dédié au réseau anonyme Tor se renforce sur le plan sécurité et apporte un meilleur support pour la vidéo HTML5

Une erreur dans cette actualité ? Signalez-le nous !

Avatar de Matthieu Vergne
Expert éminent https://www.developpez.com
Le 04/10/2016 à 15:17
Hum... je suis pas sûr de bien comprendre cette partie :

Citation Envoyé par Stéphane le calme Voir le message

La seconde difficulté, qui est d’ordre technique, consiste à faire tourner l’algorithme en temps réel. Les chercheurs expliquent que pour la partie « réseau social » ils se sont tournés vers Twitter au lieu de Facebook par exemple parce que, contrairement au fil d’actualité de Facebook, celui de Twitter est public. Pourtant, bien que les flux soient public, il n’était pas question de créer une copie locale de Twitter sur laquelle lancer les requêtes. Alors, les chercheurs se sont servi de méthodes de calcul heuristiques afin de réduire drastiquement le champ de recherche. Par la suite, ils ont associé différentes techniques pour concevoir le flux des candidats les plus prometteurs pour l’analyse. Sur ces résultats, la même méthode est appliquée pour produire le résultat final. « À partir d’un historique de navigation donné, nous pouvons typiquement mener à bien ce processus dans son ensemble en moins de 60 secondes », a affirmé Jessica Su.
Donc les chercheurs se sont focalisé sur les profils sur lesquels ça devrait marcher, et de là ils en ont tiré la conclusion que ça marche ? J'espère avoir mal compris. Enfin bon, faut dire qu'il y a un paquet de phrases qui me sont incompréhensibles dans cet article.
2  0 
Avatar de Stéphane le calme
Chroniqueur Actualités https://www.developpez.com
Le 04/10/2016 à 15:44
Citation Envoyé par Matthieu Vergne Voir le message
Donc les chercheurs se sont focalisé sur les profils sur lesquels ça devrait marcher, et de là ils en ont tiré la conclusion que ça marche ? J'espère avoir mal compris
Non, les chercheurs ne se sont pas focalisés sur les profils qui marchent. Ils expliquent qu'il est possible de trouver une empreinte numérique en se basant sur l'historique des clics des utilisateurs (dans le cas d'espèce sur Twitter). Sur Facebook, plusieurs utilisateurs définissent des publications comme étant accessibles par exemple seulement à leurs amis, aussi ils ont choisi Twitter vu que, pour la plupart du temps, les Tweet sont accessibles publiquement. Puisque l'étude porte sur les clics des utilisateurs sur Twitter, "candidat" ici ne fait pas référence aux utilisateurs eux-mêmes mais aux clics qui sont susceptibles de constituer ladite empreinte.
0  0