
mais de manière à préserver la vie privée des internautes
Les collectes de données utilisateur par les entreprises de technologie sont souvent jugées abusives, mais pour ces dernières, c'est énormément important pour améliorer l'expérience utilisateur et leurs produits. Pour cette raison, de nombreuses entreprises s'adonnent à ces pratiques à l’insu de l’utilisateur ou sans son consentement explicite.
Connu pour son engagement à l'égard de la vie privée, Mozilla évite ce genre de pratiques avec ses produits, mais l'éditeur de Firefox semble arriver à un point où il se doit aussi de collecter plus de données des utilisateurs de son navigateur Web. La fondation vient en effet de faire part de ses intentions dans une discussion sur Google Groupes : « Pour Firefox, nous voulons mieux comprendre comment les utilisateurs utilisent notre produit pour améliorer leur expérience », explique Georg Fritzsche, Platform Engineer de Mozilla travaillant sur la version desktop de Firefox. « Pour ce faire, nous prévoyons de faire une nouvelle étude pour tester la façon dont nous pouvons collecter des données supplémentaires de façon à respecter la vie privée », dit-il.
Le problème
Le problème est qu'il y a une demande récurrente des équipes de produit Firefox pour avoir la capacité de collecter des données plus sensibles, comme les sites les plus visités par les utilisateurs ou les sites Flash que rencontrent les utilisateurs. Ces équipes ont également besoin de savoir comment les fonctionnalités de Firefox fonctionnent sur des sites spécifiques. Mais actuellement, Firefox ne peut collecter ces données que lorsque l'utilisateur donne son consentement, ce qui ne lui permet pas d’avoir suffisamment de données.
Dans une discussion publique, un développeur dans l'équipe JavaScript de Mozilla (avec le pseudo kannanvijayan) essaie de mieux expliquer le problème, mais en parlant à son propre compte. Il dit en effet faire face régulièrement à des problèmes causés par l’insuffisance de données. « Suivre les régressions, les crashs et les problèmes de performance sans une bonne télémétrie sur la fréquence à laquelle cela se produit et dans quel contexte… Les problèmes qui auraient peut-être pu être résolus en quelques jours, avec de bonnes informations, prennent en fin de compte plusieurs semaines, le temps de reproduire le problème avec peu d'informations », dit-il. Ajoutant que « c'est simplement difficile de créer un meilleur navigateur sans une bonne information sur la façon dont il se comporte avec les utilisateurs. »
La solution
La solution que propose Mozilla est l'utilisation de la confidentialité différentielle. En cryptographie, la confidentialité différentielle est un mécanisme qui vise à maximiser la pertinence des résultats d'une requête faite à une base de données statistique tout en minimisant les risques d'identification des enregistrements. D'après Georg Fritzsche, cela va permettre à Firefox de « collecter des données sensibles sans pouvoir tirer de conclusions sur les utilisateurs individuels, préservant ainsi leur vie privée. » En plus, « un attaquant ayant accès aux données qu'un seul utilisateur soumet ne sera pas en mesure de déterminer si un site spécifique a été visité par cet utilisateur ou non. »
L'implémentation la plus connue et la plus déployée de la confidentialité différentielle est le projet open source de Google appelé RAPPOR. Mozilla dit avoir étudié l'utilisation de RAPPOR pour ces types de cas d'utilisation, et les résultats de simulation initiaux ont été prometteurs. Mozilla prévoit donc maintenant de faire une étude (dès la mi-septembre) pour valider sa mise en œuvre de RAPPOR, sur un échantillon aléatoire d'utilisateurs de Firefox.
Risques
Il s'agira de faire un compromis étant donné que la mission générale de Mozilla rend très difficile la collecte de données détaillées. La fondation considère en effet que la confidentialité des utilisateurs est primordiale. Il y a donc deux intérêts majeurs qui entrent en conflit : la nécessité d'obtenir de meilleures informations sur la façon dont le produit sert les utilisateurs et la nécessité pour les utilisateurs de garder leurs habitudes de navigation confidentielles.
D’après kannanvijayan, et comme Mozilla a essayé de l’expliquer, il ne s'agit pas de collecter les URL, mais seulement des domaines de premier niveau +1 (par exemple, images.google.com) et des informations associées. « Cela nous permet de connaître de manière générale sur quels sites nous voyons des problèmes, espérons-le, sans trop compromettre la vie privée de l'utilisateur. En outre, les informations associées au site sont les données de performance », explique l’ingénieur de l’équipe JS de Mozilla. « Toutefois, nous savons aussi par l'histoire que l'intention bienveillante n'est pas si importante. Les organisations changent et intègrent le changement, et les données recueillies maintenant avec une bonne intention peuvent être utilisées avec de mauvaises intentions à l'avenir. Nous devons donc faire attention à tout compromis que nous faisons, afin de veiller à ce qu'un changement d'intention à l'avenir ne compromette pas ce que nous avons à l'origine garanti à l'utilisateur », a-t-il ajouté.
Source : Discussion Google Groupes
Et vous ?


Vous avez lu gratuitement 559 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.