Les informations privées et personnelles de plus de 1,5 milliard d'utilisateurs de Facebook seraient en train d'être vendues sur un forum populaire de pirates informatiques. Ces informations privées et personnelles permettront aux cybercriminels et aux annonceurs sans scrupules de cibler les internautes du monde entier. Selon l'auteur du forum, les données fournies contiennent le nom, l'adresse électronique, le numéro de téléphone, la localisation, le sexe et l'identifiant des victimes.Le vendeur prétend représenter un groupe de scrapers web en activité depuis au moins quatre ans et affirme avoir eu plus de 18 000 clients pendant cette période. Les échantillons présentés sur le forum montrent que les données semblent effectivement authentiques. Ils affirment avoir obtenu les données par scraping (extraction de contenus) plutôt que par piratage ou compromission des comptes des utilisateurs individuels.
Rappelons que le « scraping » est une technique permettant d'extraire du contenu (des informations) d'un ou de plusieurs sites web de manière totalement automatique. Ce sont des scripts, des programmes informatiques, qui sont chargés d'extraire ces informations. Si, techniquement, aucun compte n'a été compromis, ce n'est qu'une maigre consolation pour ceux dont les données peuvent désormais se retrouver entre les mains de spécialistes du marketing Internet sans scrupules et probablement aussi entre celles de cybercriminels.
Les spécialistes du marketing sans scrupules peuvent utiliser ces données pour inonder des personnes ou des groupes de personnes spécifiques de publicités non sollicitées. Le fait que les numéros de téléphone, la localisation dans la vie réelle et les noms complets des utilisateurs soient inclus dans les données est particulièrement inquiétant. En outre, le spam par SMS et par notification Push est de plus en plus répandu, même si la plupart des pays ont rendu ces pratiques illégales il y a plusieurs années.
Le scraping est-il légal ?
Le web scraping est aussi appelé « screen scraping », ou « harvesting ». Ces termes recouvrent l’ensemble des techniques consistant à récupérer le contenu d’un site web, pour les intégrer dans un autre. Il s’agit d’une pratique fréquente.
L’affaire Ryanair contre Opodo en France illustre la tendance la plus libérale de la jurisprudence. Ryanair poursuivait le comparateur de prix Opodo pour avoir publié seulement une partie de ses tarifs. Selon la Cour, Ryanair ne démontrait pas avoir fait des investissements suffisants dans la présentation de sa grille de prix. Le transporteur ne pouvait donc pas se prévaloir d’une protection par le droit des bases de données. Par ailleurs, la violation des conditions générales n’était pas plus efficace : ces conditions n’étaient applicables qu’à l’achat d’un billet d’avion, et non pour toute visite du site internet. D’autres arguments existent. Parmi ceux-ci, certains web scrapers font habituellement valoir le caractère public des informations disponibles en ligne.
Cependant, de nombreux arguments commandent la prudence. D’abord, le scraping pourrait être considéré comme une pratique déloyale parasitaire. Ceci est particulièrement vrai lorsque le scraping est le fait d’un concurrent. Ensuite, il est rare que le site copié ne parvienne pas à prouver avoir réalisé un investissement substantiel dans sa base de données. Un tel investissement permet habituellement de se prévaloir d’un droit de propriété intellectuelle. Cela dépend toutefois du type d’utilisation qu’en fait le scraper. Les données peuvent être utilisées pour mettre en péril la sécurité des utilisateurs. Par exemple, les pirates peuvent utiliser les données extraites pour mener des attaques de phishing.
Selon certains analystes, la véritable question serait de savoir comment le web scraper compte utiliser les données extraites d'un site web (manuellement ou à l'aide d'un logiciel). En effet, les données affichées par la plupart des sites web sont destinées à la consommation publique. Il est tout à fait légal de copier ces informations. Mais c'est sur la manière dont on compte utiliser ces données que vous devez faire attention.
L'identification des numéros de...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.