Qu’est-ce qui a suscité leurs inquiétudes ? Certains évènements comme le fait que les références aux changements climatiques ont été retirées du site Web de la Maison-Blanche le jour de l’investiture du nouveau président américain, comme l’a noté le Washington Post, ou encore que l’administration Trump a demandé à l’EPA, l’Agence américaine de protection de l'environnement, de retirer la page relative aux changements climatiques de son site Web, comme l’a indiqué Reuters.
« Si le site venait à être fermé, des années de travail que nous avons fait sur le changement climatique disparaîtront », avait alors déclaré l'un des membres de l'EPA à Reuters, qui a ajouté que certains employés s'efforçaient de sauver une partie de l'information contenue sur le site Web et d’autres ont tenté de convaincre l'administration Trump afin d’en conserver des parties.
Certains craignent que les données ne soient intentionnellement perdues ou altérées. D'autres veulent s'assurer que les données sont disponibles à plus d'un endroit, en particulier sur plus d'un site Web gouvernemental, étant donné que les réductions budgétaires pourraient avoir un impact sur l'espace serveur et donc garder ces ensembles de données pourrait ne plus être une priorité.
C’est dans ce contexte que sont nées diverses initiatives visant à protéger l’accès aux données. L’une d’elles, DataRefuge, a été mise sur pied après l’élection présidentielle par Penn Libraries (de l’université de Pennsylvanie) et Penn Program in the Environmental Humanities (un collectif de chercheurs, d'étudiants, d'artistes, de scientifiques et d'éducateurs dont la mission est de susciter une prise de conscience locale et mondiale et un engagement dans le domaine émergent des sciences humaines de l'environnement).
Margaret Janz, bibliothécaire de l’université de Pennsylvanie, a commenté cette initiative en expliquant que « nous sommes très préoccupés par le fait que les données puissent être mises hors ligne et que le public pourrait ne plus y avoir accès autrement que par des demandes invoquant la Freedom of Information Act ». Et de continuer en disant que « notre objectif est de faire des copies dignes de confiance des données pour qu'elles soient disponibles au public et adaptées à la recherche... Ces données ne devraient jamais avoir été en un seul endroit ».
DateRefuge a tenu environ 30 évènements d'archivage de données et chacun d'eux a suscité en moyenne 100 participants, selon Janz. L'évènement du New Hampshire, qui a eu lieu le 10 mars, était l'un des évènements avec le plus petit taux de participation. Les organisateurs travaillent également sur les moyens de maintenir leur communauté engagée sur le long terme.
Image satellite de l'ouragan Otto qui s'approche des côtes nord-américaines
« Supprimer des données est comparable à brûler des livres », a estimé Matt Jones, un développeur logiciel à Yieldbot basé au Massachusetts qui a participé à l'archivage des données à l'évènement du New Hampshire. « Je suis passionné par les données et l'information [...] Je ne crois pas en jeter quoi que ce soit : toutes les données sont pertinentes pour quelqu'un ».
Les bénévoles de DataRefuge ne piratent pas les sites et ne volent pas les données ; ils travaillent à faire des copies de données qui sont dans le domaine public. À cet effet, ils reçoivent une formation qu’ils peuvent appliquer durant les évènements ou à la maison s’ils le désirent.
Une partie du travail est le seeding ; les participants désignent des URL à stocker dans Internet Archive, la bibliothèque numérique publique, pour donner la possibilité à son robot d'exploration d’extraire les données nécessaires de la page en question. Dans le cas où l’opération est trop complexe pour le robot (par exemple si la page est hautement interactive), les seeders la note et le relais sera passé à des volontaires qui vont « récolter » l’information.
Pour ce faire, ils vont utiliser des scripts et des outils développés en Python ou R, parcourir manuellement ces pages et collecter des jeux de données comme des fichiers GIS ou des cartes météo qu’ils vont sauvegarder.
Durant l’évènement qui a eu lieu au New Hampshire, ces « collecteurs » étaient divisés en deux groupes : ceux qui se servaient d’outils Python et ceux qui se servaient d’outils R.
visiter le site de DataRefuge
Source : Washington Post (DataRefuge), Washington Post (références aux changements climatiques retirées de la page de la Maison-Blanche), Reuters
Et vous ?
Que pensez-vous de cette initiative ?