Le 2 février 2020, GitHub va créer une image TAR de chaque dépôt public actif et la conserver au sein de l'Arctic Code Vault, Un coffre-fort sous une montagne de l'Arctique 0PARTAGES 3 0 Une part importante du savoir mondial est de nos jours stockée sur des supports éphémères : disques durs, SSD, CD bons pour quelques décennies, bandes de sauvegarde dont la durée de vie théorique de 30 ans suppose une chaleur et une humidité strictement contrôlées.



GitHub veut apporter sa contribution à la résolution de cette problématique et d’autres comme la survenue de catastrophes susceptibles de provoquer la perte des contenus. Il ne faut en effet pas perdre de vue que c’est l’une des plateformes où la plupart des logiciels ouverts du monde sont développés. Elle revendique 40 millions de personnes dont un grand nombre de bénévoles qui affinent les projets, consignent les bogues qui doivent être corrigés, recherchent les failles de sécurité et suivent les changements. Entre la publication du



L’idée derrière cette dernière est de sauvegarder les contenus des dépôts sur un support de stockage qui a une durée de vie plus importante. Piql, une société norvégienne spécialisée dans le stockage de données à très long terme, se charge de la fourniture et de l’encodage des données sur des bandes de film de 3 500 pieds. La technologie du film repose sur les halogénures d'argent et le polyester. D’après les mesures de l’ISO, ce matériau a une durée de vie de 500 ans. Des tests de vieillissement simulés indiquent que le film de Piql durera deux fois plus longtemps, soit 1000 ans.



Le service web d’hébergement et de gestion de développement de logiciels prévoit de loger les bandes dans une mine de charbon déclassée à Svalbard, en Norvège. La même ville abrite une chambre froide mondiale. Il s'agit de l'une des villes situées le plus au septentrion de la planète. Les archivistes sont d’avis que le froid et les conditions presque constantes vont contribuer de façon favorable à la préservation des contenus.



Le 2 février 2020, GitHub va créer une image TAR de chaque dépôt public actif et la conserver au sein de l’Arctic Code Vault. L’archive inclura des éléments de la branche par défaut de chaque dépôt à l’exclusion de tout fichier binaire de plus de 100 kilooctets. Pour une plus grande densité et intégrité des données, la plupart des données seront stockées sous forme de code QR. Un index et un guide lisibles par l'homme détailleront l'emplacement de chaque dépôt et expliqueront comment récupérer les données.





La plateforme compte ensuite multiplier la durée de sauvegarde des contenus par 10. GitHub a initié un partenariat avec Microsoft Research dans ce sens pour aller jusqu’à 10 000 ans. Pour y parvenir, les équipes de recherche entendent « écrire les contenus sur des plateaux en verre de quartz à l’aide de lasers femtoseconde. »



Le GitHub Archive Vault fait partie d’un vaste programme d’archivage lancé par GitHub avec un certain nombre de partenaires parmi lesquels l’Internet Archive, Microsoft Research et la fondation Long Now. La stratégie se résume en une phrase : archiver les contenus au sein de multiples organisation selon la recommandation LOCKS – Lots Of Copies Keep Stuff Safe.





La stratégie de sauvegarde est organisée en lots hot (GitHub, GHTorrent), Warm (GH Archive, Internet Archive, Software Foundation Heritage) et Cold (Bodleian Library, Arctic World Archive, Project Silica). Les lots hot feront l’objet de mises à jour en temps réel. Ainsi, au niveau de GitHub par exemple, les données feront immédiatement l’objet de transfert vers de multiples centres de données à travers le monde. Les lots warm feront seront mis à jour à une fréquence mensuelle ou annuelle. Enfin, le lot Cold dans lequel on retrouve l’Artic Code Vault feront l’objet de mises à jour tous les 5 ans à minima.



GitHub Archive Program : une initiative pour la préservation des logiciels open source pour les générations futures



« Notre mission première est de préserver les logiciels libres pour les générations futures. Nous avons également l'intention que le GitHub Archive Program soit un témoignage de l'importance de la communauté open source. Nous espérons qu'il permettra, aujourd'hui et à l'avenir, de mieux faire connaître le mouvement mondial de l'Open Source, qu'il contribuera à une plus grande adoption des politiques d'Open Source et d'Open Data dans le monde entier et qu'il encouragera la réflexion sur le long terme », écrit GitHub.



