IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Le 2 février 2020, GitHub va créer une image TAR de chaque dépôt public actif et la conserver au sein de l'Arctic Code Vault,
Un coffre-fort sous une montagne de l'Arctique

Le , par Patrick Ruiz

761PARTAGES

12  0 
Une part importante du savoir mondial est de nos jours stockée sur des supports éphémères : disques durs, SSD, CD bons pour quelques décennies, bandes de sauvegarde dont la durée de vie théorique de 30 ans suppose une chaleur et une humidité strictement contrôlées.

GitHub veut apporter sa contribution à la résolution de cette problématique et d’autres comme la survenue de catastrophes susceptibles de provoquer la perte des contenus. Il ne faut en effet pas perdre de vue que c’est l’une des plateformes où la plupart des logiciels ouverts du monde sont développés. Elle revendique 40 millions de personnes dont un grand nombre de bénévoles qui affinent les projets, consignent les bogues qui doivent être corrigés, recherchent les failles de sécurité et suivent les changements. Entre la publication du dernier State of the Octoverse et celui qui le précède, la plateforme a vu la création de plus de 44 millions de dépôts. GitHub peut donc être considéré comme une gigantesque bibliothèque d'outils logiciels réutilisables, toute chose susceptible de justifier le lancement de l’initiative Artic Code Vault.

L’idée derrière cette dernière est de sauvegarder les contenus des dépôts sur un support de stockage qui a une durée de vie plus importante. Piql, une société norvégienne spécialisée dans le stockage de données à très long terme, se charge de la fourniture et de l’encodage des données sur des bandes de film de 3500 pieds. La technologie du film repose sur les halogénures d'argent et le polyester. D’après les mesures de l’ISO, ce matériau a une durée de vie de 500 ans. Des tests de vieillissement simulés indiquent que le film de Piql durera deux fois plus longtemps, soit 1000 ans.

Le service web d’hébergement et de gestion de développement de logiciels prévoit de loger les bandes dans une mine de charbon déclassée à Svalbard, en Norvège. La même ville abrite une chambre froide mondiale. Il s'agit de l'une des villes situées le plus au septentrion de la planète. Les archivistes sont d’avis que le froid et les conditions presque constantes vont contribuer de façon favorable à la préservation des contenus.

Le 2 février 2020, GitHub va créer une image TAR de chaque dépôt public actif et la conserver au sein de l’Arctic Code Vault. L’archive inclura des éléments de la branche par défaut de chaque dépôt à l’exclusion de tout fichier binaire de plus de 100 kilooctets. Pour une plus grande densité et intégrité des données, la plupart des données seront stockées sous forme de code QR. Un index et un guide lisibles par l'homme détailleront l'emplacement de chaque dépôt et expliqueront comment récupérer les données.


La plateforme compte ensuite multiplier la durée de sauvegarde des contenus par 10. GitHub a initié un partenariat avec Microsoft Research dans ce sens pour aller jusqu’à 10 000 ans. Pour y parvenir, les équipes de recherche entendent « écrire les contenus sur des plateaux en verre de quartz à l’aide de lasers femtoseconde. »

Le GitHub Archive Vault fait partie d’un vaste programme d’archivage lancé par GitHub avec un certain nombre de partenaires parmi lesquels l’Internet Archive, Microsoft Research et la fondation Long Now. La stratégie se résume en une phrase : archiver les contenus au sein de multiples organisations selon la recommandation LOCKS – Lots Of Copies Keep Stuff Safe.


La stratégie de sauvegarde est organisée en lots hot (GitHub, GHTorrent), Warm (GH Archive, Internet Archive, Software Foundation Heritage) et Cold (Bodleian Library, Arctic World Archive, Project Silica). Les lots hot feront l’objet de mises à jour en temps réel. Ainsi, au niveau de GitHub par exemple, les données feront immédiatement l’objet de transfert vers de multiples centres de données à travers le monde. Les lots warm seront mis à jour à une fréquence mensuelle ou annuelle. Enfin, le lot Cold dans lequel on retrouve l’Artic Code Vault fera l’objet de mises à jour tous les 5 ans à minima.

GitHub Archive Program : une initiative pour la préservation des logiciels open source pour les générations futures

« Notre mission première est de préserver les logiciels libres pour les générations futures. Nous avons également l'intention que le GitHub Archive Program soit un témoignage de l'importance de la communauté open source. Nous espérons qu'il permettra, aujourd'hui et à l'avenir, de mieux faire connaître le mouvement mondial de l'Open Source, qu'il contribuera à une plus grande adoption des politiques d'Open Source et d'Open Data dans le monde entier et qu'il encouragera la réflexion sur le long terme », écrit GitHub.

Source : GAP

Et vous ?

Que pensez-vous de cette initiative ?

Voir aussi :

Rachat de GitHub : pourquoi ce rachat, et quels sont les plans de Microsoft

GitHub permet désormais de créer un nombre illimité de référentiels privés avec son offre gratuite et annonce une offre unifiée pour les entreprises

À tous ceux qui ont fui GitHub suite au rachat par Microsoft : GitLab est hébergé sur Microsoft Azure

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de eldran64
Membre extrêmement actif https://www.developpez.com
Le 26/11/2019 à 11:21
Citation Envoyé par ShigruM Voir le message
je vois pas l’intérêt...
Il y a la fois un côté artistique (laisser une trace dans l'histoire) et un côté utilitariste. Effectivement les logiciels ne cessent de progresser et de se corriger régulièrement. Mais ça fera un excellent snapshot pour aider nos descendant à comprendre qui on était. Une sorte de capsule temporelle mais pour le code info.
0  0 
Avatar de hotcryx
Membre extrêmement actif https://www.developpez.com
Le 26/11/2019 à 16:04
Citation Envoyé par ShigruM Voir le message

Qui a besoin d'un kernel linux 2.5.1 par exemple ?
Ce n'est pas Qui mais Quoi.

Pour retrouver des fonctionnalités...

EDIT: faites un tour sur l'excellent archive.org, on retrouve des perles.
0  0 
Avatar de ShigruM
Nouveau Candidat au Club https://www.developpez.com
Le 23/11/2019 à 17:18
je vois pas l’intérêt...
Je comprend l’intérêt de sauver les vieux programmes (jeux, logiciels...) en version finale (compilé et/ou avec le code source) pour en faire profiter les générations actuel/futur,

mais par contre je vois pas l'interet de sauvegarder des projets qui évolue comme le kernel linux par exemple. l'industrie du logiciel évolue tellement vite qu'il me semble inutile de sauvegarder ce genre de projets.

Qui a besoin d'un kernel linux 2.5.1 par exemple ?
Y'en a qui s'amuse a ouvrir et a utiliser des projets PHP1, python1, activeX sous IE5.5 ? en générale on les recodes le plus vite possible et on s'en débarrasse.

Le seul intérêt c'est pour des archéologeek de déterrer du vieux code comme on déterre une momie et l'exposer dans un musée mais certainement pas de réutiliser ce vieux code.
0  2