Developpez.com

Le Club des Développeurs et IT Pro

Du JavaScript stocké dans des molécules d'ADN

Serait-ce l'avenir des supports de stockage ?

Le 2012-08-17 17:41:30, par tarikbenmerar, Chroniqueur Actualités


C'est une prouesse que vient d'accomplir George Church de l'institut de Wyss de l'université Harvard, aidé par ses collègues. Ils ont réussi à encoder 53,400 mots d'un livre, 11 images JPG et un programme JavaScript, d'une totalité de 5,27 millions bits de données, dans des séquences d'ADN. Ainsi, ils ont réussi à battre le record précédent de l'équipe de Craig Venter en 2010, qui a réussi, elle, à encoder 7920 bits d'un filigrane synthétique dans leur bactérie.

L'ADN est considéré comme étant parmi les médias de stockage les plus denses et stables. En théorie, il est possible d'encoder deux bits par nucléotide. Ce qui nous amène à 455 exabytes par gramme d'ADN monocaténaire, ce qu'équivaut à 100 milliards DVD par gramme. Sans compression !

Ainsi, il est cinq ou six fois plus dense que les médias de stockage existants, tels que les mémoires flash. Les données sont aussi très persistantes dans le temps, et peuvent être lues de milliers d'années après leur écriture.

Néanmoins, la difficulté et le coût de lecture/écriture de longues séquences d'ADN ont empêché la généralisation de ce moyen de stockage. Church et son équipe sont arrivés à ce résultat en développant une technique qui élimine le besoin pour les longues séquences. En effet, ils encodent l'information dans de blocs distincts, et stockent ces derniers dans des portions distinctes plus courtes.

Cette stratégie est exactement analogue au stockage de données dans les disques durs, où les données sont divisées dans des blocs séparés appelés secteurs. Fragmentation !

Le programme JavaScript et le livre coécrit par Church ont été transformés dans un format de bit. Ensuite, l'équiper a synthétisé l'ADN pour répéter cette séquence de bits, en encodant un bit sur chaque base ADN. Les bases ADN A ou C sont encodées en '0', alors que G et T sont encodées en '1'.

Il faut noter que la molécule d'ADN ne peut servir qu'en lecture seulement, du fait qu'elle est synthétisée en même temps que l'encodage des données. Néanmoins, cette limitation ouvre la possibilité à un système d'archivage à long terme.

Ce résultat montre tout le progrès atteint par les technologies de synthèse et de séquençage ADN, jusqu'au point où il est maintenant possible d'intégrer une séquence d'information ADN dans un support de stockage.

Et vous ? C’est pour quand votre clé ADN ?

Source : Science
  Discussion forum
42 commentaires
  • Népomucène
    Modérateur
    Ils ont réussi à encoder 53,400 mots d'un livre, 11 images JPG et un programme JavaScript
    @Thorna
    Le programme JavaScript n'est qu'une petite partie de ce qui a été stocké.
    Tu as raison : le titre de ce post induit en erreur !
  • Julien Bodin
    Membre éclairé
    Envoyé par Uther
    Personnellement je suis assez sceptique quant à l'avenir de cette technologie. Je ne suis pas un expert en biologie mais il me semble bien me souvenir que des mutations dans l'ADN de nos cellules arrivent en permanence, a moins qu'il aient trouvés des mécanismes supplémentaires pour empêcher ça, la stockage à long terme sur de l'ADN me parait risqué.
    Les mutations ne sont pas spontanées. Elles surviennent lorsque l'ADN est répliqué (lors d'une division cellulaire) et que les enzymes responsables de la copie font des erreurs et dans le processus décrit il n'y a pas de copie au sens cellulaire mais de l'amplification.
  • gbdivers
    Inactif
    Merci pour le "docteur Frankenstein"

    Pour info, écrire des séquences d'ADN, on sait le faire depuis des dizaines d'années. L'inovation ici, c'est la longueur de la séquence qu'ils arrivent à écrire.

    Ensuite ils découvriront comment stocker des infos dans l'ADN humain et feront du vol d'informations (pirates informatiques...), et utiliseront des complices, des victimes... comme transporteurs d'informations.
    Pour info, ce qui se passe dans la petite boîte magique qui affiche des images qui bougent et qui parlent, ce n'est pas toujours la vérité...
    Plus sérieusement, pourquoi on aurait bien de telles techniques basées sur l'ADN alors que les "agents du renseignement" savent très bien voler des secrets industriels sans ça ? Il est tellement plus simple de placer un cheval de troie ou d'envoyer les données par mail

    Une puce indélébile nous sera implantée génétiquement et nous serons tous marqués.
    Non mais sérieusement, éteint la petite boîte avec des images qui bougent
  • mitkl
    Membre éprouvé
    Pas besoin d'aller aussi loin que les OGM et le nucléaire à vrai dire, en restant dans l'informatique, on croise de nombreuses craintes, à chaque fois qu'on parle d'intelligence artificielle, il y a toujours quelqu'un pour crier à Skynet et un farfelu pour dire qu'à force de faire des recherches en IA, on va créer un robot tellement intelligent qu'il deviendra du monde.

    Les tendances niveau paranoia en ce moment c'est le Machine Learning, le problème c'est que personne ne connait vraiment ce domaine et toutes ses possibilités alors évidemment on imagine le pire et on dit que le seul intérêt du ML c'est d'en savoir plus sur chaque être humain et ses habitudes afin d'affiner la publicité. Alors que le Machine Learning est une discipline utile en médecine qui permet de conseiller un médecin sur certains diagnostiques, ou encore de prévoir le temps à partir d'un ensemble de données.

    Pareil pour le Computer Vision, les gens ne connaissent pas le domaine, alors il s'imagine tous que la seule application du Computer Vision c'est de tracker les gens dans les rues avec des caméras de surveillance. Sauf que le Computer Vision c'est aussi ce qui permet à Curiosity sur sa planète Mars de ne pas foncer comme un demeuré contre un rocher ou de sauter d'une falaise (Object recognition).

    Je ne connais pas trop la biologie et l'ADN, je n'ai pas honte de le dire. J'ai juste quelques mots qui me reviennent du lycée du style "Transcription de l'ADN", "ARN", "ACGT", etc. Et malgré mes faibles connaissances je ne suis pas en train de m'imaginer des espèces vivantes mutantes créées à partir d'ADN codée numériquement. On a toujours et trop tendance à prendre les scientifiques pour des cons alors que vous vous posez des questions auxquelles ils ont déjà répondu depuis de nombreuses années. N'ayons pas peur de dire que nous ne savons pas !
  • gbdivers
    Inactif
    Envoyé par hotcryx
    ouvre les yeux mon gars, tu vis au pays des bisounours.
    A titre d'exemple: clonage (humain), bombe atomique, vols d'organes, génocides... sont le genre de chose dont l'humain est capable.
    Ah dommage, tu as perdu une occasion de te taire. Tu aurais un peu fait attention, tu aurais vu mon message suivant, en particulier :

    Envoyé par gbdivers
    détournent l'attention sur les vrais problématiques (parce que oui, il y a quand même de vraies questions pratiques, sécuritaires et éthiques)
    Donc oui, il y a sans problème des dérives dangereuses. Mais souvent, écouter ses peurs irrationnelles ne permet pas de voir les vrais problèmes
  • Népomucène
    Modérateur
    Envoyé par Jarodd
    Cela signifie qu'on pourra bientôt stocker des données dans le corps ? Et se les échanger par prise de sang ?

    Je ne crois pas. Si j'ai bien compris un commentaire sur cet article de Sciences,
    Il a fallu générer artificiellement de l'ADN et l'encoder au fur et à mesure.
    Donc cet ADN de synthèse n'a rien à voir avec l'ADN naturel d'un être vivant.
  • Uther
    Expert éminent sénior
    Pour moi mutations spontanées et sécurisation des données sont deux concepts antinomiques.
  • minnesota
    Membre émérite
    Reste plus qu'à trouver un couple pour faire du raid
  • gbdivers
    Inactif
    Envoyé par Uther
    Pour moi mutations spontanées et sécurisation des données sont deux concepts antinomiques.
    Sauf que tous les supports présentent des problèmes de corruption des données
    Dans la très grande majorité des cas, ça n'a pas d'importance (un bit changé dans une image ou dans un texte, on le verra même pas)
    Quand c'est des données critiques, on utilise la redondance pour sécuriser

    Envoyé par oXisahk
    Les mutations spontanées sont extrêmement rares.
    Question de point de vue. Si on vie assez vieux, on a une chance d'environ 100% de produire des cellules cancéreuses. Wiki parle de "1,000 to 1,000,000 molecular lesions per cell per day". On peut pas parler d'extrêmement rare

    Envoyé par oXisahk
    Mais on pourrait faire des lectures en simultanées ?
    C'est ce que l'on a fait pour séquencé le génome humain : on l'a découpé en fragment de quelques milliers (millions ?) de paires de base et on a utiliser des batteries de séquenceurs pour lire chaque fragment
    Ensuite ça a pris des années pour remettre tous les fragments dans l'ordre
  • pmithrandir
    Expert éminent
    Envoyé par gbdivers
    Il n'y a aucune chance que cette technique devienne un jour un technique de stockage des données informatiques. En lecture, on est à quelques centaines de base à la minute, même en comptant sur des évolutions technologiques, on n'aura jamais des débits intéressants. En écriture, c'est encore pire, on est à quelques bases minutes...
    Enfin, on se rappelle des gens qui disait que 640ko ca serait suffisant et qu'on ferait pas mieux...

    Même si ca ne devient pas un support grand public, c'est toujours interessant d'essayer de nouvelles choses.
    Par exemple, rien que pour crééer des produit qui ne soient pas influencé par le magnetisme.