Tout d’abord il faut procéder au stockage du génome des personnes volontaires. A cet effet, Google a déjà contacté des universités mais également des hôpitaux. Pendant ces 18 mois de Recherche et Développement, les ingénieurs de Google ont mis sur pied une API telle que définie par l’Alliance Mondiale pour la génomique et la santé afin de sauvegarder les données relatives à l’ADN dans le Cloud mais également visualiser ou même comparer de nombreux brin d’ADN en entier en quelques secondes avec des requêtes de type SQL et plus encore jusqu’à la possibilité de partage des données génomiques avec son groupe de collaborateurs. Pour rappel, cette alliance qui a été constituée pour contribuer à accélérer le développement de la médecine « génomique » réunit aujourd’hui plus de 200 instituts de recherche en santé, sciences de la vie et technologies de l’information.
Pour l’instant, décoder un seul génome humain est une affaire d’au moins quelques heures, et la taille des données collectées est de l’ordre de la centaine de giga octets en données brutes. Par la suite le stockage avec Google coûte 25 dollars par an, ceci sans les calculs qui vont être faits sur les données et qui s’accompagnent également d’un coût. Cependant, une fois que les données brutes sont nettoyées, le poids de données d’un génome humain tend vers le giga octet et par se fait revient 100 fois moins cher (25 cents par an).
David Glazer, l’ingénieur Google a la tête de ce projet, a expliqué à la revue technologique du MIT que faciliter le plus possible la comparaison des génomes devient une nécessité à cause du changement dans la façon qu’ont les chercheurs dans les études de gènes. Avant les gens étudiaient un seul génome, désormais ils pourront en étudier beaucoup plus à la fois. Avec Google Genomics, ils auront l’opportunité de comparer des millions de génomes et probablement de multiplier leurs découvertes durant ce processus. « Notre chance est de trouver comment utiliser une avancée technologique pour les aider dans leur transition » a-t-il avancé.
Une aventure dans laquelle l'Institut Nationale du Cancer a décidé de s’embarquer ; l'organisation a déclaré qu'elle verserait 19 millions de dollars pour télécharger des copies de son 2,6 péta octets (1 péta octet correspond à 100 téraoctets) depuis son Atlas des Génomes du Cancer dans Google Genomics mais également dans les data center d’Amazon génomique et le centre de données d'Amazon. De plus, Google Genomics compte déjà pas moins de 3 500 génomes de projets publics.
Concernant les prix, Somalee Datta, une physicienne de Stanford, estime qu’ils « deviennent enfin raisonnables, et nous pensons qu’ils vont continuer de chuter ».
Il faut tout de même préciser qu’il sera possible aux scientifiques d’utiliser une variante de BigQuery qui a été pensé dans sa genèse pour suivre et étudier le comportement des internautes sur le web. Comme le rappelle Datta, le système de Google « peut s’adapter aux besoins de la génétique, c’est donc la bonne technologie pour un nouveau problème ». L’outil Genomics est disponible en téléchargement sur GitHub en version beta.
Télécharger l'outil Genomics (GitHub) ou télécharger le client java jar
Source : MIT Technology Review , Google Genomics
Et vous ?
Que pensez-vous de ce projet ?