Présentation

Article

1 - CONTEXTE

  • 1.1 - Sphère globale des données (SGD)
  • 1.2 - Centres de données

2 - STOCKAGE DE L’INFORMATION NUMÉRIQUE SUR L’ADN

3 - STOCKAGE DE L’INFORMATION NUMÉRIQUE SUR DES POLYMÈRES NON-ADN

4 - CONCLUSION

Article de référence | Réf : RE288 v1

Conclusion
Archivage de mégadonnées dans l’ADN

Auteur(s) : François KÉPÈS

Date de publication : 10 août 2021

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Sommaire

Présentation

RÉSUMÉ

Les centres de données stockent les mégadonnées numériques sur disques durs et bandes magnétiques qui sont recopiés tous les 5-7 ans ; ils représentent des "gouffres" pour les ressources en terrain, électricité et matériaux rares. Après avoir analysé cet état de l'art, l'article présente une solution de rupture pour l'archivage de mégadonnées à l’échelle moléculaire, sur l’ADN. Il en montre les avantages et limites, puis décrit les technologies sous-jacentes, et étend la discussion au cas des polymères non-ADN. Il conclut en traçant des perspectives techno-scientifiques et économiques à cette approche.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

ABSTRACT

Archiving of big data in DNA

Datacenters store digital big data on hard disks and magnetic tapes that are copied every 5-7 years; they devour resources such as land, electricity and scarce materials. After analyzing this state of the art, this article presents a breakthrough solution for big data archiving at the molecular scale, on DNA. It shows its advantages and limitations, then describes the underlying technologies, and extends the discussion to the case of non-DNA polymers. It concludes by outlining the techno-scientific and economic perspectives of this approach.

Auteur(s)

  • François KÉPÈS : Animateur du groupe de travail « ADN : lire, écrire, stocker l'information » de l’Académie des technologies - Académie des technologies, Académie d’Agriculture de France (Paris, France)

INTRODUCTION

Linformation a été le moteur de la croissance socio-économique de la civilisation depuis ses débuts. Actuellement, son stockage, archivage et traitement par les centres dédiés n’offrent plus de marges suffisantes d’optimisation pour faire face au déluge des données, et à son problématique impact environnemental. Un récent rapport de l’Académie des technologies explore une alternative prometteuse au modèle conventionnel : l’archivage des données à l’échelle moléculaire, un chantier de 20 ans.

En effet, le stockage et archivage des mégadonnées numériques (« big data ») par l’approche actuelle des centres de données ne seront pas soutenables au-delà de 2040. La sphère globale des données (SGD) créées par l’humanité était estimée en 2018 à 33 zettaoctets (33 mille milliards de milliards d’octets), du même ordre que le nombre estimé d’étoiles dans l’univers observable. La SGD augmente d’un facteur deux tous les deux ou trois ans, soit environ cent à mille tous les vingt ans. Cet article ne traite pas des efforts qui pourraient être consentis pour ralentir la croissance de la SGD, même si cet aspect fait partie de la problématique au sens large.

Une part majoritaire de ces données est ensuite stockée dans plusieurs millions de centres de données (en incluant ceux des entreprises et le « cloud »), qui fonctionnent au sein de réseaux de transmission. Ensemble, ceux-ci consomment déjà environ 2-4 % de l’électricité dans les pays avancés. Leur coût de construction et d’exploitation est globalement de l’ordre de mille milliards d’euros. Ces centres couvrent un millionième de la surface émergée du globe (soit environ 150 km2) ; au rythme actuel, ils en couvriraient un dix-millième à un millième vers 2040 (soit environ 150 000 km2, 1/3 de la France). Les technologies de stockage utilisées par ces centres sont rapidement frappées d’obsolescence aux niveaux du format, du dispositif de lecture/écriture mais également du support lequel nécessite des copies tous les cinq à sept ans pour garantir l’intégrité des données. Elles posent aussi des problèmes croissants d’approvisionnement en ressources rares comme le silicium de grade électronique.

Sachant qu’en 2040, il y aurait cent à mille fois plus de données à conserver, ces chiffres démontrent que le modèle actuel de conservation sera d’ici là devenu insuffisant, tout en étant insupportable au plan environnemental.

L’alternative prometteuse discutée dans cet article est offerte par les supports moléculaires porteurs d’information, tel que l’ADN, utilisé ici comme agent chimique en dehors du vivant, ou d’autres hétéropolymères non-ADN très prometteurs. Potentiellement, l’ADN permet des densités informationnelles dix millions de fois supérieures aux mémoires traditionnelles : toute la SGD actuelle tiendrait dans une fourgonnette. L’ADN est stable à température ordinaire durant plusieurs millénaires, sans consommation énergétique. Il peut être aisément multiplié ou détruit à volonté. Certains calculs peuvent être physiquement implémentés avec des fragments d’ADN. Enfin, sa technologie ne deviendra pas obsolète car il constitue notre matériel héréditaire.

Points clés

Domaine : 1) Technologies de l’Information ; 2) Procédés Chimie Bio Agro

Degré de diffusion de la technologie : Émergence

Technologies impliquées : Biologie moléculaire ; Chimie des hétéropolymères ; Informatique du codage/décodage

Domaines d’application : Archivage des données numériques ; centres de données ; cloud ; big data ; intelligence artificielle

Principaux acteurs français :

Pôles de compétitivité :

Centres de compétence : Institut Charles Sadron, CNRS et Univ. Strasbourg ; I3S, CNRS et Univ. Nice ; IRISA, INRIA, CNRS et Univ. Rennes

Industriels : DNA Script ; Imagene

Autres acteurs dans le monde : Voir bibliographie et sites Web en fin de texte

Contact : [email protected]

Cet article est réservé aux abonnés.
Il vous reste 94% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

KEYWORDS

datacenter   |   data global sphere   |   digital polymers

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-re288


Cet article fait partie de l’offre

Technologies logicielles Architectures des systèmes

(233 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation

4. Conclusion

4.1 Perspectives techno-scientifiques

La preuve de concept de l’archivage de données numériques sur l’ADN hors du vivant ( in vitro ) est établie. Plusieurs études ont montré que cet archivage peut prendre en charge l’accès sélectif et évolutif aux données, ainsi que le stockage et la restitution d’information sans erreur. Cependant, des défis techniques subsistent pour que ce procédé devienne viable économiquement pour un large spectre de données. Ils concernent l’amélioration des coûts, de la vitesse et de l’efficacité des technologies de lecture, et surtout d’écriture et édition, de l’ADN ou autres polymères.

Concernant l’écriture, plusieurs acteurs du domaine placent leurs espoirs dans la synthèse d’ADN par voie enzymatique, dont le potentiel de développement semble supérieur à celui de la voie chimique traditionnelle. Lorsque des modifications sur de l’ADN stocké deviennent nécessaires (accès évolutif), deux approches sont a priori envisageables, soit la réécriture, soit l’édition du stock. Le choix entre ces deux approches doit s’appuyer sur une évaluation du rapport coût/bénéfice, qui dépend de l’extension des modifications, de leur multiplicité, et de l’état de l’art qui évolue rapidement.

Quant à la lecture, l’usage de nanopores offre un bon potentiel car cette approche restitue de longues séquences d’un seul tenant, est intrinsèquement parallélisable et montre une grande versatilité en s’adaptant à la croissante diversité chimique des polymères à applications « numériques ».

Notons aussi que, quoique les vitesses d’écriture et de lecture de l’ADN soient limitantes, cet inconvénient est pallié dans certaines applications par la possibilité de parallélisation massive. Concrètement, d’ici 2024, une seule machine pourrait écrire et lire 1 To par jour.

Pourtant, plusieurs ordres de grandeur manquent actuellement pour la pleine adoption de la solution « ADN pour l’archivage de mégadonnées » : un facteur d’environ mille pour le coût de lecture, et cent millions pour celui d’écriture. Ces facteurs peuvent sembler faramineux. Ce serait oublier la célérité des progrès des technologies associées à l’ADN. Ainsi, George M. Church avait estimé en...

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Technologies logicielles Architectures des systèmes

(233 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Conclusion
Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - Académie des technologies -   Big data : un changement de paradigme peut en cacher un autre.  -  EDP Sciences (2015).

  • (2) - Commission Européenne -   HiPEAC Vision 2015.  -  FP7 (2015).

  • (3) - REINSEL (D.), GANTZ (J.), RYDNING (J.) -   The Digitization of the World – From Edge to Core.  -  International Data Corporation & SeaGate (2018).

  • (4) -   Guide informatique  -  . Éd. (2008) https://www.guideinformatique.com/dossiers-actualites-informatiques/consommation-electrique-des-data-centers-29.html

  • (5) - DAVEY (J.) -   Powering the data revolution.  -  HSBC Global Research (2019).

  • (6) - COOK (G.) -   How clean is your cloud ?  -  Greenpeace International (2012).

  • ...

1 Sites internet

Archiver les mégadonnées au-delà de 2040. La piste de l’ADN https://www.academie-technologies.fr

Les « data centers » ; de vraies usines électriques https://www.lemonde.fr

International Data Corporation digital universe study https://www.idc.com

8,6 millions de data centers dans le monde en 2017 http://hebergement-et-infrastructure.fr

Business Wire: IDC finds growth https://www.businesswire.com

Here’s how much energy all us data centers consume https://www.datacenterknowledge.com

How clean is your cloud? https://www.greenpeace.org

Molecular Information Storage (MIST) https://www.iarpa.gov

DNAshell – Imagene http://www.imagene.fr

Twist Bioscience https://www.twistbioscience.com

DNA Script http://www.dnascript.com

Oxford Nanopore Technologies https://nanoporetech.com

HAUT DE PAGE

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Technologies logicielles Architectures des systèmes

(233 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS