Support de l'information génétique de tout être vivant, l'ADN ou acide désoxyribonucléique forme une hélice double brin. Chaque brin est constitué d'un enchaînement de nucléotides, formés eux-mêmes d'un sucre, un groupement phosphate et une base azotée ; adénine, cytosine, guanine ou thymine. Celles-ci constituent les éléments principaux du code génétique d'un organisme.
Cet enchaînement de nucléotides forme les gènes, qui, au sein de chacune des cellules, codent pour l'information nécessaire au développement, au maintien et à la reproduction d'un organisme. La taille d'un génome (ensemble du matériel génétique d'une cellule contenant toutes les séquences codantes et non codantes) peut varier de quelques milliers de bases pour les virus, à quelques millions pour les bactéries (4,6 mégabases ou Mb pour la bactérie Escherichia coli) et à quelques milliards pour les organismes pluricellulaires (3,4 gigabases ou Gb pour l'homme).
Le séquençage est la lecture de la succession des nucléotides le long d'une molécule d'ADN. Le résultat produit est un texte écrit dans l'alphabet A, C, G, T. Les séquenceurs lisent des fragments de plusieurs bases, appelés « reads », dont la longueur varie en fonction des technologies. Le génome d'un organisme s'obtient ensuite par l'assemblage des « reads ». Depuis le milieu des années 2000, les séquenceurs à haut débit sont devenus un outil indispensable à la recherche en biologie et plus particulièrement dans le domaine du médical.
Décrypter les génomes est un enjeu majeur pour la recherche scientifique. Il aide à mieux comprendre et appréhender le fonctionnement des êtres vivants, et trouve de nombreuses applications quel que soit le domaine d'expertise : médecine, environnement, agriculture...
La demande n'a jamais été aussi grande pour les technologies révolutionnaires qui offrent des informations rapides, précises et peu coûteuses sur le génome. Ainsi, de par les progrès techniques apportés ces dernières années, le séquençage est devenu plus rapide et plus efficace. Depuis les années 1970, et l'avènement du séquençage enzymatique par la méthode de Sanger, de nombreux verrous techniques ont été levés menant au séquençage haut débit. Dans cet article, nous présenterons ces évolutions qui ont permis à la fois une augmentation considérable du volume de données, une réduction du temps nécessaire à l'exécution d'un séquençage, ainsi que la diminution du coût de ces séquençages. Nous aborderons aussi le large éventail d'applications pour les technologies de séquençage, en plus de fournir des lignes directrices pour la sélection de plateformes répondant à des questions biologiques d'intérêt.
Enfin, nous discuterons des conséquences d'une telle révolution. Demain, grâce au décryptage du génome, il sera peut être possible de faire un diagnostic personnalisé de chaque individu et de mettre ainsi en place des traitements adaptés, ultra personnalisés. Connaître les maladies dont nous aurons à souffrir dans l'avenir, est-ce une bénédiction ou un fardeau ?
Un glossaire est présenté en fin d'article.