Contactez-nous
Analyse des séquences de protéines
Bioinformatique
BIO7050 v1 Article de référence

Analyse des séquences de protéines
Bioinformatique

Auteur(s) : Jean-Michel CLAVERIE

Date de publication : 10 nov. 2007 | Read in English

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Bioinformatique, des pionniers à aujourd'hui

2 - Analyse des séquences de protéines

3 - Analyse des séquences nucléiques et des génomes

4 - Alignement multiple et phylogénie moléculaire

5 - Bioinformatique structurale

6 - Analyse de données massivement parallèles

  • 6.1 - Puces à ADN
  • 6.2 - Bioinformatique et biologie des systèmes

Sommaire

Présentation

RÉSUMÉ

Cet article s’intéresse à la bioinformatique dans son intégralité, de ses débuts à aujourd’hui. Cette discipline, visant à analyser l’information biologique, a pour principal objectif l’identification de l’information contenue dans la séquence des macromolécules et leur structure. L’analyse poussée des séquences de protéines, des séquences nucléiques et des génomes (comme l’alignement optimal de deux séquences, la recherche de similarités, etc) est détaillée dans cet article. Liée aux objets d’études de la biologie moléculaire et de la génomique, la bioinformatique a vécu récemment l’arrivée de nouvelles techniques parallèles, comme les puces à ADN.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

  • Jean-Michel CLAVERIE : Professeur, faculté de Médecine de l'université de la Méditerranée et laboratoire « Information génomique et structurale », CNRS (Marseille)

INTRODUCTION

La bioinformatique est la discipline de l'analyse de l'information biologique, principalement contenue dans la séquence des macromolécules (acides nucléiques et protéines) et leur structure tridimensionnelle. C'est une branche théorique de la biologie, largement antérieure à la « révolution génomique » des années 1990.

La bioinformatique n'est pas une simple application des concepts et des outils de l'informatique traditionnelle aux données biologiques. Elle recouvre un ensemble de techniques très spécifiques, intimement liées aux objets d'étude de la biologie moléculaire et de la génomique.

Plus récemment, l'introduction de techniques expérimentales massivement parallèles (exemple : les puces à ADN), produisant une masse de données numériques, a amené les bioinformaticiens à s'approprier des méthodes mathématiques et statistiques plus générales, développées dans d'autres domaines scientifiques confrontés à un grand volume de données (« data mining »).

Enfin, la bioinformatique est indissociable de l'existence de grandes bases de données internationales publiques, de la mise en place de nombreux serveurs internet, et de l'attitude « open access » de ses développeurs.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-bio7050

Article inclus dans l'offre

"Technologies pour la santé"

(128 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

2. Analyse des séquences de protéines

L'analyse des séquences est à l'origine même du terme « bioinformatics ». Celui-ci, à l'origine encore obscure, a probablement succédé au mot « biocomputing », préféré avant les années 1990, pour distinguer l'utilisation de l'ordinateur à des fins d'analyses « textuelles » des modélisations numériques qui dominaient alors les applications informatiques en biologie (exemple : simulation des voies métaboliques, de la propagation de l'influx nerveux…).

Bien que plus complexe (car constituée d'enchaînements de 20 briques élémentaires aux propriétés physico-chimiques très différentes), la détermination des séquences de protéines a historiquement précédé celle des acides nucléiques (constitués de 4 nucléotides différents). La nécessité de comparer et de classer ces nouveaux objets de la biologie, comme celle de comprendre la relation entre séquence et fonction, a longtemps été le moteur principal de l'innovation en bioinformatique.

2.1 Alignement optimal de deux séquences

Afin de comparer deux séquences (par exemple, les deux séquences de myoglobine de la figure 2) d'une manière objective (indépendante de l'observateur), on doit d'abord les aligner d'une manière optimale. L'alignement optimal est obtenu quand la coïncidence des lettres composant les deux séquences est maximale (figure 3).

Un algorithme rigoureux, permettant la réalisation de cet alignement optimal, a été conçu par le physicien Richard Bellman en 1957, et adapté aux séquences de protéines par Needleman et Wunsch (1970) [1].

Cette technique d'optimisation, qui porte le nom de « programmation dynamique », garantit l'obtention d'un alignement au score maximal de deux séquences pour une matrice d'échange d'acides aminés (figure 4) et une valeur de pénalité données pour chaque tiret (« gap ») introduit.

Brièvement, l'algorithme fonctionne comme suit. Il opère en deux étapes.

Une matrice est d'abord constituée avec une...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Analyse des séquences de protéines

Article inclus dans l'offre

"Technologies pour la santé"

(128 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - NEEDLEMAN (S.), WUNSCH (C.) -   A general method applicable to the search for similarities in the amino acid of two proteins.  -  J. Mol. Biol., 48, p. 443-453 (1970).

  • (2) - HENIKOFF (S.), HENIKOFF (J.G.) -   Amino acid substitution matrices from protein blocks.  -  Proc. Natl. Acad. Sci. USA, 89, p. 10915-10919 (1992).

  • (3) - SMITH (T.F.), WATERMAN (M.S.) -   Identification of common molecular subsequences.  -  J. Mol. Biol., 147, p. 195-197 (1981).

  • (4) - DUMAS (J.P.), NINIO (J.) -   Efficient algorithms for folding and comparing nucleic acid sequences.  -  Nucleid Acids Res., 10, p. 197-206 (1982).

  • (5) - WILBUR (W.J.), LIPMAN (D.J.) -   Rapid similarity search of nucleic acid and protein databanks.  -  Proc. Natl. Acad. Sci. USA, 80, p. 726-730 (1983).

  • (6) - LIPMAN (D.J.), PEARSON (W.R.) -   Rapid and sensitive protein similarity searches.  -  Science,...

1 Sites Internet

Portail BLAST et bases de données du NCBI : http://www.ncbi.nlm.nih.gov/

Autre serveur BLAST rapide (Gigablaster) : http://www.igs.cnrs-mrs.fr/

Site de référence sur les génomes animaux : http://www.ebi.ac.uk/ensembl/

Banque de données de séquences protéiques UNIPROT : http://www.expasy.org/sprot/

Banques de motifs protéiques INTERPRO : http://www.ebi.ac.uk/interpro/

Banques de structures 3D (PDB) : http://www.wwpdb.org/

Serveur d'alignement multiple et de phylogénie : http://www.phylogeny.fr/

Repliement des ARNs : http://www.bioinfo.rpi.edu/applications/mfold/

Localiser les gènes dans les génomes : http://opal.biology.gatech.edu/GeneMark/

Prédictions structurales pour les séquences protéiques : http://www.predictprotein.org/

Bioinformatique structurale : http://bioserv.cbs.cnrs.fr/SITE/index.html

HAUT DE PAGE
Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 94 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Technologies pour la santé"

(128 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Ressources documentaires

Méthodes numériques de modélisation dans les applications biomédicales

La nécessité d’utiliser des méthodes numériques pour modéliser les très nombreuses données ...

Bioinformatique structurale - Bases de données et méthodes de prédiction

Cet article est dédié à la présentation de différentes méthodes bioinformatiques visant à analyser et à ...

Analyse des acides nucléiques

Ces vingt dernières années, les progrès de la biologie moléculaire et du génie génétique ont rendu ...

Microfluidique et ADN tumoral - Apport de la PCR digitale

La PCR (réaction de polymérisation en chaîne) digitale représente un saut technologique dans la ...