La bioinformatique est connue comme la discipline permettant d’exploiter, d’interpréter, d’annoter les données biologiques à l’aide d’algorithmes, c’est-à-dire de méthodes informatiques. Les données les plus fréquemment exploitées sont celles relatives aux séquences des génomes et des protéines. Néanmoins, si la connaissance de cette information est un prérequis pour caractériser une macromolécule biologique, elle ne suffit pas à comprendre la fonction qui lui est associée. Celle-ci dépend en effet de l’arrangement approprié dans l’espace des unités constitutives de ces macromolécules biologiques, par exemple nucléotides, acides aminés. Connaître, analyser la structure 3D des macromolécules se révèle donc une étape nécessaire pour mieux appréhender leur fonction et donc leurs possibles dysfonctionnements. Différentes techniques biophysiques permettent d’accéder à cette information structurale. Le dichroïsme circulaire par exemple peut fournir des indications sur la structuration du squelette polypeptidique des protéines, ou sur les formes adoptées par des séquences d’ADN. La cristallographie couplée à la diffraction des rayons X et la résonance magnétique nucléaire peuvent, quant à elles, renseigner sur la structure à une échelle atomique. L’exploitation de ces données, destinées à mettre en lumière des propriétés caractéristiques de macromolécules, requiert l’utilisation de méthodes informatiques regroupées sous le terme de « bioinformatique structurale » ou aussi « modélisation moléculaire ».
Grâce à l’analyse de l’information disponible sur les structures 3D des protéines, il a été possible de mettre en évidence des relations étroites entre séquence et structure, en particulier une conservation de la structure 3D pour des séquences similaires mais aussi pour des séquences très différentes en particulier celles qui dérivent d’un ancêtre commun (séquences homologues). Cette propriété peut ainsi être utilisée pour prédire la structure 3D d’une macromolécule à partir de sa séquence. Cela constitue un enjeu majeur pour les projets qui ont succédé aux projets de séquençage massif. Il s’agit des initiatives visant à mettre en place et à automatiser les procédures afin d’obtenir la structure 3D des protéines (Protein Structure Initiative). De même, l’impact des mutations en des positions très distantes le long de la séquence peut être mieux compris car la structure 3D peut regrouper dans l’espace ces positions. Connaître la structure permet aussi de mieux comprendre les interactions fines mises en jeu entre des partenaires qui dépendent de leur position relative. Il est ainsi possible de comprendre la spécificité de ligands et ainsi de l’améliorer, voire de potentiellement concevoir de nouvelles protéines (protein design) ou de nouveaux médicaments, enjeu majeur des prochaines décennies.
Enfin, une macromolécule biologique n’est pas un objet rigide, mais au contraire un objet capable de s’adapter à différents environnements, différents partenaires pour accomplir sa fonction. Cette adaptation qui s’effectue au cours du temps peut induire des changements conformationnels relativement limités ou au contraire de grande ampleur et sur des échelles de temps extrêmement différentes, de quelques picosecondes à plusieurs heures. Cette propriété, difficile à caractériser expérimentalement, s’avère accessible grâce à des algorithmes très performants dits de « dynamique moléculaire ».
Dans cet article seront détaillées les caractéristiques des structures 3D de différentes macromolécules biologiques, en particulier les protéines, les principes des méthodes expérimentales fournissant des informations tridimensionnelles, mais aussi les approches bioinformatiques permettant la prédiction de la structure à partir de sa séquence. Enfin, au-delà de la structure sera décrite cette propriété cruciale des macromolécules biologiques à savoir leur dynamique. Seront soulignés les atouts mais aussi les limites de ces différentes approches, ainsi que quelques applications emblématiques dans le domaine. En résumé, cet article renseignera sur le nouveau paradigme, qui relie séquence-structure-dynamique et fonction, et sur les méthodes de bioinformatique structurale et de modélisation moléculaire capables de contribuer à l’élucidation de ces relations.