- Phylogénie moléculaire
-
Cette page du Projet:Traduction permet le suivi de la traduction de l’article. Pour toutes questions, veuillez vous reporter aux instructions ci-dessous ou à l’aide du projet. Une liste d’outils est également disponible. La phylogénie moléculaire est l'utilisation de la séquence des macromolécules biologiques pour obtenir des informations sur l'histoire évolutive des êtres vivants et notamment sur leurs liens de parenté, leur phylogénie. Le produit d'une analyse de phylogénie moléculaire est un arbre phylogénétique.
Les macromolécules biologiques telles que l'ADN, l'ARN ou les protéines sont des composants fondamentaux de tous les êtres vivants. Ces molécules sont des polymères constitué de l'enchaînement de briques moléculaire de base dont la succession constitue la séquence primaire. Ainsi, l'ADN peut être considéré comme un texte écrit dans un alphabet à 4 lettres: Adénine (A), Thymine (T), Guanine (G) et Cytosine (C) et les protéines comme un texte écrit dans un alphabet à 20 lettres, les 20 acides aminés. La parenté des êtres vivants considérés est reflétée par la similarité de ces séquences primaires.
Jusqu'à une date assez récente, la séquence primaire des molécules biologiques n'était pas directement accessible. Cependant, au cours des 20 dernières années, l'avènement de la PCR et du séquençage d'ADN par la méthode de Sanger ont permis un développement très important de cette approche, ce qui a eu pour conséquence de profondément remanier la vision traditionnelle de la classification des organismes. Malgré les problèmes qu'elle a pu rencontrer, la phylogénie moléculaire a ainsi permis de redonner un nouveau souffle à la science taxonomique en permettant de mieux comprendre l'évolution de certains traits morphologique des organismes. Par ailleurs, la phylogénie moléculaire peut être associée de domaines tels que la médecine légale ou les tests génétiques.
Sommaire
Les origines
On peut considérer que la systématique moléculaire au sens large est née aux alentours de 1904, lorsque G.H.F. Nuttall utilisa pour la première fois les incompatibilités immunologiques entre primates pour estimer leur distance évolutive relative[1]. Des méthodes plus en plus perfectionnées sont utilisées pour étudier les différences entre les protéines. D'une part les méthodes immunologiques comme l'immunodiffusion, appliquée à l'étude des liens de parentés des primates par Allan Wilson. D'autre part, l'électrophorèse des allozymes et isozymes. Les premières études basées sur l'ADN utilisèrent la méthode d'hybridation ADN-ADN mise au point par Charles Sibley et Jon Ahlquist. Cette technique permet d'évaluer la distance entre l'ADN de deux espèces en comparant les températures des dissociations de l'ADN double-brin hybride et fut utilisée avec un certain succès pour étudier les liens de parenté des oiseaux ou des primates[2]. Cependant, malgré leur intérêt, ces méthodes étaient fondées sur l'évaluation de distances globales et ne proposaient aucune possibilité d'évaluation de l'homologie des caractères comparés, une condition indispensable à l'application de la méthode cladistique à la base de la phylogénétique moderne. Ce problème sera en grande partie résolu par la mise au point de méthodes de séquençage de l'ADN par Sanger qui va permettre d'accéder directement à la séquence primaire des molécules, ce qui va constituer le fondement de la phylogénie moléculaire au sens strict.
Quelles molécules utiliser ?
Les différentes régions de l'ADN des organismes et les protéines qu'elles codent n'évoluent pas toutes à la même vitesse. En effet, certains gènes sont fortement contraints car ils assurent des fonctions très importantes pour les organismes et des très faibles mutations pour ces gènes limitent drastiquement la viabilité de leurs porteurs. A l'inverse, certaines régions, comme les gènes qui codent des marqueurs du systèmes immunitaires évoluent à des vitesses très importantes. Ces types de marqueurs permettent donc d'étudier des relations évolutives à faible échelle, par exemple au sein d'une population ou entre espèces proches (par exemple, les primates avec l'exemple des travaux de Nuttall ou Wilson). A l'opposé, pour étudier les relations entre tous les organismes vivants, des marqueurs tels que l'ARN ribosomique 12S et 16S (procaryotes) ou 18S et 28S (eucaryotes) sont généralement utilisés. Ces ARN structuraux sont impliqués dans les ribosomes, organites responsable de la traduction des ARNm en protéines dont la fonction est essentielle à la vie. L'amélioration des méthodes de séquençage permet d'augmenter le nombre de marqueurs disponibles pour réaliser des études de phylogénie moléculaires. Ainsi, les génomes mitochondriaux et chloroplastiques qui contiennent plus d'une dizaine de gènes ont été utilisés pour étudier les relations des animaux et des plantes, respectivement[3]. Plus récemment, l'augmentation des données de génomes ou de transcriptomes complets disponibles a rendu possible d'étudier l'ensemble des gènes dont l'homologie peut être vérfiée. Des jeux de données incluant une centaine de gènes sont aujourd'hui utilisés couramment pour résoudre les relations des eucaryotes ou des animaux, cette nouvelle approche est appelée phylogénomique[4].
Comment construire un arbre ?
La mise en œuvre d'un reconstruction en phylogénie moléculaire passe par trois étapes:
- La construction du jeu de donnée incluant les séquences de un ou plusieurs gènes marqueurs dans un certain nombre de taxons d'intérêts. Ces séquences peuvent être nucléotidiques ou bien protéiques (acides aminés) si la portion d'ADN utilisée est codante.
- L'alignement des séquences de ce jeu de donnée pour obtenir une matrice de position homologues, c'est-à-dire qui dérivent chacune d'une position ancestrale commune. Cette étape passe généralement l'utilisation d'un programme d'alignement de séquences mais les imperfections des algorithmes requièrent bien souvent une édition manuelle des alignements, ainsi qu'une élimination des positions ambigües [5].
- L'inférence phylogénétique proprement dite par l'analyse de cette matrice de positions grâce à un programme implémentant un algorithme de reconstruction phylogénétique.
Malgré l'importance des deux premières étapes, une grande part des avancées de la phylogénie moléculaire sont liées aux algorithmes de reconstruction proprement dite.
Classification des principales méthodes de reconstruction Type de données Méthode de reconstruction Distances Sites Algorithme de clustering UPGMA, Neightbour joining Critère d'optimisation Minimum d'évolution (ME) Maximum de parsimonie (MP) Maximum de vraisemblance (ML) Parcimonie
Distance
Méthodes probabilistes
Parmi les méthodes probabilistes on compte le maximum de vraisemblance et l'inférence Bayésienne
Découvertes et écueils
Ouvrages de référence
- Felsenstein, J. 2004. Inferring phylogenies. Sinauer Associates Incorporated. ISBN 0-87893-177-5.
- Hillis, D. M. & Moritz, C. 1996. Molecular systematics. 2nd ed. Sinauer Associates Incorporated. ISBN 0-87893-282-8.
- Page, R. D. M. & Holmes, E. C. 1998. Molecular evolution: a phylogenetic approach. Blackwell Science, Oxford. ISBN 0-86542-889-1.
Notes et références
- Nuttall G.F.H. 1904. Blood Immunity and Blood relationships, Cambridge University Press
- The Phylogeny of the Hominoid Primates, as Indicated by DNA-DNA Hybridization. J Mol Evol. 1:2-15. C.G. Sibley and J.E. Ahlquist 1984.
- Mitochondrial genome evolution and the origin of eukaryotes. Annu Rev Genet. 33:351-97. Lang BF, Gray MW, Burger G. 1999.
- Phylogenomics and the reconstruction of the tree of life. Nature Reviews Genetics 6, 361-375. Delsuc, F., Brinkmann, H., and Philippe, H. 2005.
- Selection of Conserved Blocks from Multiple Alignments for Their Use in Phylogenetic Analysis. Molecular Biology and Evolution 17:540-552 (2000) J. Castresana.
Voir aussi
Wikimedia Foundation. 2010.