Unweighted Pair Group Method with Arithmetic Mean

Unweighted Pair Group Method with Arithmetic Mean

UPGMA (Unweighted Pair Group Method with Arithmetic mean) est le nom d'un algorithme destiné à la construction d'un arbre phylogénétique. Cette méthode permet la transformation d'une matrice de distances (entre différents organismes, populations, ou séquences de nucléotides) en un arbre enraciné.

La matrice fournit l'ensemble des distances entre toutes les paires d'éléments. L'algorithme fonctionne par itérations successives, qui réduisent progressivement la taille de la matrice. Chaque itération voit le regroupement des deux éléments restants séparés par la plus faible distance: ces éléments sont associés dans l'arbre, et sont remplacés par un élément « consensus ». Les nouvelles distances entre cet élément consensus et les éléments restants dans la matrice sont recalculées par la moyenne arithmétique des deux éléments regroupés.

Cette méthode simple et rapide présente toutefois de nombreux biais. En particulier, elle suppose que la vitesse d'évolution est constante dans toutes les branches. Par conséquence, si une branche « interne » évolue beaucoup plus vite que toutes les autres, elle ne sera rattachée au reste de l'arbre qu'à la dernière étape et sera à l'extérieur de l'arbre (le phénomène est similaire à l'attraction des longues branches).

Les défauts de l'UPGMA sont tels que l'algorithme n'a plus qu'un intérêt historique dans le cadre de l'inférence d'un arbre phylogénétique. Il a en effet été remplacé depuis lors par des méthodes plus avancées (comme le Neighbour Joining ou la parcimonie dans un premier temps, puis les techniques de maximum de vraisemblance ou algorithmes bayesiens utilisés aujourd'hui en phylogénie). Cet algorithme reste cependant utilisé dans le cadre de l'alignement de séquences, où il permet de déterminer l'ordre dans lequel les séquences vont être alignées. En effet l'objectif de cet arbre guide est de regrouper les séquences les plus similaires, indépendamment de leur vitesse d'évolution ou de leurs parentés phylogénétique et c'est précisément ce que fait UPGMA[1].

Notes et références

  1. Wheeler, T.J. and J.D. Kececioglu, Multiple alignment by aligning alignments. Bioinformatics, 2007. 23(13): p. i559-68

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Unweighted Pair Group Method with Arithmetic Mean de Wikipédia en français (auteurs)

Игры ⚽ Поможем написать курсовую

Regardez d'autres dictionnaires:

  • Unweighted Pair Group Method with Arithmetic mean — (kurz UPGMA) bezeichnet eine Bottom Up Clustering Methode. Sie wird oft in der Bioinformatik zur Rekonstruktion phylogenetischer Bäume angewendet. Im Gegensatz zu anderen Verfahren wie Neighbour Joining basiert UPGMA auf der Annahme der… …   Deutsch Wikipedia

  • Unweighted Pair Group Method — with Arithmetic mean (kurz UPGMA) bezeichnet eine Bottom Up Clustering Methode. Sie wird oft in der Bioinformatik zur Rekonstruktion phylogenetischer Bäume angewendet. Im Gegensatz zu anderen Verfahren wie Neighbour Joining basiert UPGMA auf der… …   Deutsch Wikipedia

  • UPGMA — Unweighted Pair Group Method with Arithmetic Mean UPGMA (Unweighted Pair Group Method with Arithmetic mean) est le nom d un algorithme destiné à la construction d un arbre phylogénétique. Cette méthode permet la transformation d une matrice de… …   Wikipédia en Français

  • UPGMA — Unweighted Pair Group Method with Arithmetic mean (kurz UPGMA) bezeichnet eine Bottom Up Clustering Methode. Sie wird oft in der Bioinformatik zur Rekonstruktion phylogenetischer Bäume angewendet. Im Gegensatz zu anderen Verfahren wie Neighbour… …   Deutsch Wikipedia

  • WPGMA — Unweighted Pair Group Method with Arithmetic mean (kurz UPGMA) bezeichnet eine Bottom Up Clustering Methode. Sie wird oft in der Bioinformatik zur Rekonstruktion phylogenetischer Bäume angewendet. Im Gegensatz zu anderen Verfahren wie Neighbour… …   Deutsch Wikipedia

  • Cluster analysis — The result of a cluster analysis shown as the coloring of the squares into three clusters. Cluster analysis or clustering is the task of assigning a set of objects into groups (called clusters) so that the objects in the same cluster are more… …   Wikipedia

  • UPGMA — (Unweighted Pair Group Method with Arithmetic mean) is a simple agglomerative or bottom up data clustering method used in bioinformatics for the creation of phylogenetic trees. UPGMA assumes a constant rate of evolution (molecular clock… …   Wikipedia

  • Computational phylogenetics — is the application of computational algorithms, methods and programs to phylogenetic analyses. The goal is to assemble a phylogenetic tree representing a hypothesis about the evolutionary ancestry of a set of genes, species, or other taxa. For… …   Wikipedia

  • Distance matrices in phylogeny — Distance matrices are used in phylogeny as non parametric distance methods were originally applied to phenetic data using a matrix of pairwise distances. These distances are then reconciled to produce a tree (a phylogram, with informative branch… …   Wikipedia

  • Neighbor-Joining-Algorithmus — Der Neighbor Joining Algorithmus ist ein mathematisches Verfahren, um Datensätze zu vergleichen und hierarchisch bifurcal (zweigabelig) anzuordnen. Dieses Verfahren wurde 1987 von Saitou und Nei vorgestellt und 1988 von Studier und Keppler… …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”