- Blast (bioinformatique)
-
Basic Local Alignment Search Tool
Pour les articles homonymes, voir Blast.BLAST Développeur Altschul S.F., Gish W., Miller E.W., Lipman D.J., NCBI Dernière version 2.2.16 [+/−] Environnement Multiplate-forme Type Outil bio-informatique Licence Domaine public Site Web Serveur FTP de NCBI BLAST (acronyme de basic local alignment search tool) est une méthode de recherche heuristique utilisée en bio-informatique permettant de trouver les régions similaires entre deux ou plusieurs séquences de nucléotides ou d'acides aminés. Ce programme permet de retrouver rapidement dans des bases de données, les séquences ayant des zones de similitude avec une séquence donnée (introduite par l'utilisateur).[1]
BLAST est utilisé pour trouver des relations fonctionnelles ou évolutives entre les séquences et peut aider à identifier les membres d'une même famille de gènes.
Sommaire
Histoire
Ce programme a été développé par Stephen Altschul, Warren Gish et David Lipman au National Center for Biotechnology Information (NCBI). La publication originale parue en octobre 1990, Basic local alignment search tool [2], a été citée plus de 20 000 fois, ce qui en fait l'une des plus citées dans le monde scientifique.
Variations
Des données utilisées
Le terme blast peut être modifié en fonction de la nature de la séquence d'entrée, et de la base de donnée utilisée:
- blast de nucléotides: Séquence nucléique contre une base de données de séquences nucléiques
- blast de protéines: Séquence de protéine contre une base de données de séquences de protéines
- blastx: Séquence nucléique traduite en séquence de protéine contre une base de données de séquences de protéines
- tblastn: Séquence de protéine contre une base de données de séquences nucléiques traduites en séquences de protéines
- tblastx: Séquence nucléique traduite en séquence de protéine contre une base de données de séquences nucléiques traduites en séquences de protéines
De l'algorithme
Depuis sa création différentes versions de l'algorithme ont été développées:
- BlastN: Blast de séquences nucléiques, lent mais permet de retrouver des similarité localisées uniquement sur une partie des séquences
- BlastP: Blast de séquences de protéines
- Megablast: Rapide, permet de retrouver des séquences hautement similaire
- PSI-Blast (Position-Specific Iterated BLAST): Blast relancé plusieurs fois par itération, à chaque itération une séquence consensus est déterminée à partir des résultats, et utilisée comme séquence source pour l'itération suivante.
- PHI-BLAST (Pattern Hit Initiated Blast): Le programme utilise comme source une séquence protéique et un motif, celui-ci est utilisé comme point de départ des recherches de similarité avec les séquences présentes dans les bases de données.
Référence
- ↑ Greg Gibson, Spencer V. Muse, Lionel Domenjoud, Raymond Cunin (trad. Lionel Domenjoud), Précis de génomique, De Boeck Université, 2004 (ISBN 2804143341), « 2 »
- ↑ (en) SF Altschul, W Gish, W Miller, EW Myers et DJ Lipman, « Basic local alignment search tool », dans Journal of molecular biology, vol. 215, no 3, 5 Octobre 1990, p. 403-10 [résumé (page consultée le 12 décembre 2008)]
Voir aussi
Lien externe
- (en) Site officiel
- Portail de la biologie cellulaire et moléculaire
Catégories : Logiciel de biologie moléculaire | Bio-informatique
Wikimedia Foundation. 2010.