- Numéro d'accession (bioinformatique)
-
Un numéro d'accession (le terme français est numéro d'ordre, numéro d'accession étant un anglicisme maladroit couramment utilisé) en bio-informatique est un identifiant unique donné à toute séquence d'ADN ou de protéine enregistrée dans un dépôt. Ce numéro permet un suivi des différentes versions d'une séquence enregistrée et des séquences associées. Du fait de sa relative stabilité, les numéros d'accession peuvent être utilisés comme clés étrangères pour toute référence à une séquence ou à un ensemble de séquences. Tous les dépôts contenant des informations de séquences mettent en œuvre ce concept de "numéro d'accession" mais peuvent introduire de subtiles variations.
Sommaire
Numéros d'accession dans des bases de données spécifiques
UniProt (SwissProt) Knowledgebase
Article principal : UniProt.La documentation fournie par UniProt stipule que le rôle d'un numéro d'accès est "de fournir un moyen stable d'identifier une entrée d'une version à l'autre." Une entrée peut être associée à plusieurs numéros d'accession. Ainsi, chez UniProt, il n'y a pas de relation spécifique entre un numéro d'accession et une séquence : le numéro d'accession se réfère à une entrée dans la base de connaissance (knowledgebase), cette entrée pouvant se référer à un ensemble de séquences. Dans la version en fichier simple d'une entrée, le champ AC correspond à un numéro d'accession, le premier étant le "numéro d'accession primaire" et les numéros suivants étant les "numéros d'accession secondaires". Le champ principal pour le suivi d'une entrée UniProt est le numéro d'accession primaire. Les différents numéros d'accession associés à une entrée de la base de connaissance proviennent de l'historique des fusions et fractionnements de cette entrée. Un nouveau numéro d'accession peut être généré de deux manières : l'enregistrement d'une nouvelle séquence (le plus souvent) ou le fractionnement d'une entrée de la base de connaissance (plus rarement)[1].
GenBank
Article principal : GenBank.EMBL
Article principal : EMBL.DDBJ
Article principal : DDBJ.Numéros d'accession communément rencontrés
- Uniprot ID
- Unified Uniprot Accession
- Uniprot-Swissprot Accession
- Uniprot-Swissprot ID
- Unified Uniprot ID
- Refseq DNA ID
- Entrez Gene ID
- CCDS ID
- Vega translation ID
- Vega Transcript ID
- Vega Peptide ID
- Vega Gene ID
- HUGO ID
- MIM ID
Notes et références
- (en) Amos Bairoch, Rolf Apweiler, Cathy H. Wu, « User Manual », UniProt Knowledgebase. Consulté le 20 octobre 2005
- (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Accession number (bioinformatics) » (voir la liste des auteurs)
- Portail de la biologie
- Portail de la biologie cellulaire et moléculaire
- Portail de l’informatique
Wikimedia Foundation. 2010.