- Code genetique
-
Code génétique
Le code génétique désigne le système de correspondance mis en jeu lors de la transformation de l'information génétique des gènes en protéines, au cours du processus de traduction. Les ribosomes traduisent ainsi, en suivant ce code, l'enchaînement des bases nucléotidiques de l'ARN en une séquence d'acides aminés appelée séquence peptidique. Le code génétique est un code de longueur fixe, lu trois nucléotides par trois nucléotides, un triplet de nucléotides ou codon correspondant à un acide aminé donné.
Sommaire
Expression du génome
La séquence des bases de l'ADN est fréquemment comparée, par analogie, à la séquence des lettres d'un texte. La séquence prise en elle-même n'a aucun sens, si le lecteur n'en connaît pas le code, c’est-à-dire le langage utilisé.
Les mots du langage génétique, appelés codons sont des triplets de nucléotides (A, C, U ou G). Il existe 4³=64 combinaisons possibles de ces quatre lettres en triplets. Trois codons, parmi ces 64 codes possibles, signifient la fin de la traduction (codon stop). Aux 61 autres codons ne correspondent que 20 acides aminés. Le code génétique est donc dit dégénéré ou redondant car un acide aminé est codé par plusieurs codons (on appelle ces codons « codons synonymes »). Ainsi, en moyenne une mutation génétique sur trois affectant une séquence d'ADN codante n'entraîne aucune modification de la protéine traduite.
Remarque : si un nucléotide avait codé un acide aminé, 20-41=16 acides aminés n'auraient pas été codés. Si deux nucléotides avaient codé un acide aminé, le même problème aurait eu lieu pour 20-4²=4 acides aminés. Avec un système de codons de 3 nucléotides, il y a au contraire trop de combinaisons.
Ce code permet la synthèse des protéines. L'ADN est transcrit en ARN-messager (ARNm). Celui-ci est traduit par les ribosomes qui assemblent les acides aminés présents sur des ARN de transfert (ARNt). L'ARNt contient un « anti-codon », complémentaire d'un codon, et porte l'acide aminé correspondant au codon. L'estérification spécifique de l'acide aminé correspondant à un ARNt donné est réalisé par les aminoacyl-ARNt synthétases, une famille d'enzymes spécifique chacune d'un acide aminé donné. Pendant la traduction, le ribosome lit l'ARNm codon par codon, met en relation un codon de l'ARNm avec l'anti-codon d'un ARNt et ajoute l'acide aminé porté par celui-ci à la protéine en cours de synthèse.
Codons
Dans le tableau suivant, la rangée indique la première lettre du codon, la colonne indique la seconde et la dernière colonne indique la dernière lettre du codon.
U C A G U UUU phénylalanine UCU sérine UAU tyrosine UGU cystéine U UUC UCC UAC UGC C UUA leucine UCA UAA stop UGA stop/sélénocystéine A UUG UCG UAG UGG tryptophane G C CUU CCU proline CAU histidine CGU arginine U CUC CCC CAC CGC C CUA CCA CAA glutamine CGA A CUG CCG CAG CGG G A AUU isoleucine ACU thréonine AAU asparagine AGU sérine U AUC ACC AAC AGC C AUA ACA AAA lysine AGA arginine A AUG méthionine/start ACG AAG AGG G G GUU valine GCU alanine GAU acide
aspartiqueGGU glycine U GUC GCC GAC GGC C GUA GCA GAA acide
glutamiqueGGA A GUG GCG GAG GGG G Tableau inverse
Comme chaque acide aminé d'une protéine est codé par un ou plusieurs codons il est parfois utile de se référer au tableau suivant. Le code à une lettre de chaque acide aminé est indiqué en parenthèses.Ala (A) GCU, GCC, GCA, GCG Lys (K) AAA, AAG Arg (R) CGU, CGC, CGA, CGG, AGA, AGG Met (M) AUG Asn (N) AAU, AAC Phe (F) UUU, UUC Asp (D) GAU, GAC Pro (P) CCU, CCC, CCA, CCG Cys (C) UGU, UGC Sec (U) UGA Gln (Q) CAA, CAG Ser (S) UCU, UCC, UCA, UCG, AGU, AGC Glu (E) GAA, GAG Thr (T) ACU, ACC, ACA, ACG Gly (G) GGU, GGC, GGA, GGG Trp (W) UGG His (H) CAU, CAC Tyr (Y) UAU, UAC Ile (I) AUU, AUC, AUA Val (V) GUU, GUC, GUA, GUG Leu (L) UUA, UUG, CUU, CUC, CUA, CUG START AUG STOP UAG, UGA, UAA Un ARNm et un gène se terminent toujours par un « codon non-sens » aussi appelé « codon-stop », il existe 3 codons-stop (UAG, UAA et UGA). Ceux-ci tiennent le rôle du point en bout de phrase. Le codon UGA peut parfois coder une sélénocystéine, produisant alors une sélénoprotéine.
Dégénérescence du code génétique
Comme on peut le voir dans le tableau ci-dessus, le code génétique est dégénéré (ou redondant), c'est à dire qu'il existe plusieurs combinaisons de trois lettres pour coder le même acide aminé. Ainsi, l'histidine peut être codée par les codons CAU et CAC. On parle alors de codons synonymes. Seuls deux acides aminés ne montrent pas de redondance de leur code: la méthionine et le tryptophane. La redondance n'est pas la même pour tous les acides aminés. Ainsi, en fonction du nombre de codons différents codant le même acide aminé, on distingue des duo (histidine, lysine, asparagine, glutamine, acide glutamique, asparagine, tyrosine, cystéine et phénylalanine), des trio (isoleucine et codons stop), des quatuor (thréonine, proline, alanine, glycine et valine) et des sextuor (arginine, leucine et serine). Il existe donc souvent plusieurs ARNt associé au même acide aminé, capables de lier les différents triplets dégénérés de nucléotides sur l'ADN. On parle alors d'ARNt isoaccepteurs, car ils acceptent le même acide aminé.
Cette dégénérescence du code génétique a pour conséquence pour la plupart des organismes un biais d'usage du code. En effet, les principales molécules fonctionnelles de la cellule sont les protéines, polymères d'acides aminés, et la dégénérescence du code fait qu'il y a plusieurs manières de coder chaque acide aminé. La cellule exprime en général des préférences assez marquées dans le choix des codons synonymes, ainsi par exemple, le codon AUA qui code pour l'isoleucine est largement évité chez l'homme comme chez Escherichia coli, par rapport aux deux autres codons synonymes AUU et AUC.
Cette préférence d'usage des codons est très variable, et dépend de l'organisme, du génome (nucléaire, mitochondrial, chloroplastique, ...), de la région génique et même du gène considéré.
Son universalité
Principe de base
Ce système de codage entre l'ADN et les acides aminés s'est avéré être utilisé par l'immense majorité des être vivants. De l'homme à la bactérie, ce même code est utilisé. Cette universalité du code est expliquée en termes d'évolution : si le changement d'une base dans l'ADN peut entraîner des changements parfois bénéfiques dans l'être vivant, cela n'est que peu probable dans le cas d'un changement du codage. En effet, cela reviendrait à changer la position des touches d'une machine à écrire d'un dactylographe tapant à l'aveugle : le texte résultant sera fort probablement complètement illisible. Le système de codage est ainsi resté inchangé durant les milliards d'années d'évolution de la vie. On estime généralement qu'il s'est fixé ainsi très tôt dans l'histoire de la vie, probablement avant le dernier ancêtre commun à tous les êtres vivant (baptisé LUCA).
Exceptions
Cette vision des choses est simpliste : si l'immense majorité des organismes vivants aujourd'hui utilisent le code génétique standard, les généticiens ont découvert quelques variantes à ce code. De plus, ces variantes se retrouvent dans les différentes lignées évolutives et consistent en des traductions différentes de quelques codons.
- Le codon CUG, traduit habituellement par la leucine, correspond à la sérine[1] chez de nombreuses espèces de champignons Candida[2] .
- De nombreuses espèces d'algues vertes du genre Acetabularia utilisent les codons-stop UAG et UAA pour coder la glycine.
- De nombreux ciliés, comme Paramecium tetraurelia, Tetrahymena thermophila ou Stylonychia[3] lemnae utilisent les codons UAG et UAA pour coder la glutamine au lieu de stop. Seul UGA est stop chez ces cellules.
- Le cilié Euplotes octocarinatus utilise le codon UGA pour coder la cystéine, ne laissant que UAG et UAA comme stops.
- Dans les trois règnes du vivant, on trouve parfois un 21e acide aminé, la sélénocystéine, codé par le codon UGA (habituellement un codon-stop).
- Il existe quelques acides aminés spéciaux, comme la 5-Hydroxylysine dans le collagène, la 4-Hydroxyproline dans la paroi végétale, le gamma-carboxylglutamate dans la prothrombine (protéine de coagulation), et la gamma-methyl-lysine dans la myosine.
- Dans les archées et les eubactéries, un 22e acide aminé, la pyrrolysine est parfois rencontré, codé par UAG (également habituellement un codon-stop).
Le premier acide aminé incorporé (déterminé par le codon-start AUG) est une méthionine chez la plupart des eucaryotes, plus rarement une valine (chez certains eucaryotes), et une formyl-méthionine chez la plupart des procaryotes. En outre, ce codon d'initiation est parfois GUG ou GUU chez certains procaryotes.
On pense donc aujourd'hui que la vie comptait à l'origine un nombre plus restreint d'acides aminés. Ces acides aminés ont été modifiés et ont vu leur nombre augmenter (par un phénomène similaire à la formation de la sélénocytéine et à la pyrrolysine qui dérivent de la sérine et de la lysine, respectivement, modifiées alors qu'elles sont sur leur ARN de transfert sur le ribosome.) Ces nouveaux acides aminés ont alors utilisé un sous-ensemble des ARN de transfert et leur codage associé. On remarque peut-être des traces de ce phénomène avec la glutamine, qui dans certaines bactéries, dérive du glutamate encore attaché à son ARN de transfert.
Autre exception : le code est parfois ambigu. Ainsi par exemple, le codon UGA peut dans un même organisme (Escherichia coli par exemple) coder tantôt pour le 21ème acide aminé évoqué plus haut (sélénocystéine) ou pour "stop".
Mitochondries
Article détaillé : génome mitochondrial.Les variations du code utilisés par les mitochondries sont encore plus nombreuses.
- Dans le génome mitochondrial de la levure de boulanger (Saccharomyces cerevisiaie), la thréonine est codée par 4 des 6 codons correspondant classiquement à la leucine.
- Dans les mitochondries humaines, AUA, comme AUG, code la méthionine et non l'isoleucine.
- Dans les mitochondries humaines, AGA et AGG sont des codons-stop et ne codent pas l'arginine.
- Dans les mitochondries humaines, de la levure de boulanger, de spiroplasmes et de Mycoplasma mollicutes, UGA n'est pas un codon-stop mais code le tryptophane.
Notes et références
Annexes
Articles connexes
Liens externes
Ala | Arg | Asn | Asp | Cys | Glu | Gln | Gly | His | Ile | Leu | Lys | Met | Phe | Pro | Ser | Thr | Trp | Tyr | Val Acide aminé essentiel | Protéine | Peptide | Code génétique - Portail de la biologie cellulaire et moléculaire
Catégorie : Code génétique
Wikimedia Foundation. 2010.