- Graphe de de Bruijn
-
Un graphe de de Bruijn est un graphe orienté défini par le mathématicien Nicolaas Govert de Bruijn en 1946. Un graphe de de Bruijn permet de représenter les chevauchements de longueur L-1 entre tous les mots de longueur L d'un langage.
Soit un alphabet de taille n. On note Gn,L = (S,A) le graphe de de Bruijn d'ordre L construit sur l'alphabet . Les sommets S de Gn,L représentent (sont étiquetés) les Ln mots de longueur L construits à partir des lettres de l'alphabet :
Il existe un arc Ai,j allant du sommet si (représentant le mot ) au sommet sj (représentant le mot ) du graphe Gn,L si
- , soit uk = vk − 1 pour k=2,…, L.
Autrement dit, il existe un arc (si,sj) dans A si le suffixe de longueur L-1 du mot u et le préfixe de longueur L-1 du mot v correspondent.
Exemple
Le graphe G2,3 = (S,A) ci-contre est construit sur un alphabet binaire pour des mots de longueur L=3. Il existe 23 = 8 mots de longueur 3 sur un alphabet binaire :
Il existe un arc allant du sommet 000 au sommet 001 car le suffixe de longueur 2 (L-1) de 000 est égal au préfixe de longueur 2 de 001. Il existe un arc allant du sommet 100 au sommet 000 car le suffixe de longueur 2 de 100 est égal au préfixe de longueur 2 de 000.
Propriétés
Chaque sommet d'un graphe de de Bruijn construit sur un alphabet n-aire a n arcs sortants (choix de la dernière lettre). De même, chaque sommet a n arcs rentrants.
Un graphe de de Bruijn est eulérien.
Utilisation
Les graphes de de Bruijn sont utilisés en bioinformatique pour l'assemblage de novo de reads (ou lectures) issues d'un séquençage.
Catégorie :- Graphe remarquable
Wikimedia Foundation. 2010.