- Lemme d'Ogden
-
Le lemme d'Ogden est un résultat de théorie des langages analogue au lemme de l'étoile. On l'utilise principalement pour démontrer que certains langages ne sont pas algébriques.
Le lemme d'Ogden est une version plus élaborée du lemme d'itération pour les langages algébriques, aussi connu sous le nom de lemme de Bar-Hillel, Perles et Shamir.
Sommaire
Énoncé
Étant donné un mot , où les ai sont des lettres, on appelle position dans w tout entier de l'ensemble . Un choix de N positions distinguées dans w (ceci est la terminologie habituelle, un peu alambiquée) est simplement un sous-ensemble de positions contenant N éléments. Avec ces définitions, le lemme s'énonce comme suit:
Lemme d'Ogden — Soit L un langage algébrique. Il existe un entier N tel que pour tout mot w de L de longueur , et pour tout choix de N positions distinguées dans w, il existe une factorisation w = xuyvz telle que
- (x et u et y) ou (y et v et z) contiennent au moins une position position distinguée
- uyv contient plus N positions distinguées
- pour tout .
L'entier N (plus précisément le plus petit entier pour lequel l'éononcé est vrai) est la constante d'Ogden.
Il existe une variante grammaticale du lemme d'Ogden: elle dit que la paire itérante (x,u,y,v,z) peut être choisie grammaticale. Cette variante est bien utile dans certains cas. Voici l'énoncé:
Lemme d'Ogden (variante grammaticale) — Soit G une grammaire algébrique d'axiome S. Il existe un entier N tel que pour tout mot w qui dérive de S de longueur , et pour tout choix de N positions distinguées dans w, il existe une factorisation w = xuyvz telle que
- (x et u et y) ou (y et v et z) contiennent au moins une position position distinguée
- uyv contient plus N positions distinguées
- il existe une variable X telle que .
Dans cet énoncé, le mot w peut contenir des variables de la grammaire: il appartient au langage « élargi » de tous les mots dérivant de S, qu'ils contiennent ou non des variables.
Exemples d'application
- Le langage n'est pas algébrique. On distingue, dans le mot aNbNcN les lettres égales à a. En applicant le lemme, on fait donc varier le nombre de a. Il faut distinguer encore le cas où le facteur v est vide ou non, mais comme on itère ce fateur, il ne peut être formé que d'un type de lettres, d'où la contradiction.
- Le langage n’est pas algébrique. On applique la variante du lemme au mot w = aNbNcNdN, où N est la constante d'Ogden, et où les lettres distinguées sont les lettres b. Il existe des dérivations
avec . On applique le lemme une deuxième fois, au mot , où cette fois-ci ce sont les lettres a qui sont distinguées. On obtient une paire itérante contenant de lettres a itérées, mais aucune lettre d, contradiction.
- Le langage est inhéremment ambigu. Un langage est inhéremment ambigu si toutes les grammaires qui l'engendrent sont ambiguës. On applique une première fois la variante du lemme au mot
w = aNbNcN + N!,
où N est la constante d'Ogden, et en distinguant les lettres b. Il existe une dérivation
.
et les conditions impliquent que u = ai et v = bi pour un entier . En itérant N! / i fois la dérivation
,
on obtient un arbre de dérivation pour le mot aN + N!bN + N!cN + N!. Cet arbre contient un sous-arbre dont la frontière ne contient que des lettres a et b, dont au moins N! − N lettres b. En appliquant le même procédé au mot
w = aN + N!bNcN,
on obtient un autre arbre de dérivation pour le même mot aN + N!bN + N!cN + N!. Cet arbre contient un sous-arbre dont la frontière ne contient que des lettres b et c, dont au moins N! − N lettres b. Cet arbre est donc différent du premier arbre.
Références
- William F. Ogden, « A Helpful Result for Proving Inherent Ambiguity », dans Mathematical Systems Theory, vol. 2, no 3, 1968, p. 191-194 [lien DOI]
- Olivier Carton, Langages formels, calculabilité et complexité, Vuibert, 2008 (ISBN 978-2-7117-2077-4)
Voir aussi
Catégories :- Langage formel
- Théorème d'informatique
- Informatique théorique
Wikimedia Foundation. 2010.