- Lemme d'itération pour les langages algébriques
-
Le Lemme d'itération pour les langages algébriques, aussi connu sous le vocable Lemme de Bar-Hillel, Perles et Shamir, donne une condition de répétition nécessaire pour les langages algébriques. Sa version simplifiée pour les langages rationnels est le lemme de l'étoile.
Une version plus élaborée du lemme d'itération est le Lemme d'Ogden.
Sommaire
Énoncé formel
Lemme d'itération — Soit L un langage algébrique. Il existe un entier N tel que tout mot w de L de longueur possède une factorisation w = xuyvz telle que
- et
- pour tout entier .
Le lemme indique donc que, dans un langage algébrique, certains facteurs de mots assez longs peuvent être itérés de concert. L'entier N est l'« entier d'itération », le couple (u,v) ou la factorisation (x,u,y,v,z) est une « paire itérante ».
Il existe une variante grammaticale du lemme d'itération: elle dit que la paire itérante (x,u,y,v,z) peut être choisie grammaticale. Cette variante est bien utile dans certains cas. Voici l'énoncé:
Lemme d'itération (variante grammaticale) — Soit G une grammaire algébrique d'axiome S. Il existe un entier N tel que tout mot w qui dérive de S de longueur possède une factorisation w = xuyvz telle que
- et
- il existe une variable X telle que .
Dans cet énoncé, le mot w peut contenir des variables de la grammaire: il appartient au langage « élargi » de tous les mots dérivant de S, qu'ils contiennent ou non des variables.
Exemple d'utilisation du lemme
Prouvons que le langage L = {anbncn | n > 0} n'est pas algébrique. Supposons le contraire, et soit N la constante d'itération du langage. Considérons le mot w = aNbNcN. Il existe une factorisation w = xuyvz vérifiant les propriétés du lemme. Comme pour tout n, chaque mot unvn contient le même nombre de lettres a,b et c, et ce nombre est non nul. Or ceci est impossible si les lettres a doivent précéder les lettres b et celles-ci les lettres c.
Limitations
Comme pour les langages rationnels, le lemme d'itération pour les langages algébriques est une condition nécessaire mais non suffisante. Parmi les lemmes de même nature le lemme d'Ogden est bien plus puissant.
Références
- Yehoshua Bar-Hillel, Micha A. Perles et Eli Shamir, « On formal properties of simple phrase structure grammars », dans Zeitschrift für Phonetik, Sprachwissenschaft und Kommunikationsforschung, vol. 14, 1961, p. 143-172
- Olivier Carton, Langages formels, calculabilité et complexité, Vuibert, 2008 (ISBN 978-2-7117-2077-4)
- (en) Michael Sipser, Introduction to the Theory of Computation, PWS Publishing, 1997 (ISBN 0-534-94728-X) Section 1.4: Nonregular Languages, pp. 77–83. Section 2.3: Non-context-free Languages, pp. 115–119.
Voir aussi
Wikimedia Foundation. 2010.