- Théorème de Kleene
-
En informatique théorique, et plus précisément en théorie des automates, le théorème de Kleene affirme qu'un langage peut être décrit par une expression rationnelle (c'est-à-dire est rationnel) si et seulement s’il est reconnu par un automate fini. C'est un théorème fondamental de la théorie des langages formels et des automates. La première formulation de ce théorème est due au mathématicien Stephen C. Kleene.
Sommaire
Historique
Le début des automates finis, et notamment la genèse du théorème de Kleene a été décrite par Dominique Perrin[1]. La première mention des automates finis remonte à un article McCulloch et Pitts en 1943[2]. C'est Stephen Kleene qui reprend cet article en 1956, et présente la première preuve de son théorème[3]. Le premier exposé complet est donné par Rabin et Scott en 1959[4].
Formulation contemporaine
Depuis le traité d'Eilenberg[5], le théorème de Kleene est formulé de façon plus concise comme suit.
L'ensemble des langages rationnels sur un alphabet A est par définition le plus petit ensemble de parties de A * contenant les singletons (parties réduites à un seul élément) et l'ensemble vide, et fermé par les opérations d'union, produit et étoile. Cet ensemble est noté Rat A * .
On appelle langage reconnaissable sur un alphabet A tout langage qui peut être reconnu par un automate fini sur A. L'ensemble des langages reconnaissables est noté Rec A * .
Le théorème de Kleene s'énonce alors comme suit.
Théorème de Kleene — Sur un alphabet fini A, il y a égalité entre langages rationnels et langages reconnaissables. En d'autres termes, on a
- Rat A * = Rec A *
Démonstrations
De nombreuses variantes de démonstrations de ce théorème existent[6]. La plupart des preuves sont constructives, et montrent les deux inclusions et .
- .
- On prouve que l'ensemble des langages reconnaissables est fermé par les opérations d'union, produit et étoile en réalisant les constructions des automates appropriés (cf paragraphe Construction d'automates finis à partir des expressions rationnelles de l'article Automate fini).
- On prouve que les langages décrits par une expression rationnelle sont reconnus par automate fini. Les méthodes les plus répandues sont :
Récemment, les applications pratiques ont suscité un intérêt pour le développement d'algorithmes efficaces pour réaliser les constructions qui interviennent dans la preuve.
- .
Il s'agit de donner une expression rationnelle pour le langage reconnu par un automate fini. Trois algorithmes sont courants :
- L'algorithme de McNaughton et Yamada : on calcule par itération les langages reconnus dont les chemins n'utilisent que certains états.
- L'algorithme de Conway : on calcule la matrice des langages reconnus par partition
- L'algorithme d'élimination ou algorithme de Brzozowski et McCluskey (en) : on élimine les états, et on remplace les étiquettes par des expression rationnelles.
Toutes ces méthodes sont des méthodes d'élimination d'états.
Généralisations et extensions
Théorème de Kleene-Schützenberger
On doit au mathématicien Marcel-Paul Schützenberger l'extension du théorème de Kleene aux séries formelles (respectivement aux automates pondérées). Le théorème affirme qu'une série formelle en variables non commutatives à coefficients dans un demi-anneau est rationnelle si et seulement si elle est reconnue par un automate fini pondéré, dont les poids des étiquettes sont des éléments de ce demi-anneau [7].
Extensions aux monoïdes
Le théorème de Kleene a fait l'objet de tentatives d'extension aux monoïdes généraux, pas nécessairement libres. Étant donné un monoïde M, les parties rationnelles de M sont la plus petite famille de parties de M contenant les singletons et l'ensemble vide, et fermée par union, produit et passage au sous-monoïde engendré (l'analogue de l'étoile de Kleene dans les monoïdes). On note Rat M l'ensemble des parties rationnelles de M.
Il convient d'exprimer de façon plus algébrique la notion de partie reconnaissable d'un monoïde. Une partie H d'un monoïde M est une partie reconnaissable de M si elle est saturée par une congruence d'index fini, en d'autres termes s'il existe un monoïde fini N, et un morphisme surjectif tel que H = f − 1(K), où H = f(H). On note Rec M l'ensemble des parties reconnaissables de M.
Avec ces définitions, l'égalité Rec M = Rat M est par exemple vraie dans les monoïdes finis. McKnight a prouvé que si M est un monoïde finiment engendré, alors . L'égalité n'est pas vraie en général. En particulier, dans le produit de deux monoïdes libres, les parties rationnelles sont les transductions rationnelles, alors que les parties reconnaissables sont, d'après un théorème de Mezei, des unions finies de produits de parties reconnaissables des deux monoïdes composants[6].
Le cas des groupes
Un sous-groupe H d'un groupe G est une partie reconnaissable de G si et seulement s'il est d'index fini.
Un sous-groupe H d'un groupe G est une partie rationnelle de G si et seulement s'il est finiment engendré.
Si G lui-même est finiment engendré, le théorème de McKnight cité plus haut implique que tout sous-groupe d'index fini est finiment engendré, un résultat habituellement attribué à Howson.
Théorèmes de Kleene pour les monoïdes partiellement commutatifs
Le théorème de Kleene reste valide, sous réserve d'une restriction de l'étoile de Kleene, dans les monoïdes des traces (en) ou monoïdes partiellement commutatifs libres[8].
Soit A un alphabet. Une relation d'indépendance ou relation de commutation I est une partie I de qui est irréflexive et symétrique. Un relation d'indépendance I définit une relation de dépendance réflexive et symétrique D par , et réciproquement.
Une relation d'indépendance induit une relation binaire ∼ sur A * , où u∼v si et seulement si u = xaby et v = xbay pour des mots et une paire . On note est la fermeture réflexive, symétrique et transitive de ∼. Le monoïde des traces est le monoïde quotient de . Les éléments de sont des traces. Pour un mot ou une trace w, on note alph(w) l'ensemble des lettres qui apparaissent dans w. Deux traces u et v sont indépendantes si toute lettre de u commute avec toute lettre de v. Une trace u est connexe si alph(u) induit un sous-graphe dont les sommets sont les lettres et les arêtes sont les éléments de D.
L'étoile de Kleene concurrente (concurrent star en anglais) d'une partie X de est l'ensemble (c(X)) * , où c(X) est l'ensemble des traces connexes non vides qui commutent avec une trace de X. Notons le plus petit ensemble de parties de contenant les singletons et l'ensemble vide, et fermé par les opérations d'union, produit et l'étoile de Kleene concurrente. On a alors l'égalité suivante, due à Ochmański:
- .
Notes
- Perrin "Débuts de la théorie des automates" (1995)
- McCullogh et Pitts (1943)
- Kleene (1956)
- Rabin et Scott (1959)
- Eilenberg (1984)
- Sakarovitch (2003) voir
- Droste et al. (2009) Pour des extensions et variantes, voir
- Diekert et Métivier (1997) Ce paragraphe est tiré de
Articles
- (en) Warren S. McCulloch et Walter Pitts, « A logical calculus of the ideas immanent in nervous activity », dans Bull. Math. Biophys., vol. 5, 1943, p. 115-133
- (en) Stephen C. Kleene, « Representation of events in nerve nets and finite automata. Automata studies », dans Annals of Mathematics Studies, Princeton University Press, no 34, 1956, p. 3-41
- Dominique Perrin, « Les débuts de la théorie des automates », dans Technique et science informatiques, vol. 14, no 4, 1995, p. 409-433 [texte intégral]
- (en) Michael O. Rabin et Dana Scott, « Finite automata and their decision problems », dans IBM J. Res. Develop., vol. 3, 1959, p. 114-125
Bibliographie
- Olivier Carton, Langages formels, calculabilité et complexité, Vuibert, 2008 (ISBN 978-2-7117-2077-4)
- (en) Volker Diekert et Yves Métivier, « Partial Commutation and Traces », dans G. Rozenberg, A. Salomaa (éditeurs), Handbook of Formal Languages, vol. 3 : Beyond Words, Springer Verlag, 1997 (ISBN 978-3-5406-0649-9)
- (en) Manfred Droste, Werner Kuich et Heiko Vogler, Handbook of Weighted Automata, Springer-Verlag, 2009 (ISBN 978-3-64201491-8)
- (en) Samuel Eilenberg, Automata, Languages and Machines, Vol. A, Academic Press, 1974 (ISBN 978-0-12234001-7)
- (en) John E. Hopcroft, Rajeev Motwani, et Jeffrey D. Ullman, Introduction to Automata Theory, Languages, and Computation, Prentice Hall, 2007, 3e éd. (ISBN 978-0-32146225-1)
- Jacques Sakarovitch, Éléments de théorie des automates, Vuibert, 2003 (ISBN 978-2-7117-4807-5).
Traduction anglaise avec corrections : Elements of Automata Theory, Cambridge University Press 2009, (ISBN 978-0-52184425-3)
Voir aussi
Catégories :- Théorème d'informatique
- Théorème de mathématiques
- Langage formel
- Stephen Cole Kleene
Wikimedia Foundation. 2010.