- Langage de Dyck
-
En informatique théorique, et plus spécialement en théorie des langages, les langages de Dyck sont des langages formels particuliers. Un langage de Dyck est l'ensemble des mots bien parenthésés, sur un alphabet formé de parenthèses ouvrantes, et de parenthèses fermantes correspondantes. Par exemple, sur la paire de parenthèses formée de '(' et ')', le mot '(())()' est bien parenthésé, et est donc un mot de Dyck, alors que le mot '())(' ne l'est pas.
Formellement, un mot est bien parenthésé s'il peut être réduit au mot vide en supprimant successivement des paires adjacentes de parenthèses de même type. Par exemple, sur l'alphabet formé de (,[,),], le mot ([()[]])() est bien parenthésé parce que
Les langages de Dyck jouent un rôle important en informatique théorique. Le théorème de Chomsky Schützenberger stipule en effet que tout langage algébrique est image d'un langage de Dyck.
Les langages de Dyck ont été nommés ainsi d'après le mathématicien allemand Walther von Dyck.
Sommaire
Définition formelle
Soit A un alphabet, et soit une copie de A disjointe de A. Sur l'ensemble des mots sur , on définit la réduction de Dyck comme suit:
- s'il existe une factorisation telle que w' = xy, avec .
La réduction de Dyck est la fermeture transitive de cette relation. Un mot de Dyck est un mot qui se réduit au mot vide ε. Le langage de Dyck sur est l'ensemble des mots de Dyck.
La réduction de Dyck est un système de réécriture confluent. La congruence de Dyck est la fermeture réflexive, symétrique et transitive de la relation.
Propriétés
- Le produit de deux mots de Dyck est encore un mot de Dyck, donc le langage de Dyck est un sous-monoïde du monoïde libre .
- Un mot Dyck premier est un mot de Dyck qui n'est pas produit de plusieurs mots de Dyck. On note DA ou D l'ensemble des mots Dyck premiers, et ou D * le langage de Dyck. On rencontre aussi la notation lorsque l'alphabet contient n lettres.
- L'ensemble des mots de Dyck premiers est un code bifixe (c'est-à-dire un code préfixe et suffixe). Les monoïdes sont donc des sous-monoïdes libres.
- Les langages de Dyck et les langages de Dyck premiers sont des langages algébriques déterministes. Voici une grammaire:
La variable S engendre le langage de Dyck , la variable T engendre le langage des mots Dyck premiers DA.
- Un autre grammaire fréquemment rencontrée est:
La variable S engendre le langage de Dyck , mais la grammaire est ambiguë
- Le théorème de Chomsky–Schützenberger stipule que tout langage algébrique est une image homomorphe de l'intersection d'un langage de Dyck avec un langage rationnel.
- Ce théorème peut être affiné comme suit: tout langage algébrique L est une image homomorphe de l'intersection de l'image homomorphe inverse du langage de Dyck sur deux paires de parenthèses un langage rationnel:
où h et g sont des morphismes et K est un langage rationnel.
- De manière équivalente, cet énoncé signifie que tout langage algébrique est image de par une transduction rationnelle, ou encore que le langage est un générateur du cône rationnel (en) des langages algébriques.
- Le langage de Dyck sur deux paires de parenthèses appartient à la classe de complexité nombre de Catalan Cn.
- Le monoïde syntaxique du langage de Dyck est le monoïde bicyclique (en).
Langages de Dyck bilatères
Ces langages sont reliés à la définition des groupes libres.
Soit A un alphabet, et soit une copie de A disjointe de A. Ici, la copie de la lettre a est vue comme son inverse formelle. Sur l'ensemble des mots sur , on définit une relation de réduction comme suit:
s'il existe une factorisation ou telle que w' = xy, avec . La réduction de Dyck bilatère est la fermeture transitive de cette relation.
Par exemple, on a
Un mot de Dyck bilatère est un mot qui se réduit au mot vide ε. Lz relation de réécriture définie ci-dessus est confluente, et tout mot se réduit en un mot irréductible (c'est-à-dire ne contenant aucun facteur ou ) unique. L'ensemble des mots irréductibles est un langage rationnel. Il est en bijection avec le groupe libre sur A.
Le langage de Dyck bilatère sur est l'ensemble des mots de Dyck bilatères.
Propriétés
- Les langages de Dyck bilatères sont algébriques. Voici une grammaire:
Cette grammaire est ambiguë. Par exemple, le mot a les deux dérivations gauches suivantes:
Il existe des grammaires non-ambiguës pour les langages de Dyck bilatères. En voici une:
Dans le cas où l'alphabet A est composé d'une seule lettre a, cette grammaire se réduit à:
- Le théorème de Chomsky–Schützenberger reste valable lorsque les langages de Dyck sont remplacés par les langages de Dyck bilatères.
Voir aussi
Références
- Olivier Carton, Langages formels, calculabilité et complexité, Vuibert, 2008 (ISBN 978-2-7117-2077-4)
- Jean-Michel Autebert, Langages algébriques, Masson, 1987 (ISBN 978-2-225-81087-9)
- Wilhelm Magnus, Abraham Karrass et Donald Solitar, Combinatorial Group Theory. Presentations of groups in terms of generators and relations, Dover Publications, 2004 (ISBN 0-486-43830-9).
Réimpression de la seconde édition, de 1976
Wikimedia Foundation. 2010.