- Nombre de Catalan
-
En mathématiques combinatoires, les nombres de Catalan forment une suite de nombres naturels utilisée dans divers problèmes de dénombrement , impliquant souvent de façon récursive des objets définis. Ils sont nommés ainsi d'après le mathématicien belge Eugène Charles Catalan (1814-1894).
Le nombre de Catalan d'indice n, appelé n-ième nombre de Catalan est défini par
(voir Coefficient binomial et Jacques Touchard). Les premiers nombres de Catalan (suite A000108 de l’OEIS) pour n = 0, 1, 2, 3, ... sont
Sommaire
Propriétés et comportement asymptotique
Une autre expression pour Cn est
ce qui est equivalent à l'expression précédente car . Cela montre que Cn est un nombre naturel, ce qui n'est pas évident de prime abord à partir de la première formule.
Les nombres de Catalan satisfont aussi la relation de récurrence
De plus,
Cela est dû au fait que:. Ils satisfont:
ce qui peut être un moyen plus efficace pour les calculer
la formule de Stirling permet de calculer un équivalent asymptotique de la suite des nombres de Catalan :
Les seuls nombres de Catalan Cn qui sont impairs sont ceux pour lesquels n = 2k − 1. Tous les autres sont pairs.Applications en combinatoire
Il existe de nombreux problèmes combinatoires dont la solution est donnée par les nombres de Catalan. Les nombres de Catalan peuvent être interprêtés de différentes façon dont voici quelques exemples :
- Cn est égal au nombre de mots de Dyck de longueur 2n.
- Cn est également le nombre de façons différentes de placer des parenthèses autour de n+1 facteurs, pour préciser une expression faisant intervenir n fois une loi de composition interne non associative
- Cn est également le nombre d'arbres binaires entiers à n+1 feuilles.
- Cn est aussi égal au nombre de façons de découper en triangles un polygone convexe à n+2 côtés en reliant certains de ses sommets par des segments de droite.
- Cn est le nombre de chemins monotones le long des arêtes d'une grille à n × n carrés, qui restent sous (ou au niveau de) la diagonale.
- Cn est le nombre de trajectoires de longueur 2n+1 d'une marche aléatoire simple qui ont la propriété d'aller de la hauteur 0 à la hauteur 1 en restant négatif ou nul lors des 2n premières étapes.
- Cn est le nombre d'arbres planaires enracinés à n arêtes.
Ces exemples peuvent être regroupés en deux groupes : les symétriques={les produits non associatifs, les arbres binaires entiers, les triangulations des polygones convexes, ...} et les latéralisés={les mots de Dyck, les chemins monotones sous la diagonale, les marches aléatoires positives, les arbres planaires, ...}. Il est relativement facile de construire des bijections entre deux ensembles du même groupe, mais il est moins évident de le faire entre un ensemble du premier groupe et un du second.
Mots de Dyck
Un mot de Dyck est une chaîne de caractères formée de n lettres X et de n lettres Y, telle qu'aucun préfixe (mot obtenu en supprimant les dernières lettres à partir d'un rang quelconque) ne contienne plus de Y que de X. Autrement dit, lorsque nous parcourons un mot de Dyck de gauche à droite, le nombre de X rencontrés est toujours supérieur ou égal au nombre de Y. Par exemple, les mots de Dyck de la longueur 6 sont:
En l'occurrence, C3= 5.
Assimilant X à une parenthèse ouvrante et Y à une parenthèse fermante, un mot de Dyck de longueur 2n peut être vu comme une expression formée de n paires de parenthèses correctement assemblées : ((())), ()(()), ()()(), (())(), (()()) ; voir aussi Langage de Dyck. Les mots de Dyck peuvent être naturellement représentés comme des chemins dans un quadrillage de n+1 points par n+1 points, reliant certains points par les traits verticaux et horizontaux. Ces chemins commencent dans le coin inférieur gauche, et se terminent dans le coin supérieur droit, en allant toujours vers le haut ou vers la droite, mais ne passant jamais au-dessus de la diagonale principale. X représente alors un « déplacement vers la droite » et Y représente un « déplacement vers le haut ».
Nous pouvons compter les mots de Dyck avec l'astuce suivante due à Désiré André (principe de symétrie) : intéressons-nous aux mots contenant n X et n Y qui ne sont pas des mots de Dyck. Dans de tels mots, déterminons le premier Y qui brise la condition de Dyck, puis modifions toutes les lettres qui suivent ce Y, en échangeant X avec Y et vice versa. Nous obtenons un mot avec n+1 Y et n-1 X, et en fait tous les mots comportant n+1 Y et n-1 X peuvent être obtenus par ce moyen et de manière unique. Le nombre de ces mots est le nombre de façons de placer les n-1 X dans 2n emplacements et est égal àce qui donne le nombre de mots qui ne sont pas de Dyck ; le nombre de mots de Dyck s'en déduit et est égal à
qui est le n-ième nombre de Catalan Cn.
Produits non associatifs
Cn est le nombre de façons différentes de placer des parenthèses autour de n+1 facteurs, pour préciser une expression faisant intervenir n fois une loi de composition interne non associative. Pour n = 3 par exemple, nous obtenons 5 façons différentes de placer des parenthèses autour de 4 facteurs: a(b(cd)), a((bc)d), (ab)(cd), (a(bc))d, ((ab)c)d.
Triangulations d'un polygone
Cn est aussi égal au nombre de façons de découper en triangles un polygone convexe à n+2 côtés en reliant certains de ses sommets par des segments de droite.
Arbres binaires entiers
Cn est également le nombre d'arbres binaires entiers à n+1 feuilles (c'est à dire à 2n arêtes). La correspondance entre les produits non associatifs, les triangulations d'un polygone et les arbres binaires entiers est illustré sur l'image ci-dessous.
Partitions non croisées
Cn est également le nombre de partitions non croisées (en) de l'ensemble {1, ..., n }. A fortiori, Cn n'excède jamais le n-ième nombre de Bell.
Chemins sous-diagonaux dans le carré
Cn est le nombre de chemins monotones le long des arêtes d'une grille à n × n carrés, qui restent sous (ou au niveau de) la diagonale. Un chemin monotone part du coin Sud-Ouest, arrive dans le coin Nord-Est, et est constitué d'arêtes dirigées à droite ou vers le haut. Un mot de Dyck encode un tel chemin de la manière suivante : X signifie « va à droite » et Y signifie « monte ». Les diagrammes ci-dessous représentent le cas n = 4 :
Trajectoires de la marche aléatoire simple
Cn est le nombre de trajectoires de longueur 2n+1 d'une marche aléatoire simple qui ont la propriété d'aller de la hauteur 0 à la hauteur 1 en restant négatif ou nul lors des 2n premières étapes. On peut voir cela en faisant pivoter de 45 degrés le chemin entre les deux coins d'un carré décrit lors du premier exemple. C'est aussi le nombre de trajectoires de longueur 2n+2 allant de la hauteur 0 à la hauteur 0 en restant strictement positives lors des 2n+1 étapes intermédiaires, ou encore le nombre de trajectoires de longueur 2n allant de la hauteur 0 à la hauteur 0 en restant positives ou nulles lors des 2n-1 étapes intermédiaires. Dans ce dernier cas on peut coder la trajectoire par une suite de 2n + et de - (pour montée et descente), la condition de positivité se traduisant par le fait que cette suite est un mot de Dyck (car chaque préfixe a plus de montées que de descentes). Ainsi, pour la marche aléatoire simple, la probabilité que le premier temps de retour en 0, partant de 0, ait lieu à l'instant 2n+2, est le facteur 2 prenant en compte les trajectoires strictement négatives en plus des trajectoires strictement positives. De même, la probabilité que le premier temps d'atteinte de 1, partant de 0, ait lieu à l'instant 2n+1, est
Arbres planaires
Cn est le nombre d'arbres planaires enracinés à n arêtes. La bijection avec les mots de Dyck, ou encore avec les trajectoires de marches aléatoires, est donnée très visuellement par un parcours extérieur de l'arbre. La trajectoire obtenue est le graphe de la fonction qui à chaque coin (secteur angulaire délimité par un sommet et deux arêtes contigües issues de ce sommet) associe la hauteur du sommet (la distance du sommet à la racine). Les coins sont parcourus dans l'ordre correspondant au parcours autour de l'arbre (voir figure ci-contre). Chaque sommet est visité autant de fois qu'il y a de coins issus de ce sommet, i.e. le nombre de visites à un sommet est le degré de ce sommet ; à titre d'exception, le nombre de visites à la racine est son degré plus un (plus le retour final à la racine, qui revient à visiter 2 fois le coin origine). Ainsi le nombre de pas de la marche est la somme des degrés du graphe, i.e. deux fois le nombre d'arêtes du graphe.
Bijections entres les exemples
Les ensembles décrits plus haut qui sont à Cn éléments sont clairement en bijection les uns avec les autres. Les bijections entre deux ensembles symétriques (Produits non associatifs, Triangulations d'un polygone, Arbres binaires entiers) sont décrits plus haut. De même les bijections entre deux ensembles latéralisés (Mots de Dyck, Chemins monotones sous la diagonale, Marches aléatoires positives, Arbres planaires) sont décrits dans les sections précédents. La bijection entre les arbres binaires entiers à 2n arêtes et les arbres planaires à n arêtes se fait en contractant soit les arêtes gauches, soit les arêtes droites de l'arbre binaire. D'où les appellations "symétriques" et "latéralisés".
L'image suivant illustre les différentes bijections avec un exemple concret :
Relations de récurrence
- Comme vu précédemment, les nombres de Catalan satisfont la relation de récurrence
Ceci vient du fait que tout mot de Dyck w de longueur supérieure à 2 peut s'écrire de manière unique sous la forme
- w = Xw1Yw2,
où w1 et w2 désignent des mots de Dyck (éventuellement vides). La fonction génératrice des nombres de Catalan est définie par
et en utilisant la relation de récurrence ci-dessus nous voyons que
et par conséquent
avec par prolongation par continuité: c(0) = 1.
- D'autre part, ils satisfont la relation de récurrence
qui permet aussi de retrouver la série génératrice, en effet, cette relation montre que c(x) est la solution de l'équation différentielle
qui vaut 1 en 0.
Matrice de Hankel
La matrice n×n de Hankel dont le terme (i, j) est le nombre de Catalan Ci+j−2 a pour déterminant 1, indépendamment de la valeur de n. Ainsi, pour n = 4, nous avons
Remarquons que si les termes sont "décalés" , en prenant les nombres de Catalan Ci+j−1, le déterminant est toujours 1, indépendamment de la valeur de n. Ainsi, pour n = 4, nous avons
La suite des nombres de Catalan est la seule suite de nombres ayant cette propriété.
Histoire
La suite de Catalan fut décrite pour la première fois au XVIIIe siècle par Leonhard Euler, qui s'était intéressé au dénombrement des différentes façons de partager un polygone en triangles. La suite est nommée ainsi en l'honneur de Eugène Charles Catalan, qui découvrit la relation avec le parenthèsage d'expressions pendant son étude du puzzle de la Tour de Hanoï.
La première publication sur ces nombres est due à Segner et la suite porte alors le nom de Nombre de Segner. Eugène Charles Catalan fit le lien avec le nombre d'expressions « parenthésées » et le nom de Catalan remplaça celui de Segner. L'astuce de comptage des mots de Dyck fut trouvée par Désiré André en 1887.
En 1988, dans la revue chinoise Neimenggu Daxue Xuebao, fut publié le fait que la suite des nombres de Catalan avait été utilisée en Chine par le mathématicien Antu Ming dès 1730, lors de l'écriture de son livre Ge Yuan Mi Lu Jie Fa, achevé par son élève Chen Jixin en 1774 et publié 60 ans plus tard. P.J. Larcombe (1999) esquissa certaines des caractéristiques du travail de Antu Ming, comme le fait, qu'il utilisa la suite des nombres de Catalan pour exprimer des expansions en séries de sin(2α) et(4α) en termes de sin(α).
- (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Catalan number » (voir la liste des auteurs)
-
Wikimedia Foundation. 2010.