- Polynômes orthogonaux
-
En mathématiques, une suite de polynômes orthogonaux est une suite infinie de polynômes p0(x), p1(x), p2(x) ... à coefficients réels, dans laquelle chaque pn(x) est de degré n, et telle que les polynômes de la suite sont orthogonaux deux à deux pour un produit scalaire de fonctions donné.
Sommaire
Introduction
Le produit scalaire de fonctions le plus simple est l'intégrale du produit de ces fonctions, sur un intervalle borné :
Plus généralement, on peut introduire une « fonction poids » W(x) dans l'intégrale (sur l'intervalle d'intégration ]a,b[, W doit être à valeurs finies et strictement positives, et l'intégrale du produit de la fonction poids par un polynôme doit être finie ; les bornes a,b peuvent être infinies) :
Avec cette définition du produit scalaire, deux fonctions sont orthogonales entre elles si leur produit scalaire est égal à zéro (de la même manière que deux vecteurs sont orthogonaux (perpendiculaires) si leur produit scalaire égale zéro). On introduit alors la norme associée : ; le produit scalaire fait de l'ensemble de toutes les fonctions de norme finie un espace de Hilbert.
L'intervalle d'intégration est appelé intervalle d'orthogonalité.
Le domaine des polynômes orthogonaux a été développé durant le XIXe siècle par Stieltjes, comme outil de la théorie analytique des fractions continues. De multiples applications en ont découlé en mathématiques et en physique.
Exemple : les polynômes de Legendre
Les polynômes orthogonaux les plus simples sont les polynômes de Legendre pour lesquels l'intervalle d'orthogonalité est ]-1, 1[ et la fonction poids est la fonction constante de valeur 1 :
Ils sont tous orthogonaux sur ]-1, 1[ :
Propriétés
Toute suite de polynômes , où chaque est de degré k, est une base de l'espace vectoriel (de dimension infinie) de tous les polynômes, « adaptée au drapeau ». Une suite de polynômes orthogonaux est une telle base qui est, de plus, orthogonale pour un certain produit scalaire. Ce produit scalaire étant fixé, une telle suite est presque unique (unique à produit près de ses vecteurs par des scalaires non nuls), et peut s'obtenir à partir de la base canonique (non orthogonale en général), par le procédé de Gram-Schmidt.
Quand on construit une base orthogonale, on peut être tenté de la rendre orthonormale, c'est-à-dire telle que pour tout n, en divisant chaque pn par sa norme. Dans le cas des polynômes, on préfère ne pas imposer cette condition supplémentaire car il en résulterait souvent des coefficients contenant des racines carrées. On préfère souvent choisir un multiplicateur tel que les coefficients restent rationnels, et donnent des formules aussi simples que possible. C'est la standardisation. Les polynômes « classiques » énumérés ci-dessous ont été ainsi standardisés ; typiquement, le coefficient de leur terme de plus haut degré ou leur valeur en un point ont été mis à une quantité donnée (pour les polynômes de Legendre, Pn(1) = 1). Cette standardisation est une convention qui pourrait aussi parfois être obtenue par une mise à l'échelle de la fonction poids correspondante. Notons
(la norme de est la racine carrée de ). Les valeurs de pour les polynômes standardisés sont énumérées dans le tableau ci-dessous. Nous avons
- ;
où δmn est le delta de Kronecker.
Toute suite (pk) de polynômes orthogonaux possède un grand nombre de propriétés remarquables. Pour commencer :
Lemme 1 : est une base de
Lemme 2 : pn est orthogonal à .
Le lemme 1 est dû au fait que pk est de degré k. Le lemme 2 vient de ce que, de plus, les pk sont orthogonaux deux à deux.
Relation de récurrence
Pour toute suite de polynômes orthogonaux, il existe une relation de récurrence relativement à trois polynômes consécutifs.
Les coefficients an,bn,cn sont donnés par
où kj et kj' désignent les deux premiers coefficients de pj :
et hj le produit scalaire de pj par lui-même :
- .
(Par convention, sont nuls.)
DémonstrationAvec les valeurs données pour an et bn, le polynôme (anx + bn)pn − pn + 1 est de degré <n (les termes de degrés n+1 et n s'éliminent). On peut donc l'exprimer sous forme d'une combinaison linéaire des éléments de la base de :
avec
(car pour j<n, pj est orthogonal à pn et pn+1).
De plus, de par la forme intégrale du produit scalaire,
Pour j<n-1, ce produit scalaire est nul car xpj est de degré <n.
Pour j=n-1, il est égal à car (par le même raisonnement qu'au début) an − 1xpn − 1 − pn est de degré <n.
On peut conclure :
avec
Noyau de Christoffel-Darboux
Dans l'espace L2 associé à W, notons Sn la projection orthogonale sur : pour toute fonction telle que ,
où Kn est le noyau de Christoffel-Darboux, défini par :
La relation de récurrence précédente permet alors de montrer :
DémonstrationDémontrons la première de ces deux formules (la seconde s'en déduit en faisant tendre y vers x), par récurrence sur n. Pour n=-1 elle est vraie (par convention, K-1=0). Supposons-la vraie au rang n-1 et prouvons-la au rang n. En remplaçant pn + 1 on obtient
avec, par hypothèse de récurrence,
d'où
Existence de racines réelles
Tout polynôme d'une suite de polynômes orthogonaux dont le degré n est supérieur ou égal à 1 admet n racines distinctes, toutes réelles, et situées strictement à l'intérieur de l'intervalle d'intégration (c'est une propriété remarquable : il est rare, pour un polynôme de degré élevé dont les coefficients ont été choisis au hasard, d'avoir toutes ses racines réelles)
DémonstrationSoit m le nombre des points où pn change de signe à l'intérieur de l'intervalle d'orthogonalité ; notons ces points. Ce sont les racines de pn d'ordre impair appartenant à l'intervalle d'orthogonalité. D'après le théorème fondamental de l'algèbre, m ≤ n. On va montrer m = n. Soit ; c'est un polynôme de degré m qui change de signe en chaque point xj ; S(x)pn(x) est donc strictement positif, ou strictement négatif, partout sur l'intervalle d'intégration sauf aux points xj , et il en est donc de même de S(x)pn(x)W(x). Ainsi, , l'intégrale de ce produit, est non nul. Mais, d'après le Lemme 2, pn est orthogonal à tous les polynômes de degré inférieur, donc le degré de S doit être n.
Position des racines
Les racines des polynômes se trouvent strictement entre les racines du polynôme de degré supérieur dans la suite.
DémonstrationOn met d'abord tous les polynômes sous une forme standardisée telle que le coefficient dominant soit positif (ce qui ne change pas les racines), puis on effectue une récurrence sur n. Pour n=0 il n'y a rien à démontrer. Supposons la propriété acquise jusqu'au rang n. Notons les racines de pn et celles de pn + 1. La relation de récurrence donne pn + 1(xj) = − cnpn − 1(xj) avec (d'après le choix de standardisation) cn > 0. Or par hypothèse de récurrence, ( − 1)n − jpn − 1(xj) > 0. On en déduit ( − 1)n + 1 − jpn + 1(xj) > 0. En outre, et . Ceci permet de conclure : .
Une autre méthode de démonstration est de prouver (par récurrence, ou plus simplement en utilisant le noyau de Christoffel-Darboux) que pour tout n et tout x, , pour en déduire que et ont même signe, si bien que ( − 1)n − jpn(yj) > 0, ce qui permet de conclure que pn s'annule entre les yj.
Équations différentielles conduisant à des polynômes orthogonaux
Une importante classe des polynômes orthogonaux provient d'une équation différentielle de Sturm-Liouville de la forme
où Q est un polynôme quadratique donné et L un polynôme linéaire donné. La fonction f est inconnue, et la constante λ est un paramètre. On peut remarquer qu'une solution polynomiale est a priori envisageable pour une telle équation, les degrés des termes étant compatibles. Cependant, les solutions de cette équation différentielle ont des singularités, à moins que λ ne prenne des valeurs spécifiques. La suite de ces valeurs conduit à une suite de polynômes solutions si l'une des assertions suivantes est vérifiée :
- Q est vraiment quadratique, L est linéaire, Q a deux racines réelles distinctes, la racine de L est située entre les deux racines de Q, et les termes de plus haut degré de Q et L ont le même signe.
- Q n'est pas quadratique, mais linéaire, L est linéaire, les racines de Q et L sont différentes, et les termes de plus haut degré de Q et L ont le même signe si la racine de L est plus petite que celle de Q, ou inversement.
- Q est un polynôme constant non nul, L est linéaire, et le terme de plus haut degré de L est de signe opposé à celui de Q.
Ces trois cas conduisent respectivement aux polynômes de Jacobi, de Laguerre et d'Hermite. Pour chacun de ces cas :
- La solution est une suite de polynômes , chaque ayant un degré n, et correspondant au nombre .
- L'intervalle d'orthogonalité est limité par les racines de Q.
- La racine de L est à l'intérieur de l'intervalle d'orthogonalité.
- En notant , les polynômes sont orthogonaux sous la fonction poids
- W(x) ne peut pas s'annuler ou prendre une valeur infinie dans l'intervalle, bien qu'il puisse le faire aux extrémités.
- W(x) peut être choisi positif sur l'intervalle (multiplier l'équation différentielle par -1 si nécessaire)
En raison de la constante d'intégration, la quantité R(x) est définie à une constante multiplicative près. Le tableau ci-dessous donne les valeurs "officielles" de R(x) et W(x).
Formule de Rodrigues
Avec les hypothèses de la section précédente, Pn(x) est proportionnel à
équation mieux connue sous le nom de « formule de Rodrigues ». Elle est souvent écrite :
où les nombres en dépendent de la normalisation. Les valeurs de en sont données dans le tableau plus bas.
Pour démontrer cette formule on vérifie, dans chacun des trois cas ci-dessus, que le Pn qu'elle fournit est bien un polynôme de degré n, puis, par intégrations par parties répétées, que pour tout polynôme P, est égal à donc est nul si P est de degré inférieur à n. Cette méthode montre en outre que .
Les nombres λn
Avec les hypothèses de la section précédente,
(on remarquera que Q étant quadratique et L linéaire, Q'' et L' sont bien des constantes.)
Seconde forme de l'équation différentielle
Avec .
Alors
En multipliant maintenant l'équation différentielle
par R/Q, on obtient
ou encore
C'est la forme normalisée de Sturm-Liouville de l'équation.
Troisième forme de l'équation différentielle
En posant .
Alors :
En multipliant maintenant l'équation différentielle
par S/Q, on obtient :
ou encore
Mais , donc
ou, en posant u = Sy,
Tableau des polynômes orthogonaux classiques
Nom et symbole conventionnel Tchebychev, Tchebychev
(seconde sorte),Legendre, Hermite (forme physique), Limite d'orthogonalité Poids, Normalisation Coefficient dominant = Carré de la norme Coefficient dominant Coefficient suivant Constante dans l'équation différentielle, Constante dans la formule de Rodrigues, Relation de récurrence, Relation de récurrence, Relation de récurrence, Nom et symbole Laguerre associé, Laguerre, Limites d'orthogonalité Poids, Normalisation Coefficient dominant = Coefficient dominant = Carré de la norme Coefficient dominant Coefficient suivant Constante dans l'équation différentielle, Constante dans la relation de Rodrigues, Relation de récurrence, Relation de récurrence, Relation de récurrence, Nom et symbole Gegenbauer, Jacobi, Limites d'orthogonalité Poids, Normalisation if Carré de la norme, Coefficient dominant Coefficient suivant Constante dans l'équation différentielle, Constante dans l'équation de Rodrigues, Relation de récurrence, Relation de récurrence, Relation de récurrence, Annexes
Bibliographie
- Jean-Louis Ovaert, Polynômes orthogonaux, dans Dictionnaire des mathématiques, algèbre, analyse, géométrie, éd. Albin Michel et Encyclopædia Universalis, Paris, 1997
Articles connexes
Liens externes
- Polynômes de Tchebychev sur Math-Linux.
- CAPES externe 2000, 1e épreuve : énoncé et corrigé
Wikimedia Foundation. 2010.