- Quotient de Rayleigh
-
Le quotient de Rayleigh est un nombre réel caractérisant l'effet d'une matrice symétrique (respectivement hermitienne) sur un vecteur, et offrant les deux propriétés fondamentales suivantes :
- le quotient de Rayleigh atteint un extremum relatif pour les vecteurs propres de la matrice
- l’application du quotient de Rayleigh à un vecteur propre donne la valeur propre correspondante.
Ces deux propriétés peuvent servir à déterminer numériquement les Valeur propre, vecteur propre et espace propre d'un opérateur hermitien ou symétrique.
Le quotient de Rayleigh, dont la propriété d'extremum peut être reliée au principe du minimum de l'énergie potentielle en mécanique, a été étudié pour la première fois par Rayleigh (1877). Walter Ritz reprit l'idée en 1909 pour en faire la base d’une méthode d’approximation variationnelle.
Sommaire
Définitions et propriétés caractéristiques
En mathématiques, pour une matrice hermitienne A à coefficients complexes et un vecteur x non nul, on appelle quotient de Rayleigh R(A,x) le scalaire :
où x * désigne le vecteur adjoint de x, c'est-à-dire le conjugué du vecteur transposé.
Pour des matrices et des vecteurs à coefficients réels, le caractère hermitien se traduit par la caractère symétrique, et il faut substituer à la matrice adjointe x * la transposée familière x'. Notons que
- pour tout nombre réel c, R(A,cx) = R(A,x).
Rappelons également que les valeurs propres d'une matrice symétrique (respectivement hermitienne) sont toutes réelles. On peut montrer[1] que, sous ces conditions,
- le quotient de Rayleigh atteint un minimum λmin (qui n'est autre que la plus petite valeur propre de A) lorsque x est un vecteur propre vmin associé à cette valeur.
- En outre, et R(A,vmax) = λmax. Le quotient de Rayleigh, combiné au théorème du minimax, permet de déterminer une à une toutes les valeurs propres d'une matrice. On peut également l'employer pour calculer une valeur approchée d'une valeur propre à partir d'une approximation d'un vecteur propre. Ces idées forment d'ailleurs la base de l’algorithme d’itération de Rayleigh.
Cas particulier des matrices de covariance
On peut factoriser une matrice de covariance Σ sous la forme A'A. Les valeurs propres d'une telle matrice sont positives, car :
- Σvi = λivi
- A'Avi = λivi
- vi'A'Avi = vi'λivi
Les vecteurs propres sont deux à deux orthogonaux :
- Σvi = λivi
- vj'Σvi = λivj'vi
- (Σvj)'vi = λivj'vi
- λjvj'vi = λivj'vi
- (λj − λi)vj'vi = 0
- vj'vi = 0 (pour des valeurs propres différentes ; en cas de multiplicité, la base de Im(Σ) peut être orthogonalisée).
Les vecteurs propres formant une base, on peut exprimer le quotient de Rayleigh en fonction des valeurs propres en décomposant un vecteur quelconque x sur cette base des vecteurs propres :
relation qui, de par l’orthogonalité des vecteurs propres, devient :
Si un vecteur x rend maximal le scalaire ρ, alors tout vecteur k.x () produira également ce maximum : il suffit donc de rechercher le vecteur propre de norme égale à 1 ; on peut donc imposer .
Par la relation ci-dessus, il apparaît que la recherche d'un vecteur propre se ramène à la recherche d'un extremum de Lagrange, à savoir sous la contrainte .
Puisque toutes les valeurs propres sont positives, le problème est convexe et le maximum est atteint à la frontière du domaine, à savoir quand α1 = 1 et (en supposant que les valeurs propres soit numérotées par ordre de valeur décroissante).
On aboutit au même résultat par la méthode des multiplicateur de Lagrange. Le problème consiste alors à déterminer les points critiques de la fonction
- ρ(x) = xTΣx, sous la contrainte .
c’est-à-dire trouver les points critiques de
- ,
où λ est un multiplicateur de Lagrange. Les points stationnaires de surviennent pour
et
Par conséquent, les vecteurs propres x1...xn de Σ ne sont autre que les points critiques du quotient de Rayleigh et les valeurs propres correspondantes λ1...λn sont les valeurs rendant ρ(x) stationnaire.
Cette propriété remarquable est à la base de l’analyse en composantes principales et des corrélations canoniques.
Méthode de Rayleigh-Ritz
La Théorie de Sturm-Liouville a trait à l’action de l’application linéaire
sur l’espace préhilbertien des fonctions y(x) vérifiant des conditions aux limites particulières en x = a et b, muni du produit scalaire : .
Dans ce cas, le quotient de Rayleigh est
On le présente parfois sous une forme équivalente, obtenue en découpant l'intégrale du numérateur et en intégrant par parties :
Pour déterminer une solution approchée de l’équation
vérifiant les conditions aux limites, on choisit un certain nombre de fonctions u1,u2,...,up vérifiant elles-mêmes les conditions aux limites, et on cherche la solution approchée comme une combinaison linéaire des p modes retenus : . Les coefficients inconnus αi s’obtiennent en écrivant la stationnarité du quotient de Rayleigh : , qui détermine p équations linéaires d'inconnues (αi)i = 1...p
Généralisation
On peut étendre la notion de quotient de Rayleigh à deux matrices symétriques définies positives réelles (A,B), et à un vecteur non-nul x, selon :
Ce « quotient de Rayleigh généralisé » se réduit au quotient de Rayleigh R(D,Cx) par la transformation D = C − TAC − 1 où C est la factorisation de Cholesky de la matrice B.
Notes et références
- Cf. par ex. Ciarlet pp.12-13.
Voir aussi
Articles connexes
Bibliographie
- Philippe Ciarlet, Introduction à l’analyse numérique matricielle et à l’optimisation, Masson, coll. « Math. Appl. pour la Maîtrise », 1985 (réimpr. 2001) (ISBN 2-225-68893-1)
- P. Lascaux, R. Théodor, Analyse numérique matricielle appliquée à l’art de l’ingénieur, vol. I, Masson, 1985 (réimpr. 2001) (ISBN 2-225-84546-8), « 1.4 - Forme hermitienne associée... »
- John William Strutt Rayleigh, The theory of Sound, McMillan Co., 1877 (réimpr. 1945), 2 vol. (ISBN 0-486-60292-3), « IV-Vibrating systems in general », p. 106-129
- (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Rayleigh quotient » (voir la liste des auteurs)
Catégories :- Analyse numérique matricielle
- Optimisation
Wikimedia Foundation. 2010.