- Matrice positive
-
Sommaire
Matrice positive
Définitions
Une matrice A de type est dite positive lorsque tous ses éléments sont réels positifs ; on écrira alors . Elle est dite strictement positive lorsque tous ses éléments sont strictement positifs ; on écrira alors A > 0.
Relation d'ordre sur les matrices réelles
A et B étant 2 matrices réelles on définit une relation d'ordre partiel sur ces matrices en posant .
Il est immédiat que cette relation d'ordre est compatible avec l'addition. De même elle est compatible avec la multiplication (à gauche ou à droite) par une matrice positive.
Matrices carrées positives
Graphe associé
À toute matrice carrée positive nous associons le graphe (orienté) défini par :
- l'ensemble des sommets est {1,2,...,n},
- un arc (orienté) joint le sommet i au sommet j si Ai,j > 0.
Rappelons par ailleurs qu'un chemin de longueur est une suite de k arcs telle que l'extrémité de chaque arc soit l'origine du suivant. L'origine du premier arc est l'origine du chemin et l'extrémité du dernier arc est l'extrémité du chemin. On peut considérer qu'un chemin de longueur 0 relie chaque sommet à lui-même.
Il est aisé (par exemple en faisant une récurrence) de vérifier :
Lemmes —
- est le graphe ayant les mêmes sommets que et dans lequel un arc relie i à j s'il existe dans un chemin de longueur k reliant i à j.
- est le graphe ayant les mêmes sommets que et dans lequel un arc relie i à j s'il existe dans un chemin de longueur reliant i à j. (I désigne la matrice unité).
Rappelons qu'un graphe est fortement connexe si pour tout couple i,j de sommets il existe un chemin joignant i à j. Il résulte alors aisément par utilisation du second lemme ci-dessus que est fortement connexe si et seulement s'il existe un naturel k tel que (A + I)k > 0.Tout chemin dans un graphe peut être simplifié en supprimant les cycles (chemin dont l'origine coïncide avec l'extrémité) parcourus dans ce chemin. Par conséquent un tel chemin simplifié ne peut passer qu'une fois au plus par chaque sommet et est donc de longueur . Le graphe est donc fortement connexe si et seulement s'il existe un naturel tel que (A + I)k > 0.
Matrice irréductible
Nous dirons que la matrice carrée positive est irréductible si le graphe est fortement connexe.
En particulier une matrice strictement positive est irréductible puisque chaque sommet i de est relié à tout sommet j par un arc (chemin de longueur 1).
L'étude ci-dessus montre qu'une caractérisation des matrices positives irréductibles est la suivante : Il existe un naturel tel que (A + I)k > 0.
On peut également caractériser ces matrices positives irréductibles par (A + I)n − 1 > 0.
DémonstrationSi (A + I)k > 0 pour on a (A + I)n − 1 = (A + I)k(A + I)n − 1 − k. Mais (A + I)n − 1 − k est une matrice positive comportant au moins tous les éléments diagonaux strictement positifs. Il est résulte immédiatement que (A + I)n − 1 > 0. L'inverse est trivial en prenant k = n − 1.
Matrice réductible
Il s'agit évidemment d'une matrice carrée positive non irréductible. En plus des caractérisations évidentes obtenues par négation des caractérisations ci-dessus nous avons :
Lemme — Soit une matrice carrée positive . Il y a équivalence entre
- A est une matrice réductible.
- Il existe une partition de {1,2,...,n} en 2 parties non vides telle que .
- Il existe une matrice de permutation S telle que [1] soit de la forme où B et C sont des matrices carrées de format non nul.
Démonstration:
Le graphe n'est pas fortement connexe. Il y a donc un couple (i,j) de sommets tel qu'il n'existe aucun chemin d'origine i et d'extrémité j. Soient alors I l'ensemble des extrémités de tous les chemins d'origine i et . Ces 2 ensembles de sommets vérifient bien la condition demandée.
:
désignant la base canonique de , désignons par une base obtenue simplement en réordonnant les vecteurs de de manière à placer d'abord les vecteurs indexés par les éléments de I et enfin ceux indexés par les éléments de J. S désignant la matrice de passage de à convient à la demande.
:
D'après la remarque ci-dessus . Désignons par U l'ensemble des naturels {1,2,...,p} où p est le format de la matrice B et soit . Posons I = σ − 1(U) et . On a donc et par conséquent . Ceci entraîne qu'un sommet du graphe appartenant à I ne peut être l'origine d'un chemin dont l'extrémité soit dans J et que le graphe ne peut être fortement connexe.
Propriétés spectrales des matrices irréductibles
Le théorème de Perron Frobenius
Théorème de Perron Fobenius — Soit A une matrice positive irréductible.
- Le rayon spectral ρ de A est une valeur propre simple de A et le sous-espace propre associé est une droite vectorielle engendrée par un vecteur (colonne) strictement positif.
- Si s et S sont respectivement le minimum et le maximum des sommes des éléments de chaque ligne de A on a .
Si alors ρ > 0. - Soit h le nombre de valeurs propres (complexes) de module ρ. Le spectre de A dans le plan complexe est invariant par la rotation de centre O et d'angle . En outre si h > 1 il existe une matrice de permutation S telle que [1] où les blocs diagonaux (nuls) sont carrés.
Voir l'article Théorème de Perron Frobenius
Matrice primitive
Définition :
Une matrice irréductible de rayon spectral ρ est dite primitive si ρ > 0 [2] et si ρ est la seule valeur propre (complexe) de module maximal ρ.Théorème — Soit A une matrice primitive de rayon spectral ρ. Alors la suite est convergente.
Sa limite est une matrice strictement positive où toutes les colonnes appartiennent à la droite vectorielle sous-espace propre de A relatif à ρ. Plus précisément cette limite est où étant le polynôme caractéristique de A et B(λ) la comatrice transposée de λI − A.
Les lignes de la limite appartiennent de manière similaire au sous-espace propre à gauche de A relatif à ρ (formé des transposées des vecteurs colonne propres de tA relatif à ρ).
DémonstrationNous appliquerons le résultat suivant[3] :
- Soient M une matrice carrée complexe, son polynôme caractéristique et B(λ) la comatrice transposée de λI − M. (Si λ n'est pas valeur propre de ).
- Pour toute valeur propre λi on posera .
- Soit . Alors .
Appliquons ceci avec la matrice M = A et le polynôme est toujours la valeur propre positive maximale de A et m est un naturel supérieur à l'ordre maximal des valeurs propres (comme racines du polynôme caractéristique de A)).
Nous pouvons choisir λ1 = ρ. Comme ρ est valeur propre simple de A d'après P.F. on a p1 = 1. Le premier terme de la somme est donc égal à .
Nous allons maintenant montrer que chacun des s-1 autres termes tend vers 0 lorsque . Par la formule de Leibniz le i-ème terme s'écrit . Le terme d'ordre k de cette somme (finie) s'écrit étant une constante (indépendante de m). Mais par hypothèse . On en déduit bien que ce terme tend vers 0.
On a donc .
Mais on montre dans la démonstration de P.F. que B(ρ) > 0. De plus l'égalité classique montre en faisant λ = ρ que les colonnes de B(ρ) sont vecteurs propres de A relatifs à ρ et donc vecteurs extrémaux.
En travaillant sur la matrice transposée de A (qui a le même polynôme caractéristique que A) on obtient le résultat analogue concernant les lignes de A.
Théorème — Soit A une matrice carrée positive. Il y a équivalence entre :
- A est primitive
- Il existe un naturel m tel que Am > 0
Démonstration(1) (2)
On applique le théorème précédent. est strictement positive et par suite pour m = mo assez grand , ce qui entraîne .
(2) (1)
Remarquons d'abord que A est irréductible. En effet (par exemple par la formule du binôme).
- Traitons d'abord le cas où A est strictement positive.
Soient donc λ une valeur propre complexe de A de module maximal ρ et X un vecteur colonne propre associé. | X | est vecteur propre de A relatif à ρ (cf. démonstration du théorème de Perron Frobenius) et est donc strictement positif. Ainsi A | X | = ρ | X | = | AX | . De A | X | = | AX | et A > 0 on déduit que les éléments de X ont le même argument α. Donc A | X | eiα = λ | X | eiα et en simplifiant par eiα on voit que λ = ρ.
- Passons maintenant au cas général.
De Am > 0 on déduit par récurrence (A irréductible ne peut avoir une colonne nulle) que . Soit alors λ une valeur propre de A de module maximal ρ et X un vecteur propre associé. De AX = λX on déduit . Mais Aq ́étant strictement positive on déduit de ce qui vient d’être montré que .
En écrivant que λm = ρm et λm + 1 = ρm + 1 on voit que λ = ρ et A est bien primitive.
On remarque qu'en particulier une matrice strictement positive est primitive (c'est dans ce cas des matrices strictement positive qu'O. Perron a établi son théorème en 1907).
Une matrice carrée positive irréductible non primitive est dite imprimitive. Dans ce cas le nombre h de valeurs propres complexes de module maximal ρ est désigné par indice d'imprimitivité de A.Propriétés spectrales des matrices carrées positives générales
Le théorème de Perron Frobenius ne s'applique pas aux matrices réductibles. Cependant il est possible d'en donner une forme affaiblie valable de manière générale.
Théorème —
Soit A une matrice carrée positive. Elle possède une valeur propre positive (ou nulle) ρ et le sous-espace propre associé comporte au moins un vecteur propre positif. Toute autre valeur propre complexe de A est de module inférieur (ou égal) à ρ.
ρ est compris entre le minimum et le maximum des sommes des éléments des lignes de A.
Démonstration- Commençons par remarquer qu'une matrice carrée positive A est la limite d'une suite de matrices irréductibles (par exemple si U est une matrice strictement positive quelconque on a ).
- Si l'ensemble des valeurs propres de l'ensemble des Am est borné.
Soit en effet le polynôme caractéristique de . Pour tout est un polynôme (à coefficients constants) en les éléments de Am et comme l'ensemble de ces éléments est borné à cause de la convergence de la suite Am il s'ensuit que l'ensemble des bm,i est borné.
Si maintenant μ est une racine complexe non nulle de Πm on peut écrire . Si l'ensemble des valeurs propres des Am n'était pas borné on aurait une suite μp de valeurs propres vérifiant . Mais à cause du caractère borné de l'ensemble des bm,i le membre de gauche de l'égalité ci-dessus avec μ = μp tendrait vers 1, ce qui est clairement contradictoire.
- Soit donc Am une suite de matrices irréductibles tendant vers A. Pour chaque valeur de m soit ρm la valeur propre positive maximale de Am.
et Xm un vecteur propre associé strictement positif (cf. P.F) qu'on peut choisir normé.
Ordonnons alors pour tout m les valeurs propres (complexes) λm,1,...,λm,n de Am dans l’ordre décroissant des modules en plaçant ρm en première position: λm,1 = ρm. L’ensemble des valeurs propres étant borné, on peut extraire de la suite des listes ordonnées ci-dessus une suite encore indexée par m (par abus de langage) telle que (en particulier ).
Comme ρm > 0 il s’ensuit que .
Comme .(continuité du déterminant).
Or . Ceci montre que le polynôme caractéristique de A est et donc que les valeurs propres de A sont exactement les λi.
Comme pour tout m le vecteur Xm est normé on peut à nouveau de la suite déjà extraite précédemment extraire une suite que nous indexerons encore par m par abus de langage de façon que Xm converge vers un vecteur X non nul (en fait normé).
On a évidemment et AX = ρX par passage à la limite de et AmXm = ρmXm.
Enfin pour chaque est compris entre le minimum et le maximum des sommes des lignes de Am. Par passage à la limite on obtient l'encadrement annoncé sur ρ.
Matrices réelles symétriques
Définitions
On note , ou plus simplement s'il n'y a pas de confusion possible, l'ensemble des matrices carrées d'ordre n symétriques à coefficients réels. On note MI,J la sous-matrice de formée de ses éléments avec indices de ligne dans I et indices de colonne dans J. L'opérateur déterminant est désigné par « det ».
On dit qu'une matrice est positive (ou semi-définie positive) si elle vérifie l'une des propriétés équivalentes suivantes :
- M est un élément positif (en) de ,
- la forme bilinéaire symétrique associée est positive : pour tout , ,
- les valeurs propres de M (qui sont nécessairement réelles) sont positives,
- tous les mineurs principaux de M sont positifs : pour tout non vide, .
On note , ou plus simplement s'il n'y a pas de confusion possible, la partie de formée des matrices positives. Par l'expression 1, peut se voir comme une intersection de demi-espaces (en nombre infini). Par l'expression 3 (exercice 4.1 chez Ben-Tal et Nemirovski (2001)[4]), peut se voir comme un ensemble semi-algébrique de base (i.e., donné par un nombre fini d'inégalités polynomiales).
Une matrice symétrique réelle définie positive est une matrice symétrique réelle positive inversible.
Exemples
- Soit f une fonction réelle de n variables réelles, définie sur un ouvert de , dérivable dans un voisinage d'un point x de cet ouvert et deux fois dérivable en ce point. Si f atteint un minimum local en x, sa matrice hessienne y est positive[5] (condition nécessaire d'optimalité du second ordre sans contrainte).
- Étant donné un vecteur aléatoire à valeurs dans dont chaque composante admet une variance, on définit sa matrice des covariances :
Celle-ci est positive. En effet, pour toute matrice colonne x à n éléments réels notés :
Elle est définie positive si et seulement si la seule combinaison linéaire de qui soit certaine est celle dont tous les coefficients sont nuls.
- Pour toute matrice réelle A, la matrice est une matrice symétrique positive. Cette dernière matrice est définie positive si et seulement si A est injective.
Propriétés
- Toute matrice réelle symétrique positive admet une unique racine carrée réelle symétrique positive. Plus formellement :
Ce résultat se généralise aux racines n-ièmes.
Cône des matrices symétriques semi-définies positives
Les expressions définissant la semi-définie positivité montrent clairement que
est un cône convexe fermé non vide de . On note le noyau de . Le cône tangent à en s'écrit
pour tout On note , (pour ) et on suppose que l'espace vectoriel est muni du produit scalaire
où désigne la trace. Alors, le cône normal à en s'écrit
Matrices complexes hermitiennes
On étend les propriétés et définitions précédentes aux matrices complexes hermitiennes.
Soit M une matrice hermitienne d'ordre n. Elle est dite positive si elle vérifie l'une des deux propriétés équivalentes suivantes :
1. Pour toute matrice colonne à n éléments complexes, on a - (où désigne la matrice transconjuguée de ).
2. Toutes les valeurs propres de M sont positives, c'est-à-dire : - .
De la même manière une matrice hermitienne définie positive est une matrice hermitienne positive inversible.
Notes
- σ est une permutation de {1,2,...,n} la matrice S associée est définie par Si,j = δi,σ(j) ( symbole de Kronecker). La matrice tSAS s'obtient aussi à partir de A en effectuant la permutation σ sur les lignes et colonnes (équivalent respectivement à la multiplication à gauche par tS et à droite par S). Autrement dit (tSAS)i,j = Aσ(i),σ(j).
On remarque que tSAS est strictement positive (resp.irréductible) si et seulement si A l'est. En effet les éléments de tSAS sont ceux de A et de plus comme .
Si - ρ > 0 (cf. P.F.) Si on a nécessairement
- F.R Gantmacher. Théorie des matrices Ch.5 §4 (Ed. Jacques Gabay)
- (en) A. Ben-Tal, A. Nemirovski (2001). Lectures on Modern Convex Optimization – Analysis, Algorithms, and Engineering Applications. MPS-SIAM Series on Optimization 2. SIAM.
- L'exemple des fonctions constantes montre qu'elle n'est pas nécessairement définie positive
Catégories :- Algèbre bilinéaire
- Matrice remarquable
Wikimedia Foundation. 2010.