Matrice hessienne

Matrice hessienne

En mathématiques, la matrice hessienne (ou simplement la hessienne) d'une fonction numérique f est la matrice carrée, notée H(f), de ses dérivées partielles secondes.

Plus précisément, étant donnée une fonction f à valeurs réelles

f(x1, x2, ..., xn),

et en supposant que toutes les dérivées partielles secondes de f existent, le coefficient d'indice i,j de la matrice hessienne de f vaut

H_{ij}(f) = \frac{\partial^2 f}{\partial x_i\partial x_j}

ou, en d'autres termes,

H(f) = \begin{bmatrix}
\frac{\partial^2 f}{\partial x_1^2} & \frac{\partial^2 f}{\partial x_1\partial x_2} & \cdots & \frac{\partial^2 f}{\partial x_1\partial x_n} \\
\frac{\partial^2 f}{\partial x_2\partial x_1} & \frac{\partial^2 f}{\partial x_2^2} & \cdots & \frac{\partial^2 f}{\partial x_2\partial x_n} \\
\vdots & \vdots & \ddots & \vdots \\
\frac{\partial^2 f}{\partial x_n\partial x_1} & \frac{\partial^2 f}{\partial x_n\partial x_2} & \cdots & \frac{\partial^2 f}{\partial x_n^2}
\end{bmatrix} .

On appelle hessien (ou discriminant hessien) le déterminant de cette matrice.

Le terme « hessien » a été introduit par James Joseph Sylvester, en hommage au mathématicien allemand Ludwig Otto Hesse.

Soit notamment f une fonction de classe \mathcal C^2 définie sur un ouvert U de l'espace E, à valeurs réelles. Sa matrice hessienne est bien définie et en vertu du théorème de Schwarz, elle est symétrique.

Sommaire

Application à l'étude des points critiques

Point col

On suppose f fonction de classe {\mathcal C}^2 sur un ouvert U. La matrice hessienne permet, dans de nombreux cas, de déterminer la nature des points critiques de la fonction f, c'est-à-dire des points d'annulation du gradient.

Condition nécessaire d'extremum local

  • si a est un point de minimum local de f, alors c'est un point critique et la hessienne en a est positive
  • si a est un point de maximum local de f, alors c'est un point critique et la hessienne en a est négative[1]

En particulier, si la hessienne en un point critique admet au moins une valeur propre strictement positive et une valeur propre strictement négative, le point critique est un point col.

Condition suffisante d'extremum local

Précisément, un point critique de f est dit dégénéré lorsque le discriminant hessien s'annule, autrement dit lorsque 0 est valeur propre de la hessienne. En un point critique non dégénéré, le signe des valeurs propres (toutes non nulles) détermine la nature de ce point (point d'extremum local ou point col):

  • si la hessienne est définie positive, la fonction atteint un minimum local au point critique
  • si la hessienne est définie négative, la fonction atteint un maximum local au point critique
  • s'il y a des valeurs propres de chaque signe, le point critique est un point col (cf. supra)

Dans ce dernier cas, on définit l'indice du point critique comme le nombre de valeurs propres négatives.

En dimension deux notamment, le discriminant hessien étant le produit des valeurs propres, son signe suffit à déterminer la nature d'un point critique non dégénéré.

Enfin pour un point critique dégénéré, aucune de ces implications n'est vraie. L'un des exemples les plus simples de point critique dégénéré est la selle de singe (en).

Courbe hessienne

Si C est la courbe algébrique d'équation projective (homogène) f(x,y,z) = 0, on appelle courbe hessienne (ou simplement hessienne) de C la courbe dont l'équation projective est | H(f) | (x,y,z) = 0, où | H(f) | est le hessien (le déterminant de la matrice hessienne) de f. La hessienne de C a pour intersection avec C les points critiques et les points d'inflexion de C[2]. Si C est de degré d, sa hessienne est de degré 3(d-2) ; d'après le théorème de Bézout, le nombre des points d'inflexion d'une courbe régulière de degré d est donc 3d(d-2), ce qui est un cas particulier d'une des formules de Plücker.

Extension au cadre des variétés

Lorsque M est une variété différentielle et f une fonction numérique indéfiniment différentiable sur M, il est possible de définir la différentielle de f en tout point, mais pas la matrice hessienne, comme on le voit en écrivant une formule de changement de cartes.

Cependant, lorsque m est un point critique pour la fonction f, la matrice hessienne de f en m peut effectivement être définie. On peut donc parler de point critique dégénéré ou non et prolonger les résultats du paragraphe précédent.

Lemme de Morse

Le lemme de Morse[3] montre que le comportement d'une fonction régulière au voisinage d'un point critique non dégénéré est entièrement déterminé par la connaissance de l'indice du point critique.

Lemme de Morse — Soit f une fonction C^\infty sur une variété différentielle de dimension n. On considère un point critique non dégénéré m de la fonction f, et on note k son indice. Alors il existe un système de coordonnées locales  x_1, \dots, x_n centré en m et tel que l'expression correspondante de f est

f(x)=f(m)-x_1^2-\cdots -x_k^2 +x_{k+1}^2+\cdots +x_n^2

On qualifie un tel système de coordonnées de Morse.

Il résulte notamment du lemme que les points critiques non dégénérés sont isolés.

Le lemme de Morse se généralise aux espaces de Hilbert sous le nom de lemme de Morse-Palais (en).

Théorie de Morse

Article détaillé : Théorie de Morse.

Une fonction dont tous les points critiques sont non dégénérés est qualifiée de fonction de Morse. La théorie de Morse a pour objectif de relier l'étude de la topologie de la variété à celle des points critiques des fonctions qui peuvent y être définies.

Notes et références

  1. Comme l'exemple des fonctions constantes le montre, la hessienne en un point de minimum local (resp. de maximum local) peut ne pas être définie positive (resp. définie négative).
  2. (en) G. Salmon, Higher Plane Curves, Stechert (1934)
  3. (en) John Milnor, Morse Theory, Princeton University Press, 1963. ISBN 0-691-08008-9, p. 6.

Voir aussi

Articles connexes

Lien externe

G. Vial, Mini-cours d’optimisation


Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Matrice hessienne de Wikipédia en français (auteurs)

Игры ⚽ Поможем сделать НИР

Regardez d'autres dictionnaires:

  • Matrice Hessienne — En mathématiques, la matrice hessienne d une fonction numérique f est la matrice carrée, notée H(f), de ses dérivées partielles secondes. Plus précisément, étant donnée une fonction f à valeurs réelles f(x1, x2, ..., xn), et en supposant que… …   Wikipédia en Français

  • Matrice de Hesse — Matrice hessienne En mathématiques, la matrice hessienne d une fonction numérique f est la matrice carrée, notée H(f), de ses dérivées partielles secondes. Plus précisément, étant donnée une fonction f à valeurs réelles f(x1, x2, ..., xn), et en… …   Wikipédia en Français

  • Matrice Jacobienne — En analyse vectorielle, la matrice jacobienne est une matrice associée à une fonction vectorielle en un point donné. Son nom vient du mathématicien Charles Jacobi. Le déterminant de cette matrice, appelé jacobien, joue un rôle important dans la… …   Wikipédia en Français

  • Matrice positive — Sommaire 1 Matrice positive 1.1 Définitions 1.2 Relation d ordre sur les matrices réelles 2 Matrices carrées positives …   Wikipédia en Français

  • Matrice jacobienne — En analyse vectorielle, la matrice jacobienne est une matrice associée à une fonction vectorielle en un point donné. Son nom vient du mathématicien Charles Jacobi. Le déterminant de cette matrice, appelé jacobien, joue un rôle important dans la… …   Wikipédia en Français

  • Hessienne — Hessien Cette page d’homonymie répertorie les différents sujets et articles partageant un même nom. Troupe hessienne lors de la guerre d indépendante américaine Hessien …   Wikipédia en Français

  • Matrice (algèbre) — Matrice (mathématiques) Pour les articles homonymes, voir Matrice. En mathématiques, les matrices servent à interpréter en termes calculatoire …   Wikipédia en Français

  • Matrice (mathematiques) — Matrice (mathématiques) Pour les articles homonymes, voir Matrice. En mathématiques, les matrices servent à interpréter en termes calculatoire …   Wikipédia en Français

  • Matrice Diagonalisable — En algèbre linéaire, une matrice carrée M d ordre n ( ) à coefficients dans un corps commutatif K, est dite diagonalisable si elle est semblable à une matrice diagonale, c est à dire s il existe une matrice inversible P et une matrice diagonale D …   Wikipédia en Français

  • Matrice carrée — Matrice (mathématiques) Pour les articles homonymes, voir Matrice. En mathématiques, les matrices servent à interpréter en termes calculatoire …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”