- Qualification de contraintes
-
En mathématiques, lorsqu'une partie d'un espace normé est décrit par des fonctions différentiables, appelées contraintes dans ce contexte, la question se pose de savoir si l'on peut obtenir le cône tangent à cet ensemble en linéarisant ces contraintes. Si c'est le cas, on dit que les contraintes sont qualifiées. L'intérêt d'avoir des contraintes qualifiées est de disposer d'une formulation analytique du cône tangent qui, sans qualification, peut être difficile à calculer.
Cette notion est utilisée
- en optimisation pour établir les conditions d'optimalité du premier ordre,
- en géométrie différentielle, auquel cas les ensembles de départ et d'arrivée sont des variétés plutôt que des espaces vectoriels.
Connaissances supposées : le calcul différentiel, l'algèbre linéaire, les bases de l'analyse convexe, la notion de cône tangent.
Sommaire
Problématique
Soient un espace normé, X une partie de et x un point de . On s'intéresse au calcul du cône tangent à X en x, que l'on note
TxX,
lorsque X est défini comme l'image réciproque d'un ensemble par une fonction. De manière plus précise, supposons que X soit défini comme suit
où P est une partie de , Q est une partie d'un espace normé , est une fonction différentiable, que l'on appelle contrainte, et l'exposant « − 1» est utilisé pour désigner l'image réciproque. On introduit le cône des contraintes linéarisées
On cherche à déterminer des conditions assurant que les deux cônes TxX et T'xX sont égaux. L'intérêt d'une telle égalité est de simplifier le calcul du cône tangent ; le cône des contraintes linéarisées étant en effet plus simple à calculer que le cône tangent puisqu'il ne fait intervenir la contrainte que par sa dérivée.
Qualification de contrainte — Dans le cadre ci-dessus, on dit que la contrainte c est qualifiée en x si c est différentiable en x et si TxX = T'xX.
On montre aisément que le cône tangent est toujours inclus dans le cône des contraintes linéarisées.
Surestimation du cône tangent — Avec les notations ci-dessus et si c est différentiable en x, on a
La qualification est une propriété de la contrainte c, pas de l'ensemble X dont la définition utilise cette contrainte. On peut en effet définir l'ensemble X par diverses fonctions c, sans modifier donc le cône tangent TxX, alors que T'xX sera le plus souvent affecté par le changement de fonction c. Dès lors, cette notion de qualification permet de sélectionner les bonnes fonctions c, dans un sens qui dépend du contexte. En optimisation, par exemple, avoir des contraintes qualifiées en une solution d'un problème permet d'obtenir des multiplicateurs optimaux ou variables duales ; voir l'article sur les conditions d'optimalité des problèmes d'optimisation.
Qualification de contraintes d'égalité
L'ensemble X_E
On considère dans cette section que l'ensemble est décrit comme l'image réciproque d'un point par une application différentiable entre deux espaces vectoriels de dimension finie et :
Le point de dont on prend l'image réciproque par c est l'origine ; c'est sans perte de généralité, car un autre point pourrait être intégré dans la fonction c.
Conditions suffisantes de qualification de la contrainte définissant X_E
D'après la formule générale de T'xX ci-dessus, le cône tangent TxXE est inclus dans le cône suivant
et on dit que la contrainte c définissant XE est qualifiée en x si TxXE = T'xXE. Une condition suffisante de qualification est la suivante.
Condition suffisante de qualification de la contrainte de XE — Si est C1 dans un voisinage de et si c'(x) est surjective, alors c est qualifiée en x.
Qualification de contraintes d'égalité et d'inégalité
L'ensemble X_EI
On considère dans cette section que l'ensemble est décrit comme l'image réciproque d'un cône particulier par une application définie sur un espace vectoriel de dimension finie :
On a noté E et I des ensembles d'indices formant une partition de l'ensemble des m premiers entiers :
Les cardinaux de E et I sont notés respectivement
si bien que m = mE + mI. Alors désigne la fonction dont les composantes ci sont celles de c avec . De même pour cI. Le cône de dont XEI est l'image réciproque par c est donc
Son cône tangent en est donné par
Conditions suffisantes de qualification de la contrainte définissant X_EI
D'après la formule générale de T'xX et celle de TyQ ci-dessus, le cône tangent TxXEI est inclus dans le cône suivant
où on a noté
l'ensemble des indices des contraintes d'inégalité actives en x. On rappelle que la contrainte c définissant XEI est dite qualifiée en x si TxXEI = T'xXEI. Vérifier que cette égalité a lieu est une tâche difficile car il faut calculer le cône tangent. On connaît un grand nombre de conditions assurant que cette qualification a lieu (des conditions suffisantes donc). Elles supposent toutes que les contraintes actives au point considéré sont différentiables en ce point, car les dérivées de ces contraintes interviennent dans la définition du cône des contraintes linéarisées. Voici les principales conditions suffisantes de qualification, donnant un petit aperçu de la galerie des conditions qui sont utilisées aujourd'hui.
Affinité locale (QC-A)
Cette condition suffisante de qualification est utilisée pour des contraintes linéaires (ou affines), comme en optimisation linéaire ou quadratique.
Affinité locale (QC-A) — est affine dans un voisinage de et est continue en x.
Slater (QC-S)
Les conditions suffisantes de qualification de Slater[1] sont essentiellement utilisées pour les ensembles définis par des contraintes convexes.
Slater (QC-S) — est continue en et
- cE est une fonction affine avec c'E surjective,
- les composantes de sont convexes,
- on peut trouver un point tel que et
Indépendance linéaire (QC-IL)
Cette condition suffisante de qualification a bien des défauts mais elle a l'avantage de la simplicité et de n'utiliser qu'un concept d'algèbre linéaire.
Indépendance linéaire (QC-IL) — est de classe C1 dans un voisinage de , est continue en x et l'une des conditions équivalentes suivantes est satisfaite :
- les gradients des contraintes actives en x sont linéairement indépendants, c'est-à-dire
implique que αi = 0 pour tout - est surjective,
- quel que soit , le sous-espace affine
est borné.
Au point 3, l'ensemble affine peut être vide (il est en réalité réduit à un point ou vide). Cette condition exprime de manière compliquée que est injective ; cette affirmation a été mise sous cette forme pour la rapprocher de celle que l'on obtient (condition 4) avec (QC-MF) ci-dessous.
Mangasarian-Fromovitz (QC-MF)
Cette condition suffisante de qualification, qui fut trouvée assez tardivement (1967)[2], est celle qui est la mieux adaptée aux problèmes avec contraintes d'inégalité non linéaires.
Mangasarian-Fromovitz (QC-MF) — est différentiable en est continue en x et l'une des conditions équivalentes suivantes est satisfaite :
- la condition
implique que αi = 0 pour tout - pour tout , il existe une direction telle que et
- c'E(x) est surjective et il existe une direction telle que et
- quel que soit , le polyèdre convexe
est borné.
La comparaison de la première condition de (QC-IL) et de la première condition de (QC-MF) montre clairement que l'on a
(QC-IL) (QC-MF). La réciproque n'est pas vraie, comme le montre le cas de deux boules tangentes intérieurement : au point de tangence, (QC-MF) est vérifiée, mais pas (QC-IL).
La seconde condition de (QC-MF) est aussi clairement plus faible que la seconde condition de (QC-IL), puisqu'elle exprime une espèce de sous-surjectivité de la jacobienne .
L'expression duale 4 des conditions de Mangasarian-Fromovitz ci-dessus est due à Gauvin (1977)[3] ; elle fait intervenir un produit scalaire sur et l'adjoint des opérateurs dérivées. Appliquée à l'optimisation, cette expression implique que l'ensemble des multiplicateurs optimaux est borné si et seulement si (QC-MF) a lieu.
Examinons à présent les liens entre (QC-S) et (QC-MF).
(QC-S) et (QC-MF) — Si cE est affine, si est convexe et différentiable en et si est continue en x, alors
(QC-S) (QC-MF).
Annexes
Notes
- (en) M. Slater (1950). Lagrange multipliers revisited: a contribution to non-linear programming. Cowles Commission Discussion Paper, Math. 403.
- (en) O. L. Mangasarian, S. Fromovitz (1967), The Fritz John necessary optimality conditions in the presence of equality and inequality constraints, Journal of Mathematical Analysis and Applications, 17, 37–47.
- (en) J. Gauvin (1977). A necessary and sufficient regularity condition to have bounded multipliers in nonconvex programming. Mathematical Programming, 12, 136–138.
Articles connexes
Lien externe
- J. Ch. Gilbert, Éléments d'Optimisation Différentiable — Théorie et Algorithmes, syllabus de cours à l'ENSTA ParisTech, Paris.
Ouvrages généraux
- (en) J. F. Bonnans, A. Shapiro (2000). Perturbation Analysis of Optimization Problems. Springer Verlag, New York.
- J.-B. Hiriart-Urruty (1996). L’Optimisation. Que sais-je, n° 3184. Presses Universitaires de France.
- (en) J.-B. Hiriart-Urruty, C. Lemaréchal (1993). Convex Analysis and Minimization Algorithms. Grundlehren der mathematischen Wissenschaften, 305-306. Springer-Verlag.
- (en) R. T. Rockafellar (1993). Lagrange multipliers and optimality. SIAM Review, 35, 183– 238.
Catégories :- Optimisation différentiable
- Analyse convexe
Wikimedia Foundation. 2010.