- Lemme de Farkas
-
Le lemme de Farkas est un résultat d'analyse convexe (une branche des mathématiques) qui s'exprime et s'interprète de multiples manières. Sous une forme assez générale, il donne une expression duale de l'adhérence de l'image d'un cône convexe K par une application linéaire A (les notations sont précisées ci-dessous) :
Lorsque A(K) est fermé, on obtient ainsi des conditions nécessaires et suffisantes pour qu'un système d'équations linéaires (ou affines) ait une solution dans K. Sous la forme ci-dessus, le lemme de Farkas généralise la relation bien connue d'algèbre linéaire reliant l'image d'une application linéaire A entre deux espaces euclidiens et le noyau de son adjointe A * , à savoir
Certaines versions du lemme sont connues sous le nom de « théorèmes de l'alternative » et s'obtiennent en prenant pour cône K l'orthant positif de . Ceux-ci expriment l'équivalence (ou l'incompatibilité) entre la satisfaction de différents systèmes d'inéquations linéaires (ou affines).
Du fait de sa généralité, le lemme de Farkas intervient dans de nombreux domaines, lorsque des questions de dualité sont en jeu. Citons l'optimisation non linéaire dans laquelle il permet d'obtenir une expression analytique de l'optimalité (les conditions de Karush, Kuhn et Tucker) à partir d'une expression géométrique de celle-ci et la théorie des jeux.
Sommaire
Historique
Ce lemme a été historiquement démontré pour la première fois par Gyula Farkas (en) en 1902 avec une formulation différente[1]. La formulation matricielle est due à Albert William Tucker dans les années 1950.
La version du lemme en géométrie vectorielle
Avant de donner l'énoncé du lemme de Farkas, commençons par rappeler un résultat sur les équations linéaires, suffisamment simple pour ne pas bénéficier d'une dénomination particulière, et dont le lemme de Farkas est la généralisation aux inégalités.
Proposition — Soient f1, ... , fk et g des formes linéaires sur un espace vectoriel E de dimension finie. Alors :
si et seulement si
- g appartient à l'espace vectoriel formé des combinaisons linéaires de f1, ... , fk.
Dit autrement : étant donné un sous-espace vectoriel de E décrit par une liste d'équations cartésiennes, toute autre équation valable sur ce sous-espace s'obtient en combinant de façon immédiate les équations initialement fournies.
Le lemme de Farkas est le résultat analogue pour des systèmes d'inéquations :
Lemme de Farkas, version vectorielle — Soient f1, ... , fk et g des formes linéaires sur un espace vectoriel réel E de dimension finie. Alors :
si et seulement si
- g est une combinaison linéaire à coefficients positifs ou nuls de f1, ... , fk.
Une des preuves passe par l'étape suivante cruciale, qui est aussi parfois appelée lemme de Farkas :
Lemme de Farkas, version topologique — Soient s1, ... , sk des éléments d'un espace vectoriel réel E de dimension finie. L'ensemble des combinaisons linéaires à coefficients positifs ou nuls de s1, ... , sk est fermé dans E.
La version matricielle du lemme
B étant une matrice de réels, on note ici B ≥ 0 lorsque tous les coefficients de B sont positifs ou nuls[2]. La notation tB désigne la matrice transposée de B.
La version matricielle du lemme est la suivante :
Lemme de Farkas, version matricielle — Soient A une matrice de réels de taille (n, k) et b un vecteur-colonne avec n entrées, alors un et un seul des systèmes linéaires suivants a une solution :
- le système Ax = b pour x vecteur-colonne à k entrées vérifiant par ailleurs x ≥ 0 ;
- le système tA y ≥ 0 pour y vecteur-colonne à n entrées vérifiant par ailleurs tb y < 0.
La vérification est sans difficulté aucune, une fois qu'on a passé l'obstacle de raccrocher les matrices de cet énoncé aux objets géométriques de l'énoncé précédent.
VérificationPour chaque colonne Cj de A (1 ≤ j ≤ k), notons fj la forme linéaire définie sur Rn par ; notons par ailleurs g la forme linéaire .
L'existence d'une solution pour la première branche de l'alternative, c'est l'existence d'un k-uplet de nombres positifs ou nuls tels que , autrement dit c'est la possibilité d'écrire g comme combinaison linéaire à coefficients positifs des fj.
L'existence d'une solution pour la deuxième branche de l'alternative, c'est l'existence d'un y qui soit dans mais qui ne soit pas dans .
L'équivalence annoncée par le théorème de Farkas garantit donc précisément qu'un et un seul des deux systèmes a une solution.
Le lemme de Farkas comme critère d'inconsistance
On dira qu'un système d'inéquations est inconsistant lorsqu'il n'a aucune solution. Si on revient à la version du théorème pour les équations linéaires, dire que c'est la même chose que de dire que l'ensemble est vide : c'est un énoncé d'inconsistance. En notant h = - g , on a donc la variante suivante :
Lemme de Farkas, critère vectoriel d'inconsistance — Soient f1, ... , fk et h des formes linéaires sur un espace vectoriel réel E de dimension finie. Alors :
si et seulement si
- ( -h ) est une combinaison linéaire à coefficients positifs ou nuls de f1, ... , fk.
Par ce critère vectoriel d'inconsistance, on obtient facilement un critère d'inconsistance pour les systèmes affines directement apparenté, et d'aspect un peu plus simple :
Lemme de Farkas, critère affine d'inconsistance — Soient f1, ... , fk des formes affines sur un espace affine réel E de dimension finie. Alors :
si et seulement si
- (-1) est une combinaison linéaire à coefficients positifs ou nuls de f1, ... , fk.
On voit de nouveau là très nettement l'idée sous-jacente à tous ces énoncés, appliquée dans le cas de l'inconsistance : un système inconsistant implique (au sens du calcu propositionnel) l'inéquation absurde - 1 ≥ 0 ; le lemme de Farkas assure dès lors qu'elle peut en être déduite non seulement par des raisonnements plus ou moins compliqués mais aussi tout simplement par combinaisons des équations du système.
DémonstrationL'implication montante est évidente, montrons l'autre. On suppose donc vide.
Introduisons un espace vectoriel Ê dans lequel E est un sous-espace affine de codimension 1 ne passant pas par l'origine. Toute forme affine sur E se prolonge d'une façon unique en une forme linéaire sur Ê. Notons le prolongement linéaire de fj (1 ≤ j ≤ k) et le prolongement de la constante -1, de sorte que E a pour équation dans Ê. L'hypothèse revient à dire que si un point y de Ê vérifie les conditions , il ne vérifie pas la condition . En jouant avec les homothéties de rapport strictement positif, il est immédiat qu'il ne peut pas non plus vérifier pour un autre niveau strictement négatif. En d'autres termes l'ensemble est inclus dans l'ensemble . On applique alors Farkas et on en déduit que est une combinaison linéaire à coefficients positifs des . Il n'y a plus qu'à restreindre à E la relation obtenue.
Déduction d'inéquations en géométrie affine
La simple reproduction du résultat écrit plus haut en géométrie vectorielle serait inexacte en géométrie affine. L'énoncé est en effet faux pour les systèmes d'inéquations inconsistants. Donnons tout de suite un exemple : dans R2 où on note (u,v) le point courant, soit le système formé des deux inéquations : u-1 ≥ 0 et -u ≥ 0. Ce système est inconsistant, faux en tout point, et implique donc (au sens précis de "implique" en calcul propositionnel) n'importe quelle inéquation, par exemple l'inéquation v-3 ≥ 0. Pourtant il n'est bien sûr pas question de produire celle-ci par des manipulations algébriques simples à partir du système initial.
Un énoncé général nécessite ainsi une hypothèse supplémentaire de consistance du système.
« Lemme de Farkas généralisé » — Soient f1, ... , fk et g des formes affines sur un espace vectoriel affine de dimension finie E. On suppose l'ensemble non vide. Alors :
si et seulement si
- g est somme d'une combinaison linéaire à coefficients positifs ou nuls de f1, ... , fk et d'une constante positive ou nulle.
DémonstrationComme dans la démonstration précédente l'implication montante est évidente. On montre l'autre, en supposant tout d'abord que . On note de nouveau Ê un espace vectoriel dont E est un sous-espace affine de codimension 1 ne passant pas par l'origine, l'extension linéaire de fj à cet espace, et naturellement l'extension linéaire de g à cet espace. On note cette fois h la forme affine valant constamment 1 sur E et son extension linéaire à Ê. On vérifie ensuite que :
- :
pour un point y de l'ensemble de gauche, on discute selon la valeur de qui est supposé positif ou nul :
- si , c'est qu'on est dans E et l'appartenance à l'ensemble de droite est assurée par l'hypothèse ;
- plus généralement, si , on se ramène au cas précédent par homothétie de rapport strictement positif ;
- si on a besoin de l'hypothèse de consistance du système initial. On prend un point auxiliaire vérifiant ce système, et on se dirige de z vers y le long du segment [ z , y [ : tout au long du voyage, les gardent toutes des valeurs positives ou nulles tandis que reste à valeurs strictement positives ; le cas précédent assure donc que est lui aussi à valeurs positives ou nulles sur le segment. On conclut alors que par passage à la limite.
Il ne reste plus qu'à appliquer le lemme de Farkas dans sa version vectorielle pour conclure que est une combinaison linéaire à coefficients positifs des et de ; on termine en restreignant cette conclusion à E.
Généralisation
On trouvera ci-dessous une version généralisée du lemme de Farkas, qui est utilisée en optimisation non linéaire pour obtenir une expression analytique de l'optimalité (e.g., les conditions de Karush, Kuhn et Tucker) à partir d'une expression géométrique de celle-ci. Les résultats précédents peuvent se voir comme des cas particuliers de ce résultat.
Commençons par rappeler certaines notions qui sont utilisées dans son énoncé. Si est une application linéaire entre deux espaces euclidiens et dont les produits scalaires sont tous les deux notés , son adjointe est l'application linéaire définie par la propriété
Par ailleurs, une partie K d'un espace vectoriel est un cône si , ce qui signifie que tx doit appartenir à K chaque fois que t est un réel strictement positif et . Ensuite, le cône dual (positif) d'une partie non vide P d'un espace euclidien est le cône convexe fermé non vide défini par
pour tout
Enfin, on note ou l'adhérence d'une partie P d'un espace topologique.
Lemme de Farkas généralisé — Soient et deux espaces euclidiens, une application linéaire, K un cône convexe non vide de et L un cône convexe fermé non vide de . Alors
On ne peut pas se passer de l'adhérence dans le membre de droite de l'identité car le cône convexe A(K) + L + n'est pas nécessairement fermé (même si K est un cône convexe fermé) alors que, en tant que cône dual, le cône du membre de droite est toujours fermé. Signalons toutefois que si K et L sont des orthant positif d'un certain ), alors A(K) + L + est aussi un cône polyédrique, donc un fermé ; dans ce cas, on peut ôter l'adhérence dans le membre de droite.
On retrouve le résultat énoncé au début de cet article lorsque , puisqu'alors L + = {0}. Dans ce cas, le résultat peut s'interpréter géométriquement comme suit. Le vecteur si et seulement si , ce qui revient à dire qu'il existe un vecteur tel que et (forme compacte de l'expression pour tout . Cette propriété exprime donc le fait que l'hyperplan sépare strictement le singleton {b} de l'adhérence du cône convexe A(K). La démonstration de ce lemme généralisé peut d'ailleurs se faire par séparation stricte de ces deux derniers convexes (Hahn-Banach).
Si et A(K) est fermé, le lemme de Farkas peut être vu comme donnant des conditions nécessaires et suffisantes pour qu'un système linéaire ait une solution dans le cône convexe K, ce qui s'écrit :
Il assure en effet que ce système a une solution si et seulement si b est dans le dual du cône convexe fermé , c'est-à-dire si et seulement si pour tout tel que Lorsque A(K) n'est pas fermé, ces dernières conditions sont équivalentes au fait que l'on peut trouver une solution du même système avec une précision aussi bonne que l'on veut, dans le sens suivant
Par ailleurs, observons que est l'intersection du cône convexe fermé L et de l'image réciproque par l'application linéaire (continue) A * du cône convexe fermé K + ; il s'agit donc d'un cône convexe fermé, si bien qu'il est égal à son bidual. On rappelle également que le cône dual d'un ensemble et de son adhérence sont identiques. Dès lors, dans les conditions énoncées dans le lemme de Farkas généralisé, on a
sans que l'on ait besoin ici de prendre d'adhérence. Cette dernière identité se démontre directement, sans théorème de séparation ; mais pour en déduire le lemme de Farkas généralisé il faut utiliser le fait que le bidual d'un cône convexe est égal à son adhérence.
Notes et références
- (de) Julius Farkas, Theorie der einfachen Ungleichungen, Journal für die reine und angewandte Mathematik 124 (1902) p. 1-27
- matrice positive. Dans un autre contexte, cette même notation désigne la notion, différente, de
L'article, à l'exception de l'introduction, de la section historique et de la section Généralisation, est une adaptation assez distanciée des pages 58-62 de Fundamentals of convex analysis, Jean-Baptiste Hiriart-Urruty et Claude Lemaréchal, coll. « Grundlehren Text Editions », Springer, 2001 (ISBN 3540422056), à la lumière de l'entrée du blog de Terence Tao du 30 novembre 2007, disponible en ligne.
Catégories :- Analyse convexe
- Optimisation
- Lemme de mathématiques
Wikimedia Foundation. 2010.