Théorèmes de l'alternative

Théorèmes de l'alternative

Les théorèmes de l'alternative, dont le plus fameux est le lemme de Farkas, concernent tous un système d'inéquations linéaires dans un espace vectoriel réel de dimension finie. Il s'agit de donner un critère permettant de trancher si le système est ou non consistant, c'est-à-dire s'il admet ou non une solution (ou, pour ceux dont 0 est une solution évidente, une solution non nulle).

Le principe en est à chaque fois le suivant : face à un système d'inéquations, on peut opérer des combinaisons linéaires de ces inéquations à coefficients positifs ou nuls, qui sont alors toutes des conséquences du système (l'usage judicieux de coefficients strictement positifs permettant au cas par cas de produire des conséquences qui soient des inégalités strictes). Il est bien évident que si l'une de ces conséquences est une absurdité – typiquement 0 < 0 – le système initial ne peut avoir de solution. Or, il se trouve que cette condition suffisante pour que le système soit inconsistant est à chaque fois nécessaire : chacun des théorèmes ci-dessous en exprime une variante.

Le nom de « théorèmes de l'alternative » vient du fait que la condition nécessaire et suffisante a, elle aussi, la forme d'un problème de recherche de solutions pour un système mêlant équations et inéquations. On se retrouve donc en parallèle avec deux systèmes, dont un et un seul a des solutions. Traduites en termes de matrices, les deux branches de l'alternative ont des formulations du même esprit, voire étonnamment semblables dans le cas du théorème de Ville.

Sommaire

Systèmes d'inéquations strictes et systèmes d'inéquations larges : les théorèmes de Gordan et de Stiemke

Le théorème de Gordan

Il couvre le cas d'un système d'inéquations toutes strictes, de la forme :

f_1(y)> 0,\, f_2(y)>0,\ldots,f_k(y)> 0

où les fj sont des formes linéaires sur un espace vectoriel réel E de dimension finie.

Il y a une obstruction évidente à l'existence de solutions pour un tel système : si on fait une combinaison linéaire à coefficients positifs non tous nuls de cette famille d'inéquations, on obtient une nouvelle inéquation stricte vérifiée par toutes les solutions. Si on peut ajuster les coefficients de cette combinaison linéaire de façon à obtenir l'inéquation absurde 0 > 0, c'est que le système était inconsistant.

Le théorème de Gordan assure que, à partir de tout système inconsistant, on peut ainsi produire l'inéquation 0 > 0 :

Théorème de Gordan (1873) — Soit f_1,\ldots,f_k des formes linéaires sur un espace vectoriel réel de dimension finie E. Alors :

\{y\in E\,\mid\,f_1(y)> 0,f_2(y)>0,\ldots,f_k(y)> 0\}=\varnothing

si et seulement si

il existe une écriture 0=\lambda_1 f_1+\cdots+\lambda_k f_k à coefficients tous positifs ou nuls dont l'un au moins n'est pas nul.

Le théorème de Stiemke

Il concerne les systèmes d'inéquations linéaires au sens large  :

f_1(y)\geq 0,\, f_2(y)\geq0,\ldots,f_k(y)\geq 0.

Son énoncé est précisément le suivant :

Théorème de Stiemke (1915) — Soit f_1,\dots,f_k des formes linéaires sur un espace vectoriel de dimension finie E. Alors :

\{y\in E\,\mid\,f_1(y)\geq 0,\ldots,f_k(y)\geq 0, l'une au moins de ces inégalités étant stricte\}=\varnothing

si et seulement si

il existe une écriture 0=\lambda_1 f_1+\dots+\lambda_k f_k à coefficients tous strictement positifs.

Cet énoncé est rendu un peu plus difficile à lire que les autres théorèmes de la série à cause de la technicité « l'une au moins de ces inégalités étant stricte »  ; la raison d'être de celle-ci est que les systèmes d'inéquations larges ne peuvent être complètement inconsistants : ils comptent au moins 0 parmi leurs solutions, et au-delà tous les points qui vérifient le système d'équations linéaires correspondant. D'où la nécessité de compliquer un peu la forme du système en ne considérant pas comme des solutions significatives celles qui sont dans l'intersection des noyaux de toutes les formes fj.

Preuve du théorème de Gordan

Parmi tous les théorèmes considérés dans cette page, le théorème de Gordan est celui où la preuve contient le moins de technicités supplémentaires. On peut la fonder sur un théorème de séparation des convexes (celui parfois appelé « deuxième forme géométrique du théorème de Hahn-Banach ») ou par le théorème de projection sur un convexe fermé. C'est ce dernier choix qui est fait ici.

Comme il est souvent pratique pour faire des manipulations dans un dual, munissons E d'une structure euclidienne ; pour chaque indice j, il existe dès lors un vecteur sj unique de E qui permette d'écrire pour tout y : fj(y) = < sj | y > .

Considérons le convexe compact K enveloppe convexe des k points sj et notons y0 = πK(0) la projection orthogonale de 0 sur ce fermé de E. On sait que pour tout s de K (et en particulier pour les sj) on dispose de l'inégalité : <-y_0|s_j-y_0>\leq 0 qu'on regroupe en -\|y_0\|^2\leq f_j(y_0).

Entrons dans le vif de la preuve de Gordan. Comme pour tous les théorèmes de l'article, l'implication montante est évidente. Montrons donc l'implication descendante, en supposant le système d'inégalités strictes inconsistant. En particulier y0 n'en est alors pas solution, donc il existe un j pour lequel f_j(y_0)\leq 0. D'où -\|y_0\| = 0, puis y0 = 0, ce qui prouve bien que 0 appartient à K, et est donc combinaison linéaire à coefficients positifs des sj.

Le théorème de Gordan entraîne le théorème de Stiemke

On peut donner une démonstration directe du théorème de Stiemke en appelant de nouveau la théorie de la séparation des convexes. Il est toutefois instructif de s'apercevoir que c'est un théorème « dual » du théorème de Gordan, et qu'on peut l'en déduire par des manipulations algébriques simples à défaut d'être naturelles.

On reverra ces mêmes manipulations présentées sous forme matricielle plus loin, en énonçant le théorème de Villé. Elles reposent sur une idée importante qu'on retrouve notamment à la base de la théorie du problème dual en optimisation linéaire : la deuxième branche de l'équivalence dans le théorème de Stiemke, qui est en première lecture un mélange d'inéquations strictes (les conditions 0 < λj) et d'une équation vectorielle (la condition \lambda_1 f_1+\cdots+\lambda_k f_k=0) peut, avec un peu de doigté, être transformée en une simple collection d'inéquations strictes, à laquelle on peut appliquer le théorème de Gordan. Stiemke apparaît finalement comme une réécriture de Gordan où les emplacements des deux énoncés équivalents se retrouvent intervertis.

Systèmes mêlant inéquations strictes et larges : le lemme de Farkas et le théorème de Motzkin

Les énoncés

Le lemme de Farkas énonce une condition nécessaire et suffisante d'inconsistance pour un système d'inéquations linéaires dont exactement une est stricte :

Article détaillé : Lemme de Farkas.

Lemme de Farkas (en) (1902) — Soit f_1,\ldots,f_k des formes linéaires sur un espace vectoriel réel de dimension finie E. Alors :

\{y\in E\,\mid\,f_1(y)> 0,f_2(y)\geq0,\ldots,f_k(y)\geq 0\}=\varnothing

si et seulement si

il existe une écriture 0=\lambda_1 f_1+\cdots+\lambda_k f_k à coefficients tous positifs ou nuls et avec \lambda_1\not=0.

Enfin le théorème de Motzkin couvre le cas général d'un système mélant inéquations strictes et inéquations larges, avec une au moins stricte ; le lemme de Farkas en est le cas particulier correspondant à p = 1 (le théorème de Gordan correspondant à p = n) :

Théorème de Motzkin (1936) — Soit f_1,\ldots,f_k des formes linéaires sur un espace vectoriel réel de dimension finie E et soit p avec 1\leq p \leq n. Alors :

\{y\in E\,\mid\,f_1(y)> 0,f_2(y)>0,\ldots,f_p(y)>0,f_{p+1}\geq 0,\ldots,f_k(y)\geq 0\}=\varnothing

si et seulement si

il existe une écriture 0=\lambda_1 f_1+\cdots+\lambda_k f_k à coefficients tous positifs ou nuls avec (\lambda_1,\ldots,\lambda_p)\not = 0.

Le théorème de Gordan entraîne le lemme de Farkas

Le théorème de Gordan se démontre en moins d'une dizaine de lignes à condition de disposer des théorèmes de séparation des convexes ou de projection sur un convexe fermé. On peut à partir de là prouver le lemme de Farkas avec un peu de gymnastique supplémentaire, qui ne nécessite aucun outil avancé mais n'est pas complètement naturelle.

Le lemme de Farkas entraîne le théorème de Motzkin

Bien que le théorème de Motzkin semble plus général que celui de Farkas, il s'en déduit en quelques lignes, comme suit :

On note, pour des indices variant de 1 à p :

\begin{matrix}
C_1&=&\{y\in E\,\mid\,f_1(y)>0,&f_2(y)\geq0,&f_3(y)\geq0,\ldots,&f_p(y)\geq0,&f_{p+1}(y)\geq0,\ldots,f_k(y)\geq0\}\\
C_2&=&\{y\in E\,\mid\,f_1(y)\geq0,&f_2(y)>0,&f_3(y)\geq0,\ldots,&f_p(y)\geq0,&f_{p+1}(y)\geq0,\ldots,f_k(y)\geq0\}\\
\vdots&&&&\vdots&&\vdots\\
C_p&=&\{y\in E\,\mid\,f_1(y)\geq0,&f_2(y)\geq0,&f_3(y)\geq0,\ldots,&f_p(y)>0,&f_{p+1}(y)\geq0,\ldots,f_k(y)\geq0\}\\
\end{matrix}

On remarque que si on prend y1 dans C1, y2 dans C2, \ldots, yp dans Cp, leur somme est dans l'ensemble des solutions du système traité par le théorème de Motzkin. Si celui-ci est vide, c'est donc que l'un des Cj est vide. Mais on peut alors appliquer le lemme de Farkas à ce Cj et il fournit bien un k-uplet (\lambda_1,\ldots,\lambda_k) qui répond aux conditions du théorème de Motzkin (en utilisant \lambda_j\not=0).

Comme dans tous les théorèmes rassemblés ici, l'implication montante est une évidence.

Extension à des systèmes d'inéquations affines

Une fois connus ces théorèmes, on peut en déduire en tant que de besoin des énoncés pour des systèmes affines, c'est-à-dire où les inéquations n'auraient pas la forme f_j(y) \geq 0 mais f_j(y)\geq c_j pour des constantes cj. La démarche est explicitée à l'article Lemme de Farkas auquel on renvoie : elle consiste à considérer l'espace affine de référence comme hyperplan affine d'équation g(y) = 1 dans un espace vectoriel \hat E. La consistance d'un système affine dans E se ramène alors à la consistance d'un système analogue dans \hat E mais auquel on a ajouté la condition supplémentaire g(y) > 0. Ainsi un système d'inéquations affines larges est-il traité par le lemme de Farkas, tandis qu'un système d'inéquations affines dont une et une seule est stricte se traite-t-il comme un système linéaire couvert par Motzkin avec p = 2 (c'est l'énoncé intitulé « lemme de Farkas généralisé » dans l'article lemme de Farkas).

Les théorèmes de l'alternative : point de vue matriciel

Pour B matrice réelle, la notation B\geq 0 signifie que tous les termes de B sont positifs ou nuls, la notation B > 0 que tous les termes de B sont strictement positifs. Enfin on note BT la transposée de la matrice B.

Traductions matricielles des énoncés déjà donnés

Commençons par la version matricielle du lemme de Farkas, puisque c'est le théorème le plus notable. Elle s'obtient sans aucune subtilité à partir de la version donnée plus haut, la seule difficulté étant de bien rapprocher les notations de l'une et de l'autre.

Lemme de Farkas, version matricielle — Soit A une matrice de réels de type (n,k) et b un vecteur-colonne avec n entrées, alors un et un seul des systèmes linéaires suivants a une solution :

  • le système Ax = b\, pour x vecteur-colonne à k entrées vérifiant par ailleurs x \geq 0 ;
  • le système A^Ty \geq 0 pour y\, vecteur-colonne à n entrées vérifiant par ailleurs b^Ty < 0\,.

On écrit de même des versions matricielles pour les théorèmes de Gordan et de Stiemke, dont la vérification est du même esprit.

Théorème de Gordan, version matricielle — Soit A une matrice de réels de type (n,k). Alors un et un seul des systèmes linéaires suivants a une solution :

  • le système Ax = 0\, pour x vecteur-colonne à k entrées vérifiant par ailleurs x \geq 0 et x \not=0 ;
  • le système ATy > 0 pour y\, vecteur-colonne à n entrées.

Théorème de Stiemke, version matricielle — Soit A une matrice de réels de type (n,k) et b un vecteur-colonne avec n entrées, alors un et un seul des systèmes linéaires suivants a une solution :

  • le système Ax = 0\, pour x vecteur-colonne à k entrées vérifiant par ailleurs x > 0 ;
  • le système A^Ty \geq 0 et A^Ty \not= 0 pour y\, vecteur-colonne à n entrées.

Le théorème de Ville

Ce théorème, qui se déduit en quelques lignes du théorème de Gordan dès lors qu'on manipule les notations matricielles, a un énoncé très agréablement symétrique sous cette forme ; on peut bien sûr le réécrire en termes de conditions nécessaire et suffisante d'existence de solutions de systèmes d'inéquations, son charme étant qu'on peut le faire de deux façons selon l'ordre dans lequel on considère les deux branches de l'alternative : au choix on peut y voir une condition nécessaire et suffisante d'existence de solutions en nombres positifs ou nuls pour un système d'inégalités linéaires larges, ou d'existence de solutions en nombres strictement positifs pour un système d'inégalités linéaires strictes.

Théorème de Ville (1938) — Soit A une matrice de réels de type (n,k). Alors un et un seul des systèmes linéaires suivants a une solution :

  • le système Ax \leq 0 pour x\, vecteur-colonne à k entrées vérifiant par ailleurs x \geq 0 et x \not=0 ;
  • ou le système A^Ty > 0\, pour y vecteur-colonne à n entrées vérifiant par ailleurs y > 0.

Références

Sauf précisions plus spécifiques, les informations fournies par cet article sont issues, sur un mode assez distancié, des pages 51 et suivantes de Linear Programming 2: Theory and Extensions, de George Dantzig et Mukund Thapa, Springer, 2003 (ISBN 978-0387986135).

La démonstration du lemme de Farkas via le théorème de Gordan est issue de Convex Analysis and Nonlinear Optimization, Theory and Examples de Jonathan M. Borwein et Adrian S. Lewis, coll. « Ouvrages de mathématiques de la Société mathématique du Canada », vol. 3, 2e édition, Springer, 2006 (ISBN 978-0387989402), p. 24-25.


Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Théorèmes de l'alternative de Wikipédia en français (auteurs)

Игры ⚽ Поможем написать реферат

Regardez d'autres dictionnaires:

  • Theoremes de l'alternative — Théorèmes de l alternative Les théorèmes de l alternative, dont le plus fameux est le lemme de Farkas, concernent tous un système d inéquations linéaires dans un espace vectoriel réel de dimension finie. Il s agit de donner un critère permettant… …   Wikipédia en Français

  • Théorèmes d'incomplétude de Gödel — Les théorèmes d incomplétude de Gödel sont deux théorèmes célèbres de logique mathématique, démontrés par Kurt Gödel en 1931 dans son article Über formal unentscheidbare Sätze der Principia Mathematica und verwandter Systeme (en) « Sur… …   Wikipédia en Français

  • Projet:Mathématiques/Liste des articles de mathématiques — Cette page n est plus mise à jour depuis l arrêt de DumZiBoT. Pour demander sa remise en service, faire une requête sur WP:RBOT Cette page recense les articles relatifs aux mathématiques, qui sont liés aux portails de mathématiques, géométrie ou… …   Wikipédia en Français

  • Liste des articles de mathematiques — Projet:Mathématiques/Liste des articles de mathématiques Cette page recense les articles relatifs aux mathématiques, qui sont liés aux portails de mathématiques, géométrie ou probabilités et statistiques via l un des trois bandeaux suivants  …   Wikipédia en Français

  • Théorème du minimax — de von Neumann John von Neumann …   Wikipédia en Français

  • Théorème du minimax de von Neumann — John von Neumann Vers où faut il …   Wikipédia en Français

  • Théorème fondamental de la théorie des jeux — Théorème du minimax de von Neumann John von Neumann …   Wikipédia en Français

  • Théorème de projection sur un convexe fermé — En mathématiques, le théorème de projection orthogonale sur un convexe est un résultat de minimisation de la distance dont le principal corollaire est l existence d un supplémentaire orthogonal, donc d une projection orthogonale sur un sous… …   Wikipédia en Français

  • Theoreme de projection sur un convexe ferme — Théorème de projection sur un convexe fermé En mathématiques, le théorème de projection orthogonale sur un convexe est un résultat de minimisation de la distance qui généralise la projection orthogonale sur un espace vectoriel. Il remplace… …   Wikipédia en Français

  • Théorème de projection orthogonale sur un convexe — Théorème de projection sur un convexe fermé En mathématiques, le théorème de projection orthogonale sur un convexe est un résultat de minimisation de la distance qui généralise la projection orthogonale sur un espace vectoriel. Il remplace… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”