Fonction convexe

Fonction convexe.

En mathématiques une fonction convexe est une fonction réelle d'une variable réelle définie sur un intervalle et dont le graphe est « tourné vers le haut » : pour tous points A et B de ce graphe, le segment [AB] est situé entièrement au-dessus du graphe. À l'inverse, une fonction dont le graphe est « tourné vers le bas » est une fonction concave.

Formellement, une fonction définie sur un intervalle $I$ est convexe lorsque, pour tous $x$ et $y$ de $I$ et tout $t$ dans $[0, 1]$ on a :

$f\left(t x+(1-t)y\right) \leq t f(x)+(1-t)f(y).$

Lorsque l'inégalité est stricte (avec $x$ différent de $y$ et $t$ dans $] 0, 1 [$ ), on parle de fonction strictement convexe.

Plus généralement, une fonction définie sur un ensemble convexe $D$ et à valeurs dans R est dite convexe lorsqu'elle vérifie l'inégalité ci-dessus pour tous points $x$ et $y$ de $D$ et tout $t$ dans $[0, 1]$ , $t x + (1 - t) y$ désignant le barycentre du système pondéré $(x; t)(y;(1 - t))$ .

Les fonctions convexes possèdent d'intéressantes propriétés de continuité et de dérivabilité. Elles permettent de démontrer un grand nombre d'inégalités remarquables, dites inégalités de convexité, et d'apporter des facilités pour la recherche d'extrema.

Convexité pour une fonction d'une variable réelle

Dans cette première section, on va supposer que l'ensemble de départ est un intervalle $I$ de $\mathbb{R}$ . Cette restriction permet de fournir une première initiation aux fonctions convexes d'abord plus aisée et parce que la possibilité de tracer des représentation graphiques planes facilite certainement la tâche, ensuite et surtout parce que les concepts de continuité ou dérivabilité sont significativement plus maniables pour les fonctions d'une seule variable. Cette approche montre tout de même vite ses limites, en particulier parce qu'elle n'est guère pertinente pour appliquer la théorie des fonctions convexes à l'optimisation qui en est sans doute la principale motivation.

Le lecteur qui recherche la définition d'une fonction convexe de plusieurs variables, ou définie sur un ensemble convexe d'un espace vectoriel ou affine est invité à se rendre directement à la section suivante.

Définitions

Définition — Une fonction $f$ d’un intervalle $I$ de $\mathbb{R}$ vers $\mathbb{R}$ est dite convexe lorsque, pour tous $x 1$ et $x 2$ de $I$ et tout $λ$ dans $[0, 1]$ on a :

$f(\lambda\, x_1+(1-\lambda)\, x_2) \leq \lambda\, f(x_1)+(1-\lambda)\, f(x_2)$

Cela signifie que pour tout $x 1$ et $x 2$ de $I$ , le segment $\ [A_1, A_2]$ de $\ \R^2$ , où $\ A_1 = (x_1 , f(x_1))$ et $\ A_2 = (x_2 , f(x_2))$ , est situé au-dessus de la courbe représentative de $f$ .

Une fonction concave est une fonction dont la fonction opposée est convexe.

On vérifie aussitôt ce qui suit, reliant les notions d'ensemble convexe et de fonction convexe :

Remarque — La fonction $f$ est convexe sur $I$ si et seulement si $\ \{(x,\, y) \in I \times \R\, | y \geq f(x)\}$ est un sous-ensemble convexe de $\ \R^2$ .

Cet ensemble est appelé l'épigraphe de $f$ .

Exemple : la fonction $x\,\colon\, \mapsto |x|$ est convexe, parce que son épigraphe est un quart de plan (lui-même convexe comme intersection de deux demi-plans). Il est souvent malcommode de vérifier la convexité d'une fonction définie par une formule concrète à partir de la seule définition, on attendra donc quelques paragraphes pour donner d'autres exemples, lorsqu'on disposera d'un critère de convexité plus utilisable en pratique.

Possibilité de n'utiliser que des milieux

La définition de la convexité fait apparaître des barycentres où les coefficients sont des réels arbitraires de $[0, 1]$ . Il est possible de n'utiliser que des milieux, mais il est alors indispensable d'ajouter une hypothèse supplémentaire de régularité portant sur $f$ ^[1].

Proposition — Une fonction $f$ continue sur $I$ est convexe sur $I$ si et seulement si quels que soient les éléments $x 1$ et $x 2$ de $I$ :

$f\left(\frac{x_1+x_2}{2}\right) \leq \frac{f(x_1)+f(x_2)}{2}$ .

Démonstration

Première preuve : par densité des dyadiques

Ce théorème se démontre en deux temps :

On prouve le résultat pour les fractions dyadiques par récurrence sur le dénominateur ;
Puis on étend l'inégalité obtenue en utilisant la densité des dyadiques.

Par récurrence sur $n$ , on démontre que, pour toute fraction rationnelle $\frac{p}{2^n}$ avec $0\leq p\leq 2^n$ : $f(\frac{p}{2^n}x+\frac{2^n-p}{2^n}y)\leq \frac{p}{2^n}f(x)+\frac{2^n-p}{2^n}f(y)$

Si $n = 1$ , on applique directement l'hypothèse du théorème.
Supposons le résultat démontré jusqu'à l'entier n − 1 ;
- Si $p$ est pair, par simplification d'un facteur 2, on se ramène au cas d'une fraction rationnelle de dénominateur $2 n - 1$ ; on applique alors l'hypothèse de récurrence.
- Si $p$ est impair, $p = 2 r + 1$ , on constate :

$\frac{2r+1}{2^n}x+\frac{2^n-(2r+1)}{2^n}y=\frac{x'+y'}{2}$ avec $x'=\frac{r}{2^{n-1}}x+\frac{2^{n-1}-r}{2^{n-1}}y$ et $y'=\frac{r+1}{2^{n-1}}x+\frac{2^{n-1}-(r+1)}{2^{n-1}}y$ ;

En appliquant l'hypothèse de récurrence à

x'

et à

y'

, il vient :

$f\left(\frac{2r+1}{2^n}x+\frac{2^n-(2r+1)}{2^n}y\right)\leq \frac{f(x')+f(y')}{2}\leq \frac{p}{2^n}f(x)+\frac{2^n-p}{2^n}f(y)$

On conclut alors par densité.

Deuxième preuve : via l'existence d'extrema pour les fonctions continues sur les compacts

On va démontrer l'énoncé contraposé. Soit donc $f$ une fonction continue non convexe sur $I$ .

On peut alors trouver un intervalle $[a, b]$ inclus dans $I$ tel qu'il existe dans cet intervalle un point $c$ avec $(c, f (c))$ strictement au-dessus de la corde qui joint $(a, f (a))$ à $(b, f (b))$ . Quitte à soustraire à $f$ la fonction affine qui prend les mêmes valeurs qu'elle en $a$ et en $b$ , on peut supposer $f (a) = f (b) = 0$ , l'information sur $c$ se réduisant alors à $0 < f (c)$ .

Soit $A$ le maximum atteint par la fonction continue $f$ sur le compact $[a, b]$ . Ce maximum est donc strictement positif. Soit maintenant $m$ le plus petit élément de $[a, b]$ en lequel $f$ prend la valeur $A$ . Pour $ε > 0$ assez petit pour qu'on reste dans $[a, b]$ , posons $x_1=m-\epsilon$ et $x_2=m+\epsilon$ . Alors $f (x 1) < f (m)$ et $f(x_2)\leq f(m)$ , donc l'inégalité de la proposition n'est pas vérifiée pour ces valeurs de $x 1$ et $x 2$ .

Extension à des barycentres de plus de deux points

Article détaillé : Inégalité de Jensen.

L'inégalité de la définition s'étend comme suit (on peut le démontrer par récurrence sur l’entier $p$ ). On dénomme parfois cette version l'inégalité de Jensen :

Proposition — Si $f$ est convexe sur $I$ et si $x_1,\, \dots,\, x_p$ sont des points de $I$ et $\lambda_1,\, \dots,\, \lambda_p$ des réels positifs ou nuls tels que $\lambda_1 + \cdots + \lambda_p = 1$ , alors :

$f(\lambda_1\, x_1 + \cdots + \lambda_p\, x_p) \leq \lambda_1\, f(x_1) + \cdots + \lambda_p\, f(x_p)$ .

Géométrie du graphe d'une fonction convexe

On appelle parfois « lemme des trois cordes » le résultat suivant^[2] :

Proposition — Si $f$ est convexe sur $I$ , pour tous points $x 1$ , $x 2$ , $x 3$ de $I$ avec $x 1 < x 2 < x 3$

$\frac{f(x_2)-f(x_1)}{x_2-x_1}\leq \frac{f(x_3)-f(x_1)}{x_3-x_1}\leq \frac{f(x_3)-f(x_2)}{x_3-x_2}.$

Réciproquement, si l'une des deux inégalités est vérifiée pour tous $x 1$ , $x 2$ , $x 3$ de $I$ avec $x 1 < x 2 < x 3$ , alors $f$ est convexe.

Régularité des fonctions convexes

Le « lemme des trois cordes » permet de montrer que^[3] :

Théorème — Si $f$ est convexe sur un intervalle ouvert $I$

$f$ est continue en tout point ;
$f$ est dérivable à gauche et à droite en tout point, et les fonctions $\ f\,'_g\,,\, f\,'_d$ sont croissantes sur $I$ ;
l’ensemble des points $x$ où $f$ n'est pas dérivable (c'est-à-dire tels que $\ f\,'_g(x) \neq f\,'_d(x)$ ) est au plus dénombrable.

Démonstration

Soit $a \in I$ . On définit sur $I \setminus \left\{ a \right\}$ le taux d'accroissement en $a$ par $\tau _a :x \mapsto \frac{{f\left( x \right) - f\left( a \right)}} {{x - a}}$ . Cette fonction est croissante d'après le lemme des trois cordes appliqué pour les trois cas: $a < x < y$ , $x < a < y$ et $x < y < a$ . Elle admet donc une limite à gauche et à droite en $a$ finies.

Cela montre que $f$ est dérivable à gauche et à droite mais cela implique aussi que $f$ est continue.

Montrons que l'ensemble des points où f n'est pas dérivable est au plus dénombrable.
- Déjà, $f$ n'est pas dérivable en tout point où la dérivée à gauche est différente de la dérivée à droite, et en particulier par croissance du taux d'accroissement, quand la dérivée à droite est supérieure strictement à la dérivée à gauche. Soit $J =\left[ {a,b} \right]$ un segment inclus dans $I$ . On note $E = \left\{ {x \in J|f'_d \left( x \right) - f'_g \left( x \right) > , et $E_n = \left\{ {x \in J|f'_d \left( x \right) - f'_g \left( x \right) > \ pour tout $n > 0$ . Il faut montrer que $E$ est au plus dénombrable. Comme $E = \bigcup\limits_{n > , en montrant que $E n$ est fini pour tout $n > 0$ , on aurait que $E$ serait une réunion dénombrable d'ensemble finis, donc au plus dénombrable.
- Supposons donc par l'absurde qu'il existe $n > 0$ tel que $E n$ ne soit pas fini. Soit $A > 0$ . Alors , puisque $E n$ est infini, on peut prendre $m$ éléments distincts dans cet ensemble où $m$ est un entier tel que $m > {. Cela implique par croissance de $f' g$ que $f'_g\left( b \right) \geq f'_g\left( a \right) + \frac{m} {n} > , ce qui signifie que $f' g$ diverge vers $+ \infty$ en $b -$ . Or comme $b$ est dans $I$ ouvert, cela est absurde puisque $f' g$ est croissante sur un intervalle autour de $b$ . On a montré que $E n$ est fini pour tout $n > 0$ .
- Pour conclure, il suffit de voir que $I$ est une réunion dénombrable de segments: $\left[ { - 2^n ,2^n } \right]$ si $I = \mathbf{R}$ , $\left[ {c + \frac{1} {n},d - \frac{1} {n}} \right]$ , si $I = \left[ {c,d} \right]$ , etc. On a que $I$ est le réunion dénombrable d'ensembles au plus dénombrables, donc il est au plus dénombrable.

Cas des fonctions dérivables

On dispose des caractérisations suivantes :

Proposition — Soit $f$ une fonction dérivable sur un intervalle $I$ .

$f$ est convexe si et seulement si sa courbe représentative est au-dessus de chacune de ses tangentes ;

$f$ est convexe si et seulement si sa dérivée est croissante sur $I$ .

d'où on tire le corollaire immédiat fort pratique pour vérifier sans mal la convexité d'exemples spécifiques :

Corollaire — Soit $f$ une fonction deux fois dérivable sur un intervalle $I$ .

$f$ est convexe si et seulement si sa dérivée seconde $f''$ est à valeurs positives ou nulles.

Ainsi on peut désormais facilement ajouter à sa collection de fonctions convexes (ou concaves) les exemples suivants :

la fonction $\ \R \to \R,\, x \mapsto x^2$ est convexe ;

la fonction $\ \R \to \R,\, x \mapsto \exp{x}$ est convexe ;

la fonction $\ \R^*_+ \to \R,\, x \mapsto \ln{x}$ est concave.

Stricte convexité

En faisant intervenir des inégalités strictes, on dispose d'une variante de la convexité, la stricte convexité.

Définition — Une fonction $f$ d’un intervalle $I$ de $\mathbb{R}$ vers $\mathbb{R}$ est dite strictement convexe lorsque, pour tous $x 1$ et $x 2$ distincts dans $I$ et tout $λ$ dans $] 0, 1 [$ on a :

$f(\lambda\, x_1+(1-\lambda)\, x_2) < \lambda\, f(x_1)+(1-\lambda)\, f(x_2)$

Les résultats énoncés plus haut pour des fonctions convexes s'adaptent généralement sans mal aux fonctions strictement convexes. On prendra garde à une nuance : de même que les fonctions dérivables convexes sont celles qui ont une dérivée croissante, les fonctions dérivables strictement convexes sont celles qui ont une dérivée strictement croissante. En revanche, il ne faudrait pas croire que la dérivée seconde d'une fonction dérivable strictement convexe est nécessairement une fonction à valeurs strictement positives : la dérivée d'une fonction strictement croissante peut s'annuler occasionnellement, ou plus exactement peut s'annuler sur un ensemble de points d'intérieur vide. Penser à $f\,\colon\, x\mapsto x^4$ pour un exemple de fonction strictement convexe dont la dérivée seconde s'annule.

Le cas général

Définitions

On peut donner au moins deux définitions légèrement différentes d'une fonction convexe, qui reviennent essentiellement au même mais ne fournissent néanmoins pas exactement les mêmes fonctions. On prendra donc garde au contexte lors d'une invocation d'une de ces définitions pour comprendre s'il s'agit ou non de fonctions susceptibles de prendre des valeurs infinies.

Définition 1 — Une fonction $f$ d’un convexe $C$ d'un espace vectoriel (ou affine) réel vers $\mathbb{R}$ est dite convexe lorsque, pour tous $x 1$ et $x 2$ de $C$ et tout $λ$ dans $[0, 1]$ on a :

$f(\lambda\, x_1+(1-\lambda)\, x_2) \leq \lambda\, f(x_1)+(1-\lambda)\, f(x_2)$ .

Définition 2 — Une fonction $f$ d’un espace vectoriel (ou affine) réel $E$ vers $\mathbb{R}\cup\{+\infty\}$ est dite convexe lorsque, pour tous $x 1$ et $x 2$ de $E$ et tout $λ$ dans $[0, 1]$ on a :

$f(\lambda\, x_1+(1-\lambda)\, x_2) \leq \lambda\, f(x_1)+(1-\lambda)\, f(x_2)$ .

Étant donnée une fonction convexe au sens de la définition 1, on peut lui associer une fonction convexe au sens de la définition 2 en la prolongeant hors de $C$ par la valeur $+\infty$ ; réciproquement étant donnée une fonction convexe $f$ au sens de la définition 2, il est immédiat de vérifier que l'ensemble des points où elle prend une valeur finie est un convexe $C$ et la restriction de $f$ à ce convexe est alors une fonction convexe au sens de la définition 1. Les deux transformations sont réciproques l'une de l'autre : les deux définitions, quoique techniquement distinctes, décrivent bien la même notion.

Certaines sources requièrent de plus que $C$ soit non-vide (dans la définition 1) ou que $f$ ne soit pas la constante $+\infty$ (dans la définition 2) pour prévenir certaines exceptions désagréables dans quelques énoncés^[4].

Fonction fortement convexe

Soit $(\mathbb{E},\|\cdot\|)$ un espace normé. On dit que $f:\mathbb{E}\to\R\cup\{+\infty\}$ est fortement convexe, de module $α > 0$ , si pour tout $x 0$ et $x 1$ dans le domaine de $f$ et pour tout $t\in[0,1]\subset\R$ , on a

$f((1-t)x_0+tx_1)\leq(1-t)f(x_0)+tf(x_1)-\frac{\alpha}{2}\,t(1-t)\|x_0-x_1\|^2.$

On retrouve la notion de fonction convexe lorsque $α = 0$ .

Exemples de fonctions convexes

Voici quelques exemples de fonctions convexes, dont certaines interviennent souvent en analyse convexe :

fonction convexe polyédrique dont l'épigraphe est un polyèdre convexe,
fonction d'appui d'un ensemble,
fonction indicatrice d'un ensemble convexe,
fonction marginale dont les valeurs sont obtenues en minimisant une seconde fonction paramétrée par ses arguments,
fonction sous-linéaire.

Propriétés élémentaires

Une proportion significative de résultats valables pour des fonctions convexes d'une variable se reproduisent à l'identique pour des fonctions convexes sur une partie d'un espace vectoriel, soit qu'on se ramène pour les prouver à considérer la restriction de la fonction à une droite, soit que la démonstration soit une simple révision de la version à une variable. En voici quelques unes :

Une fonction convexe est une fonction dont l'épigraphe est convexe.

Dans un espace vectoriel topologique, une fonction qui vérifie l'inégalité de convexité pour les seuls milieux et qui est continue est convexe.

Une fonction convexe vérifie l'inégalité de Jensen.

Dans un espace normé $E$ , on dira qu'une application $U$ définie sur un convexe de $E$ et à valeurs dans le dual $E *$ est monotone lorsque pour tous $x 1$ , $x 2$ dans $C$ , $U(x_1)(x_2-x_1)\leq U(x_2)(x_2-x_1)$ . Soit maintenant $f$ différentiable sur un ouvert convexe de $E$ . Alors $f$ est convexe si et seulement si sa différentielle est monotone.

Dans un espace normé $E$ , soit $f$ une fonction numérique deux fois différentiable sur un ouvert convexe. Alors $f$ est convexe si et seulement si, en chaque point, la forme quadratique dérivée seconde est positive.

Minorante affine

La technique de minoration des fonctions convexes par des fonctions affines est une variante adaptée à l'analyse de l'utilisation des hyperplans d'appui en géométrie convexe. La forme analytique du théorème de Hahn-Banach permettrait de minorer directement une fonction convexe définie (et à valeurs finies) sur la totalité de son espace de départ. En revanche, dès que la fonction n'est pas définie partout, il faut poser quelques restrictions techniques^[5].

Proposition — Soit $E$ un espace vectoriel topologique, $f$ une fonction convexe et continue définie sur un ouvert convexe non vide $U$ de $E$ et $x 0$ un point de $U$ . Il existe alors une fonction affine continue qui minore $f$ et qui coïncide avec elle en $x 0$ .

On verra un peu plus bas que l'hypothèse de continuité est superflue en dimension finie (c'est une conséquence de la convexité). En revanche, la condition topologique sur $U$ est indispensable, même en une seule variable : pour la fonction convexe $f(x) = -\sqrt{1-x^2}$ sur $[- 1, 1]$ (dont le graphe est un demi-cercle) et $x 0 = 1$ , on ne peut trouver de fonction affine minorante au sens de la proposition précédente.

Démonstration

Considérons d'une part l'épigraphe strict $C=\{(x,y)\in E\times \R\,\mid\, f(x)< y\}$ de $f$ : il est convexe par convexité de $f$ , ouvert dans $E\times \R$ parce que $U$ est ouvert et $f$ continue, et d'autre part le singleton $L = {(x 0, f (x 0))}$ . En utilisant la première forme géométrique du théorème de Hahn-Banach, on a la garantie qu'existe un hyperplan d'appui à $C$ passant par $(x 0, f (x 0))$ , qui est fermé. Cet hyperplan ne peut contenir la droite $\{x_0\} \times \R$ par une nouvelle utilisation du caractère ouvert de $U$ . On en conclut qu'il est le graphe d'une application affine qui minimise $f$ , et qui est continue parce que $H$ est fermé.

Fonctions convexes en dimension finie

Problèmes de continuité

Continuité sur un ouvert

Comme en dimension 1, une fonction convexe définie sur un ouvert de $\R^n$ est forcément continue en tout point de l'ouvert. La démonstration va nous donner une information plus précise^[6] :

Théorème — Une fonction convexe définie (et à valeurs finies) sur un ouvert de $\R^n$ est localement lipschitzienne, et donc continue.

Démonstration

Soit $f$ fonction convexe définie sur l'ouvert convexe $C$ , et soit $x 0$ un point de $C$ .

On va dans un premier temps montrer que $f$ est localement bornée. La dimension finie est utilisée ici de façon essentielle : qu'on songe que le résultat serait faux pour une forme linéaire discontinue en dimension infinie.

Pour majorer localement $f$ , prenons un simplexe contenant $x 0$ en son intérieur, et notons $M$ la plus grande valeur prise par $f$ sur les $n + 1$ sommets de ce simplexe. L'inégalité de convexité permet d'étendre cette majoration à tout le simplexe, donc à un voisinage de $x 0$ .

Passons à la minoration locale, valable sur toute boule $B$ centrée en $x 0$ sur laquelle on sache déjà majorer $f$ par un $M$ . Pour tout point $x 1$ de cette boule, en introduisant le symétrique $x' 1$ de $x 1$ par rapport à $x 0$ et en écrivant l'inégalité de convexité pour $x 0$ comme milieu de $[x 1, x' 1]$ et en y reportant la majoration de $f (x' 1)$ , on obtient la minoration $2f(x_0)-M\leq f(x_1)$ .

Soit alors $δ$ un réel strictement positif assez petit pour que $f$ prenne des valeurs plus petites que $M$ (et donc plus grandes que $2 f (x 0) - M$ ) sur la boule ouverte $B 2$ de centre $x 0$ et de rayon $2δ$ . On vérifie alors assez facilement que $f$ est $L$ -lipschitzienne sur la boule ouverte $B 1$ de centre $x 0$ et de rayon $δ$ , où on pose :

$L={2(M-f(x_0))\over\delta}$ .

Pour cette vérification, soit $x 1$ et $x 2$ distincts dans $B 1$ . On introduit les points auxiliaires $x' 1$ et $x' 2$ définis par :

$x_1'=x_1-\delta{{x_2-x_1}\over{\|x_2-x_1\|}}$ et $x_2'=x_2+\delta{{x_2-x_1}\over{\|x_2-x_1\|}}$ .

On remarque que ces points auxiliaires sont dans $B 2$ . Si on écrit successivement alors les inégalités de convexité correspondant à la représentation de $x 1$ comme un point du segment $[x' 1, x 2]$ et à la représentation de $x 2$ comme un point du segment $[x 1, x' 2]$ , puis qu'on y insère les majorations et minorations disponibles pour les valeurs de $f$ sur $B 2$ , on obtient rapidement la majoration souhaitée :

$\left| f(x_2)-f(x_1)\right|\leq L\|x_2-x_1\|$ .

Discontinuités au bord

À une variable, sur un intervalle non ouvert, on a vu qu'une fonction convexe n'était pas nécessairement continue.

Néanmoins il est possible de la rendre continue par un procédé simple : si $f$ est convexe sur un intervalle $[a, b]$ , alors nécessairement la limite à gauche $f + (a)$ de $f$ en $a$ existe et est inférieure ou égale à la valeur $f (a)$ . La discontinuité de $f$ en la borne $a$ se produit alors dans le cas où $f + (a) < f (a)$ . On peut s'en démêler en modifiant simplement la valeur de $f$ en ce point : il suffit de la diminuer et la remplacer par $f + (a)$ ^[7].

Dès la dimension $2$ , les choses ne sont pas aussi confortables, comme le montre l'exemple suivant :

Soit $C$ le disque-unité fermé de $\R^2$ ; considérons la fonction $f$ définie sur $C$ par :

$\left\{\begin{matrix}f(x,y)&=&\displaystyle{x^2\over{y+1}}&\mbox{si }(x,y)\not=(0,-1)\\ f(0,-1)&=&0&\\ \end{matrix}\right.$

Cette fonction $f$ est convexe. Elle est toutefois discontinue au point $(0, - 1)$ mais ici la discontinuité ne peut être levée par une simple modification de la valeur $f (0, - 1)$ . On constate en effet que si on tend radialement vers ce point, la fonction étant nulle sur le rayon, $f (0, y)$ tend vers $0$ ; mais un calcul facile permet de constater que, si on tend vers $(0, - 1)$ le long du cercle frontière de $C$ , $f (x, y)$ tend vers $2$ . Toutes les valeurs comprises entre $0$ et $2$ sont d'ailleurs valeurs d'adhérence de $f$ au point $(0, - 1)$ et il est définitivement illusoire d'espérer rendre cette $f$ continue en modifiant ses valeurs sur le bord^[8].

Toutefois, si l'ensemble de définition est un polytope, les choses se passent comme sur les intervalles de $\R$ , comme on peut le voir en appliquant le théorème suivant^[9] :

Théorème — Une fonction convexe bornée définie sur l'intérieur d'un polytope admet un prolongement convexe continu au polytope.

Fermeture d'une fonction convexe

Une fois qu'on a compris qu'il est vain de vouloir modifier une fonction convexe $f$ sur la frontière de son domaine de définition jusqu'à la rendre continue, on peut néanmoins choisir un jeu de valeurs sur cette frontière plus remarquable que les autres, en exigeant que le prolongement soit à la fois semi-continu inférieurement (ce qui nécessite de choisir des valeurs faibles) et convexe (ce qui nécessite de les prendre fortes).

Pour écrire l'énoncé assez confortablement, il est ici particulièrement approprié d'utiliser des fonctions définies sur tout $\R^n$ et prenant éventuellement la valeur $+\infty$ ; on appellera domaine effectif d'une telle fonction convexe l'ensemble des points où elle prend une valeur finie.

Théorème — Soit $f$ une fonction convexe de domaine effectif $D_f\subset \R^n$ . On note $\overline f$ la fonction définie en $x\in\R^n$ par :

$\overline f(x):=\liminf_{y\to x} f(y).$

La fonction $\overline f$ est alors caractérisée par l'une au choix des trois propriétés suivantes :

$\overline f$ coïncide avec $f$ en les points qui ne sont pas sur la frontière relative de $D_f\,$ ; elle est convexe et semi-continue inférieurement ;
$\overline f$ coïncide avec $f$ en les points qui ne sont pas sur la frontière relative de $D f$ et, pour tout point $x$ de la frontière relative de $D f$ et tout segment semi-ouvert $] x, z]$ inclus dans l'intérieur relatif de $D f$ , $f(x)=\lim_{\stackrel{y\to x}{y\in]x,z]}}f(y)$ ;
$\overline f$ a pour épigraphe l'adhérence de l'épigraphe de $f$ .

Démonstration

Le fait que $\overline f$ est semi-continue inférieurement et la propriété (3) sont vrais sans utiliser l'hypothèse de convexité de $f$ , et sont de simples exercices de topologie élémentaire.

Le fait que $\overline f$ coïncide avec $f$ hors de l'adhérence de $D f$ , c'est-à-dire prenne la valeur $+\infty$ en tout point de cette partie de l'espace est lui aussi évident.

Le fait que $\overline f$ coïncide avec $f$ sur l'intérieur relatif de $D f$ provient de la continuité de la restriction de $f$ à cet intérieur relatif, en tant que fonction convexe sur un convexe ouvert (relativement à son enveloppe affine).

La convexité de $\overline f$ peut sembler claire, puisque son épigraphe est convexe comme adhérence d'un convexe, mais il y a ici un piège ! Il ne faut en effet pas oublier de vérifier que $\overline f$ prend ses valeurs dans $\R\cup\{+\infty\}$ (autrement dit, que la $liminf$ servant à définir $\overline f$ ne vaut nulle part $-\infty$ ) ce qui n'est pas évident. Pour ce faire, il est souhaitable de se placer provisoirement dans l'espace affine enveloppe affine de $D f$ . Par la proposition d'existence des fonctions affines minimisantes, on construit une forme affine sur ce sous-espace qui minore $f$ sur l'intérieur relatif de $D f$ ; la minoration est encore vraie sur la frontière relative (on s'en aperçoit point par point en restreignant l'espace de départ à une droite passant par ce point), on prolonge enfin arbitrairement cette formea affine à $\R^n$ tout entier en une forme affine, continue puisqu'on est en dimension finie, et qui minore partout $f$ . Cette forme minore alors aussi les $liminf$ qui construisent $\overline f$ prouvant qu'elles ne peuvent valoir $-\infty$ .

Une fois connue la convexité de $f$ , donc de sa restriction à tout segment, l'affirmation (2) provient du lemme facile suivant : une fonction d'une seule variable qui est à la fois convexe et semi-continue inférieurement est en fait continue.

Il est clair que (2) et que (3) caractérisent $\overline f$ . Pour (1), cela découle du paragraphe précédent de la démonstration, dans lequel on a montré que (1) entraîne (2).

La fonction $\overline f$ est appelée la fermeture de $f$ . Les fonctions convexes égales à leur fermeture sont appelées des fonctions convexes fermées ; dit autrement ce sont les fonctions convexes dont l'épigraphe est fermé, ou encore autrement dit ce sont les fonctions convexes semi-continues inférieurement^[10].

Applications en physique

L'analyse convexe trouve un grand nombre d'applications en physique, lorsque les potentiels énergétiques sont localement convexes (existence de solutions stables, de changements de phase). En homogénéisation, par exemple, les théories de type variationnel permettent d'estimer les solutions d'équations aux dérivées partielles elliptiques grâce à la représentation des potentiels énergétiques par transformée de Legendre. La transformée de Legendre, formulation mathématique qui représente une fonction convexe par l'ensemble de ses tangentes, permet le développement de méthodes de linéarisation^[11].

Annexes

Notes

Les ouvrages mentionnés par des lettres entre crochets dans ces références sont ceux cités dans la section bibliographique.

↑ Ce résultat est mentionné par [NP] p. 10, qui l'attribuent à Johan Jensen et renvoient à son article « Sur les fonctions convexes et les inégalités entre les valeurs moyennes », Acta Mathematica vol. 30 (1906), p. 175-193. La deuxième preuve ci-dessous est celle fournie dans [N-P].
↑ Ce résultat est cité par [N-P], p. 20-21, qui l'attribuent à L. Calvani, renvoyant à son article « Sulle funzioni converse di una o due variablili definite in aggregate qualunque », Rend. Circ. Mat. Palermo, vol. 41 (1916), p. 103-134.
↑ Voir [N-P], p. 21. Cet ouvrage attribue le théorème de dérivabilité à gauche et à droite à Otto Stolz, renvoyant à son traité Grundzüge der Differential und Integralrechnung, vol. 1, Teubner, Leipzig, 1893.
↑ Pour l'ensemble de cette sous-section, voir [H-L], p.74 à 76.
↑ La proposition qui suit est énoncée dans [N-P], p. 114 (sous l'hypothèse d'un espace E normé, qui ne joue pas un rôle essentiel dans la preuve).
↑ [H-L], p. 102-104, la minoration de la fonction convexe ayant été adaptée au vu de [N-P], p. 119.
↑ Ces remarques sont disponibles, avec leurs preuves et quelques détails, dans [N-P], p. 22.
↑ L'exemple figure dans [H-L] p. 105, avec l'explication de la convexité de $f$ .
↑ Ce théorème est cité sans démonstration par [N-P], p. 123, qui renvoie à D. Gale, V. Klee et R.T. Rockafellar, « Convex functions on convex polytopes », Proceedings of the American Mathematical Society, vol. 19 (1968), p. 867-873.
↑ Pour l'ensemble de cette sous-sous-section, voir [H-L], p.79-80. [N-P], p. 122, mentionne également ces résultats en les attribuant à Werner Fenchel (de), renvoyant à Convex cones, sets and fucnctions, Princeton University Press, 1951.
↑ Voir pour un aperçu § 4 in Ivar Ekeland, Roger Temam, SIAM, 1999, Convex Analysis and Variational Problems, ISBN 0-89871-399-4.

Bibliographie

[H-L] - Jean-Baptiste Hiriart-Urruty et Claude Lemaréchal, Fundamentals of convex analysis, coll. « Grundlehren Text Editions », Springer, 2001 (ISBN 3540422056) R. Tyrrell Rockafellar, Convex Analysis, Princeton University Press, 1970, ISBN 0-691-01586-4.

[N-P] - Constantin Nicolescu et Lars-Erik Persson, Convex Functions and their Applications : A Contemporary Approach, coll. « Ouvrages de mathématiques de la Société mathématique du Canada », vol. 23, Springer, 2006 (ISBN 978-0387243009)

v · Ensemble convexe Outils et résultats fondamentaux : Enveloppe convexe • Adhérence, intérieur et frontière d'un convexe • Projection sur un convexe fermé • Séparation des convexes • Points remarquables à la frontière d'un convexe • Polytope • Théorème de Krein-Milman • Lemme de Farkas Géométrie combinatoire : Théorème de Carathéodory • Théorème de Radon • Théorème de Helly Géométrie métrique : Courbe de largeur constante • Théorème des quatre sommets Algorithmes de géométrie convexe : Approche polyédrique • Marche de Jarvis • Parcours de Graham • Théorème optimisation/séparation Optimisation linéaire : Optimisation linéaire • Algorithme du simplexe • Génération de colonnes
Interactions géométrie-analyse	Théorème de Hahn-Banach • Jauge
Analyse convexe	Articles principaux : Ensemble convexe • Fonction convexe Outils et résultats fondamentaux : Conditions de Kuhn-Tucker • Inégalité de Jensen Algorithmique : Méthodes de points intérieurs
Utilisations de la convexité	Inégalités de convexité : Inégalité arithmético-géométrique • Inégalité de Hölder Analyse fonctionnelle : Espace localement convexe • Théorème du point fixe de Schauder Localisation de zéros de polynômes : Théorème de Gauss-Lucas Théorie des nombres : Théorème de Minkowski

Portail de l'analyse

Catégories :

Analyse convexe
Analyse réelle
Fonction remarquable

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Fonction convexe de Wikipédia en français (auteurs)

Игры ⚽ Нужно сделать НИР?

Regardez d'autres dictionnaires:

Fonction Convexe — En mathématiques, et plus particulièrement en analyse, une fonction convexe est une fonction numérique vérifiant une propriété de sous additivité vis à vis de la barycentration. Graphiquement, cela correspond à un graphe dont la « partie… … Wikipédia en Français
Fonction convexe — ● Fonction convexe fonction numérique f, définie sur un intervalle I de R, telle que ∀ (x1, x2) ∊ I2 et ∀ λ ∊ [0,1] f [λx1 + (1 − λ) x2] ≤ λ f (x1) + (1 −λ)f … Encyclopédie Universelle
convexe — [ kɔ̃vɛks ] adj. • 1370; lat. convexus ♦ Courbe, arrondi vers l extérieur. ⇒ bombé, renflé; convexité. Lentille, miroir convexe. Géogr. Rive convexe, qui forme une avancée de terre (dans une courbe de la rivière). ♢ Surface, courbe convexe,… … Encyclopédie Universelle
Fonction Zeta de Riemann — Fonction zêta de Riemann En mathématiques, la fonction ζ de Riemann est une fonction analytique complexe qui est apparue essentiellement dans la théorie des nombres premiers. La position de ses zéros complexes est liée à la répartition des… … Wikipédia en Français
Fonction Zêta De Riemann — En mathématiques, la fonction ζ de Riemann est une fonction analytique complexe qui est apparue essentiellement dans la théorie des nombres premiers. La position de ses zéros complexes est liée à la répartition des nombres premiers. Elle est… … Wikipédia en Français
Fonction dzêta de Riemann — Fonction zêta de Riemann En mathématiques, la fonction ζ de Riemann est une fonction analytique complexe qui est apparue essentiellement dans la théorie des nombres premiers. La position de ses zéros complexes est liée à la répartition des… … Wikipédia en Français
Fonction zeta de Riemann — Fonction zêta de Riemann En mathématiques, la fonction ζ de Riemann est une fonction analytique complexe qui est apparue essentiellement dans la théorie des nombres premiers. La position de ses zéros complexes est liée à la répartition des… … Wikipédia en Français
Fonction zéta — Fonction zêta de Riemann En mathématiques, la fonction ζ de Riemann est une fonction analytique complexe qui est apparue essentiellement dans la théorie des nombres premiers. La position de ses zéros complexes est liée à la répartition des… … Wikipédia en Français
Fonction zêta de riemann — En mathématiques, la fonction ζ de Riemann est une fonction analytique complexe qui est apparue essentiellement dans la théorie des nombres premiers. La position de ses zéros complexes est liée à la répartition des nombres premiers. Elle est… … Wikipédia en Français
Fonction Entière — La fonction associant à chaque nombre réel sa partie entière est traitée à l article Partie entière. Voir aussi la page Entier (homonymie). En analyse complexe, une fonction entière est une fonction holomorphe définie sur tout le plan complexe. C … Wikipédia en Français

Dictionnaires et Encyclopédies sur 'Academic'

Fonction convexe

Sommaire

Convexité pour une fonction d'une variable réelle

Définitions

Possibilité de n'utiliser que des milieux

Extension à des barycentres de plus de deux points

Géométrie du graphe d'une fonction convexe

Régularité des fonctions convexes

Cas des fonctions dérivables

Stricte convexité

Le cas général

Définitions

Fonction fortement convexe

Exemples de fonctions convexes

Propriétés élémentaires

Minorante affine

Fonctions convexes en dimension finie

Problèmes de continuité

Continuité sur un ouvert

Discontinuités au bord

Fermeture d'une fonction convexe

Applications en physique

Annexes

Notes

Bibliographie

Regardez d'autres dictionnaires:

Share the article and excerpts

Dictionnaires et Encyclopédies sur 'Academic'

Wikipédia en Français

Fonction convexe

Sommaire

Convexité pour une fonction d'une variable réelle

Définitions

Possibilité de n'utiliser que des milieux

Extension à des barycentres de plus de deux points

Géométrie du graphe d'une fonction convexe

Régularité des fonctions convexes

Cas des fonctions dérivables

Stricte convexité

Le cas général

Définitions

Fonction fortement convexe

Exemples de fonctions convexes

Propriétés élémentaires

Minorante affine

Fonctions convexes en dimension finie

Problèmes de continuité

Continuité sur un ouvert

Discontinuités au bord

Fermeture d'une fonction convexe

Applications en physique

Annexes

Notes

Bibliographie

Regardez d'autres dictionnaires:

Share the article and excerpts

Direct link