- Théorie des équations (mathématiques)
-
Pour les articles homonymes, voir Théorie des équations.
La théorie des équations est la partie des mathématiques qui traite des problèmes posés par les équations polynomiales de tous les degrés. Se trouvent ainsi rassemblés les problèmes de résolution de ces équations, d'estimation des solutions, de détermination du signe de ces solutions, des algorithmes de résolution et tous les problèmes connexes.
L'expression « théorie des équations » a été très utilisée au XIXe siècle et dans la première moitié du XXe siècle. Depuis lors, bien que ce champ mathématique soit toujours actif, l'expression est de moins en moins utilisée hormis en histoire des sciences. Cependant, il n'y en a aucune autre de proposée pour cette partie des mathématiques.
Prologue
Dans toute la suite, sauf mention spéciale, on considère un polynôme d'une seule variable à coefficients réels ou complexes dont on cherche les racines réelles ou complexes.
En pratique on est souvent amené à résoudre une équation polynômiale à coefficients réels ou complexes.
Or seules les équations polynômiales générales de degrés inférieurs ou égaux à quatre sont résolubles par radicaux. Pour les équations de degrés supérieurs, sauf dans quelques cas particuliers et en excluant la solution générale d'Hermite pour le degré cinq qui fait intervenir des fonctions elliptiques, il ne reste que le calcul numérique.
La majorité des algorithmes connus pour calculer une solution repose sur une amorce proche de la solution cherchée. Se pose donc la question de déterminer une région où se trouvent les solutions.
Souvent, on n'a pas besoin de connaître les solutions avec précision. Une estimation de ces solutions suffit, voire seulement le nombre ou le signe de ces solutions, quand ce n'est pas un simple majorant.
L'objet de cet article est de donner un panorama des méthodes ingénieuses d'estimation de ces solutions découvertes depuis parfois longtemps.
Il ne sera pas donné, en général, de démonstration de ces résultats. On se reportera soit à la bibliographie soit aux articles originaux pour les démonstrations.
On consultera avec profit l'article théorie des équations (histoire) qui traite de l'histoire de la résolution par radicaux.
Définitions et conventions
Dans la suite, les polynômes considérés sont donnés sous forme développée selon la formule .
Le coefficient ak est le coefficient de la puissance kième de la variable z.
Le degré du polynôme P est égal à son coefficient non nul de rang le plus élevé.
Dans le cas où la variable considérée est réelle, on l'écrira x.
On appelle racine de P toute valeur α, réelle ou complexe, telle que P(α) = 0.
Positions des problèmes
Le premier objet de la théorie est l'étude des rapports entre les coefficients et les racines d'un polynôme. On verra que les relations entre les coefficients et les racines sont de plus en plus compliquées à mesure que le degré du polynôme augmente. Élémentaire au premier degré, raisonnable au second, l'expression des racines en fonction des coefficients devient plus difficile avec les troisième et quatrième degré, très complexe au cinquième degré et inextricables au-delà.
La résolution par radicaux
Le polynôme du premier degré a1z + a0 admet de manière évidente la racine , car .
Le polynôme du second degré P(z) = a2z2 + a1z + a0 admet deux racines complexes déterminées par les formules :
où , et les divisions et la racine carrée devant être effectuées dans l'ensemble des nombres complexes.
La conjecture de Girard et le théorème de D'Alembert-Gauss
C'est au XVIIe siècle qu'apparaît, sous la plume d'Albert Girard, la première formulation explicite de la conjecture
« Tout polynôme de degré n à coefficients complexes admet n racines complexes. »
Il n'essaie d'ailleurs pas de la démontrer. Il faut attendre D'Alembert, en 1746, pour une première tentative qui ne convainquit pas. Les tentatives d'Euler (1749), de Faunsenet (1751), Lagrange (1771) et Gauss (1799) ne sont guère plus convaincantes. Elles butent essentiellement sur des questions qui ne peuvent avoir de réponse par des méthodes de cette époque. Il faut attendre la démonstration de Gauss de 1815 pour que la conjecture soit enfin démontrée. On peut la démontrer par différentes méthodes mais la plus courante est celle qui résulte du théorème de Liouville.
Théorème de Liouville:
« Toute fonction holomorphe et bornée dans le plan complexe est constante. »
et qu'on peut démontrer par les inégalités de Cauchy.
La démonstration de la conjecture de Girard consiste à montrer que tout polynôme de degré n admet au moins une racine complexe. Et, par factorisation, il en admet donc exactement n. Soit donc P un polynôme de degré n à coefficients complexes. Supposons que P n'ait pas de racine. Alors 1/P est une fonction holomorphe dans tout le plan complexe et bornée. Donc, d'après le théorème de Liouville, 1/P est constante et P aussi. Donc tout polynôme non constant admet un zéro. D'où le théorème.
Corollaire: Tout polynôme de degré n à coefficients complexes se décompose en un produit de n termes du premier degré faisant apparaître les racines complexes αk.
Tout polynôme de degré n à coefficients réels peut s'écrire comme le produit de termes de degré au plus deux à coefficients réels. Les termes du second degré sont des polynômes n'ayant pas de racine réelle.
Dans un anneau quelconque, on n'a pas le théorème de D'Alembert-Gauss
On a tendance à exprimer le théorème de D'Alembert-Gauss sous la forme : « tout polynôme de degré n admet n racines » ou bien sous la forme « tout polynôme de degré n admet au plus n racines » suivant l'ensemble dans lequel on recherche les racines. Les deux énoncés sont faux sans autre précision. Un polynôme de degré n peut fort bien avoir plus de n racines si l'on recherche les racines dans un anneau quelconque. Par exemple, le polynôme (x-2)(x-3), qui est de degré 2, admet quatre racines dans Z/6Z : 0, 2, 3, et 5=-1.
Le cas complexe
Dans cette partie, on considère un polynôme à coefficients complexes dont on cherche les racines complexes.
Une première estimation
La démonstration du théorème de D'Alembert-Gauss par le théorème de Liouville n'apporte aucune information sur la position des racines complexes. Une seconde méthode est donnée par le théorème de Rouché :
« Soient f et g deux fonctions holomorphes dans un contour G fermé ne se recoupant pas et telles que | f(z) − g(z) | < | f(z) | + | g(z) | pour tout point z de G. Alors f et g ont le même nombre de zéros comptés avec leurs multiplicités. »
On en déduit en particulier le théorème suivant, plus précis que la conjecture de Girard :
« Soit P un polynôme de degré n normalisé (le coefficient de zn est 1) et A le plus grand module des autres coefficients de P. Alors il y a exactement n racines dans le cercle de centre 0 et de rayon 1+A. »
La démonstration consiste à appliquer le théorème de Rouché à P et au polynôme zn qui admet 0 comme racine de multiplicité n. L'inégalité nécessaire se démontre pour | z | = 1 + A:
d'où le résultat.
Corollaire :
« Soit P un polynôme de degré n s'écrivant
et soient les deux nombres
Les racines de P sont dans la couronne
. »Le théorème de Eneström-Kakeya
La relation entre les coefficients et les racines est très compliquée. Aussi faut-il s'attendre à obtenir des résultats intéressants avec des hypothèses plus fortes. C'est le cas du théorème suivant. Le théorème de Kakeya est un cas particulier d'un corollaire donné en 1893 par Eneström.
« Soit un polynôme à coefficients réels tels que alors les racines complexes sont en dehors du disque unité. »
Le théorème de Cauchy
Voisin de l'estimation obtenue par le théorème de Rouché, mais antérieur à ce dernier, ce théorème établit un lien entre le cas des polynômes à coefficients complexes et le cas des polynômes à coefficients réels.
« Soit P un polynôme de degré n s'écrivant
et Q le polynôme associé s'écrivant
Soit r l'unique racine positive de l'équation Q(z) = 0.
Alors toutes les racines de P sont de modules inférieurs ou égaux à r. »
Ce théorème est lui-même une version complexe de l'estimation de Lagrange, un résultat qui sera donné dans le cas réel.
Le théorème de Cohn-Berwald
Alors que le théorème de Cauchy ne donne qu'une majoration, le théorème suivant donne la minoration correspondante, tout en améliorant le résultat de Cauchy.
Considérant le théorème de Cauchy et utilisant un théorème de Grace, Cohn montra tout d'abord qu'au moins une des racines de P se trouvait de module supérieur à . Ce résultat a été amélioré par Berwald.
« Dans les notations du théorème de Cauchy, soient les racines complexes de P. On a l'inégalité
» Le cas réel
Dans cette partie, on considère un polynôme à coefficients réels dont on cherche les racines réelles.
Le théorème de Rolle
Article détaillé : Théorème de Rolle.Soit P un polynôme à coefficients réels.
Si l'on connaît deux nombres réels a et b tels que et tels que , alors il existe (au moins) une racine c dans du polynôme dérivé P':
P'(c) = 0. Ce théorème est un théorème de séparation des racines de P et de P'. Entre deux racines de P se trouve toujours au moins une racine de P'.
Le théorème de Bolzano
Soit P un polynôme à coefficients réels.
Si P(a) et P(b) ne sont pas de même signe, il existe au moins une racine réelle c comprise entre a et b.
La majoration de Lagrange
« Soit P(x) un polynôme à coefficients réels tel que les k coefficients appartenant aux puissances les plus élevées soient positifs ou nuls et en appelant G le plus grand des coefficients négatifs en valeur absolue et an le coefficient du terme de plus haut degré alors toutes les racines réelles, s'il en existe, sont inférieures ou égales à
» La démonstration est la suivante : On considère x comme étant réel.
P(x) est alors supérieur ou égal à
d'après la somme d'une série géométrique. En réduisant au même dénominateur, on a
. Or, si x>1, alors
(xk − xk − 1) > (x − 1)k donc si
on a
an(xk − xk − 1) > G et par conséquent P(x)>0. Donc, si elle existe, une racine de l'équation est nécessairement inférieure à
Cette règle permet de trouver très facilement une limite inférieure pour les racines négatives en appliquant la règle à P(-x), sous réserve qu'il y en ait.
En appliquant la règle au numérateur de P(1/x) après réduction au même dénominateur, de trouver une estimation de la plus petit racine positive si elle existe.
Remarque : On notera que le théorème de Cauchy n'est rien d'autre que l'adaptation au cas complexe de l'estimation de Lagrange.
Exemple
- Soit P(x) = x6 + 3x5 − 2x3 + x + 2. On cherche les limites supérieures et inférieures des racines positives et négatives.
L'application de la majoration de Lagrange donne an = 1 et G=2. D'autre part, k=3. Donc les racines positives sont inférieures à
Calculons P(1/x). On trouve que le numérateur est
2x6 + x5 − 2x3 + 3x + 1 donc an = 2, G=2 et k=3. La plus petite racine positive, si elle existe, est donc supérieure à
Estimons de même les racines négatives: P( − x) = x6 − 3x5 + 2x3 − x + 2 donc an = 1, G=3 et k=1. On a donc que les racines négatives sont toutes supérieures à -1-3=-4.
donc an = 2, G=3 et k=1. La racine négative, si elle existe est inférieure à -1/(1+3/2)=-2/5.
Un calcul numérique donne pour racines -2.738012467, -1.172706808 et il n'y a pas de racine positive !
Règle des signes de Descartes
Cette règle a été donnée par René Descartes dans le livre III de son œuvre La Géométrie (1637). Son objet est de déterminer le nombre de racines positives et négatives d'un polynôme à coefficients réels.
Descartes s'exprime ainsi, où les « vraies » racines sont les positives, tandis que les « fausses » racines sont les négatives[1] :
« On connoît aussi de ceci combien il peut y avoir de vraies racines et combien de fausses en chaque équation : à savoir il y en peut avoir autant de vraies que les signes + et - s'y trouvent de fois être changés, et autant de fausses qu'il s'y trouve de fois deux signes + ou deux signes - qui s'entre-suivent. »
On suppose que le polynôme à une variable et à coefficients réels est ordonné par ordre décroissant des exposants.
Alors le nombre des racines positives du polynôme est égal au nombre de changements de signes entre deux coefficients non nuls diminué éventuellement d'un multiple de 2 (pour tenir compte des racines complexes conjuguées qui ne sont pas decomptées), chaque racine positive étant comptée selon sa multiplicité.
En changeant la variable x en (-x), la règle permet de trouver le nombre des racines négatives, à un multiple de 2 près, puisque l'on a permuté les racines positives et négatives par la transformation.
Clairement, si le polynôme n'admet que des racines réelles, la règle de Descartes donne alors le nombre exact de racines positives.
De la même manière, on peut, par la règle de Descartes, déterminer combien de racines réelles sont supérieures à une valeur donnée c, par le changement de variable x transformé en x-c dans le polynôme.
Exemples
- Le polynôme x3 + x2 − x − 1, admet un seul changement de signes, entre le deuxième et le troisième terme. La règle de Descartes affirme donc qu'il possède exactement une racine positive.
Si l'on transforme x en -x, on a − x3 + x2 + x − 1, qui donne deux changements de signes. Donc il y a 2 ou 0 racines négatives.
- Le polynôme 5x5 − 7x4 + x3 − x + 2, admet quatre changements de signes. Donc le polynôme peut avoir zéro, deux ou quatre racines positives.
- Combien le polynôme x3 + x2 − x − 1, a-t-il de racines réelles supérieures à ? On développe et on trouve , qui n'a qu'un seul changement de signe. Il n'y a donc qu'une seule racine réelle supérieure à .
Extensions de la règle
On considère ici, non seulement les polynômes à coefficients réels mais également des expressions ressemblant à des polynômes avec des exposants réels quelconques.
Dans un article paru dans le journal de mathématique pure et appliquée, en 1883, Laguerre donne une démonstration de la règle de Descartes à partir du théorème de Rolle et cette démonstration lui permet de conclure que la règle des signes de Descartes s'applique même si les exposants ne sont pas entiers et sont des réels quelconques, ce qui constitue une première généralisation de la règle de Descartes.
Puis, Laguerre, dans le même article, essaie d'obtenir de la règle de Descartes une majoration:
Théorème de Laguerre[2]: Étant donné le "polynôme" ordonné suivant les puissances croissantes de x, les exposants pouvant être quelconques mais réels.
Le nombre des racines positives de l'équation f(x) = 0 qui sont inférieures à une quantité A est majoré par le nombre des alternances de la suite . Et si ces deux nombres diffèrent, leur différence est un nombre pair.
Cette proposition subsiste lorsque le nombre de termes est limité, pourvu que la série composée de ces termes soit convergente pour x=A.
Un cas particulier intéressant est obtenu en prenant A=1.
Exemples
- Soit f(x) = x3 − x2 + x1 / 3 + x1 / 7 − 1. Combien y a-t-il de racines positives ? Il y a trois alternances de signes (+- ; -+; +-) donc au plus 3 racines réelles positives.
- Soit . Combien y a-t-il de racines positives inférieures à 2 ? La suite se calcule ainsi:
soit numériquement 0.25;1.0004; − 1.4995;0.5004; − 5.4995; − 69.4995.
Il y a donc trois alternances (+-; -+; +-) donc trois racines positives au plus. Soit une ou trois racines positives. On vérifie graphiquement qu'il y en a une seule vers 0.4473661675.
Le théorème de Schur
Le théorème de Schur donne directement un majorant du nombre des racines positives.
Théorème de Schur:
« Si est un polynôme à coefficients réels qui admet m racines réelles positives, alors. »Le théorème de Sturm
Le théorème de Budan-Fourier
Théorème de Gauss-Lucas
Comme cas particulier, on a le théorème suivant, de Laguerre:
« Si est un polynôme unitaire de degré n, ayant n racines réelles, alors ces racines sont toutes dans l'intervalle [a,b] où a et b sont les racines du polynôme . »
Critère de Routh-Hurwitz
Article détaillé : Polynôme de Hurwitz.Méthode de Graeffe (en)-Dandelin
La conjecture de Sendof
La règle de Newton et le théorème de Sylvester
Newton avait donné sans démonstration dans l'Arithmetica Universalis, la règle suivante que nombres de mathématiciens ont cherché vainement à démontrer, parmi lesquels MacLaurin, Waring et Euler. C'est finalement en 1865 que Sylvester en donna la démonstration[3].
Le théorème de Huat
Théorème de Gershgorin
Le théorème de Gerschgorin est souvent utilisé pour donner des estimations des racines des polynômes en utilisant une matrice.
Théorème de Gershgorin:
« Soit A une matrice à coefficients complexe ai,j. Soit Ri la somme des modules des coefficients non diagonaux de la ligne i. Alors les valeurs propres li de la matrice A sont comprises dans l'union des disques définis par .
Le même théorème a lieu sur les colonnes. »
Le théorème d'Ostrowski
Théorème d'Ostrowski[4]
« Soit P un polynôme de degré n de la forme tel que
Toutes les racines de P sont dans le disque de centre 0 et de rayon . »
Remarque : Attention, le coefficient de zn − 1 est nul.
Notes et Références
- Citation de l'édition modernisée de Hermann, 1886
- Laguerre, Œuvres,T1, p9
- Sylvester, « Sur les limites du nombre des racines réelles des équations algébriques », CRAS, Paris, 1865, T60, p. 1261-1263.
- A.M. Ostrowski, A method for automatic solution of algebraic equations, dans B. Dejon and P. Henrici, Eds., Constructive Aspects of the Fundamental Equation of Algebra (Wiley/Interscience, New York, 1969) p209-224.
Bibliographie
Les livres sur la théorie des équations ne manquent pas. Voici parmi ceux-ci ceux que l'on peut trouver facilement sur internet avec le lien correspondant.
- Fantet de Lagny & Richer du Bouchet, Analyse générale, ou Méthodes nouvelles pour résoudre les problèmes de tous les genres & de tous les degrez à l'infini ,1733
- Newton, Arithmetica universalis : sive De compositione et resolutione arithmetica, T2, 1761
- Newton, Arithmetica universalis : sive De compositione et resolutione arithmetica, T1, 1761
- Bézout, Théorie générale des équations algébriques, 1779
- Bernoulli & Euler & Hewlett & Lagrange, Elements of algebra, 1822
- Hirsh & Ross, Hirsch's collection of examples, formulae, & calculations, on the literal calculus and algebra, 1827
- Young, On the theory and solution of algebraical equations, 1835
- Stevenson, A treatise on the nature and properties of algebraic equations, 1835
- Murphy, A treatise on the theory of algebraical equations, 1839
- Young, Researches respecting the imaginary roots of numerical equations: being a continuation of Newton's investigations on that subject, and forming an appendix to the "Theory and solution of equations of the higher orders.", 1844
- Hymers, A Treatise on the Theory of Algebraical Equations, 1858
- Jerrard, An essay on the resolution of equations, 1859
- Hargreave & Salmon, An essay on the resolution of algebraic equations, 1866
- MacNie, A treatise on the theory and solution of algebraical equations, 1876
- Matthiessen, Grundzüge der antiken und modernen Algebra der litteralen Gleichungen, 1878
- Welcker, Advanced algebra, 1880
- Todhunter, An Elementary Treatise on the Theory of Equations, 1880
- Burnside & Panton, The theory of equations, with an introduction to the theory of binary algebraic forms V2, 1881
- Burnside & Panton, The theory of equations, with an introduction to the theory of binary algebraic forms V1, 1899
- Beebe & Philips, Graphic Algebra: Or, Geometrical Interpretation of the Theory of Equations, 1882
- Byerly, Syllabus of a course in the theory of equations, 1883
- Serret, Cours d'algèbre supérieure, 1885
- Gauss, Die vier Gauss'schen Beweise für die Zerlegung ganzer algebraischer Functionen in reele Factoren erssten oder zweiten Grades, 1890
- Chapman, An elementary course in theory of equations, 1892
- Netto, The theory of substitutions and its applications to algebra, 1892
- Petersen, Théorie des équations algébriques, 1897
- Barton,An Elementary Treatise on the Theory of Equations, 1899
- Dickson, Introduction to the Theory of Algebraic Equations, 1903
- Cajori, An introduction to the modern theory of equations, 1904
- Mathews, algebraic equations, 1907
- Dickson, Elementary theory of equations,1914
- Dickson, First Course in the Theory of Equations, 1922
- Burnside & Panton, The Theory Of Equations, Vol 1, 1924
- Turnbull, theory of equations, 1947
Catégories :- Théorème de mathématiques
- Polynôme
Wikimedia Foundation. 2010.