Methode de Newton

publicité
1
Méthode de Newton
Théorème 1. Soit I ⊂ R intervalle de R et f : I −→ R de classe C 2 . On suppose que f s’annule
◦
f (xn )
en un point a ∈ I et que f 0 (a) 6= 0. Alors, la suite (xn )n∈N définie par xn+1 = xn − 0
f (xn )
converge quadratiquement vers a pour x0 assez proche de a.
Démonstration. :
Etape 1 : montrons l’existence d’un segment J = [a − h, a + h] sur lequel f 0 ne s’annule pas.
◦
Quitte à changer f en −f on peut supposer que f 0 (a) > 0. Comme a ∈ I et que f 0 est continue
en a (f étant C 2 ), il vient :
∀ε > 0, ∃h > 0, ∀x ∈ I, |x − a| ≤ h, |f 0 (a) − f 0 (x)| ≤ ε
et en particulier pour 0 < ε < f 0 (a), on a :
∀x ∈ [a − h, a + h], f 0 (x) > f 0 (a) − ε > 0
On pose ainsi J = [a − h, a + h] et on a bien f 0 > 0 sur J.
Etape 2 : Pour x ∈ J, posons F (x) = x −
f (x)
, bien définie cf étape 1.
f 0 (x)
Objectif : montrons qu’il existe C > 0 tel que |F (x) − a| ≤ C|x − a|2 et que quitte à diminiuer
J = [a − h, a + h] en prenant h plus petit, J est stable par F i.e |F (x) − a| ≤ h pour x ∈ J.
Remarquons pour commencer que F (a) = a et que sur J :
F 0 (x) = 1 −
f 0 (x)2 − f (x)f 00 (x)
f (x)f 00 (x)
=
=⇒ F 0 (a) = 0.
0
2
f (x)
f 0 (x)2
Evaluons donc la quantité F (x) − a pour x ∈ J. On a :
F (x) − a = (x − a) −
f 0 (x)(x − a) − f (x)
f (a) − f (x) − (a − x)f 0 (x)
f (x)
=
=
0
0
f (x)
f (x)
f 0 (x)
où l’on a rajouté f (a) = 0 au numérateur afin de pouvoir appliquer la formule de Taylor Lagrange.
Il existe c ∈]a, x[ (avec x > a ou x < a) tel que :
F (x) − a =
f 00 (c)(x − a)2
2f 0 (x)
Alors, J étant compact et f de classe C 2 , f 0 et f 00 y sont bornées et :
|F (x) − a| ≤
maxx∈J |f 00 (x)|(x − a)2
maxx∈J |f 00 (x)|
≤ C(x − a)2 où C =
.
0
2 minx∈J |f (x)|
2 minx∈J |f 0 (x)|
Ainsi, |F (x) − a| ≤ Ch2 et quitte à réduire h en prenant h <
donc |F (x) − a| ≤ h ce qui établit la stabilité de J par F .
1
, on peut supposer Ch2 < h et
C
Etape 3 : montrons que pour x0 ∈ J, (xn ) converge quadratiquement vers a. La stabilité de J
par F , nous assure que pour x0 ∈ J, (xn )n∈N est bien définie. De plus, pour n ∈ N, on a :
|xn+1 − a| = |F (xn ) − F (a)| ≤ C(xn − a)2 .
En multipliant à gauche par C > 0, on a alors C|xn+1 − a| ≤ (C|xn − a|)2 et par une récurrence
immédiate :
n
n
C|xn − a| ≤ (C|x0 − a|)2 ≤ (Ch)2 .
Comme Ch < 1, on a bien la convergence quadratique de (xn )n∈N vers a, pour x0 pris assez
proche de a.
Proposition 1. Sous les hypothèses du théorème précédent, avec toujours f 0 (a) > 0 et en supposant de plus f convexe sur I et f 00 ne s’annulant pas sur I, la convergence de la suite (xn )
(xn+1 − a)
f 00 (a)
vers a est assuré pour x0 > a et de plus
∼
(xn − a)2 +∞ 2f 0 (a)
| {z }
>0
2
Démonstration. :
Etape 1 : montrons que I ∩ {x ≥ a} = I ∩ [a, +∞[ est stable par F . La fonction f étant convexe
sur I et f de classe C 2 , on a en particulier f 00 ≥ 0 et f 0 est croissante sur I, ce qui nous assure :
f 0 (x) ≥ f 0 (a) > 0 pour x ≥ a =⇒ F est bien définie pour x ≥ a.
De plus comme f 0 > 0 pour x ≥ a, la fonction f est strictement croissante sur [a, +∞[ et donc
f (x) > f (a) = 0 pour x > a puis
F (x) = x −
f (x)
< x pour x > a (1)
f 0 (x)
| {z }
>0
En appliquant, le théorème de Taylor-Lagrange sur [a, x] où x > a, on a de nouveau l’existence
de c ∈]a, x[ tel que :
F (x) − a =
f 00 (c)(x − a)2
≥ 0 car f 0 > 0 et f 00 > 0 (2)
2f 0 (x)
On déduit de (1) et (2) que pour x ∈ I ∩ {x ≥ a}, on a :
F (x) ∈ [a, x[ où a, x ∈ I =⇒ F (x) ∈ I ∩ {x ≥ a}
Alors, la suite (xn ) est bien définie pour tout x0 ∈ I ∩ {x ≥ a}. Si x0 = a, la suite (xn ) est
stationnaire, égale à a, sinon comme F (x) < x pour x > a, elle est strictement décroissante et
est minorée par a. Donc elle converge vers une limite l ≥ a qui est par continuité de F , un point
fixe de F . Pour x ≥ a, un point fixe de F correspond à un zéro de f et le seul cas possible est
donc l = a car f (x) > f (a) = 0 pour x > a.
(xn+1 − a)
f 00 (a)
∼
. Pour x0 > a, xn > a pour tout n ∈ N∗ d’après
(xn − a)2 +∞ f 0 (a)
(2) et comme précédemment, on a l’existence de cn ∈]a, xn [ tel que :
Etape 2 : montrons que
F (xn ) − F (a) = xn+1 − a =
f 00 (cn )(xn − a)2
2f 0 (xn )
Puisque (xn ) converge vers a, par encadrement, (cn ) converge également vers a. Comme f est
C 2 , f 00 et f 0 sont continues et (f 00 (cn )) converge vers f 00 (a) et (f 0 (xn )) vers f 0 (a) ce qui donne
finalement :
(xn+1 − a)
f 00 (a)
∼
(xn − a)2 +∞ 2f 0 (a)
| {z }
>0
Référence : Rouvière.
Origine de la méthode
Pour résoudre f (x) = 0, on cherche à transformer cette équation, en un problème équivalent de
point fixe. On peut par exemple considérer une fonction λ qui ne s’annule pas et on pose :
F (x) = x + λ(x)f (x)
D’après Rouvière (premier exercice du chapitre sur les points fixes), on sait que la convergence
de la suite itérée xn+1 = F (xn ) vers le point fixe a sera d’autant plus rapide que le point est
super-attractif ie F 0 (a) = 0. Or, on a F 0 (a) = 1 + λ0 (a)f (a) + λ(a)f 0 (a) = 1 + λ(a)f 0 (a). On est
f (xn )
1
et à considérer xn+1 = xn − 0
donc incité à prendre λ(x) = − 0
f (x)
f (xn )
Méthode de Newton pour les polynômes.
Proposition 2. Soit P = X n + an−1 X n−1 + . . . + a1 X + a0 ∈ R[X] unitaire, dont toutes les
racines sont réelles P (X) = (X − α1 )m1 . . . (X − αr )mr avec αr > αr−1 > . . . > α1 . Alors, pour
P (xn )
x0 > αr , la suite itérée xn+1 = xn − 0
converge vers αr en décroissant.
P (xn )
3
Démonstration. :
Etape 1 : remarquons que P, P 0 et P 00 ne s’annulent pas sur ]αr , +∞[. D’après le théorème de
Gauss-Lucas, les zéros de P 0 sont dans l’enveloppe convexe des zéros de P ie dans [α1 , αr ] et donc
de même pour les zéros de P 00 . On en déduit ainsi, que pour x > αr , P, P 0 et P 00 ne s’annulent
pas et ont donc un signe constant. Puisque :
P 0 (X) = m1 (X − α1 )m1 −1 . . . (X − αr )mr + . . . + mr (X − α1 )m1 . . . (X − αr )mr −1
on a P 0 (x) > 0 pour x > αr . De même, le calcul explicite de P 00 donne P 00 (x) > 0 pour x > αr .
P (x)
admet une limite à droite en αr où f est bien
P 0 (x)
définie sur ]αr , +∞[, puisque P 0 ne s’y annule pas. On a alors :
Etape 2 : montrons que f : x 7−→ x −
P 0 (X) = m1
P (X)
P (X)
+ . . . + mr
(X − α1 )
(X − αr )
ce qui nous donne :
r
P
mi
P (X)
P 0 (X)
=
et 0
=
P (X)
(X
−
α
)
P
(X)
i
i=1
r
P
mi
X
− αi
i=1
−1
.
Ainsi,
lim x −
x→αr
x>αr
P (x)
= αr + x→α
lim
r
P 0 (x)
x>αr
1
= αr
mr
m1
+ ... +
(x − α1 )
(x − αr )
On prolonge ainsi par continuité la définition de f à [αr , +∞[ en posant f (αr ) = x→α
lim f (x) = αr .
r
x>αr
Etape 3 : montrons par un raisonnement par récurrence que :
x0 > αr =⇒ (xn )n∈N est bien définie et vérifie xn > αr , ∀n ∈ N.
Par hypothèse, x0 > αr . Soit n ≥ 1 tel que xn > αr . Alors,
xn > αr =⇒
P
P
(xn ) > 0 et xn+1 = xn − 0 (xn ) < xn .
P0
P
| {z }
>0
Il nous reste à montrer que xn+1 > αr , pour ce faire, on va montrer que f est strictement
croissante sur ]αr , +∞[. Puisque f est dérivable sur ]αr , +∞[, on a sur cet intervalle :
f 0 (x) = 1 −
P 0 (x)2 − P (x)P 00 (x)
P (x)P 00 (x)
=
>0
0
2
P (x)
P 0 (x)2
Alors, f 0 (x) > 0 pour x > αr et donc xn+1 = f (xn ) > f (αr ) = αr .
Conclusion : pour x0 > αr , (xn )n∈N est décroissante, minorée par αr donc convergente. Par
P
continuité de f , elle converge vers un point fixe de f sur [αr , +∞[ ie vers un zéro de 0 sur
P
P
[αr , +∞[. Comme 0 (x) 6= 0 si x > αr nécessairement lim xn = αr
n→∞
P
Proposition 3. Pour x0 > αr , on a x→α
lim f 0 (x) = 1 −
r
x>αr
1
. De plus,
mr
• si mr = 1, la convergence est quadratique.
n
1
• si mr > 1, ∃C > 0, (xn − αr ) ∼ C 1 −
∞
mr
Démonstration. :
r
P
1
mi
P 0 (x)
. Pour x > αr , on a
=
, ce qui
r
mr
P (x)
i=1 (x − αi )
x>αr
nous donne en dérivant cette dernière égalité :
Etape 1 : montrons que x→α
lim f 0 (x) = 1 −
r
r
P
P
P (x)P 00 (x) − P 0 (x)2
mi
mi
=−
⇐⇒ P (x)P 00 (x) = P 0 (x)2 − P (x)2
2
2
2
P (x)
i=1 (x − αi )
i=1 (x − αi )
4
soit encore :
00
P (x)P (x)
=1−
P 0 (x)2
P (x)
P 0 (x)
r
P
mi
(x − αi )2
mi
⇐⇒ f 0 (x) = 1 − i=1
2
2
r
P
mi
i=1 (x − αi )
i=1 (x − αi )
2
r
P
En multipliant, numérateur et dénominateur par (x − αr )2 , il vient :
r m (x − α )2
P
i
r
2
(x
−
α
)
1
mr
i
i=1
0
1
−
f
(x)
=
lim
lim
.
2 = 1 − 2 = 1 −
x→αr
x→αr
r
mr
mr
P mi (x − αr )
x>αr
x>αr
i=1 (x − αi )
Ainsi, f 0 admet une limite à droite en αr et f est C 1 sur [αr , ∞[ avec f 0 (αr ) = 1 −
1
.
mr
Cas 1 : Supposons mr = 1. Alors, P (X) = (X − α1 )m1 . . . (X − αr−1 )mr−1 (X − αr ) et par
définition même de la multiplicité d’une racine, P 0 (αr ) 6= 0. De plus P 0 est clairement C 2 sur un
voisinage de αr , ce qui donne cf le théorème 1, une convergence quadratique de (xn )n∈N vers αr .
Cas 2 : on suppose ici que mr > 1 et donc f 0 (αr ) = 1 −
1
∈ ]0, 1[.
mr
Méthode : montrons que ln(xn − αr ) − n ln(f 0 (αr )) converge vers un certain λ ∈ R. On aura
0
lim ln(xn − αr ) − n ln(f 0 (αr )) = λ =⇒ eln(xn −αr )−n ln(f (αr )) ∼ eλ et donc :
n→∞
∞
n
1
(xn − αr ) ∼ eλ f 0 (αr )n = C 1 −
pour C = eλ > 0.
∞
mr
Par la formule de Taylor-Lagrange, il existe zn ∈]αr , xn [ tel que :
(xn+1 − αr ) = f (xn ) − f (αr ) = f 0 (αr )(xn − αr ) + f 00 (zn )
(xn − αr )2
.
2
Soit :
xn+1 − αr
f 00 (zn ) (xn − αr )
=
1
+
f 0 (αr )(xn − αr )
f 0 (αr )
2
On pose alors εn =
xn+1 − αr
0
f (αr )(xn − αr )
− 1, d’où l’on déduit immédiatement εn = O(xn − αr ).
Montrons que :
(xn − αr ) = O(dn ) pour un d tel que 0 < d < 1.
Comme mr ≥ 2, on a f 0 (αr ) ∈]0, 1[ et comme précédemment, par le théorème des accroissements
finis :
∃yn ∈]αr , xn [, (xn+1 − αr ) = f (xn ) − f (αr ) = f 0 (yn )(xn − αr )
et lim f 0 (yn ) = f 0 (αr ). En particulier pour ε > 0 tel que 0 < d = ε + f 0 (αr ) < 1 on a :
n→∞
∃N ∈ N, ∀n ≥ N, |f 0 (yn ) − f 0 (αr )| ≤ ε
soit :
∃N ∈ N, ∀n ≥ N, f 0 (yn ) ≤ d
Ainsi, pour n ≥ N on a : (xn+1 − αr ) = f 0 (yn )(xn − αr ) ≤ d(xn − αr ). Par une récurrence
immédiate, on a donc pour n ≥ N :
(xn − αr )
1
≤ N (xN − αr ) =⇒ (xn − αr ) = O(dn )
dn
d
où d < 1. Ainsi, lim εn = 0 et ln(1 + εn ) = εn + o(εn ) = o(dn ). Introduisons alors la série :
n→∞
∞
P
ln(xn+1 − αr ) − ln(xn − αr ) − ln(f 0 (αr ))
{z
}
n≥0 |
(xn − αr ) ≤ dn−N (xN − αr ) =⇒
=ln(1+εn )=o(dn )
5
qui est donc convergente puisque 0 < d < 1. Ses sommes partielles convergent donc vers un réel
que l’on note µ :
lim
n−1
P
n→∞ k=0
ln(xk+1 − αr ) − ln(xk − αr ) − ln(f 0 (αr )) = µ
soit lim ln(xn − αr ) − n ln(f 0 (αr )) = µ + ln(x0 − αr ) = λ.
n→∞
λ
0
n
Conclusion : on a alors (xn − αr ) ∼ e (f (αr )) ∼= e
λ
∞
1
1−
mr
n
soit le résultat souhaité
λ
avec C = e > 0.
Remarque 1. La connaissance des racines n’est pas nécessaire pour choisir x0 > αr . On s’assure
n−1
P
en effet que x0 > αr en prenant x0 > max(1,
|ai |). Pour trouver, les autres racines on applique
i=0
la méthode de Newton précédente successivement à P1 =
P (X)
P1
, P2 =
, . . ..
m
(X − αr )
(X − αr−1 )mr−1
Démonstration. Soit P = X n + an−1 X n−1 + . . . + a1 X + a0 et α racine de P . On a :
n−1
P
|αn | = |
ai αi | ≤
i=0
n−1
P
|ai |.|α|i
i=0
Si |α| ≥ 1, en divisant par |α|n−1 des deux côtés, on a : |α| ≤
n−1
P
|ai |.|α|i−(n−1) . Comme i ≤ n−1,
i=0
n−1
P
et |α| ≥ 1, on a |α|i−(n−1) ≤ 1 et donc si |α| ≥ 1, on a |α| ≤
on a donc |α| ≤ max(1,
n−1
P
|ai |.
i=0
n−1
P
i=0
i=0
|ai |). Ainsi, en prenant x0 > max(1,
Pour toute racine α de P ,
|ai |) on a x0 > |α| ≥ α.
On peut également démontrer le résultat suivant mais qui est moins fort que le résultat précédemment invoqué, la convergence géométrique étant moins rapide que la convergence quadratique.
Cependant il est important de savoir que la convergence de la méthode de Newton pour les
polynômes est meilleure, dans le cas où le polynôme est à racines simples. On a en effet :
Remarque 2. Si mr = 1, ∀c > 0, xn − αr = o(cn )
Démonstration. On suppose mr = 1, montrons que ∀c > 0, xn − αr = o(cn ). Comme mr = 1, on
a f 0 (αr ) = 0. Soit n ∈ N, f étant continue sur [αr , xn ], dérivable sur ]αr , xn [, par le théorème
des accroissements finis :
∃yn ∈]αr , xn [, (xn+1 − αr ) = f (xn ) − f (αr ) = f 0 (yn )(xn − αr )
Comme lim xn = αr , par encadrement, on a aussi lim yn = αr et f 0 admettant une limite à
n→∞
n→∞
droite en αr , on a :
lim f 0 (yn ) = f 0 (αr ) = 1 −
n→∞
1
=0
mr
En particulier :
∀c > 0, ∃N ∈ N, ∀n ≥ N, |f 0 (yn )| = f 0 (yn ) ≤ c
Ainsi, pour c fixé et n ≥ N on a : (xn+1 −αr ) = f 0 (yn )(xn −αr ) ≤ c(xn −αr ). Par une récurrence
immédiate, on a donc pour n ≥ N :
(xn − αr )
1
≤ N (xN − αr )
n
c
c
et (xn − αr ) = O(cn ) et ceci pour tout c > 0. Ainsi, quitte à prendre d < c, on a :
(xn − αr ) ≤ cn−N (xN − αr ) =⇒
(xn − αr ) = O(dn ) où dn = o(cn ) =⇒ (xn − αr ) = o(cn ) pour tout c > 0.
Référence : Chambert-Loir.
Téléchargement