Petits exposés variés Xavier Dupré http ://www.xavierdupre.fr/

Téléchargement

Petits exposés variés

Xavier Dupré

http ://www.xavierdupre.fr/

Table des matières

0.0.1 Enoncé .......................................... 2

0.0.2 Algorithme et convergence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

0.0.3 Méthodedusecondordre ................................ 5

0.0.4 Minimisation avec gradient stochastique . . . . . . . . . . . . . . . . . . . . . . . . 7

0.0.5 Premier exemple : optimisation d’une fonction quadratique . . . . . . . . . . . . . 9

0.0.6 Court rappel sur l’estimateur du maximum de vraisemblance . . . . . . . . . . . . 9

0.0.7 Second exemple : proportion de mâles chez les poissons . . . . . . . . . . . . . . . . 13

0.0.8 Correction......................................... 14

0.0.9 Premier exemple, fonction quadratique . . . . . . . . . . . . . . . . . . . . . . . . . 14

0.0.10 Second exemple, proportion de mâles et de femelles chez les poissons . . . . . . . . 17

0.0.11 Simulation d’une série (Xi)i............................... 17

0.0.12 Estimation des paramètres avec une méthode du premier degré . . . . . . . . . . . 18

0.0.13 Estimation des paramètres avec une méthode du second degré . . . . . . . . . . . . 22

Index 25

0.0.1 Enoncé

Lorsqu’on doit trouver le minimum d’une fonction déﬁnie sur un espace vectoriel, le premier réﬂexe consiste

à dériver la fonction puis à l’annuler de manière à obtenir un système d’équation. Il reste ensuite à

déterminer si les zéros de la dérivée correspondent à un minimum ou à un maximum. Cependant, il n’est

pas toujours possible de résoudre le système d’équation obtenu. Par exemple, la fonction f(x) = cos(x)+ex

a pour dérivée f0(x) = −sin(x) = ex. Résoudre l’équation f0(x)=0est impossible.

C’est pourquoi il existe des méthodes de résolution approchées qui déterminent numériquement le minimum

de la fonction. Il existe des algorithmes permettant de trouver une solution approchée à condition toutefois

que la fonction à maximiser ou minimiser soit dérivable. Plusieurs variantes sont proposées regroupées

sous le terme de descente de gradient ou méthode de Newton. Par la suite, on cherchera à minimiser une

fonction g. Maximiser cette même fonction revient à minimiser la fonction −g.

0.0.2 Algorithme et convergence

Soit g:ℝd−→ ℝune fonction dérivable dont il faut trouver ∗

x= arg min

x∈ℝ

g(x). L’algorithme suivant

propose une méthode permettant à partir d’un x0∈ℝdquelconque de se rapprocher petit à petit du

TABLE DES MATIÈRES 3

minimum x∗comme le montre le schéma 0.1 dans le cas où g(x) = x2.

Algorithme 0.1 : descente de gradient de Newton

Soit g:ℝd−→ ℝune fonction dérivable et minorée. On cherche à déterminer le minimum de la

fonction g. Soit x0∈ℝd. Soit (t)t⩾0une suite réelle positive vériﬁant :

∞

t=0

t=∞et ∞

t=0

2

t<∞

Etape A : initialisation

t←− 0

Etape B : mise à jour

t←− t+ 1

xt←− xt−1−t∂g

∂x (xt)

Etape C : condition d’arrêt

Si f(xt)≈f(xt−1), l’algorithme s’arrête, sinon on retourne à l’étape B.

On note xtl’abscisse à l’itération t.

On note ∂g (xt)

∂x le gradient de g(x) = x2.

L’abscisse à l’itération t+ 1 sera :

xt+1 =xt−εt∂g (xt)

∂x 

εtest le pas de gradient à l’itération t.

Figure 0.1 : Minimisation par descente de gradient. A chaque itération, on se déplace dans le sens opposé à celui

du gradient, direction le minimum est susceptible de se trouver.

L’étape C détermine si l’algorithme doit continuer à chercher le minimum de la fonction gou si la valeur

approchée est satisfaisante puisque, aux alentours de ce minimum, le gradient est presque nul et la suite (xt)

presque constante. La condition f(xt)≈f(xt−1)peut par exemple être interprétée comme une diﬀérence

relative d’une itération à la suivante : 

f(xt)−f(xt−1)

f(xt−1)< A où Aest une constante positive petite. Plus elle

est petite, plus la précision sera grande. Il est aussi possible d’arrêter l’algorithme dès que f(xt)> f (xt−1)

mais la suite (f(xt))tn’est pas toujours décroissante, c’est pourquoi la condition d’arrêt précédente est

préférable.

La suite (t)tdoit vériﬁer quelques contraintes comme la suite t=0

1+t. Ces contraintes assurent la

TABLE DES MATIÈRES 4

convergence de l’algorithme vers un minimum de la fonction comme le montre le théorème suivant.

Théorème 0.2 : convergence de la méthode de Newton (Bottou1991)

Soit une fonction continue g:W∈ℝM−→ ℝ, de classe C1. On suppose les hypothèses suivantes

vériﬁées :

H1 arg min

W∈ℝq

g(W) = {W∗}est un singleton

H2 ∀ε > 0,inf

|W−W∗|>ε (W−W∗)0.∇g(W)>0

H3 ∃(A, B)∈ℝ2tels que ∀W∈ℝp,k∇g(W)k2⩽A2+B2kW−W∗k2

H4 la suite (εt)t⩾0vériﬁe, ∀t > 0, εt∈ℝ∗

+et P

t⩾0

εt= +∞,P

t⩾0

ε2

t<+∞

Alors la suite (Wt)t⩾0construite de la manière suivante :

W0∈ℝMet ∀t⩾0, Wt+1 =Wt−εt∇g(Wt)

vériﬁe lim

t−→+∞Wt=W∗

L’hypothèse H1 implique que le minimum de la fonction gest unique et l’hypothèse H2 implique que le

demi-espace déﬁni par l’opposé du gradient contienne toujours le minimum de la fonction g.

Démonstration (théorème 0.2) :

Partie A (démonstration de 0.2)

Soit la suite ut= ln 1 + ε2

tx2avec x∈ℝ,comme P

t⩾0

ε2

t<+∞, ut∼ε2

tx2,on a P

t⩾0

ut<+∞

Par conséquent, si vt=eutalors

t=1

T→∞

−→ D∈ℝ

Partie B (démonstration de 0.2)

On pose ht=kWt−W∗k2

Donc :

ht+1 −ht=kWt−εt∇g(Wt)−W∗k2− kWt−W∗k2(0.1)

Par conséquent :

ht+1 −ht=−2εt(Wt−W∗)0∇g(Wt)

| {z }

+ε2

tk∇C(Wt)k2⩽ε2

tk∇g(Wt)k2⩽ε2

tA2+B2ht

D’où :

ht+1 −ht1 + ε2

tB2⩽ε2

tA2

On pose πt=

k=1 1 + ε2

kB2−1alors, en multipliant des deux côtés par πt+1,on obtient :

TABLE DES MATIÈRES 5

πt+1ht+1 −πtht⩽ε2

tA2πt+1

d’où πq+1hq+1 −πphp⩽

t=p

ε2

tA2πt+1 ⩽

t=p

ε2

tA2Π⩽

t=p

ε2

tA2Π−→

t−→∞ 0

Comme la série P

(πt+1ht+1 −πtht)vériﬁe le critère de Cauchy, elle est convergente. Par conséquent :

lim

q→∞πq+1hq+1 = 0 = lim

q→∞Πhq+1

D’où :

lim

q→∞hq= 0 (0.2)

Partie C (démonstration de 0.2)

La série P

(ht+1 −ht)est convergente car Πht∼πtht.

t⩾0

ε2

tk∇g(Wt)k2l’est aussi (d’après H3).

D’après (0.1), la série P

t⩾0

εt(Wt−W∗)0∇g(Wt)est donc convergente. Or d’après les hypothèses (H2, H4),

elle ne peut l’être que si :

lim

t→∞Wt=W∗(0.3)

(0.2) u

Ce théorème peut être étendu dans le cas où la fonction gn’a plus un seul minimum global mais plusieurs

minima locaux (voir [?]), dans ce cas, la suite (Wt)converge vers un mimimum local. Une généralisation

de ce théorème est présentée dans [?].

Si ce théorème prouve la convergence de la méthode de Newton, il ne précise pas à quelle vitesse cette

convergence s’eﬀectue et celle-ci peut parfois être très lente. Plusieurs variantes ont été développées regrou-

pées sous le terme de méthodes de quasi-Newton, ou méthodes du second ordre, dans le but d’améliorer

la vitesse de convergence.

0.0.3 Méthode du second ordre

L’algorithme 0.1 fournit le canevas des méthodes d’optimisation du second ordre. Seule la mise à jour des

coeﬃcients (étape B) est diﬀérente : elle prend en compte les dernières valeurs des coeﬃcients ainsi que

les derniers gradients calculés. Ce passé va être utilisé pour estimer une direction de recherche pour le

minimum diﬀérente de celle du gradient, cette direction est appelée gradient conjugué (voir [?]).

La ﬁgure 0.2 est couramment employée pour illustrer l’intérêt des méthodes d’optimisation du second ordre

ou méthode de gradient conjugué. Le problème consiste à trouver le minimum d’une fonction quadratique,

par exemple, G(x, y)=3x2+y2. Tandis que le gradient est orthogonal aux lignes de niveaux de la fonction

G, le gradient conjugué se dirige plus sûrement vers le minimum global.

Ces techniques sont basées sur une approximation du second degré de la fonction à minimiser. On note

toujours g:ℝd−→ ℝla fonction à minimiser. Au voisinage de x0, un développement limité donne :

g(x) = g(x0) + ∂g (x0)

∂x (x−x0)+(x−x0)0∂2g(x0)

∂x2(x−x0) + okx−x0k2

1 / 27 100%

Documents connexes

Montage 21 Auto induction tension énergie

Une terre artificielle (par ON5HQ)

Internationalisation extension QGIS : Procédure

TP simulation électrique : Examen 23 mars 2005

Mémo Python - Physapchim.org

Université Mohammed V Agdal Faculté des Sciences Département

Pour affichage - Semaine Sécurité Patient 2016

redresseur monophase a regulateur integre

que doit contenir un rapport - ISIL-Electro

Règlement du service d`hébergement

TP4

Les troubles du self au carrefour des psychothérapies

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Petits exposés variés Xavier Dupré http ://www.xavierdupre.fr/

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Petits exposés variés Xavier Dupré http ://www.xavierdupre.fr/

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib