Notions de gradient stochastique.

Téléchargement

Quelques notions sur

le gradient stochastique

Pr´

esentation du probl`

eme

min

u∈Uad⊂U

J(u) avec J(u) = Eju,w

La variable un’est pas al´eatoire : la mˆeme valeur de us’applique `a

toutes les valeurs prises par la variable al´eatoire w:boucle ouverte.

Si on est prˆet `a calculer des esp´erances, on retombe exactement sur

le cas de l’optimisation d´eterministe sur un ensemble admissible.

Mais on veut souvent ´eviter de tels calculs de l’esp´erance. . .

Exemple : calcul par Monte Carlo E[w] = arg min

u∈R

2E(u−w)2.

u(k+1) =1

k+ 1

k+1

l=1

w(l)

=u(k)−1

k+ 1 `u(k)−w(k+1)´

Iu(k)−w(k+1) : gradient de la fonction sous l’esp´erance ;

k+1 : pas kde l’algorithme (k→0 “pas trop vite”).

Algorithme du gradient stochastique

On remplace l’´evaluation du gradient de la fonction Jau point u(k)

(E∇uju(k),w) par une ´evaluation du gradient de la fonction j

pour une valeur w(k+1) de l’al´ea (∇uju(k),w(k+1)).

Algorithme.

1. Choisir u(0) ∈Uad et {(k)}k∈Nsuite de r´eels positifs.

2. `

A l’it´eration k, eﬀectuer un tirage al´eatoire w(k+1) de w,

ind´ependamment des tirages pr´ec´edents (w(1), . . . , w(k)).

3. Remettre `a jour u`a l’aide du gradient de jen (u(k),w(k+1)) :

u(k+1) =projUad hu(k)−(k)∇uju(k),w(k+1)i.

4. Incr´ementer l’indice kde 1 et retourner `a l’´etape 2.

Mise en œuvre.

ITest d’arrˆet de l’algorithme.

IChoix des coeﬃcients (k).

Propri´

et´

es du gradient stochastique

Convergence.

La suite des u(k)(vues comme des variables al´eatoires d´ependant

des tirages w(k)) converge presque-sˆurement vers la solution u]

(d´eterministe) du probl`eme. Les conditions sur les pas sont :

k∈N

(k)= +∞et X

k∈N(k)2<+∞.

IExemple standard :(k)=α

kγ+βavec γ∈1

2,1.

Vitesse asymptotique (Uad =U:pas de projection !).

On dispose d’un th´eor`eme de la limite centrale :

√(k)u(k)−u]L

−→ N0,Σ,

La vitesse maximale est obtenue pour γ= 1 ((k)=α

k+β).

Efficacit´

e asymptotique et moyennisation

Algorithme de type Newton.

Dans la classe des algorithmes `a gain matriciel :

u(k+1) =u(k)−A

k+β∇uju(k),w(k+1),

le minimum Σ?de la covariance Σ est atteint en A=∇2J(u])−1

Algorithme moyenn´e.

L’algorithme de gradient stochastique moyenn´e :

u(k+1) =u(k)−(k)∇uj(u(k),w(k+1)),

u(k+1) =1

k+ 1

k+1

l=1

u(l),

atteint la covariance minimale Σ?, avec (k)=α

kγ+β,1

2< γ < 1:

√kb

u(k)−u]L

−→ N0,Σ?.

1 / 6 100%

Documents connexes

TP4

Sujet

VII. Réactions nucléaires et temps de chute libre

Séparation des cellules A partir de biopsie

Minimisation de la variation totale 1 Fonctionnelle approchée

Ecrit Intermédiaire 1 Recherche locale 2 Hill-climbing 3

Générateur de permutation aléatoire Loi du 2i`emepile

Programmation Mathématique

Simulation de lois classiques

Optimisation sous contrainte en probabilité (résumé de

Proposition de thèse - Ecole Doctorale Carnot Pasteur

TP 3 - Département de Mathématiques d`Orsay

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d'utilisation

Notions de gradient stochastique.

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Notions de gradient stochastique.

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib