Objectifs
Estimation de l’erreur
Strat´
egie pour ngrand
Strat´
egie avec p´
enalisation
Estimation par simulation
G´
en´
eralit´
es
Objectifs
Comment ´
evaluer la performance d’un mod`
ele statistique ?
On dispose de donn´
ees D«´
etiquet´
ees »D= (X1,Y1). . . (Xn,Yn)
´
Evaluer de fac¸on fiable la performance (fiabilit ´
e, confiance) d’un
mod`
ele est important pour ensuite pouvoir choisir le meilleur.
On propose g´
en´
eralement trois strat´
egies :
une possibilit´
e de partager Den deux parties : l’une pour
l’apprentissage du mod`
ele, l’autre pour le test
D=Dtrain ∪ Dtest
une p´
enalisation du biais par la complexit ´
e du mod`
ele lors de la
phase d’ajustement (apprentissage) du mod`
ele
un usage intensif de calcul par simulations statistiques complexes
Quel mod`
ele pour obtenir la meilleure fiabilit´
e de pr´
ediction
Cas id´
eal : on poss`
ede deux ´
echantillons, train et test
Cas standard : on poss`
ede des donn´
ees non s´
epar´
ees en train
et test. D´
ecomposition de Dou strat´
egie de p´
enalisation
Cas plus p´
enible : on poss`
ede peu d’´
echantillons
d’apprentissage : utilisation de simulations.
S´
ebastien Gadat S´
eance 7: ´
Evaluation de la qualit´
e de pr´
ediction