MASTER M1 :Statistiques-M.Boutahar 4
Il se pose alors le problème suivant : Quelles hypothèses faire sur le bruit ui?, on
suppose souvent les hypothèses suivantes :
i) les variables aléatoires uisont indépendantes et identiquement distribuées,
ii) les variables aléatoires uisont indépendantes,
iii) les variables aléatoires uisont indépendantes et identiquement distribuées suivant
la loi N(0,σ
2),
iv) idem que iii) et on suppose que σ2est connue.
La règle générale est bien évidemment plus on connaît mieux notre phénomène, plus
on se permet de supposer d’avantage des hypothèses sur ui,cependantplusonfait
d’hypothèses, plus on pourra tirer des observations des conclusions détaillées. Mais
les conclusions risquent d’être erronées si les hypothèses ne sont pas adaptées. Le
statisticien est alors confronter à deux problèmes fondamentaux :
1) Comment vérifier qu’il y’a cohérence entre les données et les hypothèses faites ?
(adéquation du modèle) 2) Comment vérifier si les conclusions que nous tirons sont
peu ou très sensibles aux hypothèses faites ?(étude de la robustesse du modèle retenu)
Definition 1 On appelle modèle statistique unefamilled’espacesdeprobabilités
(E,E,P
θ,θ ∈Θ)où Θest l’espace des paramètres.
Dans la pratique, E=Rou E=Rp, on notera Xl’application (Ω,F,P)→
(E,E,P
θ). En général X=(X1, ..., Xn)et X(ω),ω ∈Ω,est l’observation ou le ré-
sultat de l’expérience, Pθest la loi inconnue de X, c’est à dire que Pθest la mesure
image de Ppar l’application X.
Dans l’exemple 1. : Si on suppose que uiest une suite i.i.d. de loi N(µ, σ2),avec
σ2inconnu, alors θ=(µ, σ2),Pθ={N(µ, σ2)}net Θ=R×R+
Dans l’exemple 2. : Θ=©0,1
N, ..., , N
Nª,θ =p,
Pθ=loihypergéométrique(Nθ,N,n).
Dans l’exemple 3. : Si on suppose que uiest une suite i.i.d. de loi N(0,σ
2),avec σ2
inconnu, que la variable explicative voitureiest déterministe (ce qui est souvent le
cas) alors θ=(b1,b
2,σ
2),Θ=R2×R+et
Pθ=
n
Y
i=1 ©N(b1+b2voiturei,σ
2)ª.
Definition 2 Soit Qθune loi de probabilité sur un espace (E1,E1).Onappelle
échantillon de taille nde loi Qθun vecteur X=(X1, ..., Xn),oùles(Xi)1≤i≤n
sont i.i.d. de loi Qθ.
Le modèle statistique correspondant est E=En
1,E=E⊗n
1,Pθ=Qn
θ.
On dit que le modèle est paramétrique s’il existe un entier k,telqueΘ⊂Rk,non
paramétrique dans le cas contraire. Les exemples ci-dessus correspondent bien à un
modèle paramétrique ; un exemple de modèle non paramétrique est l’estimation de