Statistiques
Mohamed BOUTAHAR 1
4 octobre 2005
1Département de mathématiques case 901, Faculté des Sciences de Luminy. 163 Av.
de Luminy 13288 MARSEILLE Cedex 9, et GREQAM, 2 rue de la vieille charité 13002.
Table des matières
1 Les modèles statistiques 3
1 Modèlestatistique ............................ 3
2 Statistique................................. 6
3 Modèlesexponentiels........................... 8
4 Exercices.................................. 10
2 Théorie de l’estimation 12
1Dénitions................................. 12
2 Modèles linéaires ............................. 15
3 Méthodesdestimations.......................... 16
3.1 Estimateurdesmoindrescarrés................. 16
3.2 Estimateursempiriques...................... 18
3.3 Estimateurdumaximumdevraisemblance .......... 19
4 InformationdeFisher........................... 21
5 Estimation par région de conance ................... 24
5.1 Intervalle de conance pour la moyenne d’un échantillon gaussien 25
5.2 Intervalle de conance pour la variance d’un échantillon gaussien 26
5.3 Intervalle de conance pour les paramètres de régression . . . 26
6 Annexe:Preuvedulemme1....................... 27
7 Exercices.................................. 29
3Estimation:Théorieasymptotique 31
1 ConsistancedeLestimateur....................... 31
2 Convergenceenloi ............................ 32
3 Exercices.................................. 36
4 Annexe:Théorèmescentraleslimites.................. 37
4.1 ThéorèmedeLindeberg ..................... 37
4 Théorie du test d’hypothèses 38
1 Tests d’hypothèses simples ........................ 40
2 Tests unilares .............................. 41
3 Tests bilatères . .............................. 43
1
MASTER M1 :Statistiques-M.Boutahar 2
4 Tests sans biais .............................. 44
5 Exercices.................................. 45
5 Méthodes de test d’hypothèses 46
1 Testderapportdevraisemblance .................... 46
2 Test d’adéquation de X2......................... 48
2.1 Testdindépendancededeuxvariablesaléatoires........ 49
3 TestdeKolmogorov-Smirnov ...................... 50
4 Testsdecomparaison........................... 51
4.1 TestdecomparaisondeKolmogorov-Smirnov ......... 52
4.2 TestdecomparaisondeMann-Whitney-Wilcoxon ....... 52
5 Exercices.................................. 52
Chapitre 1
Les modèles statistiques
1 Modèle statistique
Il est très dicile de donner une dénition de la statistique, mais son but est de
trouver un modèle mathématique capable de décrire le comportement du phénomène
étudié et ceci en se basant sur le traitement des données numériques.
Exemples :
1) Un physicien réalise nmesures d’une grandeur physique µ. Chaque mesure est
entachée d’erreur, et souhaite avoir une meilleure idée sur cette grandeur.
2) Un client d’usine achète Nexemplaires d’une machine. Il veut savoir quelle est
la proportion pd’appareils déectueux. Il teste alors un échantillon de taille npour
avoir une information sur p.
3) Le ministre des transports souhaite avoir une prévision du nombre d’accidents en
fonction des voitures immatriculées.
Formalisation des exemples
1) On observe (X1, ..., Xn)avec
Xi=µ+ui,i=1, ..., n.
µest la vraie valeur inconnue, et uiest l’erreur.
2) les nexemplaires testés sont choisis " au hasard " avec un tirage sans remise,
parmi Nmachines dont pN sont déectueuses et (1 p)Nen ordre de marche.
E={0,1, ...., n},X(ω)= nombre d ’appareil déectueux trouvés ; la variable aléa-
toire Xsuit alors une loi hypergéométrique (Np,N,n),il reste alors à estimer psur
la base de cet échantillon.
3) Pour répondre à ce problème, souvent un modèle de régression simple donne des
résultats satisfaisants :
accidentsi=b1+b2voituresi+ui,i=1, ..., n.
Il reste alors à estimer par les méthodes d’estimations classiques, qui dépendent
souvent des hypothèses faites sur le bruit ui,les paramètres b1et b2.
3
MASTER M1 :Statistiques-M.Boutahar 4
Il se pose alors le problème suivant : Quelles hypothèses faire sur le bruit ui?, on
suppose souvent les hypothèses suivantes :
i) les variables aléatoires uisont indépendantes et identiquement distribuées,
ii) les variables aléatoires uisont indépendantes,
iii) les variables aléatoires uisont indépendantes et identiquement distribuées suivant
la loi N(0
2),
iv) idem que iii) et on suppose que σ2est connue.
La règle générale est bien évidemment plus on connaît mieux notre phénomène, plus
on se permet de supposer d’avantage des hypothèses sur ui,cependantplusonfait
d’hypothèses, plus on pourra tirer des observations des conclusions détaillées. Mais
les conclusions risquent d’être erronées si les hypothèses ne sont pas adaptées. Le
statisticien est alors confronter à deux problèmes fondamentaux :
1) Comment vérier qu’il y’a cohérence entre les données et les hypothèses faites ?
(adéquation du modèle) 2) Comment vérier si les conclusions que nous tirons sont
peu ou très sensibles aux hypothèses faites ?(étude de la robustesse du modèle retenu)
Denition 1 On appelle modèle statistique unefamilledespacesdeprobabilités
(E,E,P
θΘ)Θest l’espace des paramètres.
Dans la pratique, E=Rou E=Rp, on notera Xl’application (,F,P)
(E,E,P
θ). En général X=(X1, ..., Xn)et X(ω),est l’observation ou le ré-
sultat de l’expérience, Pθest la loi inconnue de X, c’est à dire que Pθest la mesure
image de Ppar l’application X.
Dans l’exemple 1. : Si on suppose que uiest une suite i.i.d. de loi N(µ, σ2),avec
σ2inconnu, alors θ=(µ, σ2),Pθ={N(µ, σ2)}net Θ=R×R+
Dans l’exemple 2. : Θ=©0,1
N, ..., , N
Nª=p,
Pθ=loihypergéométrique(Nθ,N,n).
Dans l’exemple 3. : Si on suppose que uiest une suite i.i.d. de loi N(0
2),avec σ2
inconnu, que la variable explicative voitureiest déterministe (ce qui est souvent le
cas) alors θ=(b1,b
2
2),Θ=R2×R+et
Pθ=
n
Y
i=1 ©N(b1+b2voiturei
2)ª.
Denition 2 Soit Qθune loi de probabilité sur un espace (E1,E1).Onappelle
échantillon de taille nde loi Qθun vecteur X=(X1, ..., Xn),oùles(Xi)1in
sont i.i.d. de loi Qθ.
Le modèle statistique correspondant est E=En
1,E=En
1,Pθ=Qn
θ.
On dit que le modèle est paramétrique s’il existe un entier k,telqueΘRk,non
paramétrique dans le cas contraire. Les exemples ci-dessus correspondent bien à un
modèle paramétrique ; un exemple de modèle non paramétrique est l’estimation de
1 / 58 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !