L`essentiel des statistiques inférentielles

publicité
PRÉSENTATION
Le formidable développement des outils informatiques et de leur puissance de calcul permet de
traiter de très grands nombres de données, d’obtenir rapidement des résultats et des interprétations et il est peu de domaines aujourd’hui qui ne fassent appel aux statistiques comme sources
d’informations. Que l’on s’intéresse à la physique, fondamentale ou appliquée, que l’on travaille
dans la finance, le commerce, l’assurance, la biologie, dans le monde de la recherche comme dans
celui de l’entreprise, les données sont relevées, analysées et exploitées.
La première tâche de la statistique consiste à décrire de façon précise et rigoureuse les ensembles
qu’elle étudie sous l’angle particulier qui l’intéresse mais la tâche ne s’arrête pas là. Au-delà des
observations qu’elle peut effectuer, la statistique cherche à construire des modèles, à élaborer
des hypothèses plus ou moins probables concernant certains événements échappant à son
observation directe ; soit parce que ces événements concernent des ensembles plus vastes que ceux
qui ont été observés, soit qu’il s’agisse d’événements à venir.
Cette deuxième phase de l’étude statistique, appelée statistique inductive ou statistique inférentielle
part des résultats obtenus sur les échantillons observés et, connaissant les différents modèles développés par la théorie des probabilités, permet d’élaborer des hypothèses valables avec de fortes
probabilités portant sur la population alors même que celle-ci n’aura pas été observée de façon
exhaustive.
Un premier ouvrage reprend les bases de la théorie des probabilités et les lois de probabilités
permettant la modélisation de situations concrètes. Dans ce deuxième ouvrage, les méthodes
de la statistique inférentielle sont étudiées, d’une part, avec la résolution de problèmes d’estimations de paramètres et, d’autre part, avec des problèmes portant sur le contrôle des normes à
partir de l’observation d’échantillons ou enfin le contrôle de la validité des modèles formulés.
SOMMAIRE
Chapitre 1 - Distributions d’échantillonnage
1-D
istribution d’échantillonnage
de la moyenne d’échantillon
11
12
■■ Fluctuations de la moyenne observée dans un échantillon de taille n
12
■■ Caractéristiques de la moyenne d’échantillon X14
■■ Distribution d’échantillonnage de la statistique X. Théorème central limite
14
a) Cas où la variable parente X est distribuée normalement dans la population 14
b)Cas où la distribution de la variable parente X est inconnue mais on prélève
un « grand échantillon »
15
c) Cas où la variable parente X est distribuée normalement dans la population,
mais on ne connaît pas l’écart-type σ de la variable X dans la population
15
2 - F luctuations de la variance et de l’écart-type de X
dans un échantillon gaussien
■■ Cas où m = E (X), moyenne de X dans la population est connue
a)Caractéristiques de la variable S’ 2
b)Distribution d’échantillonnage de la variable S’ 2 dans le cas
d’une population d’origine normale
■■ Cas où m = E (X), moyenne de X dans la population est inconnue
a)Caractéristiques de la variable S 2
b)Distribution d’échantillonnage de la variable S ² dans le cas
d’une population d’origine normale
3 - F luctuations de la moyenne d’échantillon X dans le cas où σ2
est inconnue, si la loi de X est normale
16
16
16
17
17
17
17
19
SOMMAIRE
4 - Fluctuations de la fréquence d’échantillons
Chapitre 2 - Estimation des paramètres
1 - La variable estimateur ou statistique
■■ L’estimateur du maximum de vraisemblance
■■ Le principe de la méthode du maximum de vraisemblance
2 - Estimation ponctuelle d’un paramètre
■■ Estimation de l’espérance E (X) = m
■■ Estimation de la variance de σ (X)
■■ Estimation de la proportion p satisfaisant un critère A dans une population
3 - Estimation par intervalle de confiance d’un paramètre
■■ Estimation de la moyenne m de la population, au seuil de confiance α
a)Cas où σ, écart-type de X dans la population est connu
b)Cas où σ, écart-type de X dans la population est inconnu
c) Commandes Excel (fx : catégorie statistique)
■■ Estimation de la variance σ2 d’une variable X dans la population,
au seuil de confiance α, dans le cas d’échantillons gaussiens
a)Cas où m : valeur moyenne de X dans la population est connue
b)Cas où m, valeur moyenne de X dans la population est inconnue
■■ Estimation de la proportion d’individus satisfaisant un critère
dans la population, au seuil de confiance α
20
23
23
23
24
27
27
27
27
28
28
28
31
33
33
33
34
36
Chapitre 3 - Tests d’hypothèses. Le contrôle des normes 41
1 - Généralités. Les principes du test d’hypothèses
41
■■ Les hypothèses
■■ Le choix des hypothèses
■■ Les risques de première et de deuxième espèce
■■ La variable de décision
■■ Le seuil de signification, la région critique
■■ Le seuil descriptif, la probabilité critique
44
44
44
45
45
46
2 - L a construction d’un test d’hypothèses
■■ Avec la région critique
■■ Avec la probabilité critique
3-R
isque de deuxième espèce. Puissance d’un test
■■ Le risque de deuxième espèce β
■■ La courbe d’efficacité du test
Chapitre 4 - Tests usuels de comparaison
d’un paramètre à une norme
1-T
ests portant sur la moyenne d’une population
46
47
48
48
48
52
52
53
57
57
■■ La construction du test
57
a) La formulation des hypothèses
57
b) Le choix de la variable de décision
57
c) La détermination de la région critique, au seuil de signification α.59
d)L’énoncé de la règle de décision
59
■■ L’utilisation du tableur : test de comparaison d’une moyenne à une norme
65
2-T
ests portant sur la variance d’une loi normale, sous condition
que X → 1 (m ; σ), quelle que soit la taille de l’échantillon
a) Formulation des hypothèses
b) Variable de décision, sous condition que X est distribuée normalement
c) Région critique
3-T
est portant sur la proportion d’individus satisfaisant un critère
dans une population
a)Formulation des hypothèses
b)Variable de décision
c) Détermination de la région critique
d) Énoncé de la règle de décision
66
66
66
67
69
69
69
70
70
SOMMAIRE
■■ La latéralité du test
■■ L’énoncé de la règle de décision. La prise de décision
SOMMAIRE
Chapitre 5 - Tests de comparaison des paramètres
de deux populations
1 - Tests portant sur la comparaison de deux variances
et de deux moyennes
■■ Dans le cas de petits échantillons gaussiens
a)Test de l’égalité des variances de Fisher Snédécor
b)Test de l’égalité des moyennes, à condition que σ 1 = σ 2 = σ 2
■■ Cas d’échantillons non gaussiens : n1 et n2 grands
a)Test de l’égalité des variances
b)Test de l’égalité des moyennes
2 - Tests portant sur la comparaison de proportions d’individus
satisfaisant un critère dans deux sous-populations
Chapitre 6 - Les tests de la régression simple
1 - Les résultats de la méthode des moindres carrés
73
73
73
74
75
81
81
81
81
877
87
■■ Indice de la qualité d’un ajustement linéaire, le coefficient de détermination R² 88
a)Formule de décomposition
88
b)Le coefficient de détermination R²
89
2 - Le modèle de régression linéaire et son estimation
■■ Le modèle
■■ Les hypothèses de Gauss Markov
■■ Les estimateurs des moindres carrés
■■ La variance résiduelle
■■ Tests d’hypothèses portant sur la validité du modèle
a)Test sur la nullité du coefficient de détermination
■■ Analyse de variance de la régression
a)Le test
b)Présentation des résultats : table d’analyse de la variance
c) La régression linéaire sur Excel
■■ Jugement par intervalle de confiance d’une valeur prédite Y
90
90
91
91
93
93
93
105
105
106
107
109
Chapitre 7 - Le test d’ajustement du khi-deux.
Modélisation
1-D
étermination de la loi d’ajustement
2 - L e test d’ajustement du χ2
■■ Le principe du test
■■ La procédure
Chapitre 8 - Test d’hypothèses d’indépendance
du khi-deux
1 - L es données
2 - L e test d’indépendance
■■ La construction du test et la prise de décision
■■ L’utilisation du tableur
Annexes - Quelques densités utilisées
en échantillonnage
Quelques densités utilisées en échantillonnage
Les tables de lois des probabilités
Exercices récapitulatifs
112
112
114
114
115
115
116
116
116
129
129
130
130
134
137
137
143
149
SOMMAIRE
■■ Étude des résidus et des observations influentes
a)Le graphe des résidus
b)La normalité des résidus
c) Indicateurs construits à partir des résidus
Téléchargement