PRÉSENTATION Le formidable développement des outils informatiques et de leur puissance de calcul permet de traiter de très grands nombres de données, d’obtenir rapidement des résultats et des interprétations et il est peu de domaines aujourd’hui qui ne fassent appel aux statistiques comme sources d’informations. Que l’on s’intéresse à la physique, fondamentale ou appliquée, que l’on travaille dans la finance, le commerce, l’assurance, la biologie, dans le monde de la recherche comme dans celui de l’entreprise, les données sont relevées, analysées et exploitées. La première tâche de la statistique consiste à décrire de façon précise et rigoureuse les ensembles qu’elle étudie sous l’angle particulier qui l’intéresse mais la tâche ne s’arrête pas là. Au-delà des observations qu’elle peut effectuer, la statistique cherche à construire des modèles, à élaborer des hypothèses plus ou moins probables concernant certains événements échappant à son observation directe ; soit parce que ces événements concernent des ensembles plus vastes que ceux qui ont été observés, soit qu’il s’agisse d’événements à venir. Cette deuxième phase de l’étude statistique, appelée statistique inductive ou statistique inférentielle part des résultats obtenus sur les échantillons observés et, connaissant les différents modèles développés par la théorie des probabilités, permet d’élaborer des hypothèses valables avec de fortes probabilités portant sur la population alors même que celle-ci n’aura pas été observée de façon exhaustive. Un premier ouvrage reprend les bases de la théorie des probabilités et les lois de probabilités permettant la modélisation de situations concrètes. Dans ce deuxième ouvrage, les méthodes de la statistique inférentielle sont étudiées, d’une part, avec la résolution de problèmes d’estimations de paramètres et, d’autre part, avec des problèmes portant sur le contrôle des normes à partir de l’observation d’échantillons ou enfin le contrôle de la validité des modèles formulés. SOMMAIRE Chapitre 1 - Distributions d’échantillonnage 1-D istribution d’échantillonnage de la moyenne d’échantillon 11 12 ■■ Fluctuations de la moyenne observée dans un échantillon de taille n 12 ■■ Caractéristiques de la moyenne d’échantillon X14 ■■ Distribution d’échantillonnage de la statistique X. Théorème central limite 14 a) Cas où la variable parente X est distribuée normalement dans la population 14 b)Cas où la distribution de la variable parente X est inconnue mais on prélève un « grand échantillon » 15 c) Cas où la variable parente X est distribuée normalement dans la population, mais on ne connaît pas l’écart-type σ de la variable X dans la population 15 2 - F luctuations de la variance et de l’écart-type de X dans un échantillon gaussien ■■ Cas où m = E (X), moyenne de X dans la population est connue a)Caractéristiques de la variable S’ 2 b)Distribution d’échantillonnage de la variable S’ 2 dans le cas d’une population d’origine normale ■■ Cas où m = E (X), moyenne de X dans la population est inconnue a)Caractéristiques de la variable S 2 b)Distribution d’échantillonnage de la variable S ² dans le cas d’une population d’origine normale 3 - F luctuations de la moyenne d’échantillon X dans le cas où σ2 est inconnue, si la loi de X est normale 16 16 16 17 17 17 17 19 SOMMAIRE 4 - Fluctuations de la fréquence d’échantillons Chapitre 2 - Estimation des paramètres 1 - La variable estimateur ou statistique ■■ L’estimateur du maximum de vraisemblance ■■ Le principe de la méthode du maximum de vraisemblance 2 - Estimation ponctuelle d’un paramètre ■■ Estimation de l’espérance E (X) = m ■■ Estimation de la variance de σ (X) ■■ Estimation de la proportion p satisfaisant un critère A dans une population 3 - Estimation par intervalle de confiance d’un paramètre ■■ Estimation de la moyenne m de la population, au seuil de confiance α a)Cas où σ, écart-type de X dans la population est connu b)Cas où σ, écart-type de X dans la population est inconnu c) Commandes Excel (fx : catégorie statistique) ■■ Estimation de la variance σ2 d’une variable X dans la population, au seuil de confiance α, dans le cas d’échantillons gaussiens a)Cas où m : valeur moyenne de X dans la population est connue b)Cas où m, valeur moyenne de X dans la population est inconnue ■■ Estimation de la proportion d’individus satisfaisant un critère dans la population, au seuil de confiance α 20 23 23 23 24 27 27 27 27 28 28 28 31 33 33 33 34 36 Chapitre 3 - Tests d’hypothèses. Le contrôle des normes 41 1 - Généralités. Les principes du test d’hypothèses 41 ■■ Les hypothèses ■■ Le choix des hypothèses ■■ Les risques de première et de deuxième espèce ■■ La variable de décision ■■ Le seuil de signification, la région critique ■■ Le seuil descriptif, la probabilité critique 44 44 44 45 45 46 2 - L a construction d’un test d’hypothèses ■■ Avec la région critique ■■ Avec la probabilité critique 3-R isque de deuxième espèce. Puissance d’un test ■■ Le risque de deuxième espèce β ■■ La courbe d’efficacité du test Chapitre 4 - Tests usuels de comparaison d’un paramètre à une norme 1-T ests portant sur la moyenne d’une population 46 47 48 48 48 52 52 53 57 57 ■■ La construction du test 57 a) La formulation des hypothèses 57 b) Le choix de la variable de décision 57 c) La détermination de la région critique, au seuil de signification α.59 d)L’énoncé de la règle de décision 59 ■■ L’utilisation du tableur : test de comparaison d’une moyenne à une norme 65 2-T ests portant sur la variance d’une loi normale, sous condition que X → 1 (m ; σ), quelle que soit la taille de l’échantillon a) Formulation des hypothèses b) Variable de décision, sous condition que X est distribuée normalement c) Région critique 3-T est portant sur la proportion d’individus satisfaisant un critère dans une population a)Formulation des hypothèses b)Variable de décision c) Détermination de la région critique d) Énoncé de la règle de décision 66 66 66 67 69 69 69 70 70 SOMMAIRE ■■ La latéralité du test ■■ L’énoncé de la règle de décision. La prise de décision SOMMAIRE Chapitre 5 - Tests de comparaison des paramètres de deux populations 1 - Tests portant sur la comparaison de deux variances et de deux moyennes ■■ Dans le cas de petits échantillons gaussiens a)Test de l’égalité des variances de Fisher Snédécor b)Test de l’égalité des moyennes, à condition que σ 1 = σ 2 = σ 2 ■■ Cas d’échantillons non gaussiens : n1 et n2 grands a)Test de l’égalité des variances b)Test de l’égalité des moyennes 2 - Tests portant sur la comparaison de proportions d’individus satisfaisant un critère dans deux sous-populations Chapitre 6 - Les tests de la régression simple 1 - Les résultats de la méthode des moindres carrés 73 73 73 74 75 81 81 81 81 877 87 ■■ Indice de la qualité d’un ajustement linéaire, le coefficient de détermination R² 88 a)Formule de décomposition 88 b)Le coefficient de détermination R² 89 2 - Le modèle de régression linéaire et son estimation ■■ Le modèle ■■ Les hypothèses de Gauss Markov ■■ Les estimateurs des moindres carrés ■■ La variance résiduelle ■■ Tests d’hypothèses portant sur la validité du modèle a)Test sur la nullité du coefficient de détermination ■■ Analyse de variance de la régression a)Le test b)Présentation des résultats : table d’analyse de la variance c) La régression linéaire sur Excel ■■ Jugement par intervalle de confiance d’une valeur prédite Y 90 90 91 91 93 93 93 105 105 106 107 109 Chapitre 7 - Le test d’ajustement du khi-deux. Modélisation 1-D étermination de la loi d’ajustement 2 - L e test d’ajustement du χ2 ■■ Le principe du test ■■ La procédure Chapitre 8 - Test d’hypothèses d’indépendance du khi-deux 1 - L es données 2 - L e test d’indépendance ■■ La construction du test et la prise de décision ■■ L’utilisation du tableur Annexes - Quelques densités utilisées en échantillonnage Quelques densités utilisées en échantillonnage Les tables de lois des probabilités Exercices récapitulatifs 112 112 114 114 115 115 116 116 116 129 129 130 130 134 137 137 143 149 SOMMAIRE ■■ Étude des résidus et des observations influentes a)Le graphe des résidus b)La normalité des résidus c) Indicateurs construits à partir des résidus