Statistiques L2 Psychologie Estimation par intervalle de confiance On présente ici un rappel concernant le TD5 et le TD6. Pour une étude plus détaillée il faut se reporter aux notes du cours magistral. 1 Statistiques 2.1 L2 Psychologie Intervalle de confiance pour la moyenne d’une distribution normale Dans ce paragraphe on suppose que Xi ∼ N (µ ; σ 2 ). 1 ⋄ Si on connaît la variance σ 2 : Introduction σ σ x̄n − u1− α2 . √ ≤ µ ≤ x̄n + u1− α2 . √ n n L’estimation par intervalle de confiance consiste à proposer un intervalle dans lequel le paramètre à estimer se trouvera avec une certaine probabilité. Autrement dit, en notant X un estimateur de θ, un intervalle de confiance de θ au niveau de confiance 1 − α est un intervalle [X − d ; X + d] tel que : 2 ⋄ Si on ne connait pas la variance σ 2 : sn sn x̄n − t1− α2 . √ ≤ µ ≤ x̄n + t1− α2 . √ n n P (X − d ≤ θ ≤ X + d) = 1 − α Si n est suffisemment grand (n ≥ 30) le résultat ci–dessus peut–être approximé par : Si on prend α = 5%, l’intervalle de confiance de θ a un niveau de confiance de 95%. Cela veut dire qu’en utilisant X comme estimateur du paramètre θ, en moyenne, sur 100 échantillons, 95 fois l’intervalle de confiance contiendra la vraie valeur du paramètre et 5 fois il ne la comprendra pas. sn sn x̄n − u1− α2 . √ ≤ µ ≤ x̄n + u1− α2 . √ n n Nous rappelons dans la suite comment trouver un intervalle de confiance quand le paramètre à estimer est une moyenne ou une proportion. Cette intervalle dépendra de la forme de la loi de distribution de l’estimateur X, de la taille de l’échantillon et de la connaissance ou de l’ignorance de la variance de la population. 2 Intervalle de confiance pour une moyenne On utilisera les notations suivantes : Pour i = 1, . . . , n, les Xi sont des variables aléatoires indépendantes et toutes de même loi. µ et σ 2 représentent la moyenne et la variance des variables Xi . x1 + · · · + xn x̄n est la moyenne empirique des xi : x̄n = . n s2n est la variance corrigée des xi : s2n = (x1 − x̄n )2 + · · · + (xn − x̄n )2 n−1 ⋄ Exemple : Douze adultes francophones ont fait l’objet d’une expérience de mémoire. Le temps (en minutes) pour apprendre une liste de 5 verbes allemands est donné ci–dessous : 5,1 4,8 6,3 5,0 5,5 5,0 5,2 4,9 4,5 5,8 5,3 5,2 On suppose que le temps d’apprentissage de ces 5 verbes suit une distribution normale et on cherche un intervalle de confiance pour le temps moyen d’apprentissage à un niveau de confiance de 95%. On est donc dans le cas où la distribution est normale, la variance est inconnue et n est petit (n = 12). En utilisant les mêmes notations que précédemment on a : 1 − α = 0, 95 et donc α = 0, 05, x̄n = 5, 1 + 4, 8 + · · · + 5, 3 + 5, 2 ≃ 5, 22 12 s2n = (5, 1 − 5, 22)2 + (4, 8 − 5, 22)2 + · · · + (5, 2 − 5, 22)2 ≃ 0, 23 et donc sn ≃ 0, 48. 12 − 1 t1− α2 = t0,975 = 2, 201 (on a n − 1 = 12 − 1 = 11 degrés de liberté). On a : u1− α2 est le fractile de 1 − α2 qui sera lu dans la table des fractiles de la loi normale centrée réduite. 0, 48 0, 48 5, 22 − 2, 201. √ ≤ µ ≤ 5, 22 + 2, 201. √ 12 12 et donc : t1− α2 est le fractile de 1 − n − 1 degrés de liberté. α 2 qui sera lu dans la table des fractiles de la loi de Student à 4, 92 ≤ µ ≤ 5, 52 Le temps d’apprentissage moyen des 5 verbes est donc compris entre 4,92 minutes et 5,52 minutes avec une probabilité de 95%. 1 2 Statistiques 2.2 L2 Psychologie Intervalle de confiance pour la moyenne d’une distribution quelconque Dans ce paragraphe la distribution des Xi n’est pas forcemment normale. 1 ⋄ Si n est grand (n ≥ 30) : (a) Si la variance σ 2 est connue : σ σ x̄n − u1− α2 . √ ≤ µ ≤ x̄n + u1− α2 . √ n n Statistiques 2 ⋄ Si n n’est pas grand (n < 30) : il est plus difficile de construire un intervalle de confiance. ⋄ Exemple : Un échantillon aléatoire de 100 gravures, pris au hasard dans un grand lot, en contient 15 ayant certaines imperfections. On veut déterminer un intervalle de confiance de la proportion des gravures défectueuses de ce lot à un niveau de 95%. 15 En utilisant les notations précédentes, on a : n = 100 ; f = = 0, 15 ; 1 − α = 0, 95 100 donc α = 0, 05 et u1− α2 = u0,975 = 1, 96. Donc : r (b) Si la variance σ 2 n’est pas connue : sn sn x̄n − u1− α2 . √ ≤ µ ≤ x̄n + u1− α2 . √ n n 2 ⋄ Si n n’est pas grand (n < 30) : il est difficile de construire un intervalle de confiance. ⋄ Exemple : Un fabricant de voitures teste la consommation d’essence sur 80 véhicules d’un même type. Il trouve que la consommation moyenne est x̄ = 6 litres au cent. De plus, il sait que l’écart–type de la consommation pour ce type de voiture est σ = 0, 2 litre au cent. On cherche l’intervalle de confiance de l’estimation de la consommation moyenne µ des voitures à un niveau de confiance de 95%. On est ici dans le cas où l’on ne connaît pas la loi des Xi , la variance est connue et n est grand (n = 80). On a α = 0, 05 ; x̄ = 6 et σ = 0, 2. De plus, u1− α2 = u0,975 = 1, 96. Donc, L2 Psychologie 0, 15 − 1, 96. r 0, 15 × (1 − 0, 15) 0, 15 × (1 − 0, 15) ≤ p ≤ 0, 15 + 1, 96. 100 100 Donc : 0, 08 ≤ p ≤ 0, 22 Il y a donc 95% de chance qu’il y ait entre 8% et 22% de gravures avec des imperfections dans le grand lot. 0, 2 0, 2 6 − 1, 96. √ ≤ µ ≤ 6 + 1, 96. √ 80 80 On trouve : 5, 95 ≤ µ ≤ 6, 04 La consommation moyenne µ est donc comprise entre 5,95 et 6,04 litres au cent avec une probabilité de 95%. 3 Intervalle de confiance pour une proportion On utilisera les notations suivantes : p est la proportion d’individus d’une population possédant un certain caractère A (p est la proportion à estimer). f est une estimation ponctuelle de p. 1 ⋄ Si n est grand (n ≥ 30) : r f − u1− α2 . r f × (1 − f ) f × (1 − f ) ≤ π ≤ f + u1− α2 . n n 3 4