Introduction À l’estimation Estimation Moyenne Estimation Proportion Introduction à l’estimation Estimation d’une moyenne Estimation d’une proportion Estimation fréquence Echantillonnage fréquence 1 / 15 Introduction À l’estimation Estimation Moyenne Exemple de problème Population = étudiants Sup de Co Un besoin : Estimation Proportion Je voudrais connaître le nombre d’heures de travail par semaine pour un étudiant Sup de Co. Estimation fréquence Echantillonnage fréquence 2 / 15 Introduction À l’estimation Estimation à partir d’un échantillon Population Taille : N Estimation Moyenne (Sup de Co) x x Estimation Proportion x x Estimation x x x Estimation fréquence Echantillonnage fréquence une variable quantitative X = nb d’heures de travail par semaine On voudrait x x x connaître un m = la x x paramètre de la x moyenne des population x valeursxde X x x la x dans x x population x x x x Echantillon taille : n x x On peut m = moyenne des calculer une x xx x valeurs x de X statistique à x x x x dans l‘échantillon x partir de x x x x l’échantillon x Supposons x que l’on x trouve x m = 10. On peut estimer m x x par 10 (estimation ponctuelle) ou par une « fourchette » autour de 10 (estimation par intervalle de confiance) 3 / 15 Introduction À l’estimation Estimation Moyenne Estimation Proportion Distribution d’échantillonnage d’une moyenne Si n est suffisamment grand, on peut considérer que la distribution de m est normale mmm mmmm mmmmm mmmmmm mmmmmmm mmmmmmm mmmmmmmm mmmmmmmm mmmmmmmm et d’écart-type sm s sm mmmmmmmmm n mmmmmmmmmm mmmmmmmmmmm C= mmmmmmmmmmmmm mmmmmmmmmmmmmmmm mmmmmmmmmmmmmmmmmmm de moyenne m Estimation fréquence Echantillonnage fréquence 95 % des m m - 1,96 sm m C (N - n) (N - 1) m + 1,96 sm 4 / 15 Introduction À l’estimation Estimation d’une moyenne mm m mm Cas mm mmmm mmmm mmmm mmmmm mmmmm mmmmm mmmmmm mmmmmm mmmmmmm mmmmmmmmm mmmmmmmmmm mmmmmmmmmmmm Estimation Moyenne Estimation Proportion m - 1,96 sm Estimation fréquence Echantillonnage fréquence m s n C , m + 1,96 95 % des m m + 1,96 sm Intervalle de confiance à 95% pour m [ m - 1,96 simple : s connu s n C] Intervalle de confiance à x% pour m [ m- Z s n C , m +Z s n C] 5 / 15 Introduction À l’estimation Estimation d’une moyenne Cas général : s inconnu Estimation Moyenne Estimation Proportion Estimation fréquence Echantillonnage fréquence Intervalle de confiance à x % pour m s s [ m- Z C,m +Z C] n n (x i - m) 2 Un bon estimateur pour s est s n -1 i 1 n m t s C n t suit une loi de Student à n-1 degrés de liberté 6 / 15 Introduction À l’estimation La loi de Student “famille de courbes” avec un nombre de degrés de liberté (ddl) qui varie. Estimation Moyenne ddl = 25 ddl = 10 Estimation Proportion 0 Estimation fréquence Echantillonnage fréquence t • Nb ddl = n-1 • t a une courbe de forme similaire à la loi normale (Z) • Quand n (ou le nb de ddl) augmente, on se rapproche de la courbe normale. 7 / 15 Introduction À l’estimation Estimation Moyenne Estimation Proportion Estimation fréquence Echantillonnage fréquence La loi de Student avec Excel 1- a/2 a - ta/2 a/2 + ta/2 Z (1- a) = niveau de confiance a = erreur 8 / 15 Introduction À l’estimation Student : exemple de lecture directe 20 ddl Estimation Moyenne Estimation Proportion Estimation fréquence Echantillonnage fréquence +1 LOI.STUDENT(1;20;1) = 0,1646 Lecture unilatérale ou bilatérale 9 / 15 Introduction À l’estimation Student : exemple de lecture inverse Estimation Moyenne 95% 2,5% Estimation Proportion Estimation fréquence Echantillonnage fréquence - ta/2 2,5% + ta/2 =LOI.STUDENT.INVERSE(0,05;20) =2,086 Lecture forcément bilatérale 10 / 15 Introduction À l’estimation Estimation d’une moyenne: exemple N = 1500, n =100, m =10, s = 5 Estimation Moyenne L’écart-type de la population est inconnu, donc pour estimer m, il faut utiliser la formule: m t Estimation Proportion s C n Calculons un intervalle de confiance à 95% pour m. Le nombre de ddl est 100-1 = 99 Estimation fréquence Echantillonnage fréquence t vaut donc 1,9842 (fonction Excel: LOI.STUDENT.INVERSE(0,05;99)) Remarque t est proche de 1,96 – Avec un échantillon de taille 100, nous aurions pu utiliser l’approximation normale. Le terme correcteur C vaut: 0,9835 (proche de 1) On trouve l’intervalle [ 9,02 ; 10,98 ] 11 / 15 Et pour une proportion, c’est pareil... Introduction À l’estimation une variable qualitative «FUMEUR» Population Taille : N Estimation Moyenne Estimation Proportion x (Sup de Co) x x x x x x x x x x Estimation x x x x x Estimation fréquence Echantillonnage fréquence x x p =xla proportion x des x fumeurs x dans la population x x pe = proportion x xx x x x x des x fumeurs x x x x x x x dans l‘échantillon x x x x x x x On voudrait connaître un paramètre de la population On peut calculer une statistique à partir de l’échantillon Echantillon taille : n 12 / 15 Introduction À l’estimation Distribution d’échantillonnage d’une proportion Si n est suffisamment grand, Estimation Moyenne on peut considérer que la distribution de pe – est normale Estimation Proportion Estimation fréquence Echantillonnage fréquence – a pour moyenne E(pe)=p – et pour écart-type sp e C = p (1- p ) xC n (N - n) (N - 1) 13 / 15 Introduction À l’estimation Estimation Moyenne Estimation d’une proportion On se limite aux grands échantillons Estimation Proportion Intervalle de confiance à x % pour p Estimation fréquence Echantillonnage fréquence pe(1 - pe) pe(1 - pe) [ pe - Z C , pe + Z C] n n 14 / 15 Introduction À l’estimation Estimation d’une proportion: exemple N = 1500, n =100, pe =0,28 (proportion de fumeurs dans l’échantillon de 100 personnes) Estimation Moyenne Estimation Proportion On utilise la formule: [ pe - Z pe(1 - pe) pe(1 - pe) C , pe + Z C] n n Calculons un intervalle de confiance à 95% pour p (la proportion de fumeurs dans la population Sup de Co). Estimation fréquence Echantillonnage fréquence Z vaut 1,96 (fonction Excel: LOI.NORMALE.STANDARD.INVERSE(0,975) Le terme correcteur C vaut: 0,9835 (proche de 1) On trouve l’intervalle [ 0,193 ; 0,367 ] 15 / 15