GCI 102. Méthodes probabilistes en génie civil Chapitre 7 Échantillonnage et estimation de paramètres par Pierre F. Lemieux, ing., professeur Département de génie civil Université de Sherbrooke Tél. : (819) 821-8000 (poste 2938) Télécopieur : (819) 821-7974 Courriel : [email protected] Révision : 25 juin 2003 GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 1 Table des matières 1. Introduction [Diapo 3] 2. Théorème de la limite centrale [Diapo 12] 3. Propriétés de la distribution d’échantillonnage [Diapo 13] 4. Estimation de paramètres [Diapo 18] 5. Estimation de paramètres par intervalle de confiance (n ≥ 30) [Diapo 22] 6. Taille d’échantillons requise [Diapo 25] 7. Estimation de paramètres par intervalle de confiance avec variance σ2 inconnue (n < 30) [Diapo 27] 8. Distribution échantillonnale d’une proportion [Diapo 33] [LRS, chap. 8] [B, chap. 7] GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 2 1 1. Introduction [LRS, p. 216] [B, p. 282] Étude statistique sur tous les éléments d’une population : onéreux et souvent irréalisable. Exemple : Prélever un cylindre de béton pour chaque m3 de béton coulé dans un ouvrage de grande taille afin de le tester pour sa résistance. Sondage pré-électoral de tous les électeurs. Échantillonnage : prélever un ensemble représentatif de la population pour estimer un paramètre statistique de la population. Échantillon aléatoire : Soit N le nombre d’éléments dans une population (nombre fini ou infini). Soit n le nombre d’éléments dans l’échantillon à prélever dans cette population. Prélever un échantillon aléatoire consiste à choisir de façon purement aléatoire chacun des éléments qui composera l’échantillon. GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) Exemple illustratif : 3 [B, p. 289] Supposons un sondage effectué dans 5 grandes compagnies pour déterminer l’âge d’informatisation (à partir du 1er achat d’équipement informatique). Entreprises Âge d’informatisation (en années) A 8 B 8,5 C 9 D 9,5 E 10 Dès lors, avec X = âge d’informatisation x1 = 8 , x2 = 8,5 , x3 = 9 , x4 = 9,5 et x5 = 10 µX = ∑ xi N σ X2 = = 45 = 9 ans 5 ∑ ( xi − µ ) N 2 = 2, 5 = 0, 5 5 GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 4 2 Échantillonnage de la population avec remise (tirage indépendant) : Hypothèse : former tous les échantillons possibles de taille n = 2 avec remise. Nombre de cas possibles : Nn = 52 = 25 Énumération des 25 échantillons Résultats de l'échantillonnage Moyenne des échantillons (A, A) (8, 8) 8.00 (A, B) (8, 8.5) 8.25 (A, C) (8, 9) 8.50 (A, D) (8, 9.5) 8.75 Échantillon Entreprises 1 2 3 4 5 (A, E) (8, 10) 9.00 6 (B, A) (8.5, 8) 8.25 7 (B, B) (8.5, 8.5) 8.50 8 (B, C) (8.5, 9) 8.,75 9 (B, D) (8.5, 9.5) 10 (B, E) (8.5, 10) 9.25 11 (C, A) (9, 8) 8.50 12 (C, B) (9, 8.5) 8.75 13 (C, C) (9, 9) 9.00 14 (C, D) (9, 9.5) 9.25 9.00 15 (C, E) (9, 10) 9.50 16 (D, A) (9.5, 8) 8.75 17 (D, B) (9.5, 8.5) 9.00 18 (D, C) (9.5, 9) 9.25 19 (D, D) (9.5, 9.5) 20 (D, E) (9.5, 10) 9.75 21 (E, A) (10, 8) 9.00 22 (E, B) (10, 8.5) 9.25 23 (E, C) (10, 9) 24 (E, D) (10, 9.5) 9.75 25 (E, E) (10, 10) 10.00 9.50 9.50 GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 5 Distribution des fréquences et représentation graphique : [B, p. 290] Moyennes Fréquence ni Fréquence relative fi 8.00 1 0.04 8.25 2 0.08 8.50 3 0.12 8.75 4 0.16 9.00 5 0.20 9.25 4 0.16 9.50 3 0.12 9.75 2 0.08 10.00 1 0.04 Distribution d'échantillonnage de la moyenne (n = 2) 0.25 Fréquence relative 0.20 0.15 0.10 0.05 0.00 8.00 8.25 8.50 8.75 9.00 9.25 9.50 9.75 10.00 Âge, en années GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 6 3 Moyenne de la distribution de l’échantillonnage : 9 E ( X ) = ∑ f i xi = 9 années i =1 Moyennes Écart Écart2 f i Écart2 8.00 -1.00 -0.75 -0.50 -0.25 0.00 0.25 0.50 0.75 1.00 1.00 0.56 0.25 0.06 0.00 0.06 0.25 0.56 1.00 0.040 0.045 0.030 0.010 0.000 0.010 0.030 0.045 0.040 8.25 8.50 8.75 9.00 9.25 9.50 9.75 10.00 9 E ( X ) = µX Écart = ( xi − µ X ) Écart 2 = ( xi − µ X ) 2 f i Écart 2 = f i ( xi − µ X ) σ X2 = ∑ f i ( xi − µ ) = 0, 25 = 2 i =1 0, 5 2 2 σ X2 n GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) Échantillonnage avec une taille de n = 3 : 7 [B, p. 290] Taille de l’échantillon : n = 3 Nombre d’échantillons possible : 53 = 125 µ X = 9 années σ X2 = 0, 5 σ X2 = 3 3 σ X2 n La répartition des moyennes échantillonnales se rapprochent de plus en plus d’une distribution normale. GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 8 4 Moyenne 8.000 8.167 8.333 8.500 8.667 8.833 9.000 9.167 9.333 9.500 9.667 9.833 10.000 Fréquence 1 3 6 10 15 18 19 18 15 10 6 3 1 Fréq. rel. 0.008 0.024 0.048 0.080 0.120 0.144 0.152 0.144 0.120 0.080 0.048 0.024 0.008 Distribution d'échantillonnage de la moyenne (n = 3) 20 18 16 14 Fréquence 12 10 8 6 4 2 0 8 8.167 8.333 8.5 8.667 8.833 9 9.167 9.333 9.5 9.667 9.833 10 Âge, en années GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 9 Remarques : [LRS, p. 216] 1. La moyenne des moyennes échantillonnales est celle de la population quelle que soit la taille de l’échantillon. 2. Les moyennes x des échantillons sont moins dispersées que les valeurs i individuelles xi par rapport à la moyenne de la population. Soit un échantillon aléatoire de taille n prélevé d’une population infinie ou d’une population finie échantillonnée avec remise. Si cette population possède une variable aléatoire X qui suit une loi de probabilité de moyenne E(X) = µ et de variance σ2, alors la moyenne de l’échantillon suit une loi de probabilité ayant les caractéristiques suivantes : E(X )= E(X) = µ Moyenne des moyennes des échantillons σ X2 = σ2 n ou σ X = Moyenne de la population σ n Erreur-type de la moyenne GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 10 5 Remarques (suite) : [B, p. 292] Pour un échantillonnage sans remise à partir d’une population finie de taille N, il faut apporter une correction au calcul de la variance et de l’écart-type. σ X2 ⎛ N ⎜1− σ ⎛ N −n⎞ σ ⎝ = = ⎜ ⎟ n ⎝ N −1 ⎠ n ⎛ N ⎜1− ⎝ 2 X 2 X n N 1 N ⎞ ⎟ σ2 ⎠ ≅ X ⎛1− n ⎞ n ⎜⎝ N ⎟⎠ ⎞ ⎟ ⎠ Taux de sondage ou taux d’échantillonnage Ignorer le facteur de correction si n ≤ 0,10 N GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 2. Théorème central limite 11 [B, p. 292] But : pouvoir tirer des conclusions sur la population à partir d’échantillons. Théorème central limite : [LRS, p. 214] [B, p. 292] Si des échantillons aléatoires de taille n sont prélevés d’une population ayant une variable aléatoire continue X (peu importe la distribution de X) ayant une moyenne µX et un écart-type σX , alors la distribution d’échantillonnage de la moyenne des échantillons tend à se rapprocher d’une loi normale ayant les caractéristiques suivantes µX = µX σX = σX n à mesure que la taille de l’échantillon augmente. GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 12 6 3. Propriétés de la distribution d’échantillonnage [B, p. 293] 1. L’expérience et la pratique ont montré que la distribution de la moyenne échantillonnale est approximativement normale quelle que soit la forme de celle de la population, dès que l’échantillon est constitué d’au moins 30 éléments. 2. Si la population possède une distribution pratiquement symétrique, il faut un échantillon d’au moins 15 éléments pour que la distribution de la moyenne échantillonnale soit approximativement normale. 3. Si la population est distribuée normalement, la distribution de la moyenne échantillonnale est normale peu importe la taille de l’échantillon. 4. Si la variance σ2 est inconnue, alors un grand échantillon (n ≥ 30) permet de déduire une valeur fiable avec s 2 ∑ ( xi − x ) = n−1 2 ≅σ2 GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) (a) Population normale et variance σ2 connue : 13 [B, p. 295] (1) La distribution de X est normale. ( 2) E ( X ) = µ σ ( 3) σ X = (4) z = x−µ σ n n Erreur-type de la moyenne (standard error on the mean) ⇒ loi normale centrée réduite GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 14 7 (b) Distribution de population et σ2 inconnues (n ≥ 30) : [B, p. 295] (1) Distribution de X approximativement normale. ( 2) E ( X ) = µ ∑ ( xi − x ) ( 3) s = ( 4) z = 2 n ( n − 1) x−µ s n ⇒ loi normale centrée réduite GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 15 Exemple d’application : Soit X l’âge d’informatisation dans une entreprise de grande taille (> 20 M$). Pour l’ensemble des industries de grande taille, on a trouvé que µ X = 12, 4 ans σ X = 3, 2 ans On prélève un échantillon de 64 industries de cette base de données. (1) Quels sont les paramètres d’échantillonnage de X pour ces 64 valeurs ? n = 64 > 30 ⇒ σX = σX n = 3, 2 64 E ( X ) = µ = 12, 4 ans = 0, 4 ans GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 16 8 (2) Probabilité que l’âge moyen soit inférieur à 11,8 années ? 11, 8 − 12, 4 ⎞ ⎛ P ( X < 11, 8 ) = P ⎜ Z < ⎟ = P ( Z < −1, 5 ) 0, 4 ⎝ ⎠ P ( Z < −1, 5 ) = 0, 5 − P ( 0 ≤ Z ≤ 1, 5 ) = 0, 5 − 0, 4332 = 0, 0668 (3) Probabilité que l’âge moyen se trouve entre 11,4 et 13,4 années ? 13, 4 − 12, 4 ⎞ ⎛ 11, 4 − 12, 4 P (11, 4 ≤ X ≤ 13, 4 ) = P ⎜ ≤Z≤ ⎟ 0, 4 0, 4 ⎝ ⎠ = P ( −2, 5 ≤ Z ≤ 2, 5 ) = 2 P ( 0 ≤ Z ≤ 2, 5 ) = 2 × 0, 4938 = 0, 9876 GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 4. Estimation de paramètres 17 [LRS, chap. 8] [B, p. 298 - 300] Estimer un paramètre : chercher une valeur approchée en se basant sur les résultats obtenus d’un échantillon. 2 manières : un nombre ou un intervalle de confiance. Estimer par intervalle de confiance : calculer, à partir d’un estimateur choisi, un intervalle dans lequel il est vraisemblable que la valeur correspondante du paramètre se trouve. Pour calculer cet intervalle de confiance, il faut connaître la distribution de l’échantillonnage de l’estimateur correspondant. GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 18 9 (a) Estimateur sans biais ou non biaisé : [B, p. 300] ( ) E θˆ = θ Valeur du paramètre à estimer Estimateur sans biais Exemple 1 : E(X)= µ Moyenne d’échantillon Moyenne de la population Exemple 2 : ( ) E s2 = σ 2 Estimateur sans biais si évalué avec (n - 1) Variance de la population GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 19 (b) Estimateur efficace : [B, p. 300] Estimateurs θˆ1 et θˆ2 ( ) ( ) Var ( θˆ ) < Var ( θˆ ) E θˆ1 = E θˆ2 1 2 ⇒ estimateur θˆ1 plus efficace que estimateur θˆ2 Exemple : Médiane E ( X ) = E ( Me ) = µ Var ( X ) = σ2 n Résultat qui peut être démontré et Var ( M e ) ≅ 1, 57 σ2 n Estimateur plus efficace GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 20 10 (c) Estimateur convergent : [B, p. 300] Estimateur dont la distribution tend à se concentrer autour de la valeur inconnue à estimer à mesure que la taille n de l’échantillon augmente. ( ) Var θˆ → 0 quand n → ∞ GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 21 5. Estimation de paramètres par intervalle de confiance [LRS, p. 367 et sq] [B, p. 301] But : calculer à partir de la moyenne échantillonnale un intervalle dans lequel il est vraisemblable que la vraie valeur µ se trouve. Niveau de confiance Intervalle à définir Cas traité : n ≥ 30 P ( X − k ≤ µ ≤ X + k ) = 1−α Loi normale - Fonction de densité 0.45 0.40 0.35 − zα / 2 0.30 f(z) zα / 2 1 −α 0.25 0.20 0.15 α/2 0.10 α/2 0.05 0.00 -3.00 -2.00 -1.00 0.00 1.00 2.00 3.00 z GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 22 11 Posons que (1 - α) = 0,95 ou 95 %. Il s’agit d’une valeur très fréquemment choisie. Dès lors, ⎛ X −k X −µ X +k ⎞ ≤ ≤ P⎜ ⎟ = 0, 95 ⎝σ n σ n σ n ⎠ ou ⎛ ⎞ ⎛ ⎞ X −µ X −µ P ⎜ − z0,025 ≤ ≤ z0,025 ⎟ = P ⎜ −1, 96 ≤ ≤ 1, 96 ⎟ = 0, 95 σ n σ n ⎝ ⎠ ⎝ ⎠ Dès lors, −1, 96 σ ≤ X − µ ≤ 1, 96 n − X − 1, 96 X − 1, 96 σ n σ n σ n ≤ − µ ≤ − X + 1, 96 ≤ µ ≤ X + 1, 96 σ n σ n GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 23 Donc X − k = X − 1, 96 σ σ n n ∑ ( xi − x ) n i =1 s= Niveau de confiance : (1 - α) x − zα / 2 Si σ non connue ≤ µ ≤ x + zα / 2 n−1 σ n Intervalle dans lequel devrait vraisemblablement se trouver µ pour un niveau de confiance (1 - α) [B, p. 302] GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 24 12 6. Taille d’échantillon requise (population normale ou quasi normale) [B, p. 304] σ x − zα / 2 n ≤ µ ≤ x + zα / 2 x − µ ≤ E = zα Il faut alors que σ n σ 2 Marge d’erreur : [pour (1 - α)] n Taille minimale requise pour obtenir E = ? ⎡z σ ⎤ n = ⎢ α/2 ⎥ ⎣ E ⎦ ⎡z s⎤ ou n = ⎢ α / 2 ⎥ ⎣ E ⎦ 2 2 GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 25 Exemple d’application : On a prélevé 400 éprouvettes pour des tests en laboratoire. Cependant on ne voudrait pas effectuer les test sur les 400 éprouvettes. Sachant qu’il est admis que l’écart-type de la résistance en compression est de l’ordre de 200 kPa, combien d’éprouvettes doit-on examiner pour déterminer la valeur moyenne avec une marge d’erreur de 50 kPa et un niveau de confiance de 95 % ? Solution : E = zα / 2 Population finie ⇒ (Voir Diapo 10) n≅ (1 - α) = 0,95 n= ⇒ σ n N −n N −1 ou N zα2 / 2 σ 2 NE 2 + zα2 / 2 σ 2 α = 0,05 ⇒ zα/2 = 1,96 400 × 1, 962 × 2002 = 53, 28 ≅ 53 400 × 502 + 1, 962 × 2002 GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 26 13 7. Estimation de paramètres par intervalle de confiance avec variance σ2 inconnue (n < 30) [LRS, p. 370] [B, p. 306] La distribution-t de Student : [B, p. 306 - 308] Population normale avec variance inconnue et n < 30 : estimation de σ2 par s2 n’est plus fiable. La variable réduite T= X −µ s n n’est plus distribuée selon la loi normale. L’estimation de σ par s n’est plus fiable, car elle varie trop d’un échantillon à l’autre. On utilise alors la distribution de Student : ⎛ν + 1 ⎞ ⎛ ν +1 ⎞ Γ⎜ ⎟ ⎡ t 2 ⎤ −⎜⎝ 2 ⎟⎠ 2 ⎝ ⎠ 1+ f (t ) = ⎢ ⎥ ν ⎛ ⎞ νπ Γ ⎣ ν ⎦ ⎜2⎟ ⎝ ⎠ 1 Degré de liberté GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 27 Fonction de densité de probabilité de la loi de Student f(t) ν =5 α/2 -5.0 -4.0 -3.0 -2.0 -1.0 0.0 1.0 2.0 3.0 4.0 5.0 t Propriétés : (1) t varie de − ∞ à + ∞ (2) distribution symétrique p/r à l’origine. (3) un seul paramètre : ν (4) E(T) = 0 et Var(T) = ν / (ν - 2) (5) ν → ∞ ⇒ distribution de Student tend vers la loi normale. GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 28 14 Remarques : (1) Notion de degré de liberté : Le calcul de la variance [LRS, p. 372] [B, p. 308] s2 se fait en utilisant n ∑ ( xi − x ) 2 i =1 Valeur à calculer au préalable puisque n ∑ ( xi − x ) = 0 i =1 ⇒ les n valeurs xi sont linéairement dépendantes. C’est pourquoi on dit que l’on a ν = (n - 1) degrés de liberté. (2) Toujours vérifier si les tables des valeurs de la distribution de Student fournissent la valeur de t pour α ou α / 2. La remarque s’applique aussi aux logiciels qui effectuent ce calcul. GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 29 Exemple : Intervalle de confiance : 95 % ou 0,95 n = 12 valeurs de xi Trouver la valeur de t dans le cas de la loi de Student. Solution : D’après (LRS, p. A-6) ou (B, p. 698 - 699) Degrés de liberté ν = 12 − 1 = 11 α = 0, 05 / 2 = 0, 025 t = 2, 2010 La table donne la valeur de t pour la section supérieure seulement. Donc il faut diviser par 2, car nous avons les 2 extrémités pour un intervalle de confiance. GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 30 15 À l’aide de logiciel EXCEL : [B, p. 331] (1) Cliquer sur fx (2) Choisir Statistiques (Statistical) (3) Choisir LOI.STUDENT.INVERSE (TINV) (4) Pour probabilité, inscrire 0,05 (car EXCEL se charge de diviser par 2 pour tenir compte que ce sont les 2 extrémités qui interviennent). (5) Pour ν, inscrire 11. (6) Cliquer sur OK. Valeur trouvée : t = 2,200986 ou 2,2010 Fichier EXCEL GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 31 Estimation d’un intervalle de confiance (par un exemple) Posons, à titre d’exemple, que n = 28 x = 225 s = 20 Niveau de confiance : 95 % Trouver l’intervalle de confiance pour une estimation de la moyenne µ Solution : L’intervalle de confiance sera donné par x − tα / 2;n −1 s n ≤ µ ≤ x + tα / 2;n −1 s n D’après la table, t = 2,0518 pour ν = 27 et α = (1 - 0,95) / 2 = 0,025 Donc 217, 24 ≤ µ ≤ 232, 76 GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 32 16 8. Distribution échantillonnale d’une proportion [LRS, p. 218 et 384] [B, p. 311 - 316] Exemple d’introduction : 58 % des Québécois s’opposent à la fusion des banques. Un dirigeant de la banque BNN a mandaté un responsable du service à la clientèle pour interroger une centaine (100) de clients, sélectionnés au hasard, pour connaître leur opinion. Hypothèse : le % ci-dessus est aussi représentatif de la BNN. Quelle est la probabilité que, dans un échantillon de 100 personnes, au moins 65 individus soient contre les fusions ? p = 58 % ou 0,58 est une proportion, car la population est divisée en 2 groupes où ce qui les différencie est la caractéristique d’être pour ou contre les fusions des banques. GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 33 Distribution échantillonnalle d’une proportion : [LRS, p. 219] [B, p. 312] Posons que l’on prélève au hasard un échantillon de grande taille d’une population dont les éléments possèdent un caractère qualitatif dans une proportion π . Sur cet échantillon de taille n, on observe une proportion de valeur p qui présentent le caractère. Cette proportion p est une variable aléatoire dont la distribution se rapproche de la distribution normale qui a les caractéristiques suivantes : µ =π σp = Grande taille Variable réduite : π (1 − π ) n ⇒ nπ (1 − π ) ≥ 10 p −π Z= π (1 − π ) n GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 34 17 Exemple 1 : Solutionnons le problème posé au tout début de cette section à propos de l’échantillon de 100 clients de la BNN pour connaître la probabilité pour que la proportion soit de 65 %, alors que la population montre une proportion de 58 %. Solution : π = 0, 58 σp = 0, 58 (1 − 0, 58 ) 100 = 0, 0493 Vérification pour l’utilisation de la loi normale : 100 × 0, 58 (1 − 0, 58 ) = 24, 36 > 10 Calcul de la variable réduite : z= 0, 65 − 0, 58 0, 58 (1 − 0, 58 ) 100 = 0, 07 = 1, 42 0, 0493 GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 35 Dès lors, Pour EXCEL P ( Z > 1, 42 ) = 1, 0 − P ( −∞ ≤ Z ≤ 1, 42 ) Pour la table = 0, 5 − P ( 0 ≤ Z ≤ 1, 42 ) = 0, 5000 − 0, 4222 = 0, 0778 Il y a 8 chances sur 100 pour que 65 individus et plus soient contre la fusion des banques dans un échantillon de 100. GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 36 18 Exemple 2 : [LRS, p. 219] Une compagnie qui fabrique des lecteurs de disques compacts doit rejeter 1 lecteur sur 10 au moment de l’inspection. Si l’on choisit au hasard un échantillon de 400 lecteurs, déterminer la probabilité que la proportion p des lecteurs rejetés de l’échantillon se trouve entre 10 % et 12 %. Solution : 0,12 − 0,10 z= 0,10 × 0, 90 400 = 0, 02 = 1, 33 0, 015 P ( 0,10 ≤ p ≤ 0,12 ) = P ( 0 ≤ Z ≤ 1, 33 ) ⇒ P = 0, 4082 Il y a donc 41 % des chances que la proportion se trouve entre 0,10 et 0,12. GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 37 Estimation des intervalles de confiance dans le cas d’une proportion [LRS, p. 384] [B, p. 313] Posons que (1 - α) 100% définisse l’intervalle de confiance. Lorsque la distribution d’une proportion peut être approximée par la loi normale, alors la figure ci-dessous illustre la nomenclature des termes. Loi normale - Fonction de densité 0.45 0.40 0.35 0.30 − zα / 2 1 −α zα / 2 f(z) 0.25 0.20 0.15 -3.00 α/2 0.10 α/2 0.05 -2.00 -1.00 0.00 0.00 1.00 2.00 3.00 z GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 38 19 Dès lors, p − Z −α / 2 p (1 − p ) n ≤ π ≤ p + Zα / 2 p (1 − p ) n Proportion de la population p=x/n proportion de l’échantillon Taille de Valeur critique provenant de la loi normale l’échantillon Rappel : Pour que la loi normale puisse servir comme approximation, il faut que np (1 − p ) ≥ 10 si la proportion π de la population n'est pas connue. GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) Exemple d’application : 39 [LRS, p. 384] Vérification de la qualité du tirage quotidien d’un journal pour déterminer la proportion de copies défectueuses. Il n’est pas pratique de vérifier toutes les copies ! Dès lors, on vérifie un échantillon. Posons que n = 200. On trouve qu’il y a 35 copies défectueuses (i.e. ayant des imperfections). Pour un intervalle de confiance de 95 %, déterminer la fourchette de variation de la proportion des copies défectueuses. Solution : p= 35 = 0,175 200 Niveau de confiance de 95 % ⇒ Z = 1,96 GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 40 20 0,175 × 0, 825 200 = 0,175 ± 1, 96 × 0, 0269 p = 0,175 ± 1, 96 = 0,175 ± 0, 053 0,122 ≤ π ≤ 0, 228 À 95 % de confiance, entre 12,2 % et 22,8 % des copies sont défectueuses. GCI 102. Méthodes probabilistes en génie civil - Chap. 7 (PFL) 41 21