1 Échantillonnage et estimation de paramètres

publicité
GCI 102. Méthodes probabilistes en génie civil
Chapitre 7
Échantillonnage et estimation de paramètres
par
Pierre F. Lemieux, ing., professeur
Département de génie civil
Université de Sherbrooke
Tél. : (819) 821-8000 (poste 2938)
Télécopieur : (819) 821-7974
Courriel : [email protected]
Révision : 25 juin 2003
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
1
Table des matières
1. Introduction
[Diapo 3]
2. Théorème de la limite centrale
[Diapo 12]
3. Propriétés de la distribution d’échantillonnage
[Diapo 13]
4. Estimation de paramètres
[Diapo 18]
5. Estimation de paramètres par
intervalle de confiance (n ≥ 30)
[Diapo 22]
6. Taille d’échantillons requise
[Diapo 25]
7. Estimation de paramètres par
intervalle de confiance avec variance σ2
inconnue (n < 30)
[Diapo 27]
8. Distribution échantillonnale d’une proportion
[Diapo 33]
[LRS, chap. 8] [B, chap. 7]
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
2
1
1. Introduction
[LRS, p. 216] [B, p. 282]
Étude statistique sur tous les éléments d’une population :
onéreux et souvent irréalisable.
Exemple :
Prélever un cylindre de béton pour chaque m3 de béton coulé dans un
ouvrage de grande taille afin de le tester pour sa résistance.
Sondage pré-électoral de tous les électeurs.
Échantillonnage : prélever un ensemble représentatif de la population pour estimer
un paramètre statistique de la population.
Échantillon aléatoire :
Soit N le nombre d’éléments dans une population (nombre fini ou infini).
Soit n le nombre d’éléments dans l’échantillon à prélever dans cette population.
Prélever un échantillon aléatoire consiste à choisir de façon purement aléatoire
chacun des éléments qui composera l’échantillon.
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
Exemple illustratif :
3
[B, p. 289]
Supposons un sondage effectué dans 5 grandes compagnies pour déterminer
l’âge d’informatisation (à partir du 1er achat d’équipement informatique).
Entreprises
Âge d’informatisation
(en années)
A
8
B
8,5
C
9
D
9,5
E
10
Dès lors, avec X = âge d’informatisation
x1 = 8 , x2 = 8,5 , x3 = 9 , x4 = 9,5 et x5 = 10
µX = ∑
xi
N
σ X2 =
=
45
= 9 ans
5
∑ ( xi − µ )
N
2
=
2, 5
= 0, 5
5
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
4
2
Échantillonnage de la population avec remise (tirage indépendant) :
Hypothèse : former tous les échantillons possibles de taille n = 2 avec remise.
Nombre de cas possibles : Nn = 52 = 25
Énumération des
25 échantillons
Résultats de
l'échantillonnage
Moyenne des
échantillons
(A, A)
(8, 8)
8.00
(A, B)
(8, 8.5)
8.25
(A, C)
(8, 9)
8.50
(A, D)
(8, 9.5)
8.75
Échantillon
Entreprises
1
2
3
4
5
(A, E)
(8, 10)
9.00
6
(B, A)
(8.5, 8)
8.25
7
(B, B)
(8.5, 8.5)
8.50
8
(B, C)
(8.5, 9)
8.,75
9
(B, D)
(8.5, 9.5)
10
(B, E)
(8.5, 10)
9.25
11
(C, A)
(9, 8)
8.50
12
(C, B)
(9, 8.5)
8.75
13
(C, C)
(9, 9)
9.00
14
(C, D)
(9, 9.5)
9.25
9.00
15
(C, E)
(9, 10)
9.50
16
(D, A)
(9.5, 8)
8.75
17
(D, B)
(9.5, 8.5)
9.00
18
(D, C)
(9.5, 9)
9.25
19
(D, D)
(9.5, 9.5)
20
(D, E)
(9.5, 10)
9.75
21
(E, A)
(10, 8)
9.00
22
(E, B)
(10, 8.5)
9.25
23
(E, C)
(10, 9)
24
(E, D)
(10, 9.5)
9.75
25
(E, E)
(10, 10)
10.00
9.50
9.50
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
5
Distribution des fréquences et représentation graphique : [B, p. 290]
Moyennes
Fréquence
ni
Fréquence
relative fi
8.00
1
0.04
8.25
2
0.08
8.50
3
0.12
8.75
4
0.16
9.00
5
0.20
9.25
4
0.16
9.50
3
0.12
9.75
2
0.08
10.00
1
0.04
Distribution d'échantillonnage de la moyenne (n = 2)
0.25
Fréquence relative
0.20
0.15
0.10
0.05
0.00
8.00
8.25
8.50
8.75
9.00
9.25
9.50
9.75
10.00
Âge, en années
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
6
3
Moyenne de la distribution de l’échantillonnage :
9
E ( X ) = ∑ f i xi = 9 années
i =1
Moyennes
Écart
Écart2
f i Écart2
8.00
-1.00
-0.75
-0.50
-0.25
0.00
0.25
0.50
0.75
1.00
1.00
0.56
0.25
0.06
0.00
0.06
0.25
0.56
1.00
0.040
0.045
0.030
0.010
0.000
0.010
0.030
0.045
0.040
8.25
8.50
8.75
9.00
9.25
9.50
9.75
10.00
9
E ( X ) = µX
Écart = ( xi − µ X )
Écart 2 = ( xi − µ X )
2
f i Écart 2 = f i ( xi − µ X )
σ X2 = ∑ f i ( xi − µ ) = 0, 25 =
2
i =1
0, 5
2
2
σ X2
n
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
Échantillonnage avec une taille de n = 3 :
7
[B, p. 290]
Taille de l’échantillon : n = 3
Nombre d’échantillons possible : 53 = 125
µ X = 9 années
σ X2 =
0, 5 σ X2
=
3
3
σ X2
n
La répartition des moyennes échantillonnales se rapprochent de plus en plus
d’une distribution normale.
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
8
4
Moyenne
8.000
8.167
8.333
8.500
8.667
8.833
9.000
9.167
9.333
9.500
9.667
9.833
10.000
Fréquence
1
3
6
10
15
18
19
18
15
10
6
3
1
Fréq. rel.
0.008
0.024
0.048
0.080
0.120
0.144
0.152
0.144
0.120
0.080
0.048
0.024
0.008
Distribution d'échantillonnage de la moyenne (n = 3)
20
18
16
14
Fréquence
12
10
8
6
4
2
0
8
8.167
8.333
8.5
8.667
8.833
9
9.167
9.333
9.5
9.667
9.833
10
Âge, en années
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
9
Remarques :
[LRS, p. 216]
1. La moyenne des moyennes échantillonnales est celle de la population quelle
que soit la taille de l’échantillon.
2. Les moyennes x des échantillons sont moins dispersées que les valeurs
i
individuelles xi par rapport à la moyenne de la population.
Soit un échantillon aléatoire de taille n prélevé d’une population infinie ou d’une
population finie échantillonnée avec remise. Si cette population possède une
variable aléatoire X qui suit une loi de probabilité de moyenne E(X) = µ et de
variance σ2, alors la moyenne de l’échantillon suit une loi de probabilité ayant
les caractéristiques suivantes :
E(X )= E(X) = µ
Moyenne des
moyennes des
échantillons
σ X2 =
σ2
n
ou σ X =
Moyenne de la population
σ
n
Erreur-type de la moyenne
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
10
5
Remarques (suite) :
[B, p. 292]
Pour un échantillonnage sans remise à partir d’une population finie de
taille N, il faut apporter une correction au calcul de la variance et de
l’écart-type.
σ X2
⎛
N ⎜1−
σ ⎛ N −n⎞ σ
⎝
=
=
⎜
⎟
n ⎝ N −1 ⎠
n
⎛
N ⎜1−
⎝
2
X
2
X
n
N
1
N
⎞
⎟ σ2
⎠ ≅ X ⎛1− n ⎞
n ⎜⎝
N ⎟⎠
⎞
⎟
⎠
Taux de sondage
ou
taux d’échantillonnage
Ignorer le facteur de correction si
n
≤ 0,10
N
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
2. Théorème central limite
11
[B, p. 292]
But : pouvoir tirer des conclusions sur la population à partir d’échantillons.
Théorème central limite :
[LRS, p. 214] [B, p. 292]
Si des échantillons aléatoires de taille n sont prélevés d’une population ayant une
variable aléatoire continue X (peu importe la distribution de X) ayant une moyenne
µX et un écart-type σX , alors la distribution d’échantillonnage de la moyenne des
échantillons tend à se rapprocher d’une loi normale ayant les caractéristiques
suivantes
µX = µX
σX =
σX
n
à mesure que la taille de l’échantillon augmente.
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
12
6
3. Propriétés de la distribution d’échantillonnage [B, p. 293]
1. L’expérience et la pratique ont montré que la distribution de la moyenne
échantillonnale est approximativement normale quelle que soit la forme de
celle de la population, dès que l’échantillon est constitué d’au moins 30
éléments.
2. Si la population possède une distribution pratiquement symétrique, il faut un
échantillon d’au moins 15 éléments pour que la distribution de la moyenne
échantillonnale soit approximativement normale.
3. Si la population est distribuée normalement, la distribution de la moyenne
échantillonnale est normale peu importe la taille de l’échantillon.
4. Si la variance σ2 est inconnue, alors un grand échantillon (n ≥ 30) permet de
déduire une valeur fiable avec
s
2
∑ ( xi − x )
=
n−1
2
≅σ2
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
(a) Population normale et variance σ2 connue :
13
[B, p. 295]
(1) La distribution de X est normale.
( 2) E ( X ) = µ
σ
( 3) σ X
=
(4) z =
x−µ
σ
n
n
Erreur-type de la moyenne (standard error on the mean)
⇒ loi normale centrée réduite
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
14
7
(b) Distribution de population et σ2 inconnues (n ≥ 30) : [B, p. 295]
(1) Distribution de X approximativement normale.
( 2) E ( X ) = µ
∑ ( xi − x )
( 3) s =
( 4) z =
2
n ( n − 1)
x−µ
s
n
⇒ loi normale centrée réduite
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
15
Exemple d’application :
Soit X l’âge d’informatisation dans une entreprise de grande taille (> 20 M$).
Pour l’ensemble des industries de grande taille, on a trouvé que
µ X = 12, 4 ans
σ X = 3, 2 ans
On prélève un échantillon de 64 industries de cette base de données.
(1) Quels sont les paramètres d’échantillonnage de X pour ces 64 valeurs ?
n = 64 > 30 ⇒
σX =
σX
n
=
3, 2
64
E ( X ) = µ = 12, 4 ans
= 0, 4 ans
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
16
8
(2) Probabilité que l’âge moyen soit inférieur à 11,8 années ?
11, 8 − 12, 4 ⎞
⎛
P ( X < 11, 8 ) = P ⎜ Z <
⎟ = P ( Z < −1, 5 )
0, 4
⎝
⎠
P ( Z < −1, 5 ) = 0, 5 − P ( 0 ≤ Z ≤ 1, 5 )
= 0, 5 − 0, 4332 = 0, 0668
(3) Probabilité que l’âge moyen se trouve entre 11,4 et 13,4 années ?
13, 4 − 12, 4 ⎞
⎛ 11, 4 − 12, 4
P (11, 4 ≤ X ≤ 13, 4 ) = P ⎜
≤Z≤
⎟
0, 4
0, 4
⎝
⎠
= P ( −2, 5 ≤ Z ≤ 2, 5 ) = 2 P ( 0 ≤ Z ≤ 2, 5 )
= 2 × 0, 4938 = 0, 9876
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
4. Estimation de paramètres
17
[LRS, chap. 8] [B, p. 298 - 300]
Estimer un paramètre : chercher une valeur approchée en se basant sur les
résultats obtenus d’un échantillon. 2 manières : un nombre ou un intervalle
de confiance.
Estimer par intervalle de confiance : calculer, à partir d’un estimateur choisi,
un intervalle dans lequel il est vraisemblable que la valeur correspondante du
paramètre se trouve.
Pour calculer cet intervalle de confiance, il faut connaître la distribution de
l’échantillonnage de l’estimateur correspondant.
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
18
9
(a) Estimateur sans biais ou non biaisé :
[B, p. 300]
( )
E θˆ = θ
Valeur du paramètre à estimer
Estimateur sans biais
Exemple 1 :
E(X)= µ
Moyenne
d’échantillon
Moyenne de
la population
Exemple 2 :
( )
E s2 = σ 2
Estimateur sans biais
si évalué avec (n - 1)
Variance de
la population
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
19
(b) Estimateur efficace :
[B, p. 300]
Estimateurs θˆ1 et θˆ2
( ) ( )
Var ( θˆ ) < Var ( θˆ )
E θˆ1 = E θˆ2
1
2
⇒ estimateur θˆ1 plus efficace que estimateur θˆ2
Exemple :
Médiane
E ( X ) = E ( Me ) = µ
Var ( X ) =
σ2
n
Résultat qui peut
être démontré
et Var ( M e ) ≅ 1, 57
σ2
n
Estimateur plus efficace
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
20
10
(c) Estimateur convergent :
[B, p. 300]
Estimateur dont la distribution tend à se concentrer autour de la valeur
inconnue à estimer à mesure que la taille n de l’échantillon augmente.
( )
Var θˆ → 0 quand n → ∞
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
21
5. Estimation de paramètres par intervalle de confiance
[LRS, p. 367 et sq] [B, p. 301]
But : calculer à partir de la moyenne échantillonnale un intervalle dans lequel
il est vraisemblable que la vraie valeur µ se trouve.
Niveau de confiance
Intervalle à définir
Cas traité : n ≥ 30
P ( X − k ≤ µ ≤ X + k ) = 1−α
Loi normale - Fonction de densité
0.45
0.40
0.35
− zα / 2
0.30
f(z)
zα / 2
1 −α
0.25
0.20
0.15
α/2
0.10
α/2
0.05
0.00
-3.00
-2.00
-1.00
0.00
1.00
2.00
3.00
z
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
22
11
Posons que (1 - α) = 0,95 ou 95 %. Il s’agit d’une valeur très fréquemment choisie.
Dès lors,
⎛ X −k X −µ X +k ⎞
≤
≤
P⎜
⎟ = 0, 95
⎝σ n σ n σ n ⎠
ou
⎛
⎞
⎛
⎞
X −µ
X −µ
P ⎜ − z0,025 ≤
≤ z0,025 ⎟ = P ⎜ −1, 96 ≤
≤ 1, 96 ⎟ = 0, 95
σ n
σ n
⎝
⎠
⎝
⎠
Dès lors,
−1, 96
σ
≤ X − µ ≤ 1, 96
n
− X − 1, 96
X − 1, 96
σ
n
σ
n
σ
n
≤ − µ ≤ − X + 1, 96
≤ µ ≤ X + 1, 96
σ
n
σ
n
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
23
Donc
X − k = X − 1, 96
σ
σ
n
n
∑ ( xi − x )
n
i =1
s=
Niveau de confiance : (1 - α)
x − zα / 2
Si σ non connue
≤ µ ≤ x + zα / 2
n−1
σ
n
Intervalle dans lequel devrait
vraisemblablement se trouver µ
pour un niveau de confiance (1 - α)
[B, p. 302]
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
24
12
6. Taille d’échantillon requise (population normale ou quasi normale)
[B, p. 304]
σ
x − zα / 2
n
≤ µ ≤ x + zα / 2
x − µ ≤ E = zα
Il faut alors que
σ
n
σ
2
Marge d’erreur :
[pour (1 - α)]
n
Taille minimale requise
pour obtenir E = ?
⎡z σ ⎤
n = ⎢ α/2 ⎥
⎣ E ⎦
⎡z s⎤
ou n = ⎢ α / 2 ⎥
⎣ E ⎦
2
2
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
25
Exemple d’application :
On a prélevé 400 éprouvettes pour des tests en laboratoire. Cependant on ne
voudrait pas effectuer les test sur les 400 éprouvettes. Sachant qu’il est admis
que l’écart-type de la résistance en compression est de l’ordre de 200 kPa,
combien d’éprouvettes doit-on examiner pour déterminer la valeur moyenne
avec une marge d’erreur de 50 kPa et un niveau de confiance de 95 % ?
Solution :
E = zα / 2
Population finie ⇒
(Voir Diapo 10)
n≅
(1 - α) = 0,95
n=
⇒
σ
n
N −n
N −1
ou
N zα2 / 2 σ 2
NE 2 + zα2 / 2 σ 2
α = 0,05 ⇒ zα/2 = 1,96
400 × 1, 962 × 2002
= 53, 28 ≅ 53
400 × 502 + 1, 962 × 2002
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
26
13
7. Estimation de paramètres par intervalle de confiance
avec variance σ2 inconnue (n < 30) [LRS, p. 370] [B, p. 306]
La distribution-t de Student :
[B, p. 306 - 308]
Population normale avec variance inconnue et n < 30 : estimation de σ2 par
s2 n’est plus fiable. La variable réduite
T=
X −µ
s
n
n’est plus distribuée selon la loi normale. L’estimation de σ par s n’est plus
fiable, car elle varie trop d’un échantillon à l’autre. On utilise alors la distribution
de Student :
⎛ν + 1 ⎞
⎛ ν +1 ⎞
Γ⎜
⎟ ⎡ t 2 ⎤ −⎜⎝ 2 ⎟⎠
2
⎝
⎠ 1+
f (t ) =
⎢
⎥
ν
⎛
⎞
νπ Γ
⎣ ν ⎦
⎜2⎟
⎝ ⎠
1
Degré de liberté
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
27
Fonction de densité de probabilité de la loi de Student
f(t)
ν =5
α/2
-5.0
-4.0
-3.0
-2.0
-1.0
0.0
1.0
2.0
3.0
4.0
5.0
t
Propriétés :
(1) t varie de − ∞ à + ∞
(2) distribution symétrique p/r à l’origine.
(3) un seul paramètre : ν
(4) E(T) = 0 et Var(T) = ν / (ν - 2)
(5) ν → ∞ ⇒ distribution de Student tend vers la loi normale.
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
28
14
Remarques :
(1) Notion de degré de liberté :
Le calcul de la variance
[LRS, p. 372] [B, p. 308]
s2
se fait en utilisant
n
∑ ( xi − x )
2
i =1
Valeur à calculer au préalable puisque
n
∑ ( xi − x ) = 0
i =1
⇒ les n valeurs xi sont linéairement dépendantes. C’est pourquoi
on dit que l’on a ν = (n - 1) degrés de liberté.
(2) Toujours vérifier si les tables des valeurs de la distribution de Student
fournissent la valeur de t pour α ou α / 2. La remarque s’applique aussi
aux logiciels qui effectuent ce calcul.
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
29
Exemple :
Intervalle de confiance : 95 % ou 0,95
n = 12 valeurs de xi
Trouver la valeur de t dans le cas de la loi de Student.
Solution :
D’après (LRS, p. A-6) ou (B, p. 698 - 699)
Degrés de liberté
ν = 12 − 1 = 11
α = 0, 05 / 2 = 0, 025
t = 2, 2010
La table donne la valeur de t
pour la section supérieure
seulement. Donc il faut diviser
par 2, car nous avons les 2
extrémités pour un intervalle
de confiance.
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
30
15
À l’aide de logiciel EXCEL :
[B, p. 331]
(1) Cliquer sur fx
(2) Choisir Statistiques (Statistical)
(3) Choisir LOI.STUDENT.INVERSE (TINV)
(4) Pour probabilité, inscrire 0,05 (car EXCEL se charge de diviser par 2
pour tenir compte que ce sont les 2 extrémités qui interviennent).
(5) Pour ν, inscrire 11.
(6) Cliquer sur OK.
Valeur trouvée : t = 2,200986 ou 2,2010
Fichier EXCEL
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
31
Estimation d’un intervalle de confiance (par un exemple)
Posons, à titre d’exemple, que
n = 28
x = 225
s = 20
Niveau de confiance : 95 %
Trouver l’intervalle de confiance pour une estimation de la moyenne µ
Solution :
L’intervalle de confiance sera donné par
x − tα / 2;n −1
s
n
≤ µ ≤ x + tα / 2;n −1
s
n
D’après la table, t = 2,0518 pour ν = 27 et α = (1 - 0,95) / 2 = 0,025
Donc
217, 24 ≤ µ ≤ 232, 76
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
32
16
8. Distribution échantillonnale d’une proportion
[LRS, p. 218 et 384] [B, p. 311 - 316]
Exemple d’introduction :
58 % des Québécois s’opposent à la fusion des banques.
Un dirigeant de la banque BNN a mandaté un responsable du service à la
clientèle pour interroger une centaine (100) de clients, sélectionnés au
hasard, pour connaître leur opinion.
Hypothèse : le % ci-dessus est aussi représentatif de la BNN.
Quelle est la probabilité que, dans un échantillon de 100 personnes, au moins
65 individus soient contre les fusions ?
p = 58 % ou 0,58 est une proportion, car la population est divisée en 2
groupes où ce qui les différencie est la caractéristique d’être pour ou
contre les fusions des banques.
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
33
Distribution échantillonnalle d’une proportion : [LRS, p. 219] [B, p. 312]
Posons que l’on prélève au hasard un échantillon de grande taille d’une population
dont les éléments possèdent un caractère qualitatif dans une proportion π .
Sur cet échantillon de taille n, on observe une proportion de valeur p qui présentent
le caractère. Cette proportion p est une variable aléatoire dont la distribution se
rapproche de la distribution normale qui a les caractéristiques suivantes :
µ =π
σp =
Grande taille
Variable réduite :
π (1 − π )
n
⇒ nπ (1 − π ) ≥ 10
p −π
Z=
π (1 − π )
n
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
34
17
Exemple 1 :
Solutionnons le problème posé au tout début de cette section à propos de
l’échantillon de 100 clients de la BNN pour connaître la probabilité pour que
la proportion soit de 65 %, alors que la population montre une proportion de
58 %.
Solution :
π = 0, 58
σp =
0, 58 (1 − 0, 58 )
100
= 0, 0493
Vérification pour l’utilisation de la loi normale :
100 × 0, 58 (1 − 0, 58 ) = 24, 36 > 10
Calcul de la variable réduite :
z=
0, 65 − 0, 58
0, 58 (1 − 0, 58 )
100
=
0, 07
= 1, 42
0, 0493
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
35
Dès lors,
Pour EXCEL
P ( Z > 1, 42 ) = 1, 0 − P ( −∞ ≤ Z ≤ 1, 42 )
Pour la
table
= 0, 5 − P ( 0 ≤ Z ≤ 1, 42 )
= 0, 5000 − 0, 4222 = 0, 0778
Il y a 8 chances sur 100 pour que 65 individus et plus soient contre la fusion
des banques dans un échantillon de 100.
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
36
18
Exemple 2 :
[LRS, p. 219]
Une compagnie qui fabrique des lecteurs de disques compacts doit rejeter 1 lecteur
sur 10 au moment de l’inspection. Si l’on choisit au hasard un échantillon de 400
lecteurs, déterminer la probabilité que la proportion p des lecteurs rejetés de
l’échantillon se trouve entre 10 % et 12 %.
Solution :
0,12 − 0,10
z=
0,10 × 0, 90
400
=
0, 02
= 1, 33
0, 015
P ( 0,10 ≤ p ≤ 0,12 ) = P ( 0 ≤ Z ≤ 1, 33 ) ⇒
P = 0, 4082
Il y a donc 41 % des chances que la proportion se trouve entre 0,10 et 0,12.
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
37
Estimation des intervalles de confiance dans le cas d’une proportion
[LRS, p. 384] [B, p. 313]
Posons que (1 - α) 100% définisse l’intervalle de confiance. Lorsque la distribution
d’une proportion peut être approximée par la loi normale, alors la figure ci-dessous
illustre la nomenclature des termes.
Loi normale - Fonction de densité
0.45
0.40
0.35
0.30
− zα / 2
1 −α
zα / 2
f(z)
0.25
0.20
0.15
-3.00
α/2
0.10
α/2
0.05
-2.00
-1.00
0.00
0.00
1.00
2.00
3.00
z
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
38
19
Dès lors,
p − Z −α / 2
p (1 − p )
n
≤ π ≤ p + Zα / 2
p (1 − p )
n
Proportion de
la population
p=x/n
proportion de
l’échantillon
Taille de
Valeur critique provenant
de la loi normale
l’échantillon
Rappel : Pour que la loi normale puisse servir comme approximation, il faut que
np (1 − p ) ≥ 10
si la proportion π de la population n'est pas connue.
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
Exemple d’application :
39
[LRS, p. 384]
Vérification de la qualité du tirage quotidien d’un journal pour déterminer la
proportion de copies défectueuses. Il n’est pas pratique de vérifier toutes les
copies ! Dès lors, on vérifie un échantillon.
Posons que n = 200.
On trouve qu’il y a 35 copies défectueuses (i.e. ayant des imperfections).
Pour un intervalle de confiance de 95 %, déterminer la fourchette de variation de
la proportion des copies défectueuses.
Solution :
p=
35
= 0,175
200
Niveau de confiance de 95 % ⇒ Z = 1,96
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
40
20
0,175 × 0, 825
200
= 0,175 ± 1, 96 × 0, 0269
p = 0,175 ± 1, 96
= 0,175 ± 0, 053
0,122 ≤ π ≤ 0, 228
À 95 % de confiance, entre 12,2 % et 22,8 % des copies sont défectueuses.
GCI 102. Méthodes probabilistes en
génie civil - Chap. 7 (PFL)
41
21
Téléchargement