TD_SQ20_P2016suite

publicité
SQ20
TD 5 - convergences et approximations
Convergences et
approximations
1
Pour s’entraîner
1
On considère une suite (X n )n∈N de variables aléatoires indépendantes suivant la même loi de Bernoulli de paramètre p.
On définit la suite (Yk )k∈N∗ de variables aléatoires par
n
1 X
∀ k > 0, Yk = X k−1 + X k . On pose enfin Z n =
Yk
n k=1
4
Une machine est chargée de conditionner automatiquement des
paquets de farine de 1 kg avec un écart type de 10 grammes. On modélise
la masse d’un paquet, exprimée en grammes, par une variable aléatoire
X d’espérance µ = 1000 et de variance σ2 = 100.
La loi de X est inconnue. Pour vérifier le fonctionnement de la machine, on prélève plusieurs échantillons de 40 paquets dont on mesure
la masse. Pour chaque échantillon, on note X k la variable aléatoire qui
modélise la masse du kième paquet.
1. Que peut-on dire de la loi de X k ? Donner E(X k ) et V (X k ).
n
1 X
2. On désigne par X n =
X k la variable aléatoire modélisant la
n k=1
masse moyenne d’un paquet dans un échantillon de taille n = 40.
Calculer E( X n ) et V ( X n ).
1. Déterminer la loi de Yk , donner son espérance et sa variance.
2. Calculer l’espérance et la variance de Z n .
Que peut-on dire de la loi de probabilité de X n ?
3. En utilisant l’inégalité de Bienaymé-Tchebychev, étudier la convergence en probabilité de la suite (Z n )n∈N∗ .
Peut-on utiliser la loi faible des grands nombres ?
http ://andre.turbergue.free.fr
SQ20 - Printemps 2016
2
Soit X 1 , X 2 , . . . , X n des variables aléatoires mutuellement indépendantes et de même loi N (0 , 1). On pose pour tout entier naturel
n
1 X
n Ê 1, T n =
X2
n k=1 k
Étudier la convergence en probabilité de la suite (T n )n∈N∗
3. Calculer la probabilité pour que la masse moyenne d’un échantillon de 40 paquets soit supérieure à 997 grammes ?
5
Au cours d’une épreuve, un événement a une probabilité 0, 2 de se
réaliser.
1. On effectue n épreuves indépendantes. Si X est le nombre de fois
où l’événement se réalise, déterminer la loi de X , son espérance,
et sa variance.
2. On prend n = 100. Calculer P(15 É X É 25) à 10−3 près :
3 ? Soit (Ω, T , P) un espace probabilisé et U une variable aléatoire
définie sur Ω suivant une loi normale centrée réduite N (0, 1).
On notera Φ la fonction de répartition de U.
1. Montrer en utilisant l’inégalité de Bienaymé-Tchebychev, que
pour tout x > 0,
1
0 < 1 − Φ(x) É 2
2x
Z A
+∗
2. Soit A ∈ R . Transformer l’intégrale
(1 − Φ(x)) dx à l’aide
d’une intégration par parties.
0
3. En
Z +∞déduire l’existence et la valeur de l’intégrale généralisée
(1 − Φ(x)) dx.
(a) en utilisant la loi de X ,
(b) en approchant la loi de X par une loi normale.
3. On prend n = 1000. Calculer P(170 É X É 230) par les méthodes
de la question précédente.
6 ? On lance une pièce de monnaie équilibrée.
On gagne 1e si le résultat est Face, et on perd 1e sinon. Majorer le
nombre de lancers à effectuer pour que l’on ait au moins une probabilité
0,95 de perdre au plus 20e.
On comparera les résultats obtenus par approximation de loi, et par l’inégalité de Bienaymé-Tchebychev.
0
page 1
UTBM
SQ20
TD 5 - convergences et approximations
7
On a mélangé 5 000 roulements d’une marque A avec 10 000
roulements de la marque B. On prélève au hasard 150 roulements.
Quelle est la probabilité pour que le nombre de roulements A soit
compris entre 45 et 60 ?
8
Soient U1 , U2 , . . . , U400 des variables aléatoires mutuellement indépendantes, qui suivent toutes la même loi uniforme sur l’intervalle
[0 , 2]. . On pose T = U1 + U2 + · · · + U400 .
On cherche le nombre a tel que P([T < a]) = 5%.
Que vaut approximativement a ?
9
Soit (X n )n∈N∗ une suite de v.a.r. mutuellement indépendantes et
n
X
suivant la même loi de Poisson de paramètre 1. On pose S n =
Xk
k=1
11 Une entreprise compte 300 employés. Chacun d’eux téléphone
en moyenne 6 minutes par heure. Quel est le nombre de lignes que
l’entreprise doit installer pour que la probabilité que toutes les lignes
soient utilisées au même instant, soit au plus égale à 0,025 ?
On notera n le nombre de lignes installées dans l’entreprise, X la var égale
au nombre d’employés qui téléphonent à un instant t fixé, et on commencera
au départ par calculer la probabilité qu’un employé donné soit en train de
téléphoner à un instant t.
2
12 On identifie R2 muni de sa structure euclidienne canonique au
plan de la géométrie usuelle. Soit A une partie de [0, 1] × [0, 1] d’aire a.
On admet que si X et Y sont deux variables aléatoires indépendantes
suivant la loi uniforme sur [0, 1], la probabilité de l’événement
[(X , Y ) ∈ A] est égale à a. Soit f : [0, 1] −→ [0, 1] une fonction continue.
1. Quelle est la loi de S n ?
1. Soit X et Y deux variables aléatoires indépendantes suivant la
loi uniforme sur [0, 1].
Quelle est la probabilité de l’événement [Y É f (X )] ?
2. Expliciter P([S n É n]).
3. En utilisant le théorème central limite, montrer que
http ://andre.turbergue.free.fr
SQ20 - Printemps 2016
n nk
X
k=0 k!
∼
( n→+∞)
Pour approfondir
en
2
10 Soit n un entier supérieur ou égal à 2. On considère n variables
aléatoires indépendantes X 1 , X 2 , . . . , X n suivant toutes la même loi
géométrique de paramètre p où p ∈]0; 1[.
X1 + X2 + · · · + X n
On pose de plus X n =
.
n
1. Déterminer l’espérance m et l’écart type σn de X n en fonction de
p et de n.
´
³
2. Montrer que lim P 0 < X n − m É σn existe et exprimer sa van→+∞
Z 1
2
leur à l’aide de
e− t /2 dt.
2. Soit (X n )n∈N∗ et (Yn )n∈N∗ deux suites indépendantes de variables
aléatoires indépendantes suivant la loi uniforme sur [0, 1].
Pour tout n ∈ N∗ , on appelle Z n la variable de Bernoulli prenant
la valeur 1 si l’événement [Yn É f (X n )] est réalisé, 0 sinon.
Pour tout n ∈ N∗ , on pose S n = Z1 + Z2 + · · · + Z n .
Quelle est la loi de S n ?
S n − E(S n )
Quelle est la limite en loi de la variable S ∗n = p
?
V (S n )
Dans la suite de l’exercice, on suppose que n est assez grand pour
identifier la loi de S ∗n à cette loi limite.
Sn
Quelle loi assigne-t-on alors à
?
n
3. Soit Φ la fonction
¯ de
¯ répartition de la loi N (0, 1).
Déterminer P(¯S ∗n ¯ É 1,96).
¯
µ¯
¶
Z 1
¯
¯ Sn
1
En déduire que P ¯¯
−
f (t) dt¯¯ É p
Ê 0,95
n
n
0
0
page 2
UTBM
SQ20
TD 5 - convergences et approximations
→
− →
−
13 Une cible est centrée sur l’origine d’un repère (O, i , j ) orthonormé. Une fléchette est lancée sur cette cible, et on suppose que les
coordonnées d’impact X et Y suivent des lois normales centrées réduites
indépendantes. Soit Z la variable aléatoire qui mesure la distance du
point d’impact au centre de la cible.
(
2
− z2
1
−
e
si z Ê 0 , où F est la fonction de
1. Montrer que F(z) =
0
si z < 0
répartition de Z.
3
14 Un dé régulier est lancé 3 000 fois. On cherche à déterminer la probabilité
de l’événement A : «on a obtenu 6 entre 450 et 550 fois».
On note X la var égale au nombre de 6 obtenus.
2. En déduire une densité f de Z, puis montrer que
r
E(Z) =
π
2
et
V (Z) =
Pour travailler seul
1. Quelle est la loi exacte de X ?
2. À l’aide de l’inégalité de Bienaymé-Tchebychev, donner une minoration
de la probabilité de A .
3. Par quelle loi peut-on approcher la loi de X ?
4. Calculer la probabilité demandée dans l’énoncé de deux façons : avec
correction de continuité et sans correction de continuité. Commenter les
résultats obtenus.
4−π
2
3. On lance 150 flèches sur la cible (les lancers sont indépendants),
et on note M la distance moyenne des impacts au centre de la
cible. Déterminer la loi qui approche celle de M.
4. Calculer P(1 < M < 1, 2).
http ://andre.turbergue.free.fr
SQ20 - Printemps 2016
Pour quel intervalle I centré sur l’espérance aura-t-on
P(M ∈ I) = 0, 9 ?
page 3
UTBM
SQ20
TD 6 - estimation ponctuelle
Estimation ponctuelle
1
ne s’écarte pas de 250 g de plus de 1 g, avec une probabilité de
95%.
Pour s’entraîner
15 Le responsable d’une entreprise a accumulé depuis des années les
résultats à un test d’aptitude à effectuer un certain travail. Il semble
plausible de supposer que les résultats au test d’aptitude sont distribués
suivant une loi normale de moyenne m = 150 et de variance σ2 = 100. On
fait passer le test à 50 individus de l’entreprise. Quelle est la probabilité
que la moyenne de l’échantillon soit comprise entre 146 et 154 ?
18 Soit (X 1 , X 2 , . . . , X n ) un échantillon de taille n d’une variable aléatoire X qui suit une loi de Poisson de paramètre λ.
n
1X
X i . Montrer que X n est un estimateur sans
1. On pose X n =
n i=1
biais et convergent de λ.
n
X
2
2. On pose T n =
i X i.
n(n + 1) i=1
Montrer que T n est un estimateur sans biais et convergent de λ.
3. Comparer les deux estimateurs précédents.
L’un est-il meilleur que l’autre ?
16 Un atelier produit en grande série des pièces cylindriques. On
désigne par X la variable aléatoire associant à chaque pièce tirée au
hasard dans la production, son diamètre x, en mm. On suppose que X
suit la loi normale de moyenne 12,50 et d’écart-type 0,02.
http ://andre.turbergue.free.fr
SQ20 - Printemps 2016
1. Déterminer, à 10−3 près, la probabilité que le diamètre d’une pièce,
prise au hasard dans la production, soit compris entre 12,45 et
12,55.
2. On note X n la variable aléatoire mesurant la moyenne des diamètres des n pièces d’un échantillon de taille n, pris au hasard
et avec remise dans la production. On note p n la probabilité que
cette moyenne appartienne à l’intervalle [12, 495 ; 12, 505].
Déterminer la taille minimale n de l’échantillon pour que la probabilité p n soit supérieure ou égale à 0,97.
4. Soit (8, 5, 4, 0, 1, 5, 0, 2, 2, 3) la réalisation d’un échantillon de taille
n = 10 de X .
Calculer les deux estimations ponctuelles de λ qui correspondent
à X n et T n . Laquelle retiendra-t-on ?
19 Un contrôle portant sur un emballage automatique de café fournit
les masses suivantes :
masse en g
247 248 249 250 251 252 253 254
nombre de paquets
2
6
8
13
11
5
3
2
1. Donner une estimation ponctuelle de la masse moyenne d’un
paquet, et une de l’écart-type.
2. En supposant la loi normale, déterminer à l’aide des estimations,
les pourcentages de paquets de masse supérieure à 250 g, de
masse comprise entre 249 et 251.
17 Un boulanger fabrique des baguettes. On suppose que la variable
aléatoire X , qui à chaque baguette tirée au hasard associe sa masse en
gramme, suit la loi normale N (250 ; 10).
1. On prélève un échantillon de 50 baguettes (au hasard et avec
remise) et on note X la variable aléatoire qui mesure le poids
moyen des baguettes de l’échantillon. Quelle est la loi X ?
Calculer la probabilité pour que la moyenne des poids des
baguettes de l’échantillon soit comprise entre 245 g et 255 g.
20 Pour un échantillon observé (x1 , x2 , · · · , x100 ) d’une variable aléatoire X , on a obtenu
2. On se propose de prélever un échantillon de taille n. Déterminer n
pour que la moyenne des masses des baguettes de cet échantillon
Proposer des estimations ponctuelles de l’espérance m = E(X ) et de la
variance σ2 = V (X ).
100
X
k=1
page 4
xk = 2000
et
100
X
x2k = 41 062.
k=1
UTBM
SQ20
TD 6 - estimation ponctuelle
2
Soit θ un réel strictement positif.
21

 2t
2
On définit la fonction f sur R par f (t) =
 0θ
1.
si t ∈ [0 , θ ]
Pour approfondir
23 Final 2015. Soit λ un nombre réel strictement positif.
sinon
Partie A
(a) Vérifier que f est une densité de probabilité.
(b) Soit X une variable aléatoire admettant f pour densité.
Calculer E(X ) et V (X ).
2. Soit (X 1 , X 2 , . . . , X n ) un échantillon de taille n de X . Déduire de
la question 1. un estimateur T n sans biais et convergent de θ .
3. On pose M n = max(X 1 , X 2 , . . . , X n ).
½
On considère la fonction f définie sur R par
si t Ê λ
si t < λ
1. Montrer que f est une densité de probabilité.
2. Déterminer la fonction de répartition F de X .
3. On considère la variable aléatoire U = X − λ.
(b) L’estimateur M n est-il sans biais ? En déduire un estimateur
dn de θ .
sans biais M
dn est-il convergent ?
(c) L’estimateur M
(a) Déterminer la fonction de répartition G de U.
(b) En déduire que U est une variable à densité qui suit une loi
classique dont on précisera le paramètre.
Préciser son espérance et sa variance.
dn . Quel est le meillleur ?
4. Comparer les estimateurs T n et M
http ://andre.turbergue.free.fr
eλ− t
0
On note X une variable aléatoire réelle de densité f .
(a) Déterminer la loi de probabilité de M n .
SQ20 - Printemps 2016
f (t) =
22 On s’intéresse à la proportion p de personnes possédant un gPhone.
On tire au sort un échantillon (X 1 , X 2 , · · · , X n ) de taille n dans une
population très grande.½ À chaque personne interrogée, on associe la
1 possède un gPhone
variable aléatoire X k =
0
sinon
1. Donner un estimateur T n = f (X 1 , X 2 , . . . , X n ) de p.
Étudier ses propriétés (biais, convergence).
2. On prend maintenant deux échantillons indépendants
(X 1 , X 2 , . . . , X n1 ) et (X 10 , X 20 , . . . , X n0 2 ) de taille n 1 et n 2 (n 1 < n 2 ).
On note f 1 et f 2 les proportions de possesseurs de gPhone pour
les deux échantillons. On note F1 et F2 les estimateurs usuels de
la proportion p sur chacun des deux échantillons.
Soit F = αF1 + βF2 (α > 0, β > 0) un estimateur de p.
(a) Déterminer α et β pour que F soit un estimateur sans biais
de p. En déterminer la variance.
(c) En déduire l’espérance et la variance de X .
Partie B
Dans toute la suite, n désigne un entier naturel non nul et X 1 , X 2 , . . . , X n
des variables aléatoires mutuellement indépendantes de même loi que
X . On cherche à estimer le réel λ. Pour tout entier naturel non nul n,
on pose
Ã
!
n
1 X
Sn = X n − 1 =
X k − 1 et Yn = min(X 1 , X 2 . . . , X n )
n k=1
(b) Déterminer α et β pour que F soit un estimateur sans biais
de p, et de variance minimale.
(c) Application numérique : n 1 = 500, n 2 = 1000, f 1 = 0, 3, et
f 2 = 0, 23.
page 5
1.
(a) Montrer que S n est un estimateur sans biais de λ.
(b) Justifier que S n est un estimateur convergent de λ.
2. Démontrer que la fonction de répartition F n de Yn est définie par
½
F n (x) =
1 − en (λ− x)
0
si x Ê λ
si x < λ
3. On considère la variable aléatoire Z n = Yn − λ.
UTBM
SQ20
TD 6 - estimation ponctuelle
(a) Déterminer la fonction de répartition G n de Z n .
(b) En déduire que Z n suit une loi exponentielle dont on précisera le paramètre.
(c) En déduire l’espérance et la variance de Yn .
25
1
4. On pose T n = Yn − .
n
Prouver que T n est un estimateur sans biais et convergent de λ.
De S n et T n , lequel est l’estimateur le plus efficace ?
3
Pour travailler seul
24 Un événement peut se produire à tout instant X (loi uniforme) dans un
intervalle I = [0, b], où b est inconnu. Pour estimer la valeur de b inconnue, on
va considérer un n-échantillon ( X 1 , X 2 , · · · , X n ).
Final 2013 .
On cherche à évaluer le nombre N de poissons vivant dans un étang.
On prélève dans cet étang en une seule fois un échantillon de r poissons
que l’on bague avant de les remettre dans l’étang. On propose une méthode
pour tenter d’estimer N .
Soit n ∈ N∗ . On prélève des poissons dans l’étang, au hasard et avec remise. On note X n la variable aléatoire égale au nombre de poissons qu’il a été
nécessaire de pêcher pour obtenir n poissons marqués.
On pose D 1 = X 1 et pour tout entier i de ‚2 , nƒ, D i = X i − X i−1 .
On considère que les D i sont des variables aléatoires mutuellement indépendantes.
1. Rappeler la densité, l’espérance, et la variance de X en fonction de b.
n
1X
2. Soit l’estimateur T1 = X =
X i . Calculer E (T1 ).
n i=1
T1 est-il sans biais ?
http ://andre.turbergue.free.fr
SQ20 - Printemps 2016
3. À l’aide de T1 , construire un estimateur sans biais T2 de b.
Calculer V (T2 ).
1.
(a) Soit i un entier fixé de ‚2 , nƒ. Justifier que la variable D i suit une
r
loi géométrique de paramètre p = .
N
Donner l’espérance et la variance de D i en fonction de N et r .
n
X
(b) Que peut-on dire de X n et
Di ?
i =1
En déduire l’espérance et la variance de X n .
r
(c) On pose Z n = X n . Montrer que Z n est un estimateur sans
n
biais et convergent de N .
4. Un autre estimateur de b est T3 = sup( X 1 , X 2 , · · · , X n ).
Pour x ∈ [0, b], calculer P(T3 É x).
En déduire la fonction de répartition, et la densité de T3 .
5. Calculer E (T3 ). T3 est-il un estimateur sans biais ? À l’aide de T3 ,
construire un estimateur sans biais T4 de b.
6. Calculer E (T4 ), V (T4 ). Parmi les 4 estimateurs T1 , T2 , T3 , T4 , lequel
est le meilleur ?
7. Application. La procédure de départ d’un Grand Prix de Formule 1 est
la suivante : cinq feux rouges sont allumés successivement, l’extinction
simultanée de ces cinq feux donne le signal du départ. Le temps qui
s’écoule entre l’allumage complet et l’extinction est une variable uniforme sur [0, b] (ce temps est choisi par le directeur de course dans les limites du règlement). Au cours des 16 G.P. d’une saison, les intervalles de
temps, en secondes, ont été : 0, 3 0, 9 2, 1 2, 6 2, 7 0, 6 1, 6 0, 1
1, 2 2, 1 0, 8 0, 6 1, 1 0, 5 1, 2 2, 7
Déterminer une estimation de b.
page 6
2. Pour n assez grand, par quelle loi peut-on approcher la loi de la variable
aléatoire X n ?
3. On a marqué r = 200 poissons puis effectué 450 prélèvements pour
obtenir n = 50 poissons marqués.
On note σ l’écart-type de Z50 .
Exprimer σ en fonction de N . Proposer une estimation ponctuelle de N .
UTBM
SQ20
TD 7 - estimation par intervalle de confiance
Estimation par intervalle de
confiance
1
1. Déterminer des estimations ponctuelles de µ et de σ2 .
2. Déterminer un intervalle de confiance de µ au niveau 0, 95.
Pour s’entraîner
http ://andre.turbergue.free.fr
SQ20 - Printemps 2016
26 BTS informatique de gestion - 2011 .
La direction des ressources humaines d’une entreprise de plus de
20 000 salariés a décidé de rembourser à ses salariés les frais professionnels de téléphone mobile. Pour prévoir cette dépense dans le budget,
il a donc été réalisé une enquête auprès de 150 salariés leur demandant
le montant de cette dépense. Cette expérience est assimilée à un tirage
aléatoire avec remise.
Pour cet échantillon, la moyenne est x e = 54 e et l’écart-type est
s e = 10 e.
On désigne par X la variable aléatoire qui, à chaque échantillon
aléatoire de 150 salariés prélevé au hasard dans l’ensemble des salariés de l’entreprise, associe la moyenne des montants en euros de
ces dépenses. On pourra assimiler ces prélèvements à des prélèvements
aléatoires avec remise.
1. Donner une estimation ponctuelle de la moyenne m des montants
des dépenses en téléphone mobile professionnel de l’ensemble des
salariés de l’entreprise.
2. Proposer une estimation ponctuelle σ
b de l’écart-type σ des montants des dépenses en téléphone mobile professionnel de l’ensemble des salariés de l’entreprise, arrondie au centième.
28 On souhaite estimer la masse m d’un certain objet. Pour cela, on
effectue des pesées successives et on note la moyenne obtenue. On
admet que la variable aléatoire renvoyant le résultat d’une pesée de
l’objet étudié suit la loi normale d’espérance m et d’écart-type σ = 0, 1.
1. On effectue 10 pesées et on obtient une masse moyenne de 72,40
grammes. Donner un intervalle de confiance au niveau de confiance
90% pour la masse m.
2. Combien de pesées suffirait-il d’effectuer pour que l’amplitude de
cet intervalle de confiance à 90% soit inférieure ou égale à 0,05 ?
3. Comment répondre à la question 1. si on ne suppose plus que le
résultat d’une pesée suit une loi normale ?
29 L’airbag (ou coussin gonflable) est un système de sécurité de plus
en plus souvent installé dans les automobiles. Son gonflement est assuré
par un dispositif pyrotechnique dont les caractéristiques importantes
sont la moyenne et l’écart-type du délai entre la mise à feu et l’explosion.
Lors de l’étude d’un certain type de dispositif d’allumage, les résultats
des mesures, effectuées sur 10 exemplaires, ont été (en millisecondes) :
28, 28, 31, 31, 33, 30, 31, 27, 32, 29.
3. Donner un intervalle de confiance de m au niveau de confiance de
99 %. Arrondir au centième les bornes de cet intervalle.
1. Calculer, au niveau de confiance de 95%, un intervalle de confiance
de la moyenne du délai si on connaît l’écart-type de la population
de référence et qu’il est égal à 2.
2. Calculer ce même intervalle si on ne connaît pas l’écart-type de la
population de référence.
27 Soit X ,→ N (µ, σ2 ).
On prélève un échantillon de variables aléatoires indépendantes
E = (X 1 , X 2 , . . . , X 9 ) dont une observation e donne :
3. Calculer, au même niveau de confiance, un intervalle de confiance
de la variance du délai dans le cas où on ne connaît pas l’écart-type
de la population de référence.
7 8 9 10 8 5 9 7 8
page 7
UTBM
SQ20
TD 7 - estimation par intervalle de confiance
30 On a observé un échantillon de taille n = 500, d’adolescents de 15
ans, dans lequel 210 présentent un surpoids. Soit p la proportion d’adolescents de 15 ans qui présentent un surpoids. Donner un intervalle de
confiance pour p aux niveaux de confiance 95% et 99%.
31 Une entreprise fabrique des sacs en cuir en grande quantité.
Un contrôle de fabrication portant sur un échantillon de 200 sacs a
montré que 50 d’entre eux étaient de première qualité, les autres de
qualité courante.
Estimer au niveau 95% l’intervalle de confiance de la proportion de
sacs de première qualité.
34 Une pièce métallique rectangulaire a une longueur X qui suit une
loi normale d’espérance 18, 4 et de variance v1 inconnue, et une largeur
Y normale d’espérance M2 , et de variance v2 inconnues.
Un échantillon de 25 pièces a donné les mesures suivantes :
• pour la longueur : un écart-type de 0, 7
• pour la largeur : une moyenne de 25, 4, et une estimation de
l’écart-type s 2 = 0, 9.
Déterminer les intervalles de confiance au niveau 95% pour les variances des deux dimensions.
2
http ://andre.turbergue.free.fr
SQ20 - Printemps 2016
32 En France, 100 personnes choisies au hasard ont été interrogées
afin de se prononcer pour ou contre le nouveau plan de rigueur présenté
par le gouvernement. On note p la proportion inconnue de personnes
qui sont favorables à ce nouveau plan. On souhaite réaliser un autre
sondage avec une amplitude pour l’intervalle de confiance 0,95 d’au
plus 0,02. Quel est le nombre minimal de personnes à interroger ?
Pour approfondir
35 On administre des somnifères à deux groupes de malades A et B
comprenant 50 et 100 individus. Le groupe A reçoit le nouveau somnifère, le groupe B reçoit l’ancien. Les patients du groupe A ont dormi
7,82 heures en moyenne, ceux du groupe B : 6,75 heures en moyenne.
Les écarts-type de chaque population sont supposés connus et égaux à
σ A = 0, 24h et σB = 0, 30h.
33 Quatre jours avant le premier tour de l’élection présidentielle de
2002, on effectue un sondage.
1. Dans un échantillon «représentatif» de 1000 électeurs (taille fréquemment utilisée pour les sondages politiques), 180 personnes
déclarent vouloir voter pour le candidat Lionel. Donner les intervalles de confiance à 95% et 99% du pourcentage de personnes
ayant l’intention de voter pour Lionel.
1. Calculer l’intervalle de confiance de la différence des moyennes
d’heures de sommeil provoquées par les deux somnifères au niveau de confiance 0,99.
2. Pensez-vous que le nouveau somnifère soit plus puissant que
l’ancien ?
2. On évalue le pourcentage de personnes ayant l’intention de voter
pour un autre candidat, Jean-Marie, à 12,5% ? Combien faut-il
interroger de personnes pour obtenir un intervalle de confiance
à 95% du pourcentage de personnes ayant l’intention de voter
Jean-Marie, avec une précision de 1% ?
page 8
UTBM
SQ20
TD 7 - estimation par intervalle de confiance
36 On a mesuré le poids de raisin produit par pied sur 10 pieds pris
au hasard dans une vigne.
On a obtenu les résultats suivants exprimés en kilogrammes :
2,4 - 3,4 - 3,6 - 4,1 - 4,3 - 4,7 - 5,4 - 5,9 - 6,5 - 6,9
On modélise le poids de raisin produit par une souche de cette vigne
par une variable aléatoire de loi normale N (µ, σ).
1. Calculer la moyenne et la variance empiriques de l’échantillon.
En déduire des estimations ponctuelles de µ et de σ2 .
2. Donner un intervalle de confiance de niveau 0,95 pour la moyenne
µ.
3. Donner un intervalle de confiance de niveau 0,95 pour la variance
σ2
4. On suppose désormais que l’écart-type des productions par pied
est connu et égal à 1,4. Donner un intervalle de confiance de
niveau 0,95 pour µ
Pour travailler seul
37
Final 2014 .
Une entreprise vend des bouchons de liège pour bouteilles de vin. Dans un
souci de productivité, elle décide de traiter ses chênes-lièges avec des produits
chimiques pour qu’ils développent leur écorce plus vite. Ces traités chimiques
peuvent altérer le liège et donner par la suite un goût bouchonné aux bouteilles.
Dans la suite, on notera p la proportion de bouchons présentant un tel défaut.
Un groupe de vignerons goûte 215 de ces bouteilles et en compte 13
bouchonnées.
1. Proposer une estimation ponctuelle de p.
2. Construire un intervalle de confiance pour p au niveau 99%.
38
Final 2011 .
On a mesuré la quantité totale d’alcool (exprimée en g/l) contenue dans un
échantillon de 10 bouteilles de cidre doux du marché. On a obtenu des valeurs
x1 , x2 , x3 , . . . , x10 telles que
10
X
k=1
xk = 62
et
10
X
x2k = 388, 4124
k=1
On modélise la quantité d’alcool contenue dans une bouteille, par une variable
aléatoire X suivant une loi normale d’espérance µ et de variance σ2 , µ et σ2
étant des paramètres inconnus.
1. Proposer des estimations ponctuelles de µ et de σ2 à partir de l’échantillon observé.
http ://andre.turbergue.free.fr
SQ20 - Printemps 2016
5. Quel nombre de pieds au minimum devrait-on observer pour
estimer µ au niveau de confiance 0,99 avec une précision de plus
ou moins 500 grammes ?
3
2. Construire un intervalle de confiance pour la moyenne µ au niveau de
confiance de 1 − α = 95%.
3. Déterminer un intervalle de confiance à 80% de la variance σ2 .
4.
(a) Si n désigne la taille d’un grand échantillon ( n > 50), exprimer
en fonction de n, l’amplitude de l’intervalle de confiance de µ au
niveau de confiance de 95%.
(b) On souhaite construire un intervalle de confiance de µ au niveau
de confiance 95% ayant une amplitude de 0,2 gramme par litre.
Quelle doit étre approximativement la taille de l’échantillon ?
On prendra comme approximation de la variance la valeur estimée
dans la question 1.
page 9
UTBM
SQ20
TD 8 - tests d’hypothèse
Tests d’hypothèse
1
2. Calculer un intervalle de confiance de µ au niveau 0, 99.
3. ? Le cahier des charges impose que l’épaisseur moyenne soit 6
mm. La production est-elle conforme ?
Pour s’entraîner
39 Une société reçoit régulièrement d’un fabricant des boîtes de 100
composants. Un accord fixe le niveau de qualité à 1 défectueux par
boîte. Un contrôle à la livraison portant sur 1000 composants donne 15
défectueux. L’accord est-il respecté au niveau de tolérance de 95% ?
40 Baccalauréat - juin 2014 .
Un ostréiculteur affirme que 60 % de ses huîtres ont une masse
supérieure à 91 g. Un restaurateur souhaiterait lui acheter une grande
quantité d’huîtres mais il voudrait, auparavant, vérifier l’affirmation
de l’ostréiculteur.
42 Soit une variable aléatoire X ,→ P (λ) avec λ = 0, 4.
Soit un échantillon (X 1 , X 2 , . . . , X n ) de variables indépendantes de même
n
X
1
loi que X , et les variables S n =
X k et X n = S n .
n
k=1
1. Donner l’espérance et la variance de X .
Dans le cas général (n ∈ N∗ ), rappeler la loi de S n , ainsi que ses
paramètres.
2. Soit n = 25. Proposer deux entiers naturels n 1 et n 2 tels que
P(n1 É S n É n2 ) ≈ 0, 95. Dans le cas où l’observation a donné une
moyenne de 0, 52, peut-on considérer que λ est effectivement égal
à 0, 4 ?
http ://andre.turbergue.free.fr
SQ20 - Printemps 2016
Le restaurateur achète auprès de cet ostréiculteur 10 douzaines
d’huîtres qu’on considérera comme un échantillon de 120 huîtres tirées au hasard. Sa production est suffisamment importante pour qu’on
l’assimile à un tirage avec remise.
Il constate que 65 de ces huîtres ont une masse supérieure à 91 g.
3. Soit n = 500. Par quelle loi peut-on approcher X 500 ?
Si on suppose que λ = 0, 4, déterminer un intervalle ]x1 , x2 [ tel
que P(x1 < X 500 < x2 ) = 0, 95.
Une observation d’un échantillon de 500 v.a. a donné une moyenne
de 0, 52. Ce résultat est-il conforme aux hypothèses ?
Que peut penser le restaurateur de l’affirmation de l’ostréiculteur ?
41 Une entreprise utilise une matière isolante dans l’assemblage de
moteurs électriques. Il est important que l’épaisseur corresponde aux
normes de montage, mais aussi que les variations ne soient pas trop
importantes. Un échantillon aléatoire, dont l’épaisseur est normale
N (µ, σ), de 20 éléments a été prélevé dans une grande production et
les résultats en mm ont été les suivants :
5, 5 5, 8 6, 1 6, 5 5, 8 5, 8 5, 5 6, 1 5, 7 5, 4
5, 5 5, 9 6, 2 6, 1 5, 8 6, 1 5, 9 6, 1 6, 2 6
43 On cherche à savoir si la fréquence d’une maladie est liée au groupe
sanguin. Sur 200 malades observés, on a dénombré 104 personnes du
groupe O, 76 du groupe A, 18 du groupe B et 2 du groupe AB.
On précise que dans la population générale, la répartition entre les
groupes sanguins est : 43% de groupe O, 45% de groupe A, 9% de
groupe B et 3% de groupe AB.
Que peut-on conclure ?
1. Déterminer des estimations ponctuelles de µ et de σ2 .
page 10
UTBM
SQ20
TD 8 - tests d’hypothèse
44 Dans une entreprise de BTP, on relève sur une période de 100 jours
le nombre journalier d’accidents du travail.
x i : nb d’accidents dans la journée
n i : nb de jours concernés
0
14
1
26
2
27
3
19
4
8
5
5
2
47
6
1
Identifier la variable étudiée et tester l’hypothèse que la distribution
de cette variable est une distribution de Poisson au seuil de 1%.
Pour approfondir
1. En lançant une pièce de monnaie 3 fois, on veut tester l’hypothèse H0 : P(«Pile») = 0, 5 contre H1 : P(«Pile») = 0, 75. On convient
de rejeter H0 si on obtient trois fois Pile. Calculer les probabilités
d’erreur de première et de seconde espèce.
2. Déterminer une région critique (un domaine de rejet de H0 ) si on
lance la pièce 25 fois, et si α = 0, 05. Calculer ensuite β.
45 L’étude de 5128 familles ayant 5 enfants s’est traduite par la
distribution suivante :
Nb de garçons
Nb de filles
Nb de familles
5
0
204
4
1
841
3
2
1585
2
3
1544
1
4
810
0
5
144
On note p la proportion de garçons à la naissance, p étant inconnue.
http ://andre.turbergue.free.fr
SQ20 - Printemps 2016
1. Quelle est la loi de probabilité (théorique) du nombre de garçons
dans une famille de 5 enfants ?
2. Comparer la distribution observée à la distribution théorique en
utilisant le test du χ2 .
Conclure.
46 La série statistique suivante obéit-elle à une loi normale ayant
pour espérance mathématique et pour écart-type les valeurs de la
moyenne et de l’écart quadratique moyen de la série (7800 et 39) ?
classes
effectifs
classes
effectifs
[7700, 7720[
2
[7800, 7820[
10
[7720, 7740[
1
[7820, 7840[
9
[7740, 7760[
4
[7840, 7860[
4
[7760, 7780[
8
[7860, 7880[
2
[7780, 7800[
9
[7880, 7900[
1
page 11
UTBM
SQ20
TD 8 - tests d’hypothèse
48 On appelle X le nombre d’accidents qui se produisent par mois à
un carrefour déterminé. On suppose que X est une variable aléatoire
qui suit une loi de Poisson de paramètre λ : X ,→ P (λ).
Durant 5 mois, on relève le nombre d’accidents survenus à ce carrefour.
On veut choisir entre les deux hypothèses :
• H0 : λ = 1 , situation jugée «acceptable» par les pouvoirs publics
• H1 : λ > 1 , situation jugée «alarmante» par les pouvoirs publics
Si en 5 mois, le nombre d’accidents relevés dépasse une certaine
valeur k, les pouvoirs publics décideront d’aménager le carrefour.
3
49 Final 2015. À l’occasion d’une commande, le service contrôle d’un laboratoire reçoit un lot de flacons. Il effectue un prélèvement aléatoire de 81 flacons
et mesure leurs volumes. Les résultats sont consignés dans le tableau suivant
1. Donner l’interprétation du choix de λ = 1 comme hypothèse de
base.
2. Quelle est la valeur critique k correspondant à un risque de première espèce α = 1, 4% ?
3. On a dénombré un total de 8 accidents sur 5 mois à ce carrefour.
Quelle décision prendra-t-on ?
http ://andre.turbergue.free.fr
4. Calculer la puissance de ce test en prenant successivement pour
hypothèse alternative H1 : λ = 1, 5 puis λ = 2 et enfin λ = 4.
SQ20 - Printemps 2016
Pour travailler seul
Volume (en m`)
Effectif
57,95
3
57,99
10
58,03
39
58,07
21
58,11
8
1. Calculer la moyenne x e et l’écart type s e de cet échantillon
(on arrondira les résultats à 10−3 près).
2. Le volume des flacons est annoncé par le fabricant comme étant
de 58 m`.
On se propose de construire un test d’hypothèse bilatéral au
seuil de signification de α = 5 % pour contrôler, au moment de la
livraison, la moyenne µ de l’ensemble des volumes (en m`) des
flacons. On admet que le volume d’un flacon est modélisé par
une variable aléatoire X qui suit une loi normale d’espérance µ
et d’écart-type σ. On note X la variable aléatoire qui, à chaque
échantillon de 81 flacons prélevés au hasard dans l’ensemble de
la production, associe la moyenne des volumes.
On veut tester :
• l’hypothèse nulle H0 : µ = 58
• contre l’hypothèse alternative H1 : µ 6= 58
(a) Quelle est la loi de probabilité de la variable aléatoire X ?
(b) Choisir la variable aléatoire de test Z et préciser sa loi de
probabilité en se plaçant sous l’hypothèse nulle H0 .
(c) Déterminer sous l’hypothèse nulle H0 , le réel t tel que
P(− t É Z É t) = 0, 95
(d) En déduire la région d’acceptation D 0 de H0 au seuil de
signification de 5%.
3. En utilisant les informations recueillies sur l’échantillon de 81
flacons, le service de contrôle acceptera-t-il cette livraison ?
page 12
UTBM
Téléchargement