Travaux dirigés SQ20 Statistiques TD 6 à 10

publicité
SQ20
Travaux dirigés SQ20
Travaux dirigés SQ20
Statistiques
TD 6 à 10
UTBM printemps 2012
page 1
SQ20
TD 6 : Convergences
TD 6 : Convergences
Au cours d'une épreuve, un événement a une probabilité 0, 2 de se réaliser.
On eectue n épreuves indépendantes. Si X est le nombre de fois où l'événement
se réalise, déterminer la loi de X , son espérance, et sa variance.
On prend n = 100. Calculer P(15 6 X 6 25) à 10−3 près :
a. en utilisant la loi de X ,
b. par l'inégalité de Bienaymé-Tchebytchev,
c. en approchant la loi de X par une loi normale.
On prend n = 1000. Calculer P(170 6 X 6 230) par les méthodes de la question
précédente.
Exercice 1.
1.
2.
3.
Exercice 2. On considère 50 v.a. continues de même loi, indépendantes, d'espérance 45,
et d'écart-type 5.
1. À quelle loi peut-on assimiler la somme S de ces variables ?
2. Calculer P(2200 6 S 6 2350), P(S > 2260), et P(S < 2230).
3.
S
À quelle loi peut-on approcher la loi de la variable aléatoire S =
? Calculer
50
P(S > 44), P(44 6 S 6 47), et P(S 6 47).
Un centre d'assistance (hotline ) résoud en moyenne 80% des questions
posées par les clients. Soit X le nombre de problèmes non résolus pour 500 appels.
Quelle est la probabilité d'enregistrer plus de 115 problèmes ? moins de 90 ?
Exercice 3.
On a mélangé 5 000 roulements d'une marque A avec 10 000 roulements de
la marque B . On prélève au hasard 150 roulements.
1. Quelle est la probabilité pour que la proportion de roulements A soit comprise entre
30 et 35% ?
2. Quelle est la probabilité pour que le nombre de roulements A soit compris entre 45
et 60 ?
Exercice 4.
Une usine fabrique des pièces en grande série en deux phases indépendantes.
La première phase est susceptible de donner un défaut A avec une probabilité 0, 02, et
la seconde un défaut B avec une probabilité 0, 08.
1. Calculer les probabilités pour qu'une pièce tirée au hasard :
Exercice 5.
• présente les deux défauts
• présente un seul des deux défauts
2.
• ne présente aucun des deux défauts
• présente au moins un défaut.
On prélève au hasard 200 pièces dans la production, et on note X le nombre de
pièces présentant le défaut A. Calculer P(X = 0), P(X = 1), P(X = 10), P(X > 3).
Pour quelle valeur de k la probabilité P(X = k) est-elle maximale ?
UTBM printemps 2012
page 2
SQ20
3.
TD 6 : Convergences
On prélève au hasard 300 pièces dans la production, et on note Y le nombre de pièces
présentant le défaut B . Calculer P(Y < 24), P(20 < Y < 35), P(Y < 30|Y > 24).
indépendantes et suivant la
Soit (Xn )n∈N∗ une suite de v.a.r. mutuellement
P
même loi de Poisson de paramètre 1. On pose Sn = nk=1 Xk .
1. Quelle est la loi de Sn ?
2. Expliciter P ([Sn 6 n]).
Pn nk
1
−n
3. En utilisant le théorême central limite, montrer que limn→+∞ e
k=0 k! = 2
Exercice 6.
Un fabricant de cordes d'escalade soumet des cordes de nylon de diamètre
12 mm à des essais de rupture (une charge de 80 kg est lâchée depuis une hauteur de 5
mètres). Le test consiste à répéter cet essai jusqu'à rupture de la corde, et on suppose
(ce qui en réalité n'est pas tout à fait exact) que la corde ne subit aucune modication
si elle ne rompt pas. La probabilité que la corde casse au cours d'un essai est p = 0, 09.
Soit X la variable aléatoire qui compte le nombre d'essais avant rupture.
1. Déterminer la loi de X , son espérance, et sa variance.
2. Après rupture de la corde, on continue le test avec une deuxième corde identique
à la première, et on dénit ainsi une deuxième variable aléatoire Y de même loi.
Soit Z = X + Y (nombre d'essais avant la deuxième rupture). Déterminer la loi de
probabilité de Z , ainsi que son espérance, et sa variance.
3. On considère un lot de 50 cordes de 12 mm, et on dénit N comme le nombre de
cordes ayant rompu au cours du premier essai. Déterminer la loi de N , et calculer
P(N < 5).
Exercice 7.
−ı , →
− ) orthonormé. Une
Une cible est centrée sur l'origine d'un repère (O, →
échette est lancée sur cette cible, et on suppose que les coordonnées d'impact X et Y
suivent des lois normales centrées réduites indépendantes. Soit Z la variable aléatoire qui
mesure la distance du point d'impact au centre de la cible.
Exercice 8.
1.
2.
3.
4.
Montrer que FZ (z) =
(
1 − e−
0
z2
2
si z > 0 , où FZ est la fonction de répartition
si z < 0
de Z .
p
En déduire la densité fZ de Z , puis montrer que E[Z] = π2 , et V (Z) = 4−π
2 .
On lance 150 èches sur la cible (les lancers sont indépendants), et on note M la
distance moyenne des impacts au centre de la cible. Déterminer la loi qui approche
celle de M .
Calculer P(M < 0, 7), et P(0, 8 < M < 1). Pour quel intervalle I centré sur
l'espérance aura-t-on P(M ∈ I) = 0, 9 ?
UTBM printemps 2012
page 3
SQ20
TD 7 : Estimation par échantillonage
TD 7 : Estimation par échantillonage
Une machine automatique remplit des paquets. Les masses en grammes sur
un échantillon de 10 paquets sont les suivantes :
Exercice 9.
297 300 295 297 300 310 300 295 310 300
Déterminer la moyenne observée, l'écart-type observé, et en déduire une estimation de
la moyenne, et de l'écart-type de la population.
Un contrôle portant sur un emballage automatique de café fournit les
masses suivantes :
Exercice 10.
247 248 249 250 251 252 253 254
masse en g
nombre de paquets 2
6
8
13 11
5
3
2
1.
2.
Donner une estimation de la masse moyenne d'un paquet, et celle de l'écart-type.
En supposant la loi normale, déterminer à l'aide des estimations, les pourcentages
de paquets de masse supérieure à 250 g, de masse comprise entre 249 et 251.
Exercice 11.
a obtenu
100
X
Pour un échantillon en = (x1 , x2 , · · · , x100 ) d'une variable aléatoire X , on
xk = 2000, et
k=1
100
X
x2k = 41 062. Déterminer les estimations ponctuelles de
k=1
l'espérance M = E[X], et de la variance σ 2 = V (X).
On considère un dé cubique dont on ne sait pas s'il est équilibré, et on le
lance jusqu'à obtenir un six (succés dont la probabilité est p). On note alors X le nombre
de lancers avant d'obtenir 6.
1. Déterminer la loi de X , son espérance, et sa variance.
2. On répète n fois l'expérience précédente pour obtenir un échantillon En = (X1 , X2 ,
· · · , Xn ) où Xk suit la même loi que X . Une observation de cet échantillon est notée
en = (x1 , x2 , · · · , xn ). Calculer en fonction de p l'expression L(x1 , x2 , · · · , xn , p) =
P(X1 = x1 ) × · · · × P(Xn = xn ).
3. En déduire les équations de vraisemblance de l'échantillon en , puis l'estimateur de
maximum de vraisemblance T de p.
4. Pour n = 20, on a obtenu l'échantillon e20 suivant :
Exercice 12.
3 2 4 6 1 2 3 5 4 2 2 1 6 2 1 6 9 4 4 2
Déterminer une estimation ponctuelle de p.
Soit une v.a. exponentielle X de paramètre λ = µ1 , et un échantillon
(X1 , X2 , · · · , Xn ) de n variables indépendantes de même loi que X .
1. Écrire la densité, l'espérance, et la variance de X en fonction de µ (et pas λ !).
2. Déterminer la fonction L(x1 , · · · , xn , µ), puis les équations de vraisemblance.
Exercice 13.
UTBM printemps 2012
page 4
SQ20
3.
4.
TD 7 : Estimation par échantillonage
En déduire un estimateur de µ : est-il sans biais ? convergent ?
A.N. : Dix dispositifs indépendants dont la durée (exprimée en mois) est exponentielle ont fonctionné pendant les temps suivants :
20 4 12 2 16 26 48 9 34 6
Déterminer une estimation de µ, puis une estimation de λ.
Exercice 14. On s'intéresse à la proportion p de personnes possédant un gPhone. On
tire au sort un échantillon (X1 , X2 , · · · , Xn ) de taille n dans une population
très grande. À
1 possède un gPhone
chaque personne intérrogée, on associe la variable aléatoire Xk =
0
sinon
1. Déterminer un estimateur T (X1 , X2 , · · · , Xn ) de p. Étudier ses propriétés (biais,
convergence).
′
′
2. On prend maintenant deux échantillons indépendants (X1 , X2 , · · · , Xn1 ) et (X1 , X2 ,
′
· · · , Xn2 ) de taille n1 et n2 (n1 < n2 ). On note f1 et f2 les proportions de possesseurs de gPhone pour les deux échantillons. Soit F = αF1 + βF2 (α > 0, β > 0)
un estimateur de p.
a. Déterminer α et β pour que F soit un estimateur sans biais de p. En déterminer
la variance.
b. Déterminer α et β pour que F soit un estimateur sans biais de p, et de variance
minimale.
c. A.N. : n1 = 500, n2 = 1000, f1 = 0, 3, et f2 = 0, 23.
Exercice 15. Un évènement peut se produire à tout instant X (loi uniforme) dans
un intervalle I = [0, b], où b est inconnu. Pour estimer la valeur de b inconnue, on va
considérer un n-échantillon (X1 , X2 , · · · , Xn ).
n
1.
1X
Xi . Calculer E(T1 ). T1 est-il sans biais ?
Soit l'estimateur T1 = X =
n
i=1
2.
3.
4.
5.
6.
À l'aide de T1 , construire un estimateur sans biais T2 de b. Calculer V (T2 ).
Un autre estimateur de b est T3 = sup(X1 , X2 , · · · , Xn ). Pour x ∈ [0, b], calculer
P(T3 6 x). En déduire la fonction de répartition, et la densité de T3 .
Calculer E(T3 ). T3 est-il un estimateur sans biais ? À l'aide de T3 , construire un
estimateur sans biais T4 de b.
Calculer E[T4 ], V (T4 ). Parmi les 4 estimateurs T1 , T2 , T3 , T4 , lequel est le meilleur ?
Application. La procédure de départ d'un Grand Prix de Formule 1 est la suivante : cinq feux rouges sont allumés successivement, l'extinction simultanée de ces
cinq feux donne le signal du départ. Le temps qui s'écoule entre l'allumage complet
et l'extinction est une variable uniforme sur [0, b] (ce temps est choisi par le directeur
de course dans les limites du règlement). Au cours des 16 G.P. d'une saison, les intervalles de temps, en secondes, ont été : 0, 3 0, 9 2, 1 2, 6 2, 7 0, 6 1, 6 0, 1
1, 2 2, 1 0, 8 0, 6 1, 1 0, 5 1, 2 2, 7
Déterminer une estimation de b.
UTBM printemps 2012
page 5
SQ20
TD 8 : Intervalles de conance
TD 8 : Intervalles de conance
Une pièce métallique rectangulaire a une longueur X qui suit une loi normale d'espérance 18, 4 et de variance v1 inconnue, et une largeur Y normale d'espérance
M2 , et de variance v2 inconnues. Un échantillon de 25 pièces a donné les mesures suivantes :
• pour la longueur : un écart-type de 0, 7
• pour la largeur : une moyenne de 25, 4, et une estimation de l'écart-type s2 = 0, 9.
Déterminer les intervalles de conance au niveau 95% pour les variances des deux dimensions.
Exercice 17. Une entreprise utilise une matière isolante dans l'assemblage de moteurs
électriques. Il est important que l'épaisseur corresponde aux normes de montage, mais
aussi que les variations ne soient pas trop importantes. Un échantillon aléatoire, dont l'épaisseur est normale N (M, σ 2 ), de 20 éléments a été prélevé dans une grande production
et les résultats en mm ont été les suivants :
Exercice 16.
5, 5 5, 8 6, 1 6, 5 5, 8 5, 8 5, 5 6, 1 5, 7 5, 4
5, 5 5, 9 6, 2 6, 1 5, 8 6, 1 5, 9 6, 1 6, 2 6
Déterminer des estimations ponctuelles de M et de σ 2 .
2
2. Calculer un intervalle de conance de σ au niveau 0, 99. Peut-on considérer que
l'écart-type de la production ne dépasse pas 0, 5 mm ?
3. Calculer un intervalle de conance de M au niveau 0, 99. Le cahier des charges
impose que l'épaisseur moyenne soit 6 mm. La production est-elle conforme ?
Exercice 18. Une entreprise fabrique des sacs en cuir en grande quantité. Un contrôle
de fabrication portant sur un échantillon de 200 sacs a montré que 50 d'entre eux étaient
de première qualité, les autres de qualité courante.
1. Estimer au niveau 95% l'intervalle de conance de la proportion de sacs de première
qualité.
2. L'entreprise fabrique aussi des sacs photo en série limitée à 500 unités. Un échantillon de 300 de ces sacs a donné 120 sacs de premìere qualité. Donner le nouvel
intervalle de conance à 95%.
2
Exercice 19. Soit X ∼ N (m, σ ), on prélève un échantillon de variables aléatoires
indépendantes E = (X1 , X2 , · · · , X9 ) dont une observation e donne :
1.
7 8 9 10 8 5 9 7 8
Déterminer une estimation de m et de σ 2 .
2. Déterminer un intervalle de conance de m au niveau 0, 95.
Exercice 20. Une étude sur les salaires mensuels de 50 ouvriers d'une usine a donné
une moyenne de 1000 e, et un écart-type de 90 e.
1. Quel risque prend-on en estimant la moyenne des salaires des 300 ouvriers de l'usine
à 1000 ± 20 e ?
2. Quel serait le risque dans le cas d'une très grande usine ?
1.
UTBM printemps 2012
page 6
SQ20
TD 9 : Tests d'hypothèses
TD 9 : Tests d'hypothèses
Soient X ∼ P(λ = 0, 4), un échantillon
P (X1 , · · · , Xn ) de variables indépendantes de même loi sur X , et les variables Sn = nk=1 Xk , Xn = n1 Sn .
∗
1. Donner l'espérance et la variance de X . Dans le cas général (n ∈ N ), déterminer
la loi Sn , ainsi que ses paramètres.
2. Soit n = 25. Déterminer deux entiers n1 et n2 tels que P(n1 6 Sn 6 n2 ) ≈ 0, 95.
Dans le cas où l'observation a donné une moyenne de 0, 52, peut-on considérer que
λ est eectivement égal à 0, 4 ?
3. Soit n = 500. Par quelle loi peut-on approcher X500 ? Si on suppose que λ =
0, 4, déterminer un intervalle ]x1 , x2 [ tel que P(x1 < X500 < x2 ) = 0, 95. Une
observation d'un échantillon de 500 v.a. a donné une moyenne de 0, 52. Ce résultat
est-il conforme aux hypothèses ?
Exercice 21.
Soient X ∼ N (m, σ = 5), et un échantillon (X1 , · · · , Xn ) de variables
indépendantes de même loi sur X , qui a donné une moyenne observée de 11.
1. Dans le cas n = 30, étudier le test H0 : m = 10 contre H1 : m > 10. En déterminer
le domaine d'acceptation, ainsi que la décision.
2. Toujours dans le cas n = 30, étudier le test H0 : m = 10 contre H1 : m = 11. En
déterminer la décision, et le risque β .
3. Le risque β étant jugé trop grand, on intervient sur la taille de l'echantillon pour le
diminuer, les autres données restant inchangées. Pour quelle valeur de n aurait-on
β ≈ 0, 1 ?
Exercice 22.
Exercice 23. Le chire d'aaires journalier d'un magasin est de 9200 e , avec un écarttype de 2000. À la suite d'une publicité portant sur un mois, le chire d'aaires moyen
pendant ces 30 jours a été de 10 200 e. L'amélioration des ventes a-t-elle été signicative
au seuil de 1% ?
Une société reçoit régulièrement d'un fabricant des boîtes de 100 composants. Un accord xe le niveau de qualité à 1 défectueux par boîte. Un contrôle à la
livraison portant sur 1000 composants donne 15 défectueux. L'accord est-il respecté au
niveau de tolérance de 95% ?
Exercice 24.
Neuf malades auxquels fut administrée une potion accusèrent des augmentations de leur tension artérielle : +7 +3 −1 +4 −3 +5 +6 −4 +1 .
Montrer que ces données n'indiquent pas que la potion soit responsable de ces augmentations.
Exercice 25.
1. En lançant une pièce de monnaie 3 fois, on veut tester l'hypothése
H0 : P(Pile) = 0, 5 contre H1 : P(Pile) = 0, 75. On convient de rejeter H0 si on
Exercice 26.
2.
obtient trois fois Pile. Calculer les probabilités d'erreur de première et de seconde
espèce.
Déterminer une région critique (un domaine de rejet de H0 ) si on lance la pièce 25
fois, et si α = 0, 05. Calculer ensuite β .
UTBM printemps 2012
page 7
SQ20
TD 10 : Tests de comparaison
TD 10 : Tests de comparaison
Exercice 27. Deux liales fabriquent des piles électriques de 4, 5V , dont les durées de
vie sont normales de variance 64 pour A et 25 pour B . Deux échantillons ont donné les
résultats suivants :
liale taille durée de vie moyenne
A
100
84 heures
150
80 heures
B
1.
2.
La diérence des moyennes des durées de vie est-elle signicative au seuil de 5% ?
Quelle serait la diérence maximale, au seuil de 1%, permettant de conclure à une
absence de diérence entre les deux productions ?
Deux techniciens sont aectés à des tests de dureté sur des feuilles de
métal avant expédition. Le problème est de déterminer s'il existe des diérences entre
les mesures des deux techniciens. On supposera que la feuille de métal utilisée pour le
test est homogène, et que la variable est normale, d'espérance m, et de variance σ 2 . Les
mesures sont consignées dans le tableau suivant :
Exercice 28.
Technicien A
Technicien B
1.
2.
3.
529 528 526 527 525 525 526 527 528 525
527 522 523 526 523 525 526 524 527 523
Calculer pour chacune des deux séries, une estimation de la moyenne et de la
variance.
En admettant l'égalité des variances, déterminer une estimation de la variance
réelle. Peut-on dire qu'il existe une diérence entre les deux techniciens ?
En ne gardant que la première série (celle du technicien A), on veut tester m =
526 contre m = 526, 9 au seuil de risque 0, 05. Quel est le résultat du test et sa
puissance ?
Exercice 29. Pour mesurer une masse µ, on peut se servir de deux procédés A et B .
La mesure de µ par A suit une loi N (µ, σA ), et la mesure de µ par B suit une loi
N (µ, σB ). On a fait huit mesures indépendantes avec A qui ont donné une variance
observée s2A = 0, 24. D'autre part, douze mesures indépendantes réalisées avec B ont
donné s2B = 0, 08. Peut-on dire, au seuil de 5%, que les deux procédés ont la même
précision ?
Deux échantillons sont prélevés au hasard et de manière indépendante
dans deux populations normales. Les résultats sont les suivants :
Exercice 30.
Échantillon 1
Échantillon 2
8, 1
8
7, 7
7, 9
8
8, 1
7, 8
8, 1
7, 8
8
8, 4
8
8
7, 5
8, 2
8, 2
8
7, 7
8
8, 4
7, 8
8
7, 9
8, 1
UTBM printemps 2012
8
8, 1
8, 2
8, 4
7, 9
7, 9
7, 8
8, 1
8
7, 8
8, 1
7, 8
8
8, 2
8, 1
8, 2
page 8
SQ20
1.
2.
3.
TD 10 : Tests de comparaison
Tester l'égalité des deux variances au risque de 0, 05.
En déduire une estimation de la variance commune.
Tester enn l'égalité des moyennes.
Au cours de deux livraisons diérentes, on a relevé 48 articles défectueux
parmi les 800 constituant la première livraison, puis 32 articles défectueux parmi les 400
constituant la seconde. Les deux pourcentages d'articles défectueux dièrent-ils signicativement (au seuil de 5%) ?
Exercice 31.
Exercice 32.
1.
Un échantillon de 16 éléments d'une variable aléatoire normale a
donné x = 41, 5, et
16
X
(xi − 41, 5)2 = 135. Montrer que l'hypothèse d'une moyenne
i=1
de 43, 5 pour cette population n'est pas raisonnable, et que l'intervalle de conance
au niveau 95% pour la moyenne est [39, 9; 43, 1].
2.
Un 20-échantillon tiré d'une population inconnue est tel que y = 43, et
20
X
(yi −
i=1
43)2 = 171. Montrer que les deux échantillons peuvent être considérés comme tirés
d'une même population.
Des rapports récents indiquent que les repas servis pendant les vols dans
diérentes compagnies aériennes sont notés sans tenir compte des autres facteurs (confort
de la cabine, retards,...). Une étude sur un échantillon aléatoire de passagers à qui on a
demandé de noter le repas a donné les résultats suivants :
Exercice 33.
A B C D
mauvais 42 35 22 23
acceptable 50 75 33 28
bon
10 17 21 18
Peut-on considérer qu'il y a une diérence signicative de qualité entre les diérentes
compagnies aériennes (au seuil α = 0, 01) ?
Un généticien prétend que quatre espèces de drosophiles (mouches du
vinaigre) devraient apparaître dans les rapports 1 : 3 : 3 : 9. On prélève un échantillon
de 4000 drosophiles qui contient 226, 764, 733, et 2277 mouches des quatres espèces.
Peut-on, au risque 0, 1, rejeter l'armation du généticien ?
Exercice 34.
UTBM printemps 2012
page 9
Téléchargement