Banque d`exercices pour le cours de "mise à niveau" de statistique

publicité
Banque d’exercices pour le cours de "mise à niveau" de statistique de
M1
AgroParisTech
Instructions pour les exercices
1. Lorsque rien n’est précisé, on suppose que la distribution étudiée est gaussienne. Pour les exercices 4 et 8, on
approche une loi binomiale par une loi normale.
2. Pour chaque estimation, on précisera l’expression de l’estimateur ainsi que sa distribution.
3. Pour chaque intervalle de confiance, on précisera l’expression et la distribution de la statistique pivotale.
4. Pour chaque test, on donnera
(a) la loi de l’expérience,
(b) les hypothèses testées et le risque de première espèce(sauf demande expresse, on prendra 5%),
(c) la statistique du test,
(d) la règle de décision (ou la zone de rejet),
(e) la décision prise.
5. Pour chaque régression linéaire,
(a) on donnera le modèle utilisé, éventuellement le changement de variable choisi,
(b) on donnera les estimations des paramètres, la droite de régression et on définira chaque objet du tableau
des paramètres obtenu par le logiciel. Vous préciserez également les tests effectués,
(c) on détaillera la table d’analyse de la variance, en donnant les sommes de carrés, leurs degrés de liberté, les
carrés moyens et la statistique de Fisher. On précisera le test effectué, et le coefficient de détermination,
(d) on étudiera le graphe des résidus. On fera éventuellement un changement de variable approprié,
(e) si la valeur de x observée est x̄, on fera une prévision pour Y et on donnera un intervalle de prédiction.
Enoncés
Exercice 1 Un échantillon de 25 yaourts pris dans une ligne de fabrication donne une contenance moyenne à 148
ml et l’écart type est supposé connu et égal à 2ml. Donner un intervalle de confiance à 95% sur la contenance réelle
de la population de yaourts de cette ligne de fabrication. A 99% ? La valeur nominale 150 ml se trouve-t-elle dans
ces intervalles de confiance ?
Exercice 2 Un échantillon de 10 yaourts pris dans une ligne de fabrication donne les résultats suivants :
156.4 − 145.2 − 149 − 150 − 151 − 147 − 148.2 − 151.6 − 149.6 − 150
1
Donner un intervalle de confiance à 95% sur la contenance réelle de la population de yaourts de cette ligne de
fabrication. A 99% ? La valeur nominale 150 ml se trouve-t-elle dans ces intervalles de confiance ?
P
P 2
Indication : pour cet échantillon, on a
xi = 1498 et
xi = 224481.
i
i
Exercice 3 Donner un intervalle de confiance à 95% sur l’écart type de la contenance réelle des yaourts de cette
ligne de fabrication. A 99% ? La valeur nominale 2 ml se trouve-t-elle dans ces intervalles de confiance ?
Exercice 4 81 personnes ont utilisé une crème anti moustiques sur les bras dans une zone infestée. Seules 6 ont
été piquées. Donner un intervalle de confiance à 95% sur la proportion de personnes immunisées contre les piqûres.
Exercice 5 Dans le cas de l’exercice 1, peut-on dire que la ligne de remplissage des yaourts est bien réglée sur la
valeur nominale de 150 ml ?
Exercice 6
1. Dans le cas de l’exercice 2, peut-on dire que la ligne de remplissage des yaourts est bien réglée
sur la valeur nominale de 150 ml ?
2. Un client pense que les yaourts ne sont pas assez remplis, faire le test unilatéral correspondant à cette question,
le résultat est-il le même que pour le test précédent, et à 1% ?
Exercice 7 L’écart type de la ligne de fabrication n’est-il pas supérieur à 2 ml, ce qui est annoncé par le fabricant ?
Exercice 8 Dans le cas de l’exercice 4, peut-on dire que l’efficacité de la crème est supérieure à 5% ?
Exercice 9 On veut comparer l’usure des semelles dans une expérience où chaque sportif porte successivement les
semelles A puis B pour le même type d’entrainement. Les résultats sont le suivants :
2sportif
Usure A
Usure B
1
13.2
14.0
2
8.2
8.8
3
10.9
11.2
4
14.3
14.2
5
10.7
11.8
6
6.6
6.4
7
9.5
9.8
8
10.8
11.3
9
10
8.8
13.3
9.3
13.6
Les résultats montrent-ils une différence d’usure entre semelle A et B ?
P
P 2
P
Indication : Dans l’échantillon A, on a
xi = 106.3 et
xi = 1184.05, et dans l’échantillon B,
yi = 110.4 et
i
i
i
P 2
yi = 1275.9.
i
Exercice 10 On veut comparer les indices céphaliques (rapport entre la largeur maximale et la longueur maximale
du crâne humain, en pourcentage) des crânes de deux populations. Pour cela, on a relevé ces indices sur 13 individus
de chaque population, pris au hasard :
– POP1 : 74.1 - 77.7 - 74.0 - 74.0 - 73.8 - 79.3 - 75.8 - 82.8 - 72.2 - 75.2 - 76.3 - 77.1 - 76.8
– POP2 : 70.8 - 74.9 - 74.2 - 70.4 - 69.2 - 72.2 - 76.8 - 72.4 - 77.4 - 78.1 - 72.8 - 74.3 - 74.7
2
En supposant ces indices distribués suivant une loi normale, faire un test de comparaison des deux populations.
Aurait-on pu prendre des échantillons de tailles différentes ?
P
P
P 2
Indication : dans l’échantillon 1, on a
xi = 989.1,
xi = 75348.73, alors que dans l’échantillon 2, on a
yi =
i
i
i
P 2
958.2 et
yi = 70716.72.
i
Exercice 11 On reprend l’exemple précédent des semelles de chaussures. Pour la semelle A sur un échantillon de
10 sportifs on a obtenu une moyenne d’usure de 10.63 mm avec un écart type de 2.45 mm. Pour la semelle B sur un
échantillon de 11 sportifs (indépendant du premier) on a obtenu une moyenne d’usure de 11.04 mm avec un écart
type de 2.51 mm.
1. La semelle B s’use-t-elle plus vite que la A ?
2. Quelle méthode expérimentale vous parait la meilleure ?
Exercice 12 On souhaite comparer la consommation de boeuf dans les villes anglaises et françaises. Pour cela, on
relève dans 10 villages français de même importance la consommation de boeuf sur deux mois (en Kg par habitant) :
1.945 − 1.832 − 1.716 − 1.774 − 1.554 − 2.056 − 1.712 − 2.077 − 1.755 − 1.883
On relève aussi dans 10 villages anglais comparables la consommation de boeuf sur deux mois (en Kg par habitant) :
1.455 − 1.555 − 1.818 − 1.564 − 1.728 − 1.601 − 1.632 − 1.468 − 1.478 − 1.789
On suppose que ces observations sont indépendantes et gaussiennes.
1. Donner un intervalle de confiance pour la consommation moyenne de boeuf sur deux mois dans les villages
français au niveau de confiance de 95%.
2. Tester au niveau 5% si l’on consomme autant de boeuf dans les villages anglais et français.
P
P 2
Indication : sur les 10 villages français, on obtient
xi = 18.304 et
xi = 33.74362. Sur les 10 villages anglais,
i
i
P
P 2
on obtient
yi = 16.088 et
yi = 26.03891.
i
i
Exercice 13 Une tablette de chocolat sera qualifiée de qualité supérieure si elle contient une teneur en cacao
supérieure à 430g par kilogramme. On effectue un contrôle de qualité sur un échantillon de 10 tablettes de chocolat.
On obtient les teneurs (exprimées en grammes par kilogramme) suivantes :
505.1 − 423.5 − 462.0 − 391.9 − 412.1 − 487.2 − 439.0 − 434.1 − 441.1 − 474.2
1. Que peut-on en conclure pour des niveaux de 20% ? de 5% ?
2. Construire un intervalle de confiance pour l’espérance de la teneur en cacao au niveau de confiance 95%.
3. Tester au niveau 10%, H0 : "l’écart-type vaut 30" contre H1 : "l’écart-type est plus grand que 30".
P
P 2
xi = 4470.2 et
xi = 2009297.
Indication : dans cet échantillon, on a
i
i
Exercice 14 Vous avez à décider si la concentration d’un certain produit est plus élevée dansune solution A que
dans une solution B. Des dosages, effectués à cet effet, on donné les résultats suivants :
– solution A : 12.8-13.1-13.3-13.6-13.8-14.1 mg/L
– solution B : 11.8-12.2-13.2-13.4 mg/L
On admet que le résultat d’un dosage est la valeur d’une variable aléatoire normale dont l’espérance est la concentration du produit dans la solution choisie et dont l’écart-type est le même dans les deux solutions.
3
Au niveau 5%, peut-on conclure que la concentration du produit est plus élevée dans la solution A ?
P
P 2
P
Indication : pour la solution A, on a
xi = 80.7 et
xi = 1086.55, et pour la solution B,
yi = 50.6 et
i
i
i
P 2
yi = 641.88.
i
Exercice 15 On souhaite vérifier la précision d’une mesure. Pour cela, on effectue 10 mesures indépendantes
du même produit. Les résultats sont supposés indépendants, gaussiens, de moyenne m = 5 et de variance σ 2 ,
représentant la précision. Les 10 mesures obtenues sont les suivantes :
5.09 − 5.12 − 4.98 − 4.79 − 4.93 − 5.07 − 5.02 − 4.89 − 5.01 − 5.04
Construire un intervalle de confiance pour σ au niveau de confiance 95%.
P
P 2
Indication : dans cet échantillon, on a
xi = 49.94 et
xi = 249.491.
i
i
Exercice 16 Dans une maternité berlinoise, une étude statistique a été menée pour essayer de déterminer quel est
l’impact de l’âge de la mère sur le poids des nouveaux-nés. On note respectivement X et Y le poids d’un bébé né à
terme respectivement d’une mère ayant moins ou plus de 30 ans. On observe un échantillon de 20 bébés dans chaque
catégorie et on obtient les poids (en Kg) suivants :
– pour les bébés ayant des mères de moins de 30 ans : 3.150-2.980-2.740-4.070-3.160-2.450-2.980-3.580-2.7602.750-3.260-3.290-2.870-2.650-3.130-3.420-3.280-3.520-2.960-2.460
– pour les bébés ayant des mères de plus de 30 ans : 2.350-3.460-2.720-2.890-3.120-3.450-3.100-2.320-2.3903.500-2.640-2.430-2.870-2.550-3.090-2.640-2.430-3.780-3.520-2.310
On suppose que les variables X et Y sont gaussiennes de moyennes respectives m1 et m2 et de même variance
σ 2 . Peut-on affirmer que les bébés nés de mères de plus de 30 ans sont plus petits à la naissance ?
P
P 2
xi = 61.46 et
xi = 191.9068. Dans le deuxième échantillon, on
Indication : dans le premier échantillon, on a
i
i
P
P 2
a
yi = 57.56 et
yi = 169.8874.
i
i
Exercice 17 Une association de consommateurs veut comparer deux modèles de voitures de deux marques différentes en s’intéressant à la proportion de véhicules qui ont besoin d’une réparation importante (plus de 500 euros)
dans les deux premières années. Elles examinent 400 véhicules de la marque A, dont 53 vont nécessiter une réparation importante, et 500 véhicules de la marque B, dont 78 vont nécessiter une réparation importante. Peut-on
conclure au risque 10% que les deux proportions sont significativement différentes ?
Exercice 18 Datation au carbone 14 des troncs de Séquoia. Un étalonnage de la méthode de datation au
carbone 14 a été réalisé par l’analyse de très vieux troncs de séquoia géants. Par un prélèvement sur le tronc, on
peut obtenir son âge en années, en comptant les anneaux de croissance et sa radio activité C en carbone 14.
t
500
1000
2000
3000
C
14.5
logC
2.67
4000
5000
6300
13.5
12
10.8
9.9
8.9
8
2.60
2.48
2.37
2.29
2.19
2.08
Les lois physiques indiquent un lien linéaire entre logC et le temps , faire une régression de Y = logC en fonction
du temps.
Exercice 19 Salaire en fonction du nombre d’années d’études. Un économiste s’intéresse à la relation liant
la rémunération à la durée des études. Il dispose de dix cas, ses amis d’enfance qui ont exactement le même âge :
4
nom
diplôme
Revenu annuel brut en KE
Julie
Ingénieur
36
Albert
CAP
14
Elodie
Kévin
DUT
Bac pro
21
16
Marie
DESS
32
Julien
Ingénieur
34
Aurélie
CAP
16
Eric
DUT
24
Carine
Bac pro
14
Vincent
DESS
30
Le nombre d’années d’étude est de -2 pour un CAP, 0 pour un Bac pro, +2 pour un DUT, +5 pour DESS et
Ingénieur. Faire une régression de Y = revenu en fonction du nombre d’années d’étude.
5
Téléchargement