Banque d’exercices pour le cours de "mise à niveau" de statistique de
M1
AgroParisTech
Instructions pour les exercices
1. Lorsque rien n’est précisé, on suppose que la distribution étudiée est gaussienne. Pour les exercices 4 et 8, on
approche une loi binomiale par une loi normale.
2. Pour chaque estimation, on précisera l’expression de l’estimateur ainsi que sa distribution.
3. Pour chaque intervalle de confiance, on précisera l’expression et la distribution de la statistique pivotale.
4. Pour chaque test, on donnera
(a) la loi de l’expérience,
(b) les hypothèses testées et le risque de première espèce(sauf demande expresse, on prendra 5%),
(c) la statistique du test,
(d) la règle de décision (ou la zone de rejet),
(e) la décision prise.
5. Pour chaque régression linéaire,
(a) on donnera le modèle utilisé, éventuellement le changement de variable choisi,
(b) on donnera les estimations des paramètres, la droite de régression et on définira chaque objet du tableau
des paramètres obtenu par le logiciel. Vous préciserez également les tests effectués,
(c) on détaillera la table d’analyse de la variance, en donnant les sommes de carrés, leurs degrés de liberté, les
carrés moyens et la statistique de Fisher. On précisera le test effectué, et le coefficient de détermination,
(d) on étudiera le graphe des résidus. On fera éventuellement un changement de variable approprié,
(e) si la valeur de x observée est ¯x, on fera une prévision pour Y et on donnera un intervalle de prédiction.
Enoncés
Exercice 1 Un échantillon de 25 yaourts pris dans une ligne de fabrication donne une contenance moyenne à 148
ml et l’écart type est supposé connu et égal à 2ml. Donner un intervalle de confiance à 95% sur la contenance réelle
de la population de yaourts de cette ligne de fabrication. A 99% ? La valeur nominale 150 ml se trouve-t-elle dans
ces intervalles de confiance ?
Exercice 2 Un échantillon de 10 yaourts pris dans une ligne de fabrication donne les résultats suivants :
156.4145.2149 150 151 147 148.2151.6149.6150
1
Donner un intervalle de confiance à 95% sur la contenance réelle de la population de yaourts de cette ligne de
fabrication. A 99% ? La valeur nominale 150 ml se trouve-t-elle dans ces intervalles de confiance ?
Indication : pour cet échantillon, on a P
i
xi= 1498 et P
i
x2
i= 224481.
Exercice 3 Donner un intervalle de confiance à 95% sur l’écart type de la contenance réelle des yaourts de cette
ligne de fabrication. A 99% ? La valeur nominale 2 ml se trouve-t-elle dans ces intervalles de confiance ?
Exercice 4 81 personnes ont utilisé une crème anti moustiques sur les bras dans une zone infestée. Seules 6 ont
été piquées. Donner un intervalle de confiance à 95% sur la proportion de personnes immunisées contre les piqûres.
Exercice 5 Dans le cas de l’exercice 1, peut-on dire que la ligne de remplissage des yaourts est bien réglée sur la
valeur nominale de 150 ml ?
Exercice 6 1. Dans le cas de l’exercice 2, peut-on dire que la ligne de remplissage des yaourts est bien réglée
sur la valeur nominale de 150 ml ?
2. Un client pense que les yaourts ne sont pas assez remplis, faire le test unilatéral correspondant à cette question,
le résultat est-il le même que pour le test précédent, et à 1% ?
Exercice 7 L’écart type de la ligne de fabrication n’est-il pas supérieur à 2 ml, ce qui est annoncé par le fabricant ?
Exercice 8 Dans le cas de l’exercice 4, peut-on dire que l’efficacité de la crème est supérieure à 5% ?
Exercice 9 On veut comparer l’usure des semelles dans une expérience où chaque sportif porte successivement les
semelles A puis B pour le même type d’entrainement. Les résultats sont le suivants :
2sportif Usure A Usure B
1 13.2 14.0
2 8.2 8.8
3 10.9 11.2
4 14.3 14.2
5 10.7 11.8
6 6.6 6.4
7 9.5 9.8
8 10.8 11.3
9 8.8 9.3
10 13.3 13.6
Les résultats montrent-ils une différence d’usure entre semelle A et B ?
Indication : Dans l’échantillon A, on a P
i
xi= 106.3et P
i
x2
i= 1184.05, et dans l’échantillon B, P
i
yi= 110.4et
P
i
y2
i= 1275.9.
Exercice 10 On veut comparer les indices céphaliques (rapport entre la largeur maximale et la longueur maximale
du crâne humain, en pourcentage) des crânes de deux populations. Pour cela, on a relevé ces indices sur 13 individus
de chaque population, pris au hasard :
POP1 : 74.1 - 77.7 - 74.0 - 74.0 - 73.8 - 79.3 - 75.8 - 82.8 - 72.2 - 75.2 - 76.3 - 77.1 - 76.8
POP2 : 70.8 - 74.9 - 74.2 - 70.4 - 69.2 - 72.2 - 76.8 - 72.4 - 77.4 - 78.1 - 72.8 - 74.3 - 74.7
2
En supposant ces indices distribués suivant une loi normale, faire un test de comparaison des deux populations.
Aurait-on pu prendre des échantillons de tailles différentes ?
Indication : dans l’échantillon 1, on a P
i
xi= 989.1,P
i
x2
i= 75348.73, alors que dans l’échantillon 2, on a P
i
yi=
958.2et P
i
y2
i= 70716.72.
Exercice 11 On reprend l’exemple précédent des semelles de chaussures. Pour la semelle A sur un échantillon de
10 sportifs on a obtenu une moyenne d’usure de 10.63 mm avec un écart type de 2.45 mm. Pour la semelle B sur un
échantillon de 11 sportifs (indépendant du premier) on a obtenu une moyenne d’usure de 11.04 mm avec un écart
type de 2.51 mm.
1. La semelle B s’use-t-elle plus vite que la A ?
2. Quelle méthode expérimentale vous parait la meilleure ?
Exercice 12 On souhaite comparer la consommation de boeuf dans les villes anglaises et françaises. Pour cela, on
relève dans 10 villages français de même importance la consommation de boeuf sur deux mois (en Kg par habitant) :
1.945 1.832 1.716 1.774 1.554 2.056 1.712 2.077 1.755 1.883
On relève aussi dans 10 villages anglais comparables la consommation de boeuf sur deux mois (en Kg par habitant) :
1.455 1.555 1.818 1.564 1.728 1.601 1.632 1.468 1.478 1.789
On suppose que ces observations sont indépendantes et gaussiennes.
1. Donner un intervalle de confiance pour la consommation moyenne de boeuf sur deux mois dans les villages
français au niveau de confiance de 95%.
2. Tester au niveau 5% si l’on consomme autant de boeuf dans les villages anglais et français.
Indication : sur les 10 villages français, on obtient P
i
xi= 18.304 et P
i
x2
i= 33.74362. Sur les 10 villages anglais,
on obtient P
i
yi= 16.088 et P
i
y2
i= 26.03891.
Exercice 13 Une tablette de chocolat sera qualifiée de qualité supérieure si elle contient une teneur en cacao
supérieure à 430g par kilogramme. On effectue un contrôle de qualité sur un échantillon de 10 tablettes de chocolat.
On obtient les teneurs (exprimées en grammes par kilogramme) suivantes :
505.1423.5462.0391.9412.1487.2439.0434.1441.1474.2
1. Que peut-on en conclure pour des niveaux de 20% ? de 5% ?
2. Construire un intervalle de confiance pour l’espérance de la teneur en cacao au niveau de confiance 95%.
3. Tester au niveau 10%, H0: "l’écart-type vaut 30" contre H1: "l’écart-type est plus grand que 30".
Indication : dans cet échantillon, on a P
i
xi= 4470.2et P
i
x2
i= 2009297.
Exercice 14 Vous avez à décider si la concentration d’un certain produit est plus élevée dansune solution A que
dans une solution B. Des dosages, effectués à cet effet, on donné les résultats suivants :
solution A : 12.8-13.1-13.3-13.6-13.8-14.1 mg/L
solution B : 11.8-12.2-13.2-13.4 mg/L
On admet que le résultat d’un dosage est la valeur d’une variable aléatoire normale dont l’espérance est la concen-
tration du produit dans la solution choisie et dont l’écart-type est le même dans les deux solutions.
3
Au niveau 5%, peut-on conclure que la concentration du produit est plus élevée dans la solution A ?
Indication : pour la solution A, on a P
i
xi= 80.7et P
i
x2
i= 1086.55, et pour la solution B, P
i
yi= 50.6et
P
i
y2
i= 641.88.
Exercice 15 On souhaite vérifier la précision d’une mesure. Pour cela, on effectue 10 mesures indépendantes
du même produit. Les résultats sont supposés indépendants, gaussiens, de moyenne m= 5 et de variance σ2,
représentant la précision. Les 10 mesures obtenues sont les suivantes :
5.09 5.12 4.98 4.79 4.93 5.07 5.02 4.89 5.01 5.04
Construire un intervalle de confiance pour σau niveau de confiance 95%.
Indication : dans cet échantillon, on a P
i
xi= 49.94 et P
i
x2
i= 249.491.
Exercice 16 Dans une maternité berlinoise, une étude statistique a été menée pour essayer de déterminer quel est
l’impact de l’âge de la mère sur le poids des nouveaux-nés. On note respectivement X et Y le poids d’un bébé né à
terme respectivement d’une mère ayant moins ou plus de 30 ans. On observe un échantillon de 20 bébés dans chaque
catégorie et on obtient les poids (en Kg) suivants :
pour les bébés ayant des mères de moins de 30 ans : 3.150-2.980-2.740-4.070-3.160-2.450-2.980-3.580-2.760-
2.750-3.260-3.290-2.870-2.650-3.130-3.420-3.280-3.520-2.960-2.460
pour les bébés ayant des mères de plus de 30 ans : 2.350-3.460-2.720-2.890-3.120-3.450-3.100-2.320-2.390-
3.500-2.640-2.430-2.870-2.550-3.090-2.640-2.430-3.780-3.520-2.310
On suppose que les variables X et Y sont gaussiennes de moyennes respectives m1et m2et de même variance
σ2. Peut-on affirmer que les bébés nés de mères de plus de 30 ans sont plus petits à la naissance ?
Indication : dans le premier échantillon, on a P
i
xi= 61.46 et P
i
x2
i= 191.9068. Dans le deuxième échantillon, on
aP
i
yi= 57.56 et P
i
y2
i= 169.8874.
Exercice 17 Une association de consommateurs veut comparer deux modèles de voitures de deux marques diffé-
rentes en s’intéressant à la proportion de véhicules qui ont besoin d’une réparation importante (plus de 500 euros)
dans les deux premières années. Elles examinent 400 véhicules de la marque A, dont 53 vont nécessiter une répa-
ration importante, et 500 véhicules de la marque B, dont 78 vont nécessiter une réparation importante. Peut-on
conclure au risque 10% que les deux proportions sont significativement différentes ?
Exercice 18 Datation au carbone 14 des troncs de Séquoia. Un étalonnage de la méthode de datation au
carbone 14 a été réalisé par l’analyse de très vieux troncs de séquoia géants. Par un prélèvement sur le tronc, on
peut obtenir son âge en années, en comptant les anneaux de croissance et sa radio activité C en carbone 14.
t500 1000 2000 3000 4000 5000 6300
C14.5 13.5 12 10.8 9.9 8.9 8
logC 2.67 2.60 2.48 2.37 2.29 2.19 2.08
Les lois physiques indiquent un lien linéaire entre logC et le temps , faire une régression de Y =logC en fonction
du temps.
Exercice 19 Salaire en fonction du nombre d’années d’études. Un économiste s’intéresse à la relation liant
la rémunération à la durée des études. Il dispose de dix cas, ses amis d’enfance qui ont exactement le même âge :
4
nom diplôme Revenu annuel brut en KE
Julie Ingénieur 36
Albert CAP 14
Elodie DUT 21
Kévin Bac pro 16
Marie DESS 32
Julien Ingénieur 34
Aurélie CAP 16
Eric DUT 24
Carine Bac pro 14
Vincent DESS 30
Le nombre d’années d’étude est de -2 pour un CAP, 0 pour un Bac pro, +2 pour un DUT, +5 pour DESS et
Ingénieur. Faire une régression de Y =revenu en fonction du nombre d’années d’étude.
5
1 / 5 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !