(MC-DAOA) Exercice de statistique

publicité
Master Complémentaire – Denrées Alimentaires d’Origine Animale
(MC-DAOA)
Exercice de statistique
1) Génération de données
Un abattoir porcin est engagé dans l’abattage de porcs charcutiers. Le poids des animaux abattus suit
une distribution normale de moyenne µP = 120 kg et de déviation standard σP = 5 kg. Les porcs
abattus émanent en principe de la catégorie E dans le classement EUROP, ce qui signifie que le
rendement en viande maigre de la carcasse est supérieur à 55%. On supposera ici que ce
rendement :
•
•
est indépendant du poids de la carcasse
est distribué de manière uniforme entre 55% et 60%.
On demande :
•
•
quel est le poids moyen (théorique) de viande maigre ?
d’obtenir une estimation de la moyenne et de la déviation standard du poids de viande
maigre au travers d’un échantillon. Cet échantillon sera constitué in silico. On va donc
simuler la prise de mesures en abattoir au moyen d’un logiciel (excel) :
o choisir une taille d’échantillon suffisante (p.e. n = 1000).
o générer n poids de viande maigre en échantillonnant les poids de carcasse et le
pourcentage de viande maigre de manière aléatoire et indépendante (cfr énoncé)
dans leur distribution respective (voir « truc » ci-dessous).
o associer à chaque carcasse un indicateur (oui | non) spécifiant si des lésions
pulmonaires ont été trouvées sur la carcasse. On supposera (ce n’est sans doute pas
très réaliste...) que la probabilité de lésion est égale au dixième du pourcentage de
viande maigre (par exemple, un animal qui a un pourcentage de viande maigre égal
à 54% a une probabilité de 5.4% de présenter des lésions pulmonaires). Le fait de
présenter ou non des lésions sera généré également de manière aléatoire.
o une fois l’échantillon constitué, obtenez les différents estimateurs demandés, ainsi
qu’une estimation de la prévalence des lésions pulmonaires dans cette cohorte
d’individus.
2) Test d’hypothèse
Supposons à présent qu’une maladie affectant les poumons, faisant passer la prévalence de 5.5-6 % à
9.5-10 % (en gros, la probabilité de lésion augmente de 4%). En imaginant qu’un nouveau lot de 200
porcs est abattu dans cette période d’épidémie, générez ce nouvel échantillon, et imaginez un test
qui permette de comparer les prévalences des 2 échantillons. Pour ce test :
•
•
•
posez l’hypothèse nulle (ce qu’on se propose de démontrer) et l’hypothèse alternative (ce
qu’on considérera comme vrai si l’hypothèse nulle n’est pas acceptée),
effectuez le test de l’hypothèse, et tirez les conditions adéquates.
on devrait « repérer » qu’il y a un problème dans cette expérience, mais il arrivera que
certaines simulations ne « voient » pas de différence entre les deux cohortes de porcs (il
s’agit d’une erreur de type 2 : il y a un effet, mais le test conclut erronément qu’il n’y en a
pas). Quelle est la probabilité de se rendre compte qu’il y a un problème sanitaire (cette
probabilité est appelée la puissance du test) ? Vous pouvez obtenir une estimation de cette
probabilité en répétant un grand nombre de fois le test ci-dessus sur de nouveaux
échantillons générés de manière similaire sur l’ordinateur : pour chaque nouvelle génération,
le test verra ou pas l’effet. Il « suffit » donc de comptabiliser la proportion de situations dans
lesquelles l’augmentation de la prévalence a été constatée pour avoir une estimation de la
puissance du test.
Trucs :
•
•
•
•
la fonction ALEA() génère des valeurs aléatoires entre 0 et 1 (comme des probabilités, par
exemple...)
la fonction LOI.NORMALE(X ;µ ;σ ;VRAI) permet de calculer la probabilité P d’être inférieur à
X dans une distribution normale de moyenne µ et de déviation standard σ.
la fonction LOI.NORMALE.INVERSE(P ;µ ;σ) permet de calculer la valeur de X pour laquelle la
probabilité de lui être inférieur vaut P.
la fonction LOI.STUDENT(...) permet de calculer des probabilité associées à des valeurs de la
statistique t de Student. Cette statistique est notamment utilisées dans la comparaison de
proportions...
Téléchargement