Master Complémentaire – Denrées Alimentaires d’Origine Animale (MC-DAOA) Exercice de statistique 1) Génération de données Un abattoir porcin est engagé dans l’abattage de porcs charcutiers. Le poids des animaux abattus suit une distribution normale de moyenne µP = 120 kg et de déviation standard σP = 5 kg. Les porcs abattus émanent en principe de la catégorie E dans le classement EUROP, ce qui signifie que le rendement en viande maigre de la carcasse est supérieur à 55%. On supposera ici que ce rendement : • • est indépendant du poids de la carcasse est distribué de manière uniforme entre 55% et 60%. On demande : • • quel est le poids moyen (théorique) de viande maigre ? d’obtenir une estimation de la moyenne et de la déviation standard du poids de viande maigre au travers d’un échantillon. Cet échantillon sera constitué in silico. On va donc simuler la prise de mesures en abattoir au moyen d’un logiciel (excel) : o choisir une taille d’échantillon suffisante (p.e. n = 1000). o générer n poids de viande maigre en échantillonnant les poids de carcasse et le pourcentage de viande maigre de manière aléatoire et indépendante (cfr énoncé) dans leur distribution respective (voir « truc » ci-dessous). o associer à chaque carcasse un indicateur (oui | non) spécifiant si des lésions pulmonaires ont été trouvées sur la carcasse. On supposera (ce n’est sans doute pas très réaliste...) que la probabilité de lésion est égale au dixième du pourcentage de viande maigre (par exemple, un animal qui a un pourcentage de viande maigre égal à 54% a une probabilité de 5.4% de présenter des lésions pulmonaires). Le fait de présenter ou non des lésions sera généré également de manière aléatoire. o une fois l’échantillon constitué, obtenez les différents estimateurs demandés, ainsi qu’une estimation de la prévalence des lésions pulmonaires dans cette cohorte d’individus. 2) Test d’hypothèse Supposons à présent qu’une maladie affectant les poumons, faisant passer la prévalence de 5.5-6 % à 9.5-10 % (en gros, la probabilité de lésion augmente de 4%). En imaginant qu’un nouveau lot de 200 porcs est abattu dans cette période d’épidémie, générez ce nouvel échantillon, et imaginez un test qui permette de comparer les prévalences des 2 échantillons. Pour ce test : • • • posez l’hypothèse nulle (ce qu’on se propose de démontrer) et l’hypothèse alternative (ce qu’on considérera comme vrai si l’hypothèse nulle n’est pas acceptée), effectuez le test de l’hypothèse, et tirez les conditions adéquates. on devrait « repérer » qu’il y a un problème dans cette expérience, mais il arrivera que certaines simulations ne « voient » pas de différence entre les deux cohortes de porcs (il s’agit d’une erreur de type 2 : il y a un effet, mais le test conclut erronément qu’il n’y en a pas). Quelle est la probabilité de se rendre compte qu’il y a un problème sanitaire (cette probabilité est appelée la puissance du test) ? Vous pouvez obtenir une estimation de cette probabilité en répétant un grand nombre de fois le test ci-dessus sur de nouveaux échantillons générés de manière similaire sur l’ordinateur : pour chaque nouvelle génération, le test verra ou pas l’effet. Il « suffit » donc de comptabiliser la proportion de situations dans lesquelles l’augmentation de la prévalence a été constatée pour avoir une estimation de la puissance du test. Trucs : • • • • la fonction ALEA() génère des valeurs aléatoires entre 0 et 1 (comme des probabilités, par exemple...) la fonction LOI.NORMALE(X ;µ ;σ ;VRAI) permet de calculer la probabilité P d’être inférieur à X dans une distribution normale de moyenne µ et de déviation standard σ. la fonction LOI.NORMALE.INVERSE(P ;µ ;σ) permet de calculer la valeur de X pour laquelle la probabilité de lui être inférieur vaut P. la fonction LOI.STUDENT(...) permet de calculer des probabilité associées à des valeurs de la statistique t de Student. Cette statistique est notamment utilisées dans la comparaison de proportions...