Statistiques inférentielles Objectif Présentation du problème

BTS2 Statistiques inférentielles 2011-2012

Objectif

On cherche le lien entre les propriétés d’un caractère sur une population de taille Net un échantillon de cette population

de taille n.

Présentation du problème

Exemple 1

Un fabricant de pétards pour feux d’artiﬁce désire connaître la proportion de pétards défectueux dans la production

hebdomadaire qui est de 10 000 pétards. Doit-il faire griller ses 10 000 pétards pour connaître ce nombre ?

Exemple 2

Une laiterie produit 1 million de yaourts par semaine. A la suite d’une rupture de la chaîne du froid dans la fabrication,

il se produit une crainte de prolifération de la bactérie listéria monocytogene dans cette production.

On estime que jusqu’à 5 % de la population peut être porteuse de listéria monocytogene dans les intestins, sans

ressentir d’eﬀets de maladie.

Par mesure de précaution, la laiterie est prête à détruire cette production si la proportion de yaourts infectés dépasse

1 %.

Doit-on analyser un à un tout les yaourts pour détecter cette présence ? (ce qui reviendrait encore plus cher qu’une

destruction pure et simple).

En décidant de prélever un échantillon de 100 yaourts pour lequel on détermine la proportion de yaourts infectés ; que

nous indique ce résultat ?

Par exemple, que dire si la proportion de yaourts infectés est égale à de 2% ?

1. Aurait-on obtenu le même pourcentage en prélevant un autre échantillon ?

2. La taille 100 de l’échantillon est-elle suﬃsante au vu de la taille de la production ?

3. Quelle conﬁance accorder au fait que cette analyse ait conduit à une proportion de 2 % ?

4. Aurait-on gagné en ﬁabilité si l’on avait analysé 500, 1 000, 10 000 yaourts ?

Analyse d’un exemple

Pour bien comprendre le phénomène analysons, en détail, un exemple avec une population réduite à 5 éléments et un

échantillon de taille 2 : Ω = {2; 3; 6; 8; 11}

Voir le ﬁchier Excel joint : Après avoir activé les macro-commandes, consulter successivement les pages M0, M1, M2,

M3, M4.

Ne pas oublier de cliquer sur le bouton Moyennes des feuilles M2, M3, M4.

1Bernard GAULT Lycée Blaise Pascal Segré

BTS2 Statistiques inférentielles 2011-2012

Phase 1 : Analyse ( Echantillonnage )

On connaît les caractéristiques de la population. On étudie les caractéristiques de l’échantillon.

Population

Eﬀectif : N

Moyenne : m

Ecart type : σ

Probabilité : p

Echantillon

Eﬀectif : n

Moyenne : me

Ecart type : σe

Probabilité : fe

Fluctuation d’échantillonnage

La simulation nous permet de constater des ﬂuctuations des valeurs de me,σeet feen fonction des échantillons : C’est

la ﬂuctuation d’échantillonnage.

Si l’on calcule la moyenne de chacun des échantillons possibles de taille nalors :

•La moyenne de ces moyennes des échantillons est égale à m.

•L’écart type de ces moyennes des échantillons est égale à σ

√n

Si l’on calcule la fréquence d’un caractère pour chacun des échantillons possibles de taille nalors :

•La moyenne de ces fréquences des échantillons est égale à p.

•L’écart type de ces fréquences des échantillons est égale à rpq

Si l’on calcule la variance de chacun des échantillons possibles de taille nalors :

•La moyenne de ces variances des échantillons est égale à n−1

nσ2.

Remarque : Plus la taille de l’échantillon est grande, plus l’intervalle de ﬂuctuation diminue.

Lois limites

Propriété 1

Etant donné une population de taille Nsur laquelle on étudie un caractère de moyenne met d’écart type σ.

Lorsque l’on prélève des échantillons de taille nassez grand ( n≥30 ), la loi d’échantillonnage des moyennes peut

être approchée par la loi N(m;σ

√n)

Propriété 2

Etant donné une population de taille Nsur laquelle on étudie un caractère de fréquence p.

Lorsque l’on prélève des échantillons de taille nassez grand ( n≥30 ), la loi d’échantillonnage des fréquences

peut être approchée par la loi Np;rpq

n(rem : σ=√pq)

2Bernard GAULT Lycée Blaise Pascal Segré

BTS2 Statistiques inférentielles 2011-2012

Propriété 3

Etant donné une population de taille Nsur laquelle on étudie un caractère de moyenne met d’écart type σ.

Lorsque l’on prélève des échantillons de taille nassez grand ( n≥30 ), la loi d’échantillonnage des variances peut

être approchée par une loi de moyenne n−1

nσ2

Pour info : La loi d’échantillonnage des variances peut être approchée par une loi en khi-carré avec n−1degrés de

liberté.

Phase 2 : Estimation

On connaît les caractéristiques de l’échantillon. On voudrait en déduire les caractéristiques de la population.

Population

Eﬀectif : N

Moyenne : m

Ecart type : σ

Probabilité : p

Echantillon

Eﬀectif : n

Moyenne : me

Ecart type : σe

Probabilité : fe

Estimation

Estimation ponctuelle

La moyenne de l’échantillon est me, on estime alors que la moyenne de la population est m=me.

La fréquence de l’échantillon est fe, on estime alors que la fréquence de la population est p=fe.

L’écart type de l’échantillon est σe, on estime alors que l’écart type de la population est σ=rn

n−1σe.

3Bernard GAULT Lycée Blaise Pascal Segré

BTS2 Statistiques inférentielles 2011-2012

Intervalle de conﬁance d’une moyenne

Nous étudions un caractère d’une population dont la moyenne est met l’écart type σ.

La variable aléatoire Xqui, à chaque échantillon de taille nassocie sa moyenne, suit la loi Nm;σ

√n.

La variable aléatoire centrée réduite T=X−m

√n

suit la loi N(0; 1).

On se ﬁxe un seuil de risque αou un niveau de conﬁance 1 - α, on détermine alors le réel ttel que P(−t < T < t) = 1−α:

Exemple : Les valeurs les plus courantes du niveau de conﬁance 1−αet de tcorrespondantes sont données dans le

tableau ci-dessous :

1−α99 % 98 % 95 % 90 %

t2,58 2,33 1,96 1,645

2Π(t)−1

−t

Or : −t < T < t ⇔ −t < X−m

√n

< t ↔ −tσ

√n<X−m < t σ

√n

Si l’on tire un échantillon, on obtient une valeur de X, la relation ci-dessus va nous permettre de déterminer un

encadrement de la moyenne mde la population.

P(−t < T < t)⇐⇒ P



−t < X−m

√n

< t



= 1 −α⇐⇒ PX−tσ

√n< m < X+tσ

√n= 1 −α.

Ce dernier intervalle s’appelle l’intervalle de conﬁance au seuil de risque de αou au coeﬃcient de conﬁance de 1−α.

Intervalle de conﬁance d’une fréquence

Nous étudions un caractère d’une population dont la fréquence est p.

La variable aléatoire Xqui, à chaque échantillon de taille nassocie sa fréquence, suit la loi Np;rpq

n.

La variable aléatoire centrée réduite T=X−p

rpq

suit la loi N(0; 1).

Soit αla probabilité, ﬁxée à l’avance, pour que Tn’appartienne pas à l’intervalle [−t;t], nous pouvons écrire :

P(−t < T < t) = 1 −α⇐⇒ P



−t < X−p

rpq

< t





= 1 −α⇐⇒ PX−trpq

n< p < X+trpq

n= 1 −α.

Remarque : Comme la valeur de pest inconnue, on ne connaît donc pas l’écart type rpq

n. On le remplace alors par

son estimation ponctuelle rfe(1 −fe)

n−1

4Bernard GAULT Lycée Blaise Pascal Segré

1 / 4 100%

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Statistiques inférentielles Objectif Présentation du problème

Faire une suggestion

Produits

Assistance

Produits

Assistance

Statistiques inférentielles Objectif Présentation du problème

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib