Intervalle de fluctuation

publicité
PROBABILITES et
ECHANTILLONNAGE
Liens entre programmes de 2nde
et de première(s )
Qu’appelle –t- on échantillon de taille n?
« Par définition, un échantillon s’obtient par
tirage avec remise ».
Un échantillon de taille n est donc la liste des n
résultats obtenus par n répétitions indépendantes
de la même expérience (doc ressource 2nde p.15)
Echantillonnage : Fluctuation


Expérience aléatoire
Fréquence f d’une issue particulière dans différents
échantillons de taille n :
La fréquence varie (« fluctue »)
en fonction de l’échantillon
On parle de « fluctuation des fréquences » ou
« fluctuation d’échantillonnage »
"L'esprit statistique naît
lorsqu'on prend conscience
de la fluctuation d'échantillonnage"
1. Introduction à la notion de
probabilité (3ème – 2nde)


Expérience aléatoire
Fréquence f d’une issue donnée
dans des échantillons de taille n,
quand la taille des échantillons augmente
Théorème et définition :

Quand n devient de plus en plus grand, la
fréquence f de chaque issue tend à se
« stabiliser » vers une valeur théorique
appelée probabilité de cette issue
( « loi faible des grands nombres »)
Espace probabilisé et simulations



On peut alors associer à l’expérience
aléatoire une loi de probabilité
(modélisation)
Une fois ce modèle choisi, on obtient un
espace probabilisé : on peut y réaliser des
simulations à partir du modèle choisi
On peut alors réaliser une étude statistique
sur les résultats obtenus par simulation
Le Passé
Statistique
descriptiv
e
Probabilités
Le Futur
Statistique
Echantillon
inférentielle
Population
SIMULATION
2. Echantillonnage :
Intervalle de fluctuation,
Intervalle de confiance



Intervalle de fluctuation pour une proportion
En 1ère S, STI… la loi binomiale est utilisée
……
Intervalle de confiance pour une proportion
2.1. Intervalle de fluctuation
Dans une population, on s’intéresse à la
fréquence d’apparition d’un caractère
particulier :
On considère des échantillons de
même taille n
2.1. Intervalle de fluctuation
On connaît la proportion p du caractère
dans la population :
 On peut chercher
l’intervalle de fluctuation au seuil de 95%
pour un échantillon de taille n
Définition :


L’intervalle de fluctuation au seuil de 95%
pour un échantillon de taille n
est l’intervalle centré sur p où se situe,
avec une probabilité de 0,95, la fréquence f
du caractère dans un échantillon de taille n
Cet intervalle peut être approché par
simulation (*)
On peut admettre le résultat suivant (P1):

p étant la proportion du caractère dans l’ensemble de
la population et f la fréquence dans un échantillon de
taille n :
Pour n  25, il y a 95% de chances pour que f
appartienne à l’intervalle
[p-
1
n
; p+
1
n
]
Cet intervalle est l’intervalle de fluctuation
au seuil de 95% pour un échantillon de taille n
Ce résultat peut être conjecturé expérimentalement (*)
Quels types de problèmes?
Aide à la prise de décision (décider si une
différence est significative ou non) :
* Un échantillon donné est-il « conforme » à la
« norme »?
* Semble –t- il provenir de la population connue?
Exemple :
Situation discriminatoire ou non …
2.2. Intervalle de confiance
On ne connaît pas la proportion p du caractère
dans la population :

On peut chercher à estimer p à partir de la
fréquence empirique f (expérimentale)
mesurée dans un échantillon
Comment estimer p?
On peut faire une estimation ponctuelle,
en posant p = f
 Mieux :
On peut chercher un intervalle de confiance
de la proportion p à partir de la fréquence f
mesurée dans un échantillon de taille n

On admet la propriété suivante (P2) :
Parmi tous les échantillons de taille n possibles,
95% des intervalles associés
de la forme
1
1
n,
n,
contiennent le nombre p.
La fréquence empirique f étant connue, on dit que
cet intervalle est un intervalle de confiance à 95%
pour la proportion p.

[f - ; f + ]

Propriété (P3) :
1
1
[
p
;
p
+
f appartient à
n
n]
est logiquement équivalent à
1
1
[f
;
f
+
p appartient à
n,
n, ]
Quels types de problèmes?
Estimer la proportion d’un caractère dans une
population à partir d’un échantillon :
Sondages (par exemple électoraux)
Contrôles qualité
…
Exemple 1 (sondages!):
Avant une élection, un sondage sur un échantillon de
998 personnes (…) donne les résultats suivants :
Candidat A : 20%
Candidat B : 22%
Candidat C : 23 %.
Seuls les deux candidats en tête seront au second
tour : Il y aura donc les candidats B et C?
Réponse avec les intervalles de confiance :
Il y a 95% de chances que les résultats se trouvent
dans les intervalles suivants :
Pour A : [0,168; 0,232]
Pour B : [0,188; 0, 252]
Pour C : [0,198; 0,262].
Intersection non vide! (faire un dessin)
Exemple 2 :
Avant le second tour d’une élection, un
sondage sur un échantillon de 998
personnes (…) donne les résultats suivants
pour les candidats A et B :
Candidat A : 52%
Candidat B : 48%.
Le candidat A commande le champagne…
A –t- il raison?
Réponse avec les intervalles de confiance :
Il y a 95% de chances pour que les résultats se situent
dans les intervalles suivants :
Pour A : [0,488; 0,552]
Pour B : [0,448; 0, 512]
Intersection non vide! Conclusion ….
!!!
(faire un dessin)
[
[
]
]
B
A
3. Quelques repères pour l’évaluation
Cf. doc ressource de 2nde, page 20 :
Des formes variées adaptées à la
diversité des objectifs
Quelques repères pour l’évaluation

Forme « classique » (DS)
pour :
- Calculs de probabilités,
- Représentations graphiques,
- Résumés statistiques
Mais : ….
Quelques repères pour l’évaluation

Comptes-rendus de TP ou devoirs maison
« majoritairement » pour :
- Simulations avec tableur ou calculatrice
- Analyse critique d’un résultat d’échantillonnage
- Utiliser un logiciel ou une calculatrice pour étudier
une série statistique
…
Quelques repères pour l’évaluation

La place de l’oral
à travers échanges et exposés,
à développer
… avec les points d’appui explicités lors de
l’expérimentation de l’épreuve pratique!
Téléchargement