Modélisation – Simulation - Fluctuation d`échantillonnage Intervalle

Modélisation Echantillonnage Commentaires pour les oraux. p. 1/4
Jeanne Fine IUFM Midi-Pyrénéeshttp://finestat.free.fr/
ModélisationSimulation - Fluctuation déchantillonnage
Intervalle de fluctuation - Intervalle de confiance
Commentaire sur les oraux
Oral 2 - Thème 10 : Modélisation et simulation d'exriences aléatoires :
fluctuation d'échantillonnage
Aucun dossier sur ce thème na été proposé par le Jury du Capes. En revanche, des questions
sur la simulation sont posées dans le cadre dautres dossiers. Les programmes de probabilités
et statistique ont été profondément modifiés depuis 2000.
Les programmes
Depuis la rentrée 2008, une introduction aux probabilités est proposée en 3ème.
Avant cette date, cétait seulement en première quétaient abordées « les probabilités » aps
une introduction intuitive en seconde à l'aide de "simulation et fluctuation d'échantillonnage".
Depuis la rentrée 2009, le nouveau programme de seconde prend en compte lintroduction
aux probabilités faite en 3ème. La simulation et la fluctuation déchantillonnage sont toujours
au programme mais laccent est mis sur les notions dintervalle de fluctuation dune fquence
d’échantillonnage à 95% et sur lestimation par intervalle de confiance à 95% dune
proportion.
La statistique inférentielle est constituée de trois parties :
- l’échantillonnage qui consiste à étudier les distributions de probabilis des variables
aatoires dites déchantillonnage,
- l’estimation ponctuelle ou par intervalle de confiance des paramètres de la population
ou du modèle probabiliste, enfin
- les tests statistiques (test d’adéquation à une loi de probabilité, test de comparaison
d’une moyenne ou dune fréquence à une valeur donnée, test de comparaison de deux
moyennes ou de deux fréquences, …)
Les deux premières parties sont donc abordées en 2nde pour une « proportion ». L’objectif de
savoir interpréter les résultats dun sondage avec la notion de fourchette de sondage
(intervalle de confiance) fait partie de la statistique du citoyen.
La troisième partie est abordée en terminale : test dadéquation à une loi équirépartie.
Les nouveaux programmes de première pour la rentrée 2010 ne sont toujours pas sortis à ce
jour (avril 2010). Lintroduction aux probabilis aura déjà été faite, la simulation et la
fluctuation déchantillonnage auront déjà été étudiées lannée précédente. Il sagit à présent de
« formaliser » la notion de distribution de probabilité et de modéliser des situations réelles.
Vocabulaire :
Modéliser une expérience aléatoire
Modéliser une expérience aléatoire, c'est trouver l'espace probabilisé associé (c'est-dire,
l'ensemble des résultats possibles et les probabilités associées).
Les nouveaux programmes utilisent le terme de "loi de probabilité" associée (cf. page 15 du
document d'accompagnement de première ES : "Remarque : nous avons choisi pour
l'enseignement secondaire d'employer le terme de loi de probabilité sur un ensemble, que
celle-ci soit ou non la loi d'une variable aléatoire."). On pourra aussi parler de "distribution de
Modélisation Echantillonnage Commentaires pour les oraux. p. 2/4
Jeanne Fine IUFM Midi-Pyrénéeshttp://finestat.free.fr/
probabilité" qui est synonyme de "loi de probabilité" et plus proche de la notion de
"distribution de fréquences" vue en statistique.
Plutôt que trouver l'espace probabili associé, on devrait dire trouver "un" espace probabilisé
associé qui décrive "au mieux" l'expérience aléatoire. "Au mieux" signifie que, si l'on répète
un grand nombre de fois l'expérience aléatoire dans les mêmes conditions, la distribution de
fréquences observée sur les n premières exriences tend vers la "distribution de probabilité"
lorsque n augmente.
Exemple 1 :
On tire "au hasard" une boule dans une urne contenant trois boules indiscernables au
toucher, deux blanches et une noire et on s'intéresse à la couleur de la boule.
Deux moles associés sont, avec des notations évidentes,
21
{ , }avec ({ }) et ({ })
33
bn P b P nΩ= = =
et
12 1 2 1
' { , , } avec '({ }) '({ }) '({ }) .
3
bbn Pb Pb PnΩ= = = =
De fait le premier modèle est implicitement construit à partir du second. Les boules sont
indiscernables au toucher mais sont physiquement au nombre de trois et, par hypothèse, le
tirage se fait avec équiprobabilité. Ces deux modèles sont équivalents dans la mesure où ils
donnent les mêmes probabilités aux événements associés à l'expérience aléatoire.
Lnement "obtenir une blanche" scrit
{}b
dans le premier modèle et
12
{, }bb
dans le
deuxième et on a :
2
({ }) et
3
Pb =
12
2
'({ , }) .
3
P bb =
Exemple 2
On tire au hasard dans une urne contenant des boules, indiscernables au toucher,
blanches ou noires. On ne connaît pas la proportion de boules blanches dans l'urne
mais l'on a l'autorisation de tirer 10 fois de suite avec remise et dans les mêmes
conditions une boule de l'urne. On obtient 3 blanches et 7 noires.
On propose alors la modélisation suivante :
{ , }avec ({ }) 0.3et ({ }) 0.7bn P b P nΩ= = =
,
quitte à modifier le modèle si l'on peut recommencer des tirages et avoir des informations
supplémentaires.
Simuler une expérience aléatoire
« Simuler une expérience aléatoire, c'est choisir un mole de cette expérience puis simuler ce
modèle ». Cf. les programmes de 1ère S et ES et le document « Simulation et
échantillonnage ».
Bien sûr, dans le langage courant, le mot "simulation" a un autre sens et même deux autres
sens : "faire semblant" (simuler un sentiment ou une maladie) et "remplacer une situation par
une autre plus simple donnant les mêmes résultats" (simulation de vol ou d'accidents).
On peut simuler une distribution de probabilité que l'on ne connaît pas et que l'on cherche à
"approcher" par simulation. C'est ce que l'on a fait dans l'exemple 2 ci-dessus. D'après le
programme de 1ère S : "On simulera des lois de probabilités simples obtenues comme images
d'une loi équirépartie par une variable aléatoire. La molisation avec des lois ne découlant
pas d'une loi équirépartie est hors programme."
Modélisation Echantillonnage Commentaires pour les oraux. p. 3/4
Jeanne Fine IUFM Midi-Pyrénéeshttp://finestat.free.fr/
Par exemple, la loi de probabilité de la v.a.r. X égale à la somme des points marqués par 3 dés
lancés simultament est l'image par X de l'équiprobabilité sur 3
{1,...,6} . Il suffit de simuler
par exemple 1000 triplets de la loi équirépartie sur 3
{1,...,6} (c'est-à-dire 3000 observations de
la loi équirépartie sur
3
{1,...,6}
que l'on répartit 3 par 3) et pour chaque triplet de calculer la
somme des 3 nombres obtenus pour obtenir la distribution de fréquences de cet échantillon de
taille 1000 de X et donc une approximation de la loi de probabilité de X.
Fluctuation d’échantillonnage
Version simulation (classe de 2nde) : lorsque lon simule n fois une loi de probabili
(Bernoulli de paramètre 1/3 ou loi uniforme discrète sur {1,,6}), on obtient un « échantillon
de résultats de taille n » : on peut alors sintéresser à la fréquence dun événement appelé
« succès », appelée fréquence déchantillonnage, ou à la moyenne des résultats obtenus,
appelée moyenne d’échantillonnage,
Les valeurs prises par les variables déchantillonnage sont difrentes d’un échantillon de
taille n à un autre ; il sagit de ce que lon appelle la « fluctuation déchantillonnage ».
Lorsque la taille de léchantillon augmente, les fluctuations deviennent de plus en plus faibles
et tendent à se stabiliser autour de la fréquence de succès lors dune expérience ou de la
moyenne de la loi de probabilité.
Version probabiliste : soit une suite de v.a.r. indépendantes et de même loi de
probabilité despérance mathématique µ et décart-type σ. On pose : . Cette
nouvelle v.a.r. est appelée « moyenne déchantillonnage ». Elle a pour espérance
matmatique µ et pour écart-type . La moyenne déchantillonnage « converge » donc
vers µ lorsque la taille de léchantillon augmente. De plus, sa loi de probabilité peut être
approchée par une loi normale de mêmes paramètres dès que la taille de léchantillon est
suffisamment grande
Dans le cas où la loi de probabilité est une loi de Bernoulli de paramètre p (loi de lindicatrice
du succès d’une épreuve de Bernoulli), alors µ = p et , la moyenne
d’échantillonnage nest autre que la « fréquence déchantillonnage » (fréquence de succès sur
l’échantillon) et elle est notée .
Intervalle de fluctuation dune fréquence déchantillonnage à 95%
On sait que, pour toute variable aléatoire normale, 95% des valeurs sont comprises entre la
moyenne moins 2 écart-types et la moyenne plus 2 écart-types.
L’intervalle est appelé « intervalle de fluctuation de à
95% ». Lorsque p est compris entre 0.2 et 0.8 on peut approcher par 1/2 et
l’intervalle de fluctuation de à 95% devient .
Intervalle de confiance à 95% dune proportion
On sintéresse à une sous-population A d’une population finie dont la proportion par rapport à
la population est notée p. Lorsque lon tire « au hasard » (cest-à-dire avec équiprobabilité) un
individu de la population, la probabilité de succès (obtenir un individu de A) est p.
L’indicatrice de succès suit une loi de Bernoulli de paramètre p.
Modélisation Echantillonnage Commentaires pour les oraux. p. 4/4
Jeanne Fine IUFM Midi-Pyrénéeshttp://finestat.free.fr/
Le tirage dun échantillon de taille n avec équiprobabilité et avec remise peut être molisé
par une suite de v.a.r. indépendantes et de même loi de Bernoulli de paramètre p (les
indicatrices de succès).
On convient dassimiler un tirage sans remise à un tirage avec remise dès que le taux de
sondage (rapport de la taille de léchantillon sur la taille de la population) est suffisamment
petit (inférieur à 0.1).
On tire au hasard avec remise un échantillon de taille n dans la population et on note f la
fréquence dindividus de A dans léchantillon. On sait que f est une observation dune variable
aléatoire dont lespérance mathématique est p.
Une estimation ponctuelle de la proportion p de A dans la population est alors f (fréquence de
A dans léchantillon).
On sait de plus que 95% des valeurs de sont à une distance de p inférieure ou égale à
(résultat du paragraphe précédent).
Une estimation par intervalle de confiance à 95% de la proportion p est .
La procédure utilisée permet de dire que nous faisons erreur dans 5% des cas et que la
proportion p appartient bien à lintervalle donné dans 95% des cas.
1 / 4 100%

Modélisation – Simulation - Fluctuation d`échantillonnage Intervalle

La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !