Document

Téléchargement

- 1 -

Chapitre 9

Simulations, échantillonnage

Activité 1.

I. Simulation

De quoi s’agit-il ?

Certaines expériences aléatoires sont particulièrement longues à réaliser. Grâce à la

calculatrice ou à l’ordinateur, il est souvent possible de les remplacer par des expériences

« équivalentes », beaucoup plus rapides à effectuer et aussi moins coûteuses.

Exemple 1:

Supposons que l’on effectue des lancers avec une pièce équilibrée. On voudrait savoir

combien de fois « pile » apparait lorsque l’on effectue 1 000 lancers. On peut bien

évidemment effectuer les 1 000 lancers à la main, mais il est plus commode et plus rapide de

remplacer cette expérience par la suivante : on fait sortir à la calculatrice ou à l’ordinateur

mille fois l’un des nombres 0 ou 1, de manière équiprobable. Pour cela on utilise les fonctions

ALEA et ENT avec la formule : ENT (2



ALEA()). On associe le nombre 1 à « pile » et le

nombre 0 à « face ». Un calcul élémentaire permet alors d’obtenir le nombre de « pile ».

Exercice 1 :

Simuler le lancer d’une pièce de monnaie répété 500 fois. On note 1 la face « Pile » et 0 la

face « face ».

Exercice 2 :

Une urne contient 40% de boules blanches. On souhaite effectuer 1000 tirages, avec remise,

d’une boule au hasard.

Proposer une manière de simuler cette expérience sur l’ordinateur en utilisant le fait qu’il peut

faire sortir au hasard chacun des dix nombres 1 ; 2 ; 3 ; 4 ; 5 ; 6 ; 7 ; 8 ; 9 et 10 de façon

équiprobable. Vérifier la proportion de boules blanches sur votre échantillon de 1000 tirages.

Exercices 1, 2, 3, 7 et 9p267.

II. Introduction à l’échantillonnage

Les sondages jouent un rôle important dans notre société. Il en est souvent question pour

indiquer la cote de popularité d’hommes politiques, mais en réalité, ils interviennent aussi

dans bien d’autres domaines, moins médiatiques, mais importants.

A. De quoi s’agit-il ?

On peut en résumer le principe de la manière suivante : dans une population contenant « un

grand nombre » N d’individus, un pourcentage p de ces individus possède une certaine

propriété P, par exemple, « ont l’intention de voter pour tel candidat ». Pour trouver p, on

pourrait, en théorie, examiner tous les individus et compter ceux qui possède la propriété P.

- 2 -

Connaissant le nombre total d’individus, on en déduirait alors immédiatement le pourcentage

p cherché.

B. Estimation

Dans la pratique, il est très difficile d’examiner tous les individus : cela nécessiterait trop de

temps, trop d’argent. Parfois même, l’examen de tous les individus donnerait p, certes, mais la

connaissance de p ne servirait à rien.

En effet, par exemple, imaginons que l’on veuille connaitre, dans un lot de 10 000 ampoules,

avant de les mettre en vente, le pourcentage p d’ampoules ayant une durée de vie supérieure à

1 500 heures. En allumant sans interruption chacune des 10 000 ampoules on verrait qu’elle

est la durée de vie de chacune, et on en déduirait p. Mais alors, toutes les ampoules seraient

abimées donc non commercialisables, et alors les calculs relatifs à ce lot seraient inutiles !

Dans la pratique, on ne considère donc qu’une partie de la population, contenant un nombre n

d’éléments, n étant nettement inférieur au nombre total N d’éléments. On peut alors calculer,

dans cette partie de la population, le pourcentage f d’individus ayant la propriété P. Si cette

partie n’est pas « trop petite » on conçoit intuitivement que le pourcentage réel p, relatif à

toute la population, devrait être « voisin » de f .

Souvent on considère que n



25 et 0,2



0,8 permettent d’utiliser ce qui va être fait dans

la suite du chapitre.

C. Une certitude : jamais

En effet, si par « malchance », la partie de la population choisie a des caractéristiques très

distinctes de celle de la population totale, p et f peuvent ne pas être voisins.

La théorie des probabilités et des statistiques permet d’obtenir, grâce à des calculs qui ne sont

pas au programme de la classe de seconde, une estimation plus satisfaisante, faisant

intervenir, cette fois, un intervalle de centre f susceptible de contenir p.

III. Notion d’échantillon

A. De quoi s’agit-il ?

Définition :

Un échantillon de taille n est constitué des résultats de n répétitions indépendantes de la

même expérience. Lorsque l’on étudie une partie de la population, on dit que l’on étudie un

échantillon. Le nombre d’individus formant l’échantillon est la taille de l’échantillon.

B. Exemples

Cas d’une urne :

Un échantillon de taille n est constitué des résultats de n tirages avec remise.

Notons que si les tirages s’effectuent sans remise, alors les tirages ne sont plus indépendants.

En effet la composition de l’urne varie après chaque tirage.

Cas d’un sondage :

Supposons que l’on interroge n personnes dans une population totale de N personnes. A

priori, il s’agit d’une situation analogue à un tirage sans remise dans une urne ; en effet, les

personnes interrogées ne sont interrogées qu’une seule fois. Mais souvent n est tellement plus

petit que N que l’on convient que cela correspond à un tirage avec remise.

- 3 -

Exemple 2:

Pour un sondage, on sait que la proportion de personne ayant répondu « oui » était de 0,4. On

sait donc que p = 0,4. Comment faire à l’aide d’un tableur pour simuler une telle enquête au

près de 500 personnes ?

Activité.

IV. Fluctuation d’échantillon

A. Exemple

Reprenons l’exemple de l’urne dans laquelle la population de boules blanches est égale à p.

Supposons que p est connue, par exemple p = 0,6.

Voici les fréquences de boules blanches obtenues, par simulation, à partir de 20 échantillons,

chacun de taille 100.

0,51

0,62

0,68

0,55

0,6

0,69

0,58

0,61

0,7

0,47

0,55

0,63

0,53

0,5

0,52

0,68

0,69

0,54

0,55

0,59

On constate sur cet exemple que les fréquences observées fluctuent. Ce phénomène est

appelée fluctuation de l’échantillonnage.

Plus précisément, on peut constater que, pour la plus part des échantillons, la fréquence de

sortie d’une boule blanche se trouve dans l’intervalle [0,5 ; 0,7]. On dispose ainsi d’un ordre

de grandeur du nombre d’échantillons dont la fréquence appartient à l’intervalle [0,5 ; 0,7].

Dans l’exemple, on peut vérifier qu’il y en a 19 sur 20, c'est-à-dire 95%.

B. Propriété générale

Les résultats observés dans l’exemple précédent sont en accord avec la propriété générale

suivante, démontrée en théorie des probabilités et des statistiques ; mais pas cette année !

Propriété :

La fréquence du caractère dans un échantillon de taille n appartient à l’intervalle :

Error!

, avec une probabilité d’au moins 95%.

C. Intervalle de fluctuation

Définition :

Pour un échantillon de taille n, l’intervalle

Error!

est appelé intervalle de fluctuation de la

fréquence f au seuil de 95%.

Remarque :

L’intervalle de fluctuation de la fréquence f au seuil de 95% ne dépend que de p et de la taille

de l’échantillon n et non de la population totale.

Exemple 3 :

Dans l’exemple du paragraphe IV. A. ci-dessus, n = 100 et p = 0,6. Donc l’intervalle de

fluctuation de f au seuil de 95% est l’intervalle [0,5 ; 0,7].

On a pu constater que pour 95% des échantillons considérés, la fréquence f se trouvait bien

dans cet intervalle de fluctuation.

Exercice 3 :

- 4 -

Une urne contient 20 boules, dont 9 rouges. On effectue des séries de 100 tirages avec remise

et on relève, pour chaque série, le pourcentage de boules rouges.

Quel est l’intervalle de fluctuation de f au seuil de 95% ?

V. Prise de décision à partir d’un échantillon

La connaissance de l’intervalle de fluctuation peut permettre de mieux analyser certaines

situations. Une telle analyse statistique conduit parfois à des résultats surprenants, comme on

va le voir dans l’exemple suivant.

A. Méfions-nous des apparences

Deux entreprises A et B recrutent dans une région où il y a autant de femmes que d’hommes.

Dans l’entreprise A, il y a 100 employés dont 43 femmes et 57 hommes. Dans l’entreprise B,

il y a 2 500 employés, dont 46% de femmes et 54% d’hommes.

On peut être tenté de penser que l’entreprise B respecte mieux la parité homme-femme que

l’entreprise A, où il n’y a que 43% de femmes.

B. Une analyse statistique

Statistiquement, on peut considérer que le critère de parité est respecté lorsque les résultats

observés pourraient être obtenus par un choix au hasard des individus dans la population

totale, quel que soit leur sexe. Puisqu’il y a autant d’hommes que des femmes dans la région

considérée, nous sommes donc en présence d’un phénomène du même type qu’un tirage avec

remise d’une urne avec p = 0,5.

Dans l’entreprise A, l’intervalle de fluctuation au seuil de 95% est l’intervalle

Error!

, c'est-à-

dire [0,4 ; 0,6].

Dans l’entreprise B, l’intervalle de fluctuation au seuil de 95% est l’intervalle

Error!

, c'est-à-

dire environ l’intervalle [0,48 ; 0,52].

Ainsi, pour l’entreprise A, 43%, c'est-à-dire 0,43, est bien dans l’intervalle de fluctuation au

seuil de 95%, alors que l’entreprise B, 46%, c'est-à-dire 0,46, ne l’est pas !

C. Une prise de décision à présent

On peut traduire le fait que 0,46 ne se trouve pas dans l’intervalle de fluctuation de la manière

suivante : si on considère le modèle accordant une probabilité égale d’obtenir un homme et

une femme, la proportion de 46% s’observe dans moins de 5% des échantillons.

On peut alors rejeter l’hypothèse que l’entreprise B respecte mieux la parité que l’entreprise

A, contrairement aux apparences.

Remarque :

Quelle que soit la décision prise, il y a toujours le risque que ce ne soit pas la bonne décision

dans 5% des cas.

Exercice 4 :

Reprenons le contexte de l’exemple ci-dessus.

- 5 -

Dans le cas ci-dessous, indiquer le pourcentage de femmes dans chaque entreprise, puis

interpréter statistiquement la situation en procédant comme dans l’exemple précédent.

Dans l’entreprise A, il y a 41 femmes sur 100 employés.

Dans l’entreprise B, il y a 4 850 femmes sur 10 000 employés.

Exercice 5 :

Cette année, 55% des candidats qui ont passé un certain concours l’ont réussi. Voici les

résultats obtenus par deux centres qui préparaient ce concours.

Centre A : sur 100 personnes qui ont présenté ce concours, 46 l’ont réussi.

Centre B : sur 2 500 personnes qui ont présenté ce concours, 1 271 l’ont réussi.

1. a. Quel est le pourcentage p1 de réussite pour le centre A ?

b. Quel est le pourcentage p2 de réussite pour le centre B ?

c. Lequel de ces deux centres a le mieux réussi ?

2. On assimile le centre A à un échantillon de taille n = 100 relevant du modèle de

probabilité p = 0,55. Donner l’intervalle de la fluctuation de l’échantillonnage au seuil de

95%. Est-ce que p1 appartient à cet intervalle ?

3. On assimile le centre B à un échantillon de taille n = 2 500 relevant du modèle

de probabilité p = 0,55. Donner l’intervalle de la fluctuation de l’échantillonnage au seuil de

95%. Est-ce que p2 appartient à cet intervalle ?

4. Conclure sur le centre qui est le plus représentatif du résultat national à ce

concours.

Exercice 13p268.

Exercices 20 et 21p270.

Exercice 30p272.

Exercice 39p274.

VI Estimation d’une proportion inconnue p à partir d’un

échantillon

On suppose cette fois que la proportion p n’est pas connue. On va voir comment les résultats

concernant la fluctuation d’échantillonnage peuvent être utilisés pour obtenir une estimation

d’un pourcentage p.

Cette situation est celle que l’on rencontre dans un sondage.

Exemple 4 :

Supposons qu’une urne contienne des boules de différentes couleurs, dont p% sont blanches.

Si ce pourcentage p est inconnu, on peut en obtenir une estimation en effectuant un certain

nombre de tirages, avec remise, et en calculant la fréquence f d’apparition des boules blanches

lors des tirages effectués.

A. Propriété pour faire le lien

Propriété :

Soit a un réel positif.

Les deux assertions sont équivalentes

 p



[f – a ; f +a]

 f



[p – a ; p +a]

Démonstration :



[f – a; f +a] SSI f – a



f + a

1 / 7 100%

Documents connexes

I- Intervalle de fluctuation avec la loi binomiale

Document

Le cours - pyreach.free.fr

integrales

Solutions du chapitre I

1 ECHANTILLONAGE Le principe : On considère par exemple l

PROBA - Intervalles de fluctuation-Estimation

√n √n √n ] √100 √400

1 ECHANTILLONNAGE Le principe : On considère par exemple l

Fiche 11 : Echantillonnage et intervalles de fluctuation Ce qu`il faut

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Document

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Document

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib