livret proba stat et progressions

FORMATION NOUVEAUX PROGRAMMES de TERMINALE

Journées novembre 2012

Les statistiques inférentielles enseignées au Lycée

Seconde

Première

Terminale

Problématique : On s’intéresse à un caractère d’une population que l’on ne peut pas recenser et on sonde cette population à l’aide

d’un échantillon.

Deux grandeurs entrent en jeu :

 La proportion pour la population et la fréquence observée dans l’échantillon.

Deux questions :

 Connaissant la proportion pour la population (p), peut-on prévoir la fréquence observée dans l’échantillon (f) ?

= Notion d’intervalle de fluctuation

 Réciproquement, peut-on déduire de la fréquence observée dans l’échantillon (f) la proportion pour la

population (p) ?

= Notion d’intervalle de confiance

Avec le modèle probabiliste, on peut parvenir à répondre à ces deux questions sous certaines conditions au lycée :

 Il faut que l’échantillon soit constitué en prélevant les individus au hasard et avec remise ou que le tirage soit assimilable à

un tirage avec remise (le rapport entre la taille de l’échantillon et la taille de la population doit être inférieur à 1%)

 Il faut que la taille n de l’échantillon soit assez grande (plus de 25 en seconde ou plus de 30 en terminale.)

 Il faut que la proportion de la population ne soit pas marginale (entre 20% et 80% en seconde, que nf ≥5 et n(1-f) ≥5 en

terminale).

Qu’est-ce que la fluctuation de l’échantillonnage ?

L’échantillonnage (étude statistique de la distribution des fréquences observées dans l’ensemble des échantillons de même taille)

permet de constater la fluctuation des fréquences et trouver une loi qui modélise cette fluctuation.

Seconde

Première

Terminale

En réalisant plusieurs simulations sur des

échantillons de même taille n, on observe une

variation de la fréquence des individus

possédant le caractère étudié. On peut aussi

observer que ces fréquences sont distribuées

dans une sorte d’intervalle qui les contient

presque toutes (intervalle de fluctuation).

En réalisant de nouvelles simulations, pour

des valeurs de n de plus en plus grandes, on

observe que cet intervalle qui contient

presque toutes les valeurs est de moins en

moins large : On constate que la fluctuation

des fréquences diminue quand n augmente.

On considère que l’on peut

modéliser l’étude du caractère

de proportion p sur un

échantillon de taille n par n

répétitions d’une expérience

aléatoire pour laquelle on

observe le nombre

d’individus présentant ce

caractère.

On s’intéresse alors à la

variable aléatoire Xn qui

associe à chaque échantillon,

le nombre d’individus de

l’échantillon de taille n qui

possèdent le caractère.

La variable aléatoire Xn suit

une loi binomiale B(n ; p).

Si on s’intéresse aux

fréquences, c’est à dire à la

variable aléatoire Fn = Xn/n,

qui présente la même

distribution de probabilités

que Xn, on constate que leur

distribution se stabilise quand

la taille de l’échantillon

grandit.

On veut pouvoir passer du caractère discret de

la loi binomiale de première à une loi continue.

Pour cela on observe que si on centre et réduit la

loi binomiale Xn, en posant :

(1 )

nX np

Znp p





on obtient une loi Zn de moyenne 0, d’écart type

Par un passage à l’histogramme, et en respectant

le fait que l’aire des rectangles doit être égale à

la probabilité, on observe que lorsque n devient

grand, la fonction de répartition de Zn tend vers

la fonction de répartition de la variable aléatoire

Z qui suit la loi normale N(0 ;1) dont la

fonction densité est f définie par :

() 2

f x e







C’est le théorème de Moivre-Laplace.

En conclusion, la loi de probabilité de Z est

donnée par : P(a ≤ Z ≤ b) qui est l’aire sous la

courbe Cf entre a et b.

Qu’est-ce que l’intervalle de fluctuation au seuil de 95% ?

Seconde

Première

Terminale

Si 0,2 ≤ p ≤ 0,8, on admet que la fréquence

observée dans un échantillon de taille n (n ≥

25), a une probabilité voisine de 95% d’être

comprise entre





On s’en convainc en simulant des

expériences.

En calculant les probabilités

cumulées de la loi binomiale

(calculatrice ou tableur), on

détermine le plus petit entier

a tel que P(Xn ≤ a) > 0,025, et

le plus petit entier b tel que

P(Xn ≤ b) ≥ 0,975.

L’intervalle [a ; b] contient

alors au moins 95% des

fréquences observées.

Attention !

Dans le cas où np ≥ 5 et n(1 – p) ≥ 5, et n ≥ 30

c’est-à dire p











 n

;

, on peut

approcher la loi binomiale par la loi normale et

définir l’intervalle asymptotique au seuil de 1-

α comme l’intervalle I tel que :













I

nlim

≃1- α

 p n’est pas le centre de

l’intervalle.

 Il n’y a aucune contrainte

sur n et p

Si Z est une variable aléatoire qui suit la loi normale centrée réduite, quel que soit α de ]0 ; 1[, il existe un unique réel u tel que :

P(-uα ≤ Z ≤ u

) = 1-α.

est l’unique antécédent de 1-α/2 par la fonction de répartition qui est continue et strictement croissante. (T.V.I)

Pour α = 0,05, la loi nous donne uα ≈1,96, et on a P(-1,96 ≤ Z ≤ 1,96) ≃95%

En revenant à la variable aléatoire Fn = Xn/n, on peut alors dire que la fréquence observée dans l’échantillon de taille n (n ≥

30) a une probabilité d’environ 95%, d’être comprise entre

(1 )

1,96 pp



(1 )

1,96 pp





Quelles sont les prises de décision possibles à partir de l’intervalle de fluctuation ?

Au lycée, l’intervalle de fluctuation va permettre une initiation aux tests d’hypothèses dans un cadre simplifié : la prise de

décision en situation de risque. Le seuil de risque est en général fixé à 5%, c’est-à-dire α = 5%. La proportion p du caractère

étudié est supposée connue.

Le protocole suit les étapes suivantes :

 Déterminer l’intervalle de fluctuation associé à ce risque pour une taille n.

 Observer la fréquence f du caractère étudié dans un échantillon de taille n.

 Appliquer la règle de décision concernant une hypothèse formulée en langage naturel (réviser la machine,

fermer l’usine, ets...) :

Règle de décision :

si f I alors l hypothèse est acceptée

si f I alors l hypothèse est rejetée





Si l’écart entre valeur observée f et valeur attendue p est trop important pour être attribué aux fluctuations d'échantillonnage,

l'hypothèse doit être rejetée. Le seuil de risque choisi au départ est celui de rejeter l’hypothèse à tord lorsque les fluctuations

d'échantillonnage sont seules en cause.

Cette règle de décision peut permettre d’effectuer plusieurs types de test :

Test d’une conformité :

On cherche à vérifier si un échantillon suit la même loi que celle suivie par les échantillons issus de la population dans laquelle le

caractère étudié est dans une proportion p. On teste l’hypothèse « l’échantillon est issu d’une population où le caractère est dans

une proportion p ».

Test d’homogénéité : On compare les valeurs observées sur au moins deux échantillons pour évaluer si elles suivent la même loi.

On teste l’hypothèse : « les deux échantillons appartiennent à la même population ».

Le travail mathématique consiste à calculer l’intervalle de fluctuation connaissant p, n et la marge d’erreur que l’on se donne.

Seconde

Première

Terminale

On utilise la formule en vérifiant que les

conditions d’application sont vérifiées pour

calculer l’intervalle.

On définit la variable

aléatoire, on identifie la loi

binomiale puis on utilise

l’algorithme et les TICE pour

déterminer l’intervalle.

On approche la loi binomiale avec la loi

normale et on calcule l’intervalle avec la

formule.

Qu’est-ce que l’intervalle de confiance pour une proportion ?

Quel que soit α dans ]0 ; 1[ , l’intervalle de confiance d’une proportion p au seuil de 1-α est un intervalle aléatoire contenant p

avec une probabilité la plus proche possible de 1-α.

Cet intervalle, pour une fréquence f, observée sur un échantillon, donne une fourchette de valeurs pour estimer la proportion p

dans la population mère.

On cherche un intervalle [Fn-ε ; Fn+ε ] susceptible de contenir p, c’est à dire que P(p



[Fn-ε ; Fn+ε ] ) = 1- α.

Seconde

Première

Terminale

Au seuil de 95% , on a :

Fn

[ ; ]pp



ce qui est équivalent à













 n

Fnn 11

L’intervalle











 n

Fnn 11

est appelé

intervalle de confiance pour un niveau de

confiance de 0,95.

Pour une valeur observée f,











 n

f11

est

une fourchette de sondage pour un niveau de

confiance de 0,95 sous les conditions n  25

et 0,2  f 0,8.

Dans ces conditions, f est une estimation de

p pour une précision de 1/

et un niveau de

confiance de 0,95.

Pas d’intervalle de confiance

dans le programme de

première !

C’est le même que celui de seconde !

mais sous les conditions :

sous les conditions

n  30 et nf  5 et n(1-f)  5

Le travail mathématique consiste à :

 Estimer à l’aide d’un intervalle une proportion inconnue d’une population en observant un échantillon.

 Déterminer la taille d’un échantillon pour obtenir une estimation avec une erreur donnée.

Progression Terminale S – 2012/2013

n’

’e

ré

éc

l’

’u

l’

’a

dé

ée

l’

’i

Chapitre

Objectifs

Démonstrations

étudiées

spécifiquement

TICE

Algorithmes

Remise en route

1 semaine

Fonctions, équations, inéquations, limites

intuitives et suites.

Algobox : trouver

un rang n à partir

duquel un>100

Raisonnement

par récurrence

1 semaine

Tableur :

conjecture d’une

propriété à

démontrer par

récurrence

Fonction exp

2 semaines

Dérivée. Propriétés algébriques

Notation

Variations, limites et représentation graphique

Démontrer unicité y tel

que y’ = y et y(0) = 1

Limites

Xcas : étude d’un

sujet du type Bac

en vérifiant les

calculs avecXCas

Nbres complexes

Forme algébrique

2 semaines

Introduction historique. Forme algébrique

Calculs algébriques (+ – × ÷). Conjugué

Équations de degré 2 à coefficients réels.

Affixe d'un point, d'un vecteur, du milieu

Etude d’une

transformation

z’=(az+b)/(cz+d)

avec GéoGébra

Fonction ln

2 semaines

Introduire la fonction ln à partir de l’équation

fonctionnelle.

Propriétés algébriques

Variation, limites et représentation graphique

Évocation de la fonction log

Xcas ou algobox

pour étude suite

associée

Probabilités

conditionnelles

2 semaines

Arbres pondérés

Probabilités conditionnelles

Événements indépendants

Formule des proba totales (vocabulaire non

attendu – un arbre peu constituer une preuve))

Démontrer que si deux

événements A et B sont

indépendants, alors il

en est de même pour A

et B.

Simulation

d' une marche

aléatoire

Fonctions

sin et cos

2 semaines

Dérivées

Parité et périodicité

Représentation graphique

Lien avec le cercle trigonométrique

Nbres complexes

Forme trigo

2 semaines

Forme trigonométrique

Transformation forme algébriq  forme trigo

Forme exponentielle

Formules trigo d'addition et de duplication

Etude d’un sujet

u type Bac avec

GéoGébra

Compléments sur

les fonctions

3 semaines

Limites

Continuité sur un intervalle

Théorème des valeurs intermédiaires

Théorème de la bijection (vocabulaire non

attendu) (extension aux intervalles ouverts et semi

ouverts)

Etude d’une

fonction avec

paramètre

(Géogébra)

ex :

() nx

f x x e

(sujet bac2011)

Recherche des

solutions de

f(x)= k

Intégration

2 semaines

Intégrale d'une fct continue et positive

Notation

Primitive d'une fct continue

Primitives des fonctions usuelles

Tte fct continue sur un intervalle fermé admet

des primitives

Pas d'intégration par parties

Principe de

démonstration du

théorème dans le cas

où f est continue et

positive

Vérifications de

calculs de

primitives avec

Xcas

Encadrement

d'une intégrale

pour une fct

continue et

positive

Espace affine et

plan

2 semaines

Positions relatives de droites et de plans

Établir l'orthogonalité d'une droite et d'un

plan

Utiliser les coordonnées

Théorème du toit

Geogebra 3D

Compléments sur

les suites

2 semaines

Limites

limite éventuelle d'une suite géométrique

Convergence monotone

Théorème de

comparaison

Toute suite croissante

majorée a pour limite

+∞

Algobox pour

trouver des

valeurs

approchées de

alpha

Rang à partir

duquel un est

supérieur à A.

Des activités

algo sont

menées dans le

cadre de suites

récurrentes

Variables

aléatoires

2 semaines

Loi binomiale (rappel de 1ere)

Loi à densité sur un intervalle

Loi à densité uniforme+espérance

Loi exponentielle+ espérance + calcul de

proba

Loi normale centrée réduite

Théorème de Moivre Laplace (admis)

Loi normale

Espérance de la loi

exponentielle

Utiliser le tableur

ou une

calculatrice pour

calculer une

proba avec une

loi normale

Simulation de loi

binomiale avec

algobox

Espace et plan

2 semaines

Produit scalaire dans l'espace

Déterminer si un vecteur est normal à un plan.

Déterminer une équation cartésienne d’un

plan connaissant un point et un vecteur

normal.

Caractérisation vectorielle de deux droites

orthogonales ; notion de plans

perpendiculaires.

Déterminer un vecteur normal à un plan défini

par une équation cartésienne.

Choisir la forme la plus adaptée entre

équation cartésienne et représentation

paramétrique pour :

- déterminer l’intersection d’une droite et

d’un plan ;

- étudier la position relative de deux plans.

Caractériser les points

d’un plan de l’espace

par une relation

ax+by+cz+d=0

avec a , b , c trois

nombres réels non tous

nuls.

Démontrer qu’une

droite est orthogonale à

toute droite d’un plan

si et seulement si elle

est orthogonale à deux

droites sécantes de ce

plan.

Geogebra 3D

Échantillonnage

2 semaines

Connaître l’intervalle de fluctuation

asymptotique au seuil de 95 % .

Estimer par intervalle une proportion

inconnue à partir d’un échantillon.

Déterminer une taille d’échantillon suffisante

pour obtenir, avec une précision donnée, une

estimation d’une proportion au niveau de

confiance 0,95.

Expression d'un

intervalle de

fluctuation au seuil de

1-α de la variable

Fn=Xn

si la variable

aléatoire

suit la loi

B (n, p).

1 / 6 100%

Documents connexes

I- Intervalle de fluctuation avec la loi binomiale

integrales

Tableau récapitulatif des lois de probabilité à

Fiche 11 : Echantillonnage et intervalles de fluctuation Ce qu`il faut

Document

Le cours - pyreach.free.fr

Terminale ES Intervalle de fluctuation -Estimation Intervalle de fluctuation

1 ECHANTILLONAGE Le principe : On considère par exemple l

PROBA - Intervalles de fluctuation-Estimation

P X n

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

livret proba stat et progressions

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

livret proba stat et progressions

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib