livret proba stat et progressions

publicité
FORMATION NOUVEAUX PROGRAMMES de TERMINALE
Journées novembre 2012
Les statistiques inférentielles enseignées au Lycée
Seconde
Première
Terminale
Problématique : On s’intéresse à un caractère d’une population que l’on ne peut pas recenser et on sonde cette population à l’aide
d’un échantillon.
Deux grandeurs entrent en jeu :
 La proportion pour la population et la fréquence observée dans l’échantillon.
Deux questions :
 Connaissant la proportion pour la population (p), peut-on prévoir la fréquence observée dans l’échantillon (f) ?
= Notion d’intervalle de fluctuation
 Réciproquement, peut-on déduire de la fréquence observée dans l’échantillon (f) la proportion pour la
population (p) ?
= Notion d’intervalle de confiance
Avec le modèle probabiliste, on peut parvenir à répondre à ces deux questions sous certaines conditions au lycée :
 Il faut que l’échantillon soit constitué en prélevant les individus au hasard et avec remise ou que le tirage soit assimilable à
un tirage avec remise (le rapport entre la taille de l’échantillon et la taille de la population doit être inférieur à 1%)
 Il faut que la taille n de l’échantillon soit assez grande (plus de 25 en seconde ou plus de 30 en terminale.)
 Il faut que la proportion de la population ne soit pas marginale (entre 20% et 80% en seconde, que nf ≥5 et n(1-f) ≥5 en
terminale).
Qu’est-ce que la fluctuation de l’échantillonnage ?
L’échantillonnage (étude statistique de la distribution des fréquences observées dans l’ensemble des échantillons de même taille)
permet de constater la fluctuation des fréquences et trouver une loi qui modélise cette fluctuation.
Seconde
Première
Terminale
En réalisant plusieurs simulations sur des On considère que l’on peut On veut pouvoir passer du caractère discret de
échantillons de même taille n, on observe une modéliser l’étude du caractère la loi binomiale de première à une loi continue.
variation de la fréquence des individus de proportion p sur un Pour cela on observe que si on centre et réduit la
possédant le caractère étudié. On peut aussi échantillon de taille n par n loi binomiale Xn, en posant :
observer que ces fréquences sont distribuées répétitions d’une expérience
X n  np
Zn 
dans une sorte d’intervalle qui les contient aléatoire pour laquelle on
np(1  p)
presque toutes (intervalle de fluctuation).
observe
le
nombre
d’individus présentant ce on obtient une loi Zn de moyenne 0, d’écart type
1.
En réalisant de nouvelles simulations, pour caractère.
des valeurs de n de plus en plus grandes, on On s’intéresse alors à la
observe que cet intervalle qui contient variable aléatoire Xn qui Par un passage à l’histogramme, et en respectant
presque toutes les valeurs est de moins en associe à chaque échantillon, le fait que l’aire des rectangles doit être égale à
moins large : On constate que la fluctuation le nombre d’individus de la probabilité, on observe que lorsque n devient
des fréquences diminue quand n augmente.
l’échantillon de taille n qui grand, la fonction de répartition de Zn tend vers
la fonction de répartition de la variable aléatoire
possèdent le caractère.
Z qui suit la loi normale N(0 ;1) dont la
La variable aléatoire Xn suit fonction densité est f définie par :
une loi binomiale B(n ; p).
x²

1
f ( x) 
e
Si
on
s’intéresse
aux
2
fréquences, c’est à dire à la C’est le théorème de Moivre-Laplace.
variable aléatoire Fn = Xn/n, En conclusion, la loi de probabilité de Z est
qui présente la même donnée par : P(a ≤ Z ≤ b) qui est l’aire sous la
distribution de probabilités courbe Cf entre a et b.
que Xn, on constate que leur
distribution se stabilise quand
la taille de l’échantillon
grandit.
Qu’est-ce que l’intervalle de fluctuation au seuil de 95% ?
Seconde
Première
Terminale
Si 0,2 ≤ p ≤ 0,8, on admet que la fréquence En calculant les probabilités Dans le cas où np ≥ 5 et n(1 – p) ≥ 5, et n ≥ 30
observée dans un échantillon de taille n (n ≥ cumulées de la loi binomiale c’est-à dire p  5
5  , on peut
1  n ;1  n 
25), a une probabilité voisine de 95% d’être (calculatrice ou tableur), on
détermine le plus petit entier approcher la loi binomiale par la loi normale et
comprise entre p  1 et p  1 .
a tel que P(Xn ≤ a) > 0,025, et définir l’intervalle asymptotique au seuil de 1n
n
On s’en convainc en simulant des le plus petit entier b tel que α comme l’intervalle I tel que :
P(Xn ≤ b) ≥ 0,975.
expériences.
 Xn

L’intervalle [a ; b] contient
 I  ≃1- α
lim P

alors au moins 95% des n    n
fréquences observées.
Attention !
2
1
 p n’est pas le centre de
l’intervalle.
 Il n’y a aucune contrainte
sur n et p
Si Z est une variable aléatoire qui suit la loi normale centrée réduite, quel que soit α de ]0 ; 1[, il existe un unique réel u tel que :
P(-uα ≤ Z ≤ uα) = 1-α.
uα est l’unique antécédent de 1-α/2 par la fonction de répartition qui est continue et strictement croissante. (T.V.I)
Pour α = 0,05, la loi nous donne uα ≈1,96, et on a P(-1,96 ≤ Z ≤ 1,96) ≃95%
En revenant à la variable aléatoire Fn = Xn/n, on peut alors dire que la fréquence observée dans l’échantillon de taille n
(n ≥
30) a une probabilité d’environ 95%, d’être comprise entre p  1,96
p(1  p)
et p  1,96
p(1  p)
.
n
n
Quelles sont les prises de décision possibles à partir de l’intervalle de fluctuation ?



Au lycée, l’intervalle de fluctuation va permettre une initiation aux tests d’hypothèses dans un cadre simplifié : la prise de
décision en situation de risque. Le seuil de risque est en général fixé à 5%, c’est-à-dire α = 5%. La proportion p du caractère
étudié est supposée connue.
Le protocole suit les étapes suivantes :
Déterminer l’intervalle de fluctuation associé à ce risque pour une taille n.
Observer la fréquence f du caractère étudié dans un échantillon de taille n.
Appliquer la règle de décision concernant une hypothèse formulée en langage naturel (réviser la machine,
fermer l’usine, ets...) :
Règle de décision :
si f  I
si f  I
alors l ' hypothèse est acceptée.
alors l ' hypothèse est rejetée.
Si l’écart entre valeur observée f et valeur attendue p est trop important pour être attribué aux fluctuations d'échantillonnage,
l'hypothèse doit être rejetée. Le seuil de risque choisi au départ est celui de rejeter l’hypothèse à tord lorsque les fluctuations
d'échantillonnage sont seules en cause.
Cette règle de décision peut permettre d’effectuer plusieurs types de test :
Test d’une conformité :
On cherche à vérifier si un échantillon suit la même loi que celle suivie par les échantillons issus de la population dans laquelle le
caractère étudié est dans une proportion p. On teste l’hypothèse « l’échantillon est issu d’une population où le caractère est dans
une proportion p ».
Test d’homogénéité : On compare les valeurs observées sur au moins deux échantillons pour évaluer si elles suivent la même loi.
On teste l’hypothèse : « les deux échantillons appartiennent à la même population ».
Le travail mathématique consiste à calculer l’intervalle de fluctuation connaissant p, n et la marge d’erreur que l’on se donne.
Seconde
Première
Terminale
On utilise la formule en vérifiant que les
On définit la variable
On approche la loi binomiale avec la loi
conditions d’application sont vérifiées pour
aléatoire, on identifie la loi
normale et on calcule l’intervalle avec la
calculer l’intervalle.
binomiale puis on utilise
formule.
l’algorithme et les TICE pour
déterminer l’intervalle.
Qu’est-ce que l’intervalle de confiance pour une proportion ?
Quel que soit α dans ]0 ; 1[ , l’intervalle de confiance d’une proportion p au seuil de 1-α est un intervalle aléatoire contenant p
avec une probabilité la plus proche possible de 1-α.
Cet intervalle, pour une fréquence f, observée sur un échantillon, donne une fourchette de valeurs pour estimer la proportion p
dans la population mère.
On cherche un intervalle [Fn-ε ; Fn+ε ] susceptible de contenir p, c’est à dire que P(p[Fn-ε ; Fn+ε ] ) = 1- α.
Seconde
Première
Terminale
Au seuil de 95% , on a :
Pas d’intervalle de confiance
C’est le même que celui de seconde !
1
1
;p
]
Fn [ p 
dans
le
programme
de
mais sous les conditions :
n
n
première
!
sous les conditions
ce qui est équivalent à
n

30
et nf  5 et n(1-f)  5
p  F  1 ; F  1 
 n

n
L’intervalle
n

n
1
1  est

; Fn 
 Fn 

n
n

appelé
intervalle de confiance pour un niveau de
confiance de 0,95.
Pour une valeur observée f,  f  1 ; f  1  est


n

n
une fourchette de sondage pour un niveau de
confiance de 0,95 sous les conditions n  25
et 0,2  f 0,8.
Dans ces conditions, f est une estimation de
p pour une précision de 1/ n et un niveau de
confiance de 0,95.
2
Le travail mathématique consiste à :
 Estimer à l’aide d’un intervalle une proportion inconnue d’une population en observant un échantillon.
 Déterminer la taille d’un échantillon pour obtenir une estimation avec une erreur donnée.
3
Progression Terminale S – 2012/2013
Remarque importante : ceci n’est pas une préconisation mais seulement un exemple qui met en relation l’utilisation
des TICE et l’algorithmique avec les diverses parties du programme et peut donner aussi une idée de l’importance à
accorder aux diverses parties. Diverses autres organisations sont possibles.
Chapitre
Remise en route
1 semaine
Objectifs
Démonstrations
étudiées
spécifiquement
TICE
Algobox : trouver
un rang n à partir
duquel un>100
Fonctions, équations, inéquations, limites
intuitives et suites.
Tableur :
conjecture d’une
propriété à
démontrer par
récurrence
Raisonnement
par récurrence
1 semaine
Dérivée. Propriétés algébriques
x
Notation e
Variations, limites et représentation graphique
Xcas : étude d’un
Démontrer unicité y tel
sujet du type Bac
que y’ = y et y(0) = 1
en vérifiant les
Limites
calculs avecXCas
Introduction historique. Forme algébrique
Nbres complexes
Calculs algébriques (+ – × ÷). Conjugué
Forme algébrique
Équations de degré 2 à coefficients réels.
2 semaines
Affixe d'un point, d'un vecteur, du milieu
Etude d’une
transformation
z’=(az+b)/(cz+d)
avec GéoGébra
Fonction exp
2 semaines
Algorithmes
Fonction ln
2 semaines
Introduire la fonction ln à partir de l’équation
fonctionnelle.
Propriétés algébriques
Variation, limites et représentation graphique
Évocation de la fonction log
Probabilités
conditionnelles
2 semaines
Arbres pondérés
Probabilités conditionnelles
Événements indépendants
Formule des proba totales (vocabulaire non
attendu – un arbre peu constituer une preuve))
Fonctions
sin et cos
2 semaines
Dérivées
Parité et périodicité
Représentation graphique
Lien avec le cercle trigonométrique
Nbres complexes
Forme trigo
2 semaines
Forme trigonométrique
Transformation forme algébriq  forme trigo
Forme exponentielle
Formules trigo d'addition et de duplication
Xcas ou algobox
pour étude suite
associée
Démontrer que si deux
événements A et B sont
indépendants, alors il
en est de même pour A
et B.
Simulation
d' une marche
aléatoire
Etude d’un sujet
u type Bac avec
GéoGébra
Etude d’une
fonction avec
paramètre
(Géogébra)
ex :
Limites
Continuité sur un intervalle
Compléments sur
Théorème des valeurs intermédiaires
les fonctions
Théorème de la bijection (vocabulaire non
3 semaines
attendu) (extension aux intervalles ouverts et semi
ouverts)
f n ( x)  x n e x
Recherche des
solutions de
f ( x)= k
(sujet bac2011)
Intégration
2 semaines
Intégrale d'une fct continue et positive
Notation
Primitive d'une fct continue
Primitives des fonctions usuelles
Tte fct continue sur un intervalle fermé admet
des primitives
Pas d'intégration par parties
Espace affine et
plan
2 semaines
Positions relatives de droites et de plans
Établir l'orthogonalité d'une droite et d'un
plan
Utiliser les coordonnées
Principe de
démonstration du
théorème dans le cas
où f est continue et
positive
Vérifications de
calculs de
primitives avec
Xcas
Encadrement
d'une intégrale
pour une fct
continue et
positive
Geogebra 3D
Théorème du toit
4
Théorème de
comparaison
Compléments sur Limites
limite éventuelle d'une suite géométrique
les suites
2 semaines
Convergence monotone
Variables
aléatoires
2 semaines
Loi binomiale (rappel de 1ere)
Loi à densité sur un intervalle
Loi à densité uniforme+espérance
Loi exponentielle+ espérance + calcul de
proba
Loi normale centrée réduite
Théorème de Moivre Laplace (admis)
Loi normale
Toute suite croissante
majorée a pour limite
+∞
Espérance de la loi
exponentielle
Produit scalaire dans l'espace
Déterminer si un vecteur est normal à un plan.
Déterminer une équation cartésienne d’un
plan connaissant un point et un vecteur
normal.
Caractérisation vectorielle de deux droites
orthogonales ; notion de plans
perpendiculaires.
Espace et plan
2 semaines
Algobox pour
trouver des
valeurs
approchées de
alpha
Rang à partir
duquel un est
supérieur à A.
Des activités
algo sont
menées dans le
cadre de suites
récurrentes
Utiliser le tableur
ou une
calculatrice pour
calculer une
proba avec une
loi normale
Simulation de loi
binomiale avec
algobox
Geogebra 3D
Caractériser les points
d’un plan de l’espace
par une relation
ax+ by+ cz+ d = 0
avec a , b , c trois
nombres réels non tous
nuls.
Déterminer un vecteur normal à un plan défini
par une équation cartésienne.
Démontrer qu’une
droite est orthogonale à
Choisir la forme la plus adaptée entre
toute droite d’un plan
équation cartésienne et représentation
si et seulement si elle
paramétrique pour :
est orthogonale à deux
droites sécantes de ce
- déterminer l’intersection d’une droite et
plan.
d’un plan ;
- étudier la position relative de deux plans.
Connaître l’intervalle de fluctuation
asymptotique au seuil de 95 % .
Estimer par intervalle une proportion
inconnue à partir d’un échantillon.
Échantillonnage
2 semaines
Déterminer une taille d’échantillon suffisante
pour obtenir, avec une précision donnée, une
estimation d’une proportion au niveau de
confiance 0,95.
Expression d'un
intervalle de
fluctuation au seuil de
1-α de la variable
Xn
n si la variable
aléatoire X n suit la loi
F n=
B (n, p).
5
Progression Terminale ES – 2012/2013
Remarque importante : ceci n’est pas une préconisation mais seulement un exemple qui met en relation l’utilisation
des TICE et l’algorithmique avec les diverses parties du programme et peut donner aussi une idée de l’importance à
accorder aux diverses parties. Diverses autres organisations sont possibles.
Chapitres
nb sem
TICE
Algorithmes
1 – Rappels dérivation Tableau
de variation
Continuité et théorème des
valeurs intermédiaires
Approche
Analyse
Remarque : Les suites sont
traitées en 1/2 groupe sur les
créneaux des heures
3
dédoublées à l'aide du tableur
de même que l'algorithmique
2 – Probabilités conditionnelles
et loi binomiale
Proba
3
3 – Continuité et théorème des
valeurs intermédiaires
Analyse
1
4 – Fonction exponentielle
5 – Primitives
6 – Intégration (1)
7 – Loi à densité
8– Fonction logarithme
népérien
9 – Convexité
10 - Intervalle de fluctuation estimation
11 – Intégrale
12 – Intégration (2) suite et fin
Analyse
3
Analyse
2
Analyse
1
Proba
3
Analyse
3
Analyse
3
Proba
3
Analyse
1
Analyse
2
Toussaint
Noël
Vacances
Hiver
Vacances
printemps
6
Téléchargement