Probas_en_TS

publicité
Probabilités
Statistiques
en terminale S.
Nouveau programme
rentrée 2012.
« Je ne crois aux
statistiques
que lorsque je les ai
moi même trafiquées »
Churchill
Des années de formation…
« Comment est constitué le monde dans
lequel je vis ? »,
« Quelle y est ma place ? »,
« Quelles sont les responsabilités
individuelles et collectives ? ».
Toutes les disciplines concourent à
l’élaboration de cette représentation…
Progr. Collège. Bulletin officiel spécial n° 6 du 28 août 2008
• Des statistiques dès la sixième,
• Des probabilités en troisième,
• Un enseignement renforcé en
seconde avec l’échantillonnage et le
calcul de probabilités.
• Introduction de la loi binomiale et des
coefficients en première
• Loi normale estimation en terminale.
…Comme dans d’autres pays.
Le pion d’Anne est
sur la case
« DÉPART ».
Anne lance les 2
dés.
Quelle est la
probabilité
qu’Anne se
retrouve sur une
case
correspondant à
une rue ?
(d’après un exercice finlandais, en
classe 8, équivalent à la quatrième)
Un premier retour de
l’enseignement en première.
Pas mal de questions,
Mais beaucoup de réponses,
Et une vraie compréhension de la probabilité
d’obtenir k succès.
* Un exemple d’activité
* Représentation
de la loi binomiale
• Evaluer autrement ?
* D’autres questions...
Un point (délicat) en T.S :
L’introduction de la loi
normale centrée réduite.
Les pré-requis
Extrait du programme
Extrait du programme
* La loi normale centrée réduite
définie avant la loi induit elle une
présentation particulière ?
* L’intérêt des outils numériques
particulièrement probant ?
* Des notions très difficiles pour
les élèves de TS ?
Problème : Comment justifier
l’apparition de Z  X n  np
n
np(1  p)
l’expression
pour l’introduction de la loi
normale centrée réduite ?
Ce passage de la loi binomiale pour
des grandes valeurs de n à la loi
normale n’est-il pas LE point très délicat
qui ne doit être abordé qu’avec
précaution :
• Quid de la loi des grands nombres ?
• Une V. A. pour une expérience, ou la
somme de n V.A pour n expériences
indépendantes ?
• Il semble plus
aisé d’utiliser Zn 
l’expression
Xn
n
(
 p)
p(1  p) n
soit que la moyenne des X i
cv vers p avec n.
Il s’agit d’une convergence en loi mais
il n’est pas question d’en donner une
définition générale,
seulement d’en donner une
observation graphique.
• On peut proposer le modèle suivant, qui
utilise les trois niveaux d’expérimentation,
simulation et modélisation :
• On utilise une machine de Galton. En
premier lieu avec peu de rangées, puis en
augmentant n on montre que
« l’enveloppe » « tend » vers une courbe
caractéristique de la courbe de
Gauss. (par translation de la loi N.C.R.)
Vers un déroulement logique ?
Un exemple d’utilisation de
l’approximation de la loi binomiale
par la loi normale:
Surréservation aérienne
Il arrive assez
souvent que le
nombre de réservations pour
une liaison aérienne soit
supérieur au nombre de
passagers se présentant
effectivement le jour du vol.
• Etudions un exemple : Pour compenser le
manque à gagner, une compagnie aérienne
exploitant un avion de 300 places décide de
faire de la surréservation en prenant pour
chaque vol un nombre n > 300 de
réservations.
• S’il se présente plus de 300 passagers à
l’embarquement, les 300 premiers
arrivés prennent leur vol
et les autres sont
dédommagés
financièrement.
On considère que les passagers sont
mutuellement indépendants (?) et on
évalue statistiquement la probabilité de
désistement de chacun d’eux à 10%. On
note n le nombre de réservations prises
par la compagnie pour un vol donné et Sn
le nombre (aléatoire) de passagers se
présentant à l’embarquement pour ce
vol.
On se propose de chercher la valeur
maximale de n telle que :
P(Sn <300) > 0,99.
(en clair, on voudrait avoir 99% de
chances de ne pas avoir à payer de
dédommagement à des passagers)
Le théorème de De Moivre-Laplace
permet de donner une solution
approchée à ce problème.
• La variable aléatoire Sn suit la loi
binomiale B( n ; 0,9) , de moyenne m  np  0,9n
et d’écart type   npq  n  0,9  0,1  0,3 n
• Cette loi peut être approchée par la loi
normale N (0,9n;0,3 . n ) Il s’agit de trouver
la plus grande valeur de n vérifiant :
P(Sn <300)> 0,99 .
• La variable peut être approximée par la loi
normale centrée réduite. C’est ici le cœur
du théorème :
Sn  300 équivaut à :
Soit :
Tn 
300  0,9n
S n  0,9n
0,3 n

300  0,9n
0,3 n
(T.M.L).
0,3 n
Or une table de la loi normale centrée réduite
(ou une calculatrice) donne précisément
la probabilité de l’évènement Tn  t
.
selon les valeurs de t avec un pas de 1/100.
Cette probabilité dépasse 0.99 à partir de t=2,33.
Il suffit donc de choisir n de façon à ce que :
300  0,9n
0,3 n
 2,33
La solution positive de l’équation :
0,9x² + 0,699x – 300 = 0 est 17,87,
au centième près, et son carré est : 319,45.
Si on prend jusqu’à 319 réservations, sous
les hypothèses de notre modélisation, le
Nombre de passagers se présentant à
l’embarquement ne dépassera pas 300 au
risque maximum de 1%.
Le mot « au risque » n’est pas clair
pour un non initié aux tests
d’hypothèse : peut être parler de
probabilité ?
Pour aller plus loin :
On cherche, appelant p la
probabilité q’un passager ne se
désiste pas, quel nombre de
réservation accepter pour que l’on
ait 99% de chances de ne pas avoir
à payer de dédommagement à des
passagers)
• En remplaçant 0,9 par p, on obtient une
formule compliquée, mais qu’un tableur
permet d’utiliser sans difficulté :
L’équation trouvée plus haut s’écrit :
p.n  2,33 p(1  p). n  300  0
et en posant
x  n de discriminant
2,332 p(1  p)  1200 p
ce qui équivaut à :
n
 2,33 (1  p)  2,332 (1  p)  1200
2 p
Auto-critique…
• On voit que le résultat varie beaucoup en
fonction de la valeur donnée à p ! Selon qu’on
évalue p à 0,90 ou à 0,85, le nombre de
surréservation acceptable passe de 19 à 35 !
• On conçoit que la validité de ce type de calcul
soit sujette à discussion ! en tous cas on voit
bien qu’avec une probabilité de désistement de
50% , on peut surbooker de presque 90%...
Convergence en loi
• Soient F1, F2, ... la suite des fonctions de
répartition associées aux variables aléatoires
réelles X1, X2, ..., et F la fonction de répartition
de la variable aléatoire réelle X. Autrement
dit, Fn est définie par Fn(x)=P(Xn ≤ x),
et F par F(x)=P(X ≤ x). lim
• La suite Xn converge vers X en loi, ou en
distribution, si
pour tout réel a où F est continue :

lim ( Fn (a ))  F (a ))
n 
Visualisation 1
VisualisationTLC
Retour
Beaucoup de questions :
1. Quel niveau de formalisation ?
2. Définition explicite ou pas des
concepts :Proba, variable aléatoire,
indépendance…
3. Approche fréquentiste et probabilités.
Exemples :
On fait un test sur une
personne puis un deuxième
de façon indépendante.
Quelle frontière :
entre les statistique et les
probabilités ?
n° Face
1
2
3
4
5
6
nb d’
apparitions
75
80
90
85
78
92
On lance 500 fois
un dé pipé.
Quelle est la probabilité
d'obtenir 4?
Quelle est la probabilité
d'obtenir un nombre
impair?
Quelle est la probabilité
d'obtenir un nombre
pair ?
Exercice : extrait du manuel Maths
Bréal 3ème n°56 page 102
Comment évaluer les
connaissances acquises :
• Alors qu’on a appris à étudier un problème
avec du temps devant soi,
• A étudier sa mise en œuvre par
expérimentation,
• A recueillir les données,
• A travailler en équipe,
• A simuler sur ordinateur,
• Etc… L’exemple de l’option informatique
Retour
Intervalle de fluctuation ou de confiance ?
En seconde, l’intervalle de fluctuation au seuil de
95% est :
1
1 

;p
p

n
n

Soit :
Soit :
Xn
1
1
p

 p
n
n
n
X n  np
1 
1
n
X n  np
a pour variance :
Yn 
n
p( 1  p ) qui ne dépend pas de n et
Zn 
X n  np
np( 1  p )
a pour espérance 0 et
variance 1 qui ne dépend
ni de n ni de p.
• A- Définition
• Soit X une variable suivant une loi
B (n, p).
• On appelle intervalle de fluctuation de
X au seuil 1-α tout intervalle [a,b] tel
que :
 ( X  [a ,b])=1-
Un intervalle de confiance pour une proportion p à
un niveau de confiance 1 – α est la réalisation, à
partir d’un échantillon, d’un intervalle aléatoire
contenant la proportion p avec une probabilité
supérieure ou égale à 1 - α. Cet intervalle aléatoire
est déterminé à partir de la variable aléatoire
Xn
Fn 
n
qui, à tout échantillon de taille n,
associe la fréquence.
Exemple
Supposons que p soit inconnu . On peut
approximer p par la proportion f obtenue
par les données de l’échantillon
(estimation ponctuelle) et déterminer
l’intervalle de confiance de p au risque
0,95.

Xn
1
1 
  p 

 p
  0,95

n
n
n 

A justifier
1
1
1
1
p
 Fn  p 
 Fn 
 p  Fn 
n
n
n
n

1
1 
P   Fn 
 p  Fn 
   0,95
n
n 

L’intervalle aléatoire a une probabilité
supérieure à 0,95 de contenir p. Il est appelé
intervalle de confiance de p au seuil de 95%.
Téléchargement