Probas_en_TS_V-S

publicité
Probabilités
Statistiques
en terminale S.
6 février 2013
Nouveau programme
rentrée 2012.
Un premier retour de
l’enseignement en première.
Pas mal de questions,
Mais beaucoup de réponses,
Et une vraie compréhension de la probabilité
d’obtenir k succès.
* Un exemple d’activité
* Représentation
de la loi binomiale
* D’autres questions...
Un point (délicat) en T.S :
L’introduction de la loi
normale centrée réduite.
Extrait du programme.
Un tiers du temps...
Intervalles de fluctuation
et intervalles de confiance
Problème : Comment justifier
l’apparition de Z  X n  np
n
np(1  p)
l’expression
pour l’introduction de la loi
normale centrée réduite ?
• Il semble plus
aisé d’utiliser Zn 
l’expression
Xn
n
(
 p)
p(1  p) n
soit que la moyenne des X i
cv vers p avec n.
Il s’agit d’une convergence en loi mais
il n’est pas question d’en donner une
définition générale,
seulement d’en donner une
observation graphique.
• On peut proposer le modèle suivant, qui
utilise les trois niveaux d’expérimentation,
simulation et modélisation :
• On utilise une machine de Galton. En
premier lieu avec peu de rangées, puis en
augmentant n on montre que
« l’enveloppe » « tend » vers une courbe
caractéristique de la courbe de
Gauss. (par translation de la loi N.C.R.)
Vers un déroulement logique ?
Un exemple d’utilisation de
l’approximation de la loi binomiale
par la loi normale:
Surréservation aérienne
Il arrive assez
souvent que le
nombre de réservations pour
une liaison aérienne soit
supérieur au nombre de
passagers se présentant
effectivement le jour du vol.
• Exemple : Pour compenser le manque à
gagner, une compagnie aérienne exploitant
un avion de 300 places décide de faire de la
surréservation en prenant pour chaque vol
un nombre n > 300 de réservations.
• S’il se présente plus de 300 passagers à
l’embarquement, les 300 premiers
arrivés prennent leur vol
et les autres sont
dédommagés
financièrement.
On considère que les passagers sont
mutuellement indépendants (?) et on
évalue statistiquement la probabilité de
désistement de chacun d’eux à 10%. On
note n le nombre de réservations prises
par la compagnie pour un vol donné et Sn
le nombre (aléatoire) de passagers se
présentant à l’embarquement pour ce
vol.
On se propose de chercher la valeur
maximale de n telle que :
P(Sn <300) > 0,99.
(en clair, on voudrait avoir 99% de
chances de ne pas avoir à payer de
dédommagement à des passagers)
Le théorème de De Moivre-Laplace
permet de donner une solution
approchée à ce problème.
• La variable aléatoire Sn suit la loi
binomiale B( n ; 0,9) , de moyenne m  np  0,9n
et d’écart type   npq  n  0,9  0,1  0,3 n
• Cette loi peut être approchée par la loi
normale N (0,9n;0,3 . n ) Il s’agit de trouver
la plus grande valeur de n vérifiant :
P(Sn <300)> 0,99 .
• La variable peut être approximée par la loi
normale centrée réduite. C’est ici le cœur
du théorème :
Sn  300 équivaut à :
Soit :
S n  0,9n
0,3 n

300  0,9n
0,3 n
300  0,9n
(T.M.L).
zn 
0,3 n
Or une table de la loi normale centrée réduite
(ou une calculatrice) donne précisément
la probabilité de l’évènement zn  t
.
selon les valeurs de t avec un pas de 1/100.
Cette probabilité dépasse 0.99 à partir de t=2,33.
Il suffit donc de choisir n de façon à ce que :
300  0,9n
0,3 n
 2,33
La solution positive de l’équation :
0,9x² + 0,699x – 300 = 0 est 17,87,
au centième près, et son carré est : 319,45.
Si on prend jusqu’à 319 réservations, sous
les hypothèses de notre modélisation, le
Nombre de passagers se présentant à
l’embarquement ne dépassera pas 300 au
risque maximum de 1%.
Le mot « au risque » n’est pas clair
pour un non initié aux tests
d’hypothèse : peut être parler de
probabilité ?
Pour aller plus loin :
On cherche, appelant p la
probabilité q’un passager ne se
désiste pas, quel nombre de
réservation accepter pour que l’on
ait 99% de chances de ne pas avoir
à payer de dédommagement à des
passagers)
• En remplaçant 0,9 par p, on obtient une
formule compliquée, mais qu’un tableur
permet d’utiliser sans difficulté :
L’équation trouvée plus haut s’écrit :
p.n  2,33 p(1  p). n  300  0
et en posant
x  n de discriminant
2,332 p(1  p)  1200 p
ce qui équivaut à :
n
 2,33 (1  p)  2,332 (1  p)  1200
2 p
Auto-critique…
• On voit que le résultat varie beaucoup en
fonction de la valeur donnée à p ! Selon qu’on
évalue p à 0,90 ou à 0,85, le nombre de
surréservation acceptable passe de 19 à 35 !
• On conçoit que la validité de ce type de calcul
soit sujette à discussion ! en tous cas on voit
bien qu’avec une probabilité de désistement de
50% , on peut surbooker de presque 90%...
Convergence en loi
• Soient F1, F2, ... la suite des fonctions de
répartition associées aux variables aléatoires
réelles X1, X2, ..., et F la fonction de répartition
de la variable aléatoire réelle X. Autrement
dit, Fn est définie par Fn(x)=P(Xn ≤ x),
et F par F(x)=P(X ≤ x). lim
• La suite Xn converge vers X en loi, ou en
distribution, si
pour tout réel a où F est continue :

lim ( Fn (a ))  F (a ))
n 
Visualisation 1
VisualisationTLC
Retour
Beaucoup de questions :
1. Quel niveau de formalisation ?
2. Définition explicite ou pas des
concepts :Proba, variable aléatoire,
indépendance…
3. Approche fréquentiste et probabilités.
Exemples :
On fait un test sur une
personne puis un deuxième
de façon indépendante.
Quelle frontière :
entre les statistique et les
probabilités ?
n° Face
1
2
3
4
5
6
nb d’
apparitions
75
80
90
85
78
92
On lance 500 fois
un dé pipé.
Quelle est la probabilité
d'obtenir 4?
Quelle est la probabilité
d'obtenir un nombre
impair?
Quelle est la probabilité
d'obtenir un nombre
pair ?
Exercice : extrait du manuel Maths
Bréal 3ème n°56 page 102
Comment évaluer les
connaissances acquises :
• Alors qu’on a appris à étudier un problème
avec du temps devant soi,
• A étudier sa mise en œuvre par
expérimentation,
• A recueillir les données,
• A travailler en équipe,
• A simuler sur ordinateur,
Retour
Intervalle de fluctuation ou de confiance ?
En seconde, l’intervalle de fluctuation au seuil de
95% est :
1
1 

;p
p

n
n

Soit :
Soit :
Xn
1
1
p

 p
n
n
n
X n  np
1 
1
n
X n  np
a pour variance :
Yn 
n
p( 1  p ) qui ne dépend pas de n et
Zn 
X n  np
np( 1  p )
a pour espérance 0 et
variance 1 qui ne dépend
ni de n ni de p.
• A- Définition
• Soit X une variable suivant une loi
B (n, p).
• On appelle intervalle de fluctuation de
X au seuil 1-α tout intervalle [a,b] tel
que :
 ( X  [a ,b])=1-
Un intervalle de confiance pour une proportion p à
un niveau de confiance 1 – α est la réalisation, à
partir d’un échantillon, d’un intervalle aléatoire
contenant la proportion p avec une probabilité
supérieure ou égale à 1 - α. Cet intervalle aléatoire
est déterminé à partir de la variable aléatoire
Xn
Fn 
n
qui, à tout échantillon de taille n,
associe la fréquence.
Exemple
Supposons que p soit inconnu . On peut
approximer p par la proportion f obtenue
par les données de l’échantillon
(estimation ponctuelle) et déterminer
l’intervalle de confiance de p au risque
0,95.

Xn
1
1 
  p 

 p
  0,95

n
n
n 

A justifier
1
1
1
1
p
 Fn  p 
 Fn 
 p  Fn 
n
n
n
n

1
1 
P   Fn 
 p  Fn 
   0,95
n
n 

L’intervalle aléatoire a une probabilité
supérieure à 0,95 de contenir p. Il est appelé
intervalle de confiance de p au seuil de 95%.
Téléchargement