Probabilités Statistiques en terminale S. Nouveau programme rentrée 2012. « Je ne crois aux statistiques que lorsque je les ai moi même trafiquées » Churchill Des années de formation… « Comment est constitué le monde dans lequel je vis ? », « Quelle y est ma place ? », « Quelles sont les responsabilités individuelles et collectives ? ». Toutes les disciplines concourent à l’élaboration de cette représentation… Progr. Collège. Bulletin officiel spécial n° 6 du 28 août 2008 • Des statistiques dès la sixième, • Des probabilités en troisième, • Un enseignement renforcé en seconde avec l’échantillonnage et le calcul de probabilités. • Introduction de la loi binomiale et des coefficients en première • Loi normale estimation en terminale. …Comme dans d’autres pays. Le pion d’Anne est sur la case « DÉPART ». Anne lance les 2 dés. Quelle est la probabilité qu’Anne se retrouve sur une case correspondant à une rue ? (d’après un exercice finlandais, en classe 8, équivalent à la quatrième) Un premier retour de l’enseignement en première. Pas mal de questions, Mais beaucoup de réponses, Et une vraie compréhension de la probabilité d’obtenir k succès. * Un exemple d’activité * Représentation de la loi binomiale • Evaluer autrement ? * D’autres questions... Un point (délicat) en T.S : L’introduction de la loi normale centrée réduite. Les pré-requis Extrait du programme Extrait du programme * La loi normale centrée réduite définie avant la loi induit elle une présentation particulière ? * L’intérêt des outils numériques particulièrement probant ? * Des notions très difficiles pour les élèves de TS ? Problème : Comment justifier l’apparition de Z X n np n np(1 p) l’expression pour l’introduction de la loi normale centrée réduite ? Ce passage de la loi binomiale pour des grandes valeurs de n à la loi normale n’est-il pas LE point très délicat qui ne doit être abordé qu’avec précaution : • Quid de la loi des grands nombres ? • Une V. A. pour une expérience, ou la somme de n V.A pour n expériences indépendantes ? • Il semble plus aisé d’utiliser Zn l’expression Xn n ( p) p(1 p) n soit que la moyenne des X i cv vers p avec n. Il s’agit d’une convergence en loi mais il n’est pas question d’en donner une définition générale, seulement d’en donner une observation graphique. • On peut proposer le modèle suivant, qui utilise les trois niveaux d’expérimentation, simulation et modélisation : • On utilise une machine de Galton. En premier lieu avec peu de rangées, puis en augmentant n on montre que « l’enveloppe » « tend » vers une courbe caractéristique de la courbe de Gauss. (par translation de la loi N.C.R.) Vers un déroulement logique ? Un exemple d’utilisation de l’approximation de la loi binomiale par la loi normale: Surréservation aérienne Il arrive assez souvent que le nombre de réservations pour une liaison aérienne soit supérieur au nombre de passagers se présentant effectivement le jour du vol. • Etudions un exemple : Pour compenser le manque à gagner, une compagnie aérienne exploitant un avion de 300 places décide de faire de la surréservation en prenant pour chaque vol un nombre n > 300 de réservations. • S’il se présente plus de 300 passagers à l’embarquement, les 300 premiers arrivés prennent leur vol et les autres sont dédommagés financièrement. On considère que les passagers sont mutuellement indépendants (?) et on évalue statistiquement la probabilité de désistement de chacun d’eux à 10%. On note n le nombre de réservations prises par la compagnie pour un vol donné et Sn le nombre (aléatoire) de passagers se présentant à l’embarquement pour ce vol. On se propose de chercher la valeur maximale de n telle que : P(Sn <300) > 0,99. (en clair, on voudrait avoir 99% de chances de ne pas avoir à payer de dédommagement à des passagers) Le théorème de De Moivre-Laplace permet de donner une solution approchée à ce problème. • La variable aléatoire Sn suit la loi binomiale B( n ; 0,9) , de moyenne m np 0,9n et d’écart type npq n 0,9 0,1 0,3 n • Cette loi peut être approchée par la loi normale N (0,9n;0,3 . n ) Il s’agit de trouver la plus grande valeur de n vérifiant : P(Sn <300)> 0,99 . • La variable peut être approximée par la loi normale centrée réduite. C’est ici le cœur du théorème : Sn 300 équivaut à : Soit : Tn 300 0,9n S n 0,9n 0,3 n 300 0,9n 0,3 n (T.M.L). 0,3 n Or une table de la loi normale centrée réduite (ou une calculatrice) donne précisément la probabilité de l’évènement Tn t . selon les valeurs de t avec un pas de 1/100. Cette probabilité dépasse 0.99 à partir de t=2,33. Il suffit donc de choisir n de façon à ce que : 300 0,9n 0,3 n 2,33 La solution positive de l’équation : 0,9x² + 0,699x – 300 = 0 est 17,87, au centième près, et son carré est : 319,45. Si on prend jusqu’à 319 réservations, sous les hypothèses de notre modélisation, le Nombre de passagers se présentant à l’embarquement ne dépassera pas 300 au risque maximum de 1%. Le mot « au risque » n’est pas clair pour un non initié aux tests d’hypothèse : peut être parler de probabilité ? Pour aller plus loin : On cherche, appelant p la probabilité q’un passager ne se désiste pas, quel nombre de réservation accepter pour que l’on ait 99% de chances de ne pas avoir à payer de dédommagement à des passagers) • En remplaçant 0,9 par p, on obtient une formule compliquée, mais qu’un tableur permet d’utiliser sans difficulté : L’équation trouvée plus haut s’écrit : p.n 2,33 p(1 p). n 300 0 et en posant x n de discriminant 2,332 p(1 p) 1200 p ce qui équivaut à : n 2,33 (1 p) 2,332 (1 p) 1200 2 p Auto-critique… • On voit que le résultat varie beaucoup en fonction de la valeur donnée à p ! Selon qu’on évalue p à 0,90 ou à 0,85, le nombre de surréservation acceptable passe de 19 à 35 ! • On conçoit que la validité de ce type de calcul soit sujette à discussion ! en tous cas on voit bien qu’avec une probabilité de désistement de 50% , on peut surbooker de presque 90%... Convergence en loi • Soient F1, F2, ... la suite des fonctions de répartition associées aux variables aléatoires réelles X1, X2, ..., et F la fonction de répartition de la variable aléatoire réelle X. Autrement dit, Fn est définie par Fn(x)=P(Xn ≤ x), et F par F(x)=P(X ≤ x). lim • La suite Xn converge vers X en loi, ou en distribution, si pour tout réel a où F est continue : lim ( Fn (a )) F (a )) n Visualisation 1 VisualisationTLC Retour Beaucoup de questions : 1. Quel niveau de formalisation ? 2. Définition explicite ou pas des concepts :Proba, variable aléatoire, indépendance… 3. Approche fréquentiste et probabilités. Exemples : On fait un test sur une personne puis un deuxième de façon indépendante. Quelle frontière : entre les statistique et les probabilités ? n° Face 1 2 3 4 5 6 nb d’ apparitions 75 80 90 85 78 92 On lance 500 fois un dé pipé. Quelle est la probabilité d'obtenir 4? Quelle est la probabilité d'obtenir un nombre impair? Quelle est la probabilité d'obtenir un nombre pair ? Exercice : extrait du manuel Maths Bréal 3ème n°56 page 102 Comment évaluer les connaissances acquises : • Alors qu’on a appris à étudier un problème avec du temps devant soi, • A étudier sa mise en œuvre par expérimentation, • A recueillir les données, • A travailler en équipe, • A simuler sur ordinateur, • Etc… L’exemple de l’option informatique Retour Intervalle de fluctuation ou de confiance ? En seconde, l’intervalle de fluctuation au seuil de 95% est : 1 1 ;p p n n Soit : Soit : Xn 1 1 p p n n n X n np 1 1 n X n np a pour variance : Yn n p( 1 p ) qui ne dépend pas de n et Zn X n np np( 1 p ) a pour espérance 0 et variance 1 qui ne dépend ni de n ni de p. • A- Définition • Soit X une variable suivant une loi B (n, p). • On appelle intervalle de fluctuation de X au seuil 1-α tout intervalle [a,b] tel que : ( X [a ,b])=1- Un intervalle de confiance pour une proportion p à un niveau de confiance 1 – α est la réalisation, à partir d’un échantillon, d’un intervalle aléatoire contenant la proportion p avec une probabilité supérieure ou égale à 1 - α. Cet intervalle aléatoire est déterminé à partir de la variable aléatoire Xn Fn n qui, à tout échantillon de taille n, associe la fréquence. Exemple Supposons que p soit inconnu . On peut approximer p par la proportion f obtenue par les données de l’échantillon (estimation ponctuelle) et déterminer l’intervalle de confiance de p au risque 0,95. Xn 1 1 p p 0,95 n n n A justifier 1 1 1 1 p Fn p Fn p Fn n n n n 1 1 P Fn p Fn 0,95 n n L’intervalle aléatoire a une probabilité supérieure à 0,95 de contenir p. Il est appelé intervalle de confiance de p au seuil de 95%.