FORMATION NOUVEAUX PROGRAMMES de TERMINALE Journées novembre 2012 Les statistiques inférentielles enseignées au Lycée Seconde Première Terminale Problématique : On s’intéresse à un caractère d’une population que l’on ne peut pas recenser et on sonde cette population à l’aide d’un échantillon. Deux grandeurs entrent en jeu : La proportion pour la population et la fréquence observée dans l’échantillon. Deux questions : Connaissant la proportion pour la population (p), peut-on prévoir la fréquence observée dans l’échantillon (f) ? = Notion d’intervalle de fluctuation Réciproquement, peut-on déduire de la fréquence observée dans l’échantillon (f) la proportion pour la population (p) ? = Notion d’intervalle de confiance Avec le modèle probabiliste, on peut parvenir à répondre à ces deux questions sous certaines conditions au lycée : Il faut que l’échantillon soit constitué en prélevant les individus au hasard et avec remise ou que le tirage soit assimilable à un tirage avec remise (le rapport entre la taille de l’échantillon et la taille de la population doit être inférieur à 1%) Il faut que la taille n de l’échantillon soit assez grande (plus de 25 en seconde ou plus de 30 en terminale.) Il faut que la proportion de la population ne soit pas marginale (entre 20% et 80% en seconde, que nf ≥5 et n(1-f) ≥5 en terminale). Qu’est-ce que la fluctuation de l’échantillonnage ? L’échantillonnage (étude statistique de la distribution des fréquences observées dans l’ensemble des échantillons de même taille) permet de constater la fluctuation des fréquences et trouver une loi qui modélise cette fluctuation. Seconde Première Terminale En réalisant plusieurs simulations sur des On considère que l’on peut On veut pouvoir passer du caractère discret de échantillons de même taille n, on observe une modéliser l’étude du caractère la loi binomiale de première à une loi continue. variation de la fréquence des individus de proportion p sur un Pour cela on observe que si on centre et réduit la possédant le caractère étudié. On peut aussi échantillon de taille n par n loi binomiale Xn, en posant : observer que ces fréquences sont distribuées répétitions d’une expérience X n np Zn dans une sorte d’intervalle qui les contient aléatoire pour laquelle on np(1 p) presque toutes (intervalle de fluctuation). observe le nombre d’individus présentant ce on obtient une loi Zn de moyenne 0, d’écart type 1. En réalisant de nouvelles simulations, pour caractère. des valeurs de n de plus en plus grandes, on On s’intéresse alors à la observe que cet intervalle qui contient variable aléatoire Xn qui Par un passage à l’histogramme, et en respectant presque toutes les valeurs est de moins en associe à chaque échantillon, le fait que l’aire des rectangles doit être égale à moins large : On constate que la fluctuation le nombre d’individus de la probabilité, on observe que lorsque n devient des fréquences diminue quand n augmente. l’échantillon de taille n qui grand, la fonction de répartition de Zn tend vers la fonction de répartition de la variable aléatoire possèdent le caractère. Z qui suit la loi normale N(0 ;1) dont la La variable aléatoire Xn suit fonction densité est f définie par : une loi binomiale B(n ; p). x² 1 f ( x) e Si on s’intéresse aux 2 fréquences, c’est à dire à la C’est le théorème de Moivre-Laplace. variable aléatoire Fn = Xn/n, En conclusion, la loi de probabilité de Z est qui présente la même donnée par : P(a ≤ Z ≤ b) qui est l’aire sous la distribution de probabilités courbe Cf entre a et b. que Xn, on constate que leur distribution se stabilise quand la taille de l’échantillon grandit. Qu’est-ce que l’intervalle de fluctuation au seuil de 95% ? Seconde Première Terminale Si 0,2 ≤ p ≤ 0,8, on admet que la fréquence En calculant les probabilités Dans le cas où np ≥ 5 et n(1 – p) ≥ 5, et n ≥ 30 observée dans un échantillon de taille n (n ≥ cumulées de la loi binomiale c’est-à dire p 5 5 , on peut 1 n ;1 n 25), a une probabilité voisine de 95% d’être (calculatrice ou tableur), on détermine le plus petit entier approcher la loi binomiale par la loi normale et comprise entre p 1 et p 1 . a tel que P(Xn ≤ a) > 0,025, et définir l’intervalle asymptotique au seuil de 1n n On s’en convainc en simulant des le plus petit entier b tel que α comme l’intervalle I tel que : P(Xn ≤ b) ≥ 0,975. expériences. Xn L’intervalle [a ; b] contient I ≃1- α lim P alors au moins 95% des n n fréquences observées. Attention ! 2 1 p n’est pas le centre de l’intervalle. Il n’y a aucune contrainte sur n et p Si Z est une variable aléatoire qui suit la loi normale centrée réduite, quel que soit α de ]0 ; 1[, il existe un unique réel u tel que : P(-uα ≤ Z ≤ uα) = 1-α. uα est l’unique antécédent de 1-α/2 par la fonction de répartition qui est continue et strictement croissante. (T.V.I) Pour α = 0,05, la loi nous donne uα ≈1,96, et on a P(-1,96 ≤ Z ≤ 1,96) ≃95% En revenant à la variable aléatoire Fn = Xn/n, on peut alors dire que la fréquence observée dans l’échantillon de taille n (n ≥ 30) a une probabilité d’environ 95%, d’être comprise entre p 1,96 p(1 p) et p 1,96 p(1 p) . n n Quelles sont les prises de décision possibles à partir de l’intervalle de fluctuation ? Au lycée, l’intervalle de fluctuation va permettre une initiation aux tests d’hypothèses dans un cadre simplifié : la prise de décision en situation de risque. Le seuil de risque est en général fixé à 5%, c’est-à-dire α = 5%. La proportion p du caractère étudié est supposée connue. Le protocole suit les étapes suivantes : Déterminer l’intervalle de fluctuation associé à ce risque pour une taille n. Observer la fréquence f du caractère étudié dans un échantillon de taille n. Appliquer la règle de décision concernant une hypothèse formulée en langage naturel (réviser la machine, fermer l’usine, ets...) : Règle de décision : si f I si f I alors l ' hypothèse est acceptée. alors l ' hypothèse est rejetée. Si l’écart entre valeur observée f et valeur attendue p est trop important pour être attribué aux fluctuations d'échantillonnage, l'hypothèse doit être rejetée. Le seuil de risque choisi au départ est celui de rejeter l’hypothèse à tord lorsque les fluctuations d'échantillonnage sont seules en cause. Cette règle de décision peut permettre d’effectuer plusieurs types de test : Test d’une conformité : On cherche à vérifier si un échantillon suit la même loi que celle suivie par les échantillons issus de la population dans laquelle le caractère étudié est dans une proportion p. On teste l’hypothèse « l’échantillon est issu d’une population où le caractère est dans une proportion p ». Test d’homogénéité : On compare les valeurs observées sur au moins deux échantillons pour évaluer si elles suivent la même loi. On teste l’hypothèse : « les deux échantillons appartiennent à la même population ». Le travail mathématique consiste à calculer l’intervalle de fluctuation connaissant p, n et la marge d’erreur que l’on se donne. Seconde Première Terminale On utilise la formule en vérifiant que les On définit la variable On approche la loi binomiale avec la loi conditions d’application sont vérifiées pour aléatoire, on identifie la loi normale et on calcule l’intervalle avec la calculer l’intervalle. binomiale puis on utilise formule. l’algorithme et les TICE pour déterminer l’intervalle. Qu’est-ce que l’intervalle de confiance pour une proportion ? Quel que soit α dans ]0 ; 1[ , l’intervalle de confiance d’une proportion p au seuil de 1-α est un intervalle aléatoire contenant p avec une probabilité la plus proche possible de 1-α. Cet intervalle, pour une fréquence f, observée sur un échantillon, donne une fourchette de valeurs pour estimer la proportion p dans la population mère. On cherche un intervalle [Fn-ε ; Fn+ε ] susceptible de contenir p, c’est à dire que P(p[Fn-ε ; Fn+ε ] ) = 1- α. Seconde Première Terminale Au seuil de 95% , on a : Pas d’intervalle de confiance C’est le même que celui de seconde ! 1 1 ;p ] Fn [ p dans le programme de mais sous les conditions : n n première ! sous les conditions ce qui est équivalent à n 30 et nf 5 et n(1-f) 5 p F 1 ; F 1 n n L’intervalle n n 1 1 est ; Fn Fn n n appelé intervalle de confiance pour un niveau de confiance de 0,95. Pour une valeur observée f, f 1 ; f 1 est n n une fourchette de sondage pour un niveau de confiance de 0,95 sous les conditions n 25 et 0,2 f 0,8. Dans ces conditions, f est une estimation de p pour une précision de 1/ n et un niveau de confiance de 0,95. 2 Le travail mathématique consiste à : Estimer à l’aide d’un intervalle une proportion inconnue d’une population en observant un échantillon. Déterminer la taille d’un échantillon pour obtenir une estimation avec une erreur donnée. 3 Progression Terminale S – 2012/2013 Remarque importante : ceci n’est pas une préconisation mais seulement un exemple qui met en relation l’utilisation des TICE et l’algorithmique avec les diverses parties du programme et peut donner aussi une idée de l’importance à accorder aux diverses parties. Diverses autres organisations sont possibles. Chapitre Remise en route 1 semaine Objectifs Démonstrations étudiées spécifiquement TICE Algobox : trouver un rang n à partir duquel un>100 Fonctions, équations, inéquations, limites intuitives et suites. Tableur : conjecture d’une propriété à démontrer par récurrence Raisonnement par récurrence 1 semaine Dérivée. Propriétés algébriques x Notation e Variations, limites et représentation graphique Xcas : étude d’un Démontrer unicité y tel sujet du type Bac que y’ = y et y(0) = 1 en vérifiant les Limites calculs avecXCas Introduction historique. Forme algébrique Nbres complexes Calculs algébriques (+ – × ÷). Conjugué Forme algébrique Équations de degré 2 à coefficients réels. 2 semaines Affixe d'un point, d'un vecteur, du milieu Etude d’une transformation z’=(az+b)/(cz+d) avec GéoGébra Fonction exp 2 semaines Algorithmes Fonction ln 2 semaines Introduire la fonction ln à partir de l’équation fonctionnelle. Propriétés algébriques Variation, limites et représentation graphique Évocation de la fonction log Probabilités conditionnelles 2 semaines Arbres pondérés Probabilités conditionnelles Événements indépendants Formule des proba totales (vocabulaire non attendu – un arbre peu constituer une preuve)) Fonctions sin et cos 2 semaines Dérivées Parité et périodicité Représentation graphique Lien avec le cercle trigonométrique Nbres complexes Forme trigo 2 semaines Forme trigonométrique Transformation forme algébriq forme trigo Forme exponentielle Formules trigo d'addition et de duplication Xcas ou algobox pour étude suite associée Démontrer que si deux événements A et B sont indépendants, alors il en est de même pour A et B. Simulation d' une marche aléatoire Etude d’un sujet u type Bac avec GéoGébra Etude d’une fonction avec paramètre (Géogébra) ex : Limites Continuité sur un intervalle Compléments sur Théorème des valeurs intermédiaires les fonctions Théorème de la bijection (vocabulaire non 3 semaines attendu) (extension aux intervalles ouverts et semi ouverts) f n ( x) x n e x Recherche des solutions de f ( x)= k (sujet bac2011) Intégration 2 semaines Intégrale d'une fct continue et positive Notation Primitive d'une fct continue Primitives des fonctions usuelles Tte fct continue sur un intervalle fermé admet des primitives Pas d'intégration par parties Espace affine et plan 2 semaines Positions relatives de droites et de plans Établir l'orthogonalité d'une droite et d'un plan Utiliser les coordonnées Principe de démonstration du théorème dans le cas où f est continue et positive Vérifications de calculs de primitives avec Xcas Encadrement d'une intégrale pour une fct continue et positive Geogebra 3D Théorème du toit 4 Théorème de comparaison Compléments sur Limites limite éventuelle d'une suite géométrique les suites 2 semaines Convergence monotone Variables aléatoires 2 semaines Loi binomiale (rappel de 1ere) Loi à densité sur un intervalle Loi à densité uniforme+espérance Loi exponentielle+ espérance + calcul de proba Loi normale centrée réduite Théorème de Moivre Laplace (admis) Loi normale Toute suite croissante majorée a pour limite +∞ Espérance de la loi exponentielle Produit scalaire dans l'espace Déterminer si un vecteur est normal à un plan. Déterminer une équation cartésienne d’un plan connaissant un point et un vecteur normal. Caractérisation vectorielle de deux droites orthogonales ; notion de plans perpendiculaires. Espace et plan 2 semaines Algobox pour trouver des valeurs approchées de alpha Rang à partir duquel un est supérieur à A. Des activités algo sont menées dans le cadre de suites récurrentes Utiliser le tableur ou une calculatrice pour calculer une proba avec une loi normale Simulation de loi binomiale avec algobox Geogebra 3D Caractériser les points d’un plan de l’espace par une relation ax+ by+ cz+ d = 0 avec a , b , c trois nombres réels non tous nuls. Déterminer un vecteur normal à un plan défini par une équation cartésienne. Démontrer qu’une droite est orthogonale à Choisir la forme la plus adaptée entre toute droite d’un plan équation cartésienne et représentation si et seulement si elle paramétrique pour : est orthogonale à deux droites sécantes de ce - déterminer l’intersection d’une droite et plan. d’un plan ; - étudier la position relative de deux plans. Connaître l’intervalle de fluctuation asymptotique au seuil de 95 % . Estimer par intervalle une proportion inconnue à partir d’un échantillon. Échantillonnage 2 semaines Déterminer une taille d’échantillon suffisante pour obtenir, avec une précision donnée, une estimation d’une proportion au niveau de confiance 0,95. Expression d'un intervalle de fluctuation au seuil de 1-α de la variable Xn n si la variable aléatoire X n suit la loi F n= B (n, p). 5 Progression Terminale ES – 2012/2013 Remarque importante : ceci n’est pas une préconisation mais seulement un exemple qui met en relation l’utilisation des TICE et l’algorithmique avec les diverses parties du programme et peut donner aussi une idée de l’importance à accorder aux diverses parties. Diverses autres organisations sont possibles. Chapitres nb sem TICE Algorithmes 1 – Rappels dérivation Tableau de variation Continuité et théorème des valeurs intermédiaires Approche Analyse Remarque : Les suites sont traitées en 1/2 groupe sur les créneaux des heures 3 dédoublées à l'aide du tableur de même que l'algorithmique 2 – Probabilités conditionnelles et loi binomiale Proba 3 3 – Continuité et théorème des valeurs intermédiaires Analyse 1 4 – Fonction exponentielle 5 – Primitives 6 – Intégration (1) 7 – Loi à densité 8– Fonction logarithme népérien 9 – Convexité 10 - Intervalle de fluctuation estimation 11 – Intégrale 12 – Intégration (2) suite et fin Analyse 3 Analyse 2 Analyse 1 Proba 3 Analyse 3 Analyse 3 Proba 3 Analyse 1 Analyse 2 Toussaint Noël Vacances Hiver Vacances printemps 6