OBJECTIFS CHAPITRE 8 Les statistiques à une variable Prérequis Lire et exploiter un tableau ou un graphique (TP1). • les pourcentages Calculer la moyenne et l’écart type (TP2-3). • les repères du plan Calculer la médiane et les quartiles (TP5). Utiliser l’intervalle interquartile (TP5). Calculer des fréquences conditionnelles (TP1). Utiliser un tableur et les fonctions statistiques d’une calculatrice (TP3). c ACTIVITÉ Lecture graphique Objectif : Lire un graphique quelle que soit sa forme. A. Lecture d’un diagramme circulaire Le graphique ci-contre donne 8,9 la répartition en pourcentages des 2 290 élèves du second 4,2 degré du lycée Corot pour l’année scolaire 2003-2004. 5,9 41,0 10,0 1.Déterminer le nombre d’élèves inscrits en Seconde au lycée Corot. 2.Que représente le nombre 30 % par rapport à l’effectif total ? 5,9 9,7 4,8 Secondes Premières STG Premières ES Premières S Premières L Terminales STG Terminales ES Terminales S Terminales L 9,6 3.Quel est le pourcentage des élèves inscrits en Terminale ? Quel est l’effectif des élèves inscrits en Terminale ? 4.Quel est le pourcentage des élèves de Terminale inscrits en STG ? 5.Quelle est la part des élèves du second degré inscrits en STG ? 168 B. Lecture d’un diagramme en barres Le graphique ci-dessous donne, en milliards de voyageurs/kilomètres, les trois principaux modes de trafic dans sept pays européens. 1 000 68 75 800 45 70 95 44 45 39 600 400 723 700 664 Autocars Transports ferroviaires Voitures particulières 38 20 613 200 305 141 15 15 98 0 Allemagne France Italie Royaume-Uni Espagne Pays-Bas 5 8 Belgique 1.Dans quel pays le transport ferroviaire est-il le plus important : a.en valeur absolue ? b.en pourcentage ? 2.Construire le même type de graphique en donnant, pour chaque pays, les fréquences de chaque type de transport. C. Lecture sur une courbe Les courbes ci-dessous donnent le taux de chômage chez les 15/25 ans de 1990 à 2003. 30 Femmes Hommes 25 20 15 1990 1992 1994 1996 1998 2000 2002 2004 1.Quel était le taux de chômage des jeunes femmes en 1993 ? celui des hommes en 2000 ? 2.Sur quelles périodes le taux de chômage des hommes est-il passé sous la barre des 20 % ? 3.Peut-on dire que le taux de chômage des femmes a augmenté sur la période 1990-1997 ? 4.Déterminer pour chaque année l’écart entre le taux de chômage des femmes et celui des hommes. Cet écart tend-il à se réduire ? 5.Si on fait l’hypothèse que chaque année le nombre de filles est égal au nombre de garçons, construire sur le même graphique, la courbe donnant le taux de chômage des jeunes entre 15 et 25 ans sur la période 1990-2003. 169 ACTIVITÉ Les notations indicielles Objectif : Se familiariser avec les notations. A. Les notations indicielles Les notes de mathématiques de Sébastien pour l’année 2004 sont données dans le tableau suivant. Notes : Xi 4,5 7 9 11 14 15,5 18 1 2 3 2 2 1 1 Effectifs : ni X i et n i sont ici définis pour i entier compris entre 1 et 7. On a par exemple : X 1 = 4,5 ; X 2 = 7 ; … ; X 7 = 18, de même n 1 = 1, n 2 = 2, …, n 7 = 1. 1.Quels sont les nombres X 3 et X 5 ? 2.Quelle est la plus grande valeur de X i ? 3.Que valent n 4 et n 6 ? 4.Quelle est la plus grande valeur de n i ? 5.X i est-il toujours un nombre entier ? n i est-il toujours un nombre entier ? B. Le symbole ∑ Définition Le symbole ∑ est le symbole somme. i=7 Le nombre total de contrôles est N = ∑ n i = n 1 + n 2 + … + n 7. i=1 1.Déterminer N. i=3 2.Que représente ∑ n i ? i=1 3.À combien de contrôles Sébastien a-t-il obtenu plus de la moyenne ? i=7 4.Que représente ∑ n i ? i=4 paramètres statistiques ACTIVITÉ Les et la calculatrice Objectif : Retrouver les paramètres statistiques appris les années précédentes. A. Le calcul des fréquences et de la moyenne Rappels La fréquence d’une valeur X i est f i = ni . n ∑ n i Xi La note moyenne sur l’année est ⁄ X = . n 170 Reprenons les notes de Sébastien de l’activité 2. 1.Entrer les notes et leurs effectifs dans deux listes d’une calculatrice qu’on notera L1 et L2. 2.Si, sur la calculatrice, on tape : L3=L2 :Sum(L2), qu’obtient-on ? Remarque : On pourra se reporter aux pages 185 et 186 pour l’emploi de la calculatrice en mode statistique. 3.Compléter le tableau suivant : Notes : Xi 4,5 7 9 11 14 15,5 18 Fréquences : fi 4.Calculer ∑ fi. 5.Calculer la moyenne ; vérifier en utilisant le mode statistique de votre calculatrice. 6.Montrer que l’on a aussi ⁄ X = ∑ f i Xi. Comment peut-on obtenir ce résultat avec les fonctions de la calculatrice ? B. Comparaison des notes de Sébastien et de celles d’Agnès Les notes obtenues par Agnès pendant la même période sont données par le tableau ci-dessous. Notes : Yi 7 8 9 10 12 14 Effectifs : ni 1 1 1 3 5 1 1.Calculer la moyenne ⁄ Y d’Agnès (on prendra une valeur approchée à 10 –1 près). 2.La différence des moyennes entre ces deux élèves est-elle significative ? 3.Quel élève estimez-vous le plus régulier ? Pour « mesurer » cette régularité, on peut calculer l’écart moyen défini pour une variable notée ∑ n i 8Xi – ⁄ X 8 Xi par e (X ) = . n 4.Compléter le tableau ci-dessous et déterminer l’écart moyen e (X ) des notes de Sébastien. Notes : Xi Effectifs : ni 4,5 7 9 11 14 15,5 18 1 2 3 2 2 1 1 Total 8Xi – ⁄ X 8 ni8Xi – ⁄ X 8 5.Déterminer de même e (Y ). 6.La calculatrice donne l’écart type, noté sx ou xsn. Déterminer à l’aide de la calculatrice s(X) et s(Y ). 7.Que constatez-vous ? 171 cours ■ 1 Vocabulaire et organisation de données Les statistiques descriptives étudient sur un ensemble, appelé population et constitué d’individus, un aspect (ou propriété) appelé caractère ou variable. Le caractère étudié peut prendre différentes valeurs appelées modalités. Un échantillon ou panel est une partie de la population. Les différentes modalités sont notées x 1 , x 2 , x 3 , …, x p . Définitions L’effectif d’une modalité x i est égal au nombre d’individus qui prennent cette valeur : on le note n i . L’effectif total est l’effectif de la population, donc N = n 1 + n 2 + n 3 + … + n p . Remarque : On peut aussi écrire N = ∑ n i (où le symbole ∑ (sigma) représente l’addition). On organise les données dans un tableau d’effectifs : Valeurs x1 x2 x3 … xp Total Effectifs n1 n2 n3 … np N Définition La fréquence d’une valeur, notée fi, est le rapport de l’effectif de cette valeur par n l’effectif total. La fréquence de la modalité x i est donc : fi = —i . N On peut aussi présenter les données sous forme d’un tableau de fréquences. (On peut aussi compléter le tableau d’effectifs par une ligne supplémentaire comportant les fréquences.) Valeurs x1 x2 x3 … xp Total Fréquences f1 f2 f3 … fp 1 Remarque : La somme des fréquences vaut toujours 1. n n n n + n2 + … + np N = = 1. En effet : f1 + f2 + … + fp = 1 + 2 + … + p = 1 N N N N N Les variables On distingue deux types de variables : • les variables qualitatives prennent des valeurs non mesurables ; Exemples : La couleur des yeux d’une population, le mode de résidence des habitants d’une région… • les variables quantitatives prennent des valeurs numériques. On parle de variable discrète si elle prend des valeurs isolées ou de variable continue si elle prend n’importe quelle valeur dans un intervalle. Exemples : – Le nombre de frères et sœurs, la note obtenue à un contrôle sont des variables discrètes. – Le salaire des employés d’une entreprise, la durée des communications téléphoniques sont des variables continues. 172 Les statistiques à une variable CHAPITRE 8 Dans le cas d’une variable continue, on procède à un regroupement par classes. Exemple 1 : Répartition des salaires dans l’entreprise Çavafort (les salaires sont exprimés en centaines d’euros). Salaires [0 ; 10[ [10 ; 15[ [15 ; 25[ [25 ; 30[ Total Effectifs 25 32 38 8 103 Dans le cas de variables quantitatives, on ordonne les valeurs de la variable dans l’ordre croissant : x 1 < x 2 < x 3 < … < x p . Définition L’effectif (ou la fréquence) cumulé croissant (ou cumulée croissante) d’une valeur x i est la somme des effectifs (ou fréquences) des valeurs inférieures ou égales à x i. L’effectif (ou la fréquence) cumulé décroissant (ou cumulée décroissante) d’une valeur x i est la somme des effectifs (ou fréquences) des valeurs supérieures ou égales à x i. Exemple 2 : Nombres de DVD achetés au cours des deux derniers mois par les élèves de la classe de Première STG2. Nombres de DVD 0 1 2 3 4 5 6 Effectifs 4 5 7 6 5 2 1 Effectifs cumulés croissants 4 9 16 22 27 29 30 Fréquences cumulées décroissantes 30 26 13 21 7 14 7 8 4 3 1 =1 = = = = = 30 30 15 30 10 30 15 30 15 30 10 Exercices 1 30 n° 8 à 14 ■ 2 Représentations graphiques On représente souvent ces variables par des diagrammes circulaires ; la mesure de chaque secteur angulaire est proportionnelle à l’effectif (ou à la fréquence) de la modalité. Exemple : Le diagramme ci-dessous donne la répartition de la population française des 15 ans et plus selon la catégorie socioprofessionnelle en 2003. 17,5 1,6 3,1 7,4 Agriculteurs 12,4 Artisans Cadres Professions intermédiaires Employés 15,5 29 Ouvriers Retraités Sans activité professionnelle 13,8 COURS Variables qualitatives 173 COURS On peut aussi représenter les variables qualitatives par des diagrammes en barres. Exemple : Le diagramme ci-dessous représente la population de huit zones urbaines françaises (en milliers d’habitants). 12 000 11 174 10 000 8 000 6 000 4 000 1 648 2 000 0 Paris Lyon 1 516 1 143 964 933 925 Marseille Aixen-Provence Lille Toulouse Nice Bordeaux 711 Nantes Variables quantitatives Les variables discrètes sont souvent représentées par un diagramme en bâtons. Exemple : En reprenant l’exemple 2 du ■ 1 concernant le nombre de DVD achetés par les élèves de la classe de Première STG2, on obtient le diagramme suivant : ;;;;;;;; ;;;;;;;; ;;;;;;;; ;;;;;;;; ;;;;;;;; 7 5 3 1 0 1 2 3 4 5 6 Les variables continues sont représentées par des histogrammes : la surface de chaque rectangle est proportionnelle à l’effectif (ou la fréquence) de la modalité. Exemple : En reprenant l’exemple 1 du ■ 1 concernant les salaires de l’entreprise Çavafort, on obtient l’histogramme suivant où le rectangle de base correspond à 5 individus. ;;;;;;;;; ;;;;;;;;; ;;;;;;;;; ;;;;;;;;; 5 salariés 0 10 15 25 30 Exercices 174 Les statistiques à une variable n° 8 à 14 CHAPITRE 8 ■ 3 Paramètres statistiques 1 ■ Les paramètres de position La moyenne Définition La moyenne d’une série quantitative discrète, notée ⁄ X, est égale à : n1 x1 + n2 x2 + n3 x3 + … + np xp ∑ ni xi — — — = —. ⁄X = — N N Cette formule est équivalente à ⁄ X = f1 x 1 + f2 x 2 + f3 x 3 + … + fp x p = ∑ fi x i . Exemple : Calculons la moyenne de la série définie dans l’exemple 2 du ■ 1: 4 ¥ 0 + 5 ¥ 1 + 7 ¥ 2 + 6 ¥ 3 + 5 ¥ 4 + 2 ¥ 5 + 1 ¥ 6 74 = = 2,47 à 10 –2 près par excès. 30 30 Dans le cas d’une variable continue, on calcule de la même façon en prenant pour valeur de x i le a + ai + 1 centre, noté ci , de la classe correspondante [ai , a i + 1[ : ci = i . 2 ⁄X = La moyenne définie dans l’exemple 1 du ■ 1 se calcule à l’aide du tableau ci-dessous. Salaires [0 ; 10[ [10 ; 15[ [15 ; 25[ [25 ; 30[ Centres des classes 5 12,5 20 27,5 Effectifs 25 32 38 8 25 ¥ 5 + 32 ¥ 12,5 + 38 ¥ 20 + 8 ¥ 27,5 = 14,61 à 10 –2 près par défaut. 103 Le salaire moyen d’un employé de Çavafort est donc de 1 461 €. On trouve ⁄ X = n° 15 à 26 Propriété de la moyenne Soit ⁄ X1 la moyenne sur une population E1 d’effectif N1 et ⁄ X2 la moyenne sur une population E2 d’effectif N2. Si les populations E 1 et E 2 n’ont aucun élément commun, alors la population E = E 1 »E 2 est d’effectif N1 + N2 et la moyenne sur E est égale à : Propriété N1 ⁄ X1 + N2 ⁄ X2 —. ⁄X = — N1 + N2 Exemple : Les classes de Premières STG1 et STG2 comptent respectivement 28 et 33 élèves. Les élèves des deux classes ont fait le même contrôle de mathématiques. La moyenne des notes en 1re STG1 est de 9,8 et en 1re STG2, elle est de 10,4. La moyenne des notes de ce contrôle sur les deux classes est donc : ⁄X = 617,6 28 ¥ 9,8 + 33 ¥ 10,4 = = 10,1 à 0,1 près 61 28 + 33 Exercices n° 27 à 32 COURS Exercices 175 COURS La médiane Définition Soit une série quantitative ordonnée. La médiane, notée M, est une valeur qui sépare la population en deux sous-ensembles de même effectif. Elle correspond à une fréquence cumulée croissante de 50 %. 50 % de l’effectif x≤M 50 % de l’effectif x≥M M Exemples : • Si les notes de Paul sont 7 ; 8 ; 8 ; 10 ; 12 ; 13 ; 14, la note médiane est 10. • Si les notes d’Alice sont 5 ; 8 ; 9 ; 10 ; 10 ; 14, on prend pour note médiane 9,5 (toute note dans ]9 ;10[ est médiane ; on choisit plutôt le centre de l’intervalle). Exercices n° 32 à 42 2 ■ Les paramètres de dispersion L’étendue L’étendue est la différence entre la plus grande et la plus petite valeur de la variable. L’écart type L’écart type d’une série de moyenne ⁄ X est le réel, noté s(X), tel que : s(X) = ÷⁄n1 (x 1 –⁄ ⁄ X ) 2 + ⁄n2(x 2 ⁄– ⁄ X ) 2 ⁄+ n3(x 3 ⁄– ⁄ X ) 2 ⁄+ … + ⁄n p (x p⁄ – ⁄ X ) 2 N . Remarque : Cette quantité est positive ou nulle ; elle n’est nulle que si x 1 = x 2 = x 3 = … = x p = ⁄ X. • Plus s(X) est petit, plus la série est concentrée autour de sa moyenne ⁄ X. • Plus s(X) est grand, plus la série est dispersée autour de sa moyenne ⁄ X. Exemple : Kathy a eu les notes suivantes au cours du trimestre : 7 ; 10 ; 8 ; 13 ; 10 ; 7 ; 11 ; 14. Mathieu a eu comme notes au cours du même trimestre : 3 ; 17 ; 4 ; 9 ; 14 ; 14 ; 4 ; 15. Les deux élèves ont la même moyenne ⁄ X1 = ⁄ X2 =10. En revanche, les écarts types sont différents : s 1 = 2,44 et s 2 = 5,33. Kathy est plus régulière dans ses résultats que Mathieu. Remarque : Le couple (⁄ X, s(X)) permet de caractériser la série par une valeur centrale et une valeur qui mesure son étalement ; il prend en compte toutes les valeurs, mêmes les plus extrêmes. Exercices 176 Les statistiques à une variable n° 16 à 31 CHAPITRE 8 ■ 4 Quartiles et intervalle interquartile Définition Les quartiles, notés Q1, Q2 et Q3, sont des valeurs qui séparent une série ordonnée en quatre sous-ensembles, tels que 25 % au moins des valeurs soient inférieures ou égales à Q1 et 25 % au moins des valeurs soient supérieures ou égales à Q3. De plus, Q2 = M. 25 % de l’effectif x ≤ Q1 Définition 25 % de l’effectif Q1 Q1 ≤ x ≤ Q 2 25 % de l’effectif Q2 ≤ x ≤ Q 3 Q2 25 % de l’effectif Q3 x ≥ Q3 L’intervalle interquartile est l’intervalle [Q1, Q3 ], il contient 50 % des effectifs. Remarque : • Plus l’intervalle interquartile est grand, plus la série est dispersée autour de sa médiane. • Plus il est petit, plus la série est concentrée autour de sa médiane. Exemple : Dans la série des notes de Kathy : Q1 = 7,5 ; Q2 = M = 10 et Q3 = 12. L’intervalle interquartile est donc : [Q1, Q3 ] = [7,5 ; 12]. En revanche, dans la série des notes de Mathieu : Q1 = 4 ; Q2 = M = 11,5 et Q3 =14,5. L’intervalle interquartile est donc : [Q1, Q3 ] = [4 ; 14,5]. L’intervalle interquartile des notes de Mathieu est plus étendu que celui des notes de Kathy. Remarque : Le couple (M ; [Q1, Q3 ]) permet aussi de caractériser la série par une valeur centrale M et un intervalle qui donne une mesure de son étalement autour de M. Il ne prend pas en compte les valeurs extrêmes ; il caractérise surtout les valeurs centrales. Représentation graphique Xmin Q1 M Q3 Xmax Exemple : Le diagramme ci-dessous représente la répartition des employés de l’entreprise Çavafort en fonction de leur âge. Xmin Q1 M Q3 Xmax 18 23,2 34,5 51,4 65 Les déciles Pour des analyses plus précises ou lorsque les valeurs sont très étalées, on utilise les déciles qui séparent une série en dix sous-ensembles. La médiane est alors le cinquième décile. Exercices n° 32 à 42 COURS Dans le cas d’une série ayant un effectif important, on représente la série par un diagramme mettant en valeur les valeurs centrales, un diagramme en boîte ou « diagramme à moustaches ». 177 COURS ■ 5 Fréquences conditionnelles : tableaux croisés On a souvent à étudier conjointement deux variables X et Y sur une même population. On construit alors un tableau d’effectifs croisés pour faire apparaître en même temps les deux séries : l’une en colonnes, l’autre en lignes. Exemple : Dans un lycée, la répartition des élèves en fonction de leur niveau et de leur régime par rapport à la demi-pension est donnée dans le tableau ci-dessous. Seconde Première Terminale Total Demi-pensionnaire 425 385 237 1 046 Externe 124 104 225 453 Total 549 489 462 1 500 453 151 = . 1 500 500 489 163 La fréquence des Premières est f (P) = = . 1 500 500 La fréquence des externes est f (E ) = La fréquence des externes parmi les Premières est f 1 = notée f P (E ). La fréquence des Premières parmi les externes est f 2 = notée f E (P). 104 . C’est une fréquence conditionnelle 489 104 . C’est une fréquence conditionnelle 453 Plus généralement, si X prend les valeurs D et E et si Y prend les valeurs A, B et C : X D E Total Y A B C Total n1,1 n1,2 n1,3 d n2,1 n2,2 n2,3 e a b c N Le nombre ni,j qui est à l’intersection de la ligne i et de la colonne j représente l’effectif correspondant aux individus qui réalisent à la fois les modalités xi et yj. Les nombres a, b et c correspondent au total de chaque colonne. Ils représentent les effectifs des modalités A, B et C. Les nombres d et e correspondent au total de chaque ligne. Ils représentent les effectifs des modalités D et E. Le nombre N est l’effectif total ; il est égal à la somme de la dernière ligne et aussi à celle de la dernière colonne : N = a + b + c = d + e. Si l’on considère parmi les individus qui vérifient B, la fréquence de ceux qui vérifient en même temps D, c’est-à-dire la fréquence de D « B parmi B, on définit la fréquence conditionnelle f B (D) par : n Effectif de D « B f B (D) = 1,2 = . Effectif de B b n On définit de même f D (B) par : f D (B) = 1,2 . d On a ainsi défini la fréquence des individus qui vérifient B, parmi les individus qui vérifient D. Exercices 178 Les statistiques à une variable n° 43 à 46 TRA V A UX PRA TIQUES TP1Des problèmes de fréquences et d’effectifs ■ 1 ■ Le personnel de l’entreprise Frigor Le tableau ci-dessous donne la répartition du personnel de l’entreprise Frigor. Sexe Hommes Femmes Ouvriers Employés Cadres 350 125 135 147 117 26 Total Ensemble 1 Compléter le tableau. 2 Calculer les fréquences suivantes : a. la fréquence des femmes ; b. la fréquence des employés ; c. la fréquence des hommes cadres ; d. la fréquence des femmes ouvrières. (On donnera les résultats sous une forme approchée à 10 – 3 près.) 3 On note : H : l’ensemble des hommes ; F : l’ensemble des femmes ; O : l’ensemble des ouvriers ; E : l’ensemble des employés ; C : l’ensemble des cadres. a. Que représentent les nombres f F (O) et f O (F) ? b. Calculer f H (C) et f H (O). c. Calculer f C (H) et f C (F). d. Comparer f (F) et f C (F). Quel commentaire peut-on faire ? 2 ■ Les élèves d’un lycée Un établissement scolaire comporte 350 élèves de Seconde : parmi eux, 20 % sont internes, 70 % demi-pensionnaires et les autres sont externes. Les filles représentent 30 % des internes, 60 % des demi-pensionnaires et 60 % des externes. 1 Compléter l’arbre pondéré : 30 % 20 % 70 % Internes 60 % Demi-pensionnaires Externes Filles Garçons Filles Garçons Filles Garçons 2 Reproduire et compléter le tableau d’effectifs. Internes Demi-pensionnaires Externes Filles Garçons Total 3 a. Déterminer la fréquence des demi-pensionnaires parmi les garçons. b. Déterminer la fréquence des externes parmi les filles. Total 350 TRA V A UX PRA TIQUES Qualification 179 TRA V A UX PRA TIQUES TP2 Moyenne, écart type et regroupement ■ en classes La classe de Première STG2 est composée de 30 élèves dont 20 filles et 10 garçons. Le relevé des tailles exprimées en centimètres de chaque élève a donné : • pour les filles : 170 ; 162 ; 160 ; 169 ; 166 ; 160 ; 164 ; 163 ; 160 ; 165 ; 158 ; 164 ; 164 ; 165 ; 172 ; • pour les garçons : 170 ; 174 ; 180 ; 185 ; 176 ; 180 ; 180 ; 171 ; 181 ; 172. 1 ■ Calcul de la moyenne 1 2 3 4 Calculer la taille moyenne des filles. Calculer la taille moyenne des garçons. En déduire la taille moyenne des élèves de 1re STG2. Calculer, à l’aide de la calculatrice, l’écart type de la taille des élèves de cette classe. 2 ■ Regroupement par classes On décide de faire des regroupements par classes et de voir comment évoluent ces deux paramètres. 1 Compléter le tableau suivant : Tailles [150 ; 160 [ [ 160 ; 170 [ [ 170 ; 180 [ [180 ; 190 [ Effectifs Déterminer à l’aide de ce regroupement la taille moyenne et l’écart type de cette série. 2 Effectuer le même travail à partir du regroupement ci-dessous. Tailles [158 ; 162 [ [ 162 ; 166 [ [ 166 ; 170 [ [170 ; 174 [ [ 174 ; 178 [ [ 178 ; 182 [ [182 ; 186 [ Effectifs 3 Des résultats des deux questions précédentes, quels sont ceux qui sont les plus proches de ceux de la partie 1 ? À retenir On effectue un regroupement par classes quand la variable prend un grand nombre de valeurs, les informations perdent alors en précision. De plus, les moyens informatiques permettent d’effectuer facilement des calculs même sur un effectif important. 3 ■ Exemple d’une variable continue On a effectué avec les mêmes élèves un sondage sur le temps de trajet, exprimé en minutes, pour se rendre au lycée. Les résultats sont donnés ci-dessous. 1 2 3 4 Temps de trajet [0 ; 5[ [5 ; 10[ [10 ; 15[ Nombre d’élèves 2 5 4 [15 ; 20[ [20 ; 30[ [30 ; 60[ 10 6 3 Pourquoi a-t-on choisi un regroupement par classes ? Déterminer le temps de trajet moyen ⁄ X. Calculer l’écart type s(X). On estime qu’un élève a de réels problèmes de transport quand son temps de trajet est supérieur à ⁄ X + s(X). Combien d’élèves de 1re STG2 ont de réels problèmes de transport ? 180 Les statistiques à une variable CHAPITRE 8 TP3 Pour organiser et calculer avec un tableur ■ (ou une calculatrice) 1 ■ Les notes du baccalauréat Avec un tableur 1 Entrer les valeurs dans un classeur sur une même colonne. 2 Utiliser la fonction NB SI (cette fonction compte dans une plage donnée le nombre de cellules dont le contenu vérifie une condition donnée : NB.SI(plage ;condition)) pour remplir le tableau d’effectifs : 3 Calculer la moyenne M1 et l’écart type s 1 de cette série de notes. Avec une calculatrice 1 2 3 4 Entrer toutes les notes dans la liste L1. Classer les notes dans l’ordre croissant (utiliser la fonction Sort A). En déduire les effectifs de chaque valeur. Calculer la moyenne M1 et l’écart type s 1 de cette série de notes. 2 ■ Modification de la moyenne La moyenne de cette correctrice est inférieure aux moyennes des autres correcteurs. On lui suggère de remonter ses notes. 1 Première méthode Elle relève toutes ses notes d’un point : a. Créer la liste des nouvelles notes. b. Calculer la moyenne M2 et l’écart type s 2 de cette série et les comparer avec M1 et s 1. (On expliquera la méthode utilisée sur le tableur ou sur la calculatrice.) 2 Deuxième méthode avec un tableur Elle multiplie toutes ses notes par 1,11 et elle arrondit à l’entier le plus proche. TRA V A UX PRA TIQUES Un professeur a corrigé des copies pour l’épreuve de baccalauréat. Elle doit rendre avec ses copies une feuille de statistiques sur ses notes. Elle a rentré ses notes dans un tableur. 181 TRA V A UX PRA TIQUES a. Calculer les nouvelles notes. b. Calculer la moyenne M3 et l’écart type s 3 de cette série et les comparer avec M1 et s 1. 3 Deuxième méthode avec une calculatrice a. Les notes sont dans la liste L1. Aller dans L2 et taper : L2=L1*1,11. b. Aller dans L3 et utiliser la fonction :Round pour donner une valeur arrondie. c. En déduire les effectifs de chaque valeur. d. Calculer la moyenne M3 et l’écart type s 3 de cette série et les comparer avec M1 et s 1. TP4 Le prix psychologique ■ Une méthode pour déterminer le prix de vente d’un nouvel article est de faire un sondage en demandant aux personnes interrogées : • à partir de quel montant le prix de vente du produit est considéré comme excessif ; • en dessous de quel prix elles considèrent la qualité du produit insuffisante. Une enquête pour déterminer le prix d’un téléviseur écran LCD a donné les résultats suivants : Tranche de prix Pourcentage de personnes trouvant les prix excessifs (1) Pourcentage de personnes trouvant la qualité insuffisante (2) [1 300 ; 1 500[ 0% 12 % [1 500 ; 1 700[ 4% 15 % [1 700 ; 2 000[ 26 % 32 % [2 000 ; 2 500[ 23 % 30 % [2 500 ; 3 000[ 16 % 11 % Plus de 3 000 31 % 0% Total 100 % 100 % Pourcentage cumulé croissant sur les prix excessifs (3) Pourcentage cumulé décroissant sur la qualité insuffisante (4) Pourcentage de non-acheteurs (3) + (4) 1 Si possible, entrer ses données dans un tableur et compléter le tableau. 2 On estime qu’une personne n’est pas un acheteur éventuel si elle trouve la qualité insuffisante ou le prix excessif. Pour un prix donné, le pourcentage de non-acheteurs correspond donc à la somme des colonnes (3) et (4). À quelle tranche de prix correspond le plus grand pourcentage d’acheteurs éventuels ? Le prix ainsi déterminé est appelé prix psychologique. 182 Les statistiques à une variable CHAPITRE 8 TP5 Médiane et quartiles ■ La répartition des salaires mensuels donnés en euros de l’entreprise Édic est donnée dans la tableau ci-dessous. 1 Reproduire et compléter le tableau. Salaires [ 700 ; 900 [ [ 900 ; 1 500 [ [1 500 ; 2 000[ [2 000 ; 2 800[ [2 800 ; 3 500[ Effectifs 18 34 18 52 17 11 5 16 5 Effectifs cumulés croissants Effectifs cumulés décroissants Fréquences cumulées croissantes 2 3 4 5 6 Combien de salariés ont un salaire : inférieur à 2 000 € ? supérieur à 1 500 € ? Construire la courbe des fréquences cumulées croissantes. En déduire graphiquement la médiane et les quartiles associés à cette série. À quel salaire correspond le quartile Q3 ? Déterminer l’intervalle interquartile et construire le diagramme en boîte de cette série. TP6 Les lissages ■ Lorsqu’une série numérique qui dépend du temps (série chronologique) a des variations importantes, on peut procéder à un lissage afin de dégager une tendance. On construit une nouvelle série en remplaçant les valeurs par la moyenne sur une période donnée. La courbe ainsi obtenue est la courbe « lissée ». On parle aussi de « moyennes mobiles ». L’entreprise Toubois construit et distribue des jouets en bois : son chiffre d’affaires sur les quatre dernières années est donné en k€ dans le tableau ci-dessous. 1 a. Construire la courbe donnant le chiffre d’affaires en fonction du temps. b. Peut-on dire que cette fonction est croissante sur la période 2001-2004 ? 2 On décide, à partir du 4e trimestre 2001, de remplacer le chiffre d’affaires d’un trimestre par la moyenne de ce dernier et des trois précédents. a. Quelle valeur obtient-on pour le 4e trimestre 2001 ? pour le premier trimestre 2002 ? b. Copier les données sur une feuille de calcul d’un tableur comme Excel. c. Quelle formule mettre en cellule E4 ? Étendre cette formule jusqu’à la cellule Q4. d. Compléter le tableau précédent. e. Construire la courbe relative à cette nouvelle série sur le même graphique. f. Est-elle plus régulière que celle de la série initiale ? Peut-on parler d’une tendance à la hausse pour le chiffre d’affaires de l’entreprise Toubois pour la période 2001-2004 ? TRA V A UX PRA TIQUES Fréquences 183 l’essentiel 1> Vocabulaire et organisation de données On étudie sur une population, constituée d’individus, un aspect (ou propriété) appelé caractère ou variable qui peut prendre différentes valeurs appelées modalités, notées x 1 , x 2 , x 3 , …, x p . L’effectif, noté n i , d’une modalité x i est le nombre d’individus qui prennent cette valeur. L’effectif total est l’effectif de la population N = n 1 + n 2 + n 3 + … + n p . n La fréquence d’une valeur est le rapport de l’effectif de cette valeur par l’effectif total : fi = i . N On distingue deux types de variables : les variables qualitatives et les variables quantitatives. Une variable quantitative est discrète si elle prend des valeurs isolées et continue si elle prend n’importe quelle valeur dans un intervalle. L’effectif (ou la fréquence) cumulé croissant (ou cumulée croissante) d’une valeur x i est la somme des effectifs (ou fréquences) des valeurs inférieures ou égales à x i . 2> Représentations graphiques Les variables qualitatives sont représentées par des diagrammes circulaires ou par des diagrammes en barres Les variables quantitatives sont souvent représentées par un diagramme en bâtons, quand elles sont discrètes et par des histogrammes quand elles sont continues. 3> Paramètres statistiques Les paramètres de position • La moyenne n1x1 + n2x2 + n3 x3 + … + np xp ∑ ni xi ⁄X = — — — — = — = ∑ fi x i . N N Propriété : Si les populations E 1 et E 2 n’ont aucun élément commun, alors la population E = E 1 » E 2 est d’effectif N1 + N2 et la moyenne sur E est égale à : N1 ⁄ X1 + N2⁄ X2 ⁄X = — —. N1 + N2 • La médiane, notée M, est une valeur qui sépare la population en deux sous-ensembles de même effectif. Elle correspond à une fréquence cumulée croissante de 50 %. Les paramètres de dispersion • L’étendue est la différence entre la plus grande et la plus petite valeur de la variable. • L’écart type : s(X) = ÷⁄n1 (x 1 –⁄ ⁄ X ) 2 + ⁄n2(x 2 ⁄– ⁄ X ) 2 ⁄+ n3(x 3 ⁄– ⁄ X ) 2 ⁄+ … + ⁄n p (x p⁄ – ⁄ X ) 2 N . 4> Quartiles et intervalle interquartile Les quartiles, notés Q1, Q2 et Q3, sont des valeurs qui séparent une série ordonnée en quatre sousensembles, tels que 25 % au moins des valeurs soient inférieures ou égales à Q1 et 25 % au moins des valeurs soient supérieures ou égales à Q3. De plus, Q2 = M. L’intervalle interquartile est l’intervalle [Q1, Q3 ], il contient 50 % des effectifs. 5> Fréquences conditionnelles : tableaux croisés On définit la fréquence conditionnelle f B (D) comme la fréquence des individus prenant la valeur Nombre d’individus vérifiant D et B . D parmi les individus prenant la valeur B : f B (D) = Nombre d’individus vérifiant B 184 Les statistiques à une variable Le mode Stat Aller dans Stat. Choisir : Clrlist. Taper les listes à effacer, puis Enter . Effacer les données précédentes Revenir dans Stat et choisir : EDIT. Entrée des données Exemple : xi 2 7 11 ni 1 4 2 Entrer par exemple les valeurs dans L1, en tapant sur Enter après chaque valeur, et les effectifs dans L2. Pour obtenir les valeurs des fonctions classiques de statistique : aller dans Stat CALC et choisir : 1-VarStats. calculatrice TI 82-82Stat-83-83plus Taper : Enter . Calcul des paramètres statistiques Quelques fonctions particulières Représentation graphique Taper : L1 , L2 Enter . Les résultats s’affichent. • Pour classer les éléments d’une liste dans l’ordre croissant : aller dans : Stat EDIT et choisir : Sort A Taper la liste à trier puis Enter . • Pour calculer la somme des éléments d’une liste : aller dans List ( 2de Stat ), choisir Math . Sélectionner la fonction Sum. Taper la liste dont on veut la somme. Aller dans StatPlot. Choisir 1 puis taper : Enter Sélectionner : ON Choisir le type de représentation. 185 calculatrice Casio Graph 25-35-65 Choisir le menu Stat. Le mode Stat Se positionner par exemple sur List1. DEL.A YES Effacer les données précédentes Entrée des données Exemple : xi 2 7 11 ni 1 4 2 Entrer par exemple les valeurs dans List1, en tapant sur EXE après chaque valeur, et les effectifs dans List2. Calcul des paramètres statistiques Pour obtenir les valeurs des fonctions classiques de statistique : choisir CALC puis 1VAR. Ne pas oublier de vérifier SET. • Pour classer les éléments d’une liste dans l’ordre croissant : choisir le menu List. Choisir Sort A. Taper 1 (si on veut trier une liste) puis 1(si on veut trier la liste1). Quelques fonctions particulières • Pour calculer la somme des éléments d’une liste : OPTN List Sum List . Puis taper le numéro de la liste dont on veut la somme. Représentation graphique Choisir : GRPH. 186 Les statistiques à une variable exercices résolus Comment calculer une médiane ? 1 1. a. Dans une PMI, la puéricultrice a relevé le poids des bébés que les mamans ont amenés à la consultation ce jour-là : 3,8 ; 4,5 ; 3,6 ; 5,3 ; 6,1 ; 5,9 ; 7,8 ; 4,9 ; 6,5 ; 5,2 ; 3,9. Déterminer le poids médian. b. Le lendemain, elle relève les tailles, exprimées en centimètres, des bébés : 54 ; 52 ; 60 ; 58 ; 74 ; 68 ; 59 ; 62 ; 71 ; 67 ; 59 ; 66 ; 70 ; 64. Déterminer la taille médiane. 2. La série statistique est définie par la courbe des fréquences cumulées croissantes suivantes : 100 % 50 % 10 % ;;;;;;; ;;;;;;; ;;;;;;; ;;;;;;; ;;;;;;; ;;;;;;; 40 20 60 80 100 120 a. Lire graphiquement les différentes classes. b. Donner le tableau des fréquences cumulées croissantes. c. En déduire les fréquences de chaque classe. d. Que représentent les cinq valeurs affichées en pointillés sur l’axe des abscisses ? 3. Le professeur a effectué un sondage sur le temps de connexion, exprimé en heures, sur Internet pendant un week-end des élèves de Première STG2. Classes [0 ; 1[ [1 ; 3[ [3 ; 6[ Effectifs 6 5 11 [6 ; 10[ [10 ; 15] 5 3 a. Déterminer les fréquences, puis les fréquences cumulées croissantes. b. Construire la courbe des fréquences cumulées croissantes et lire graphiquement la valeur de la médiane. c. Retrouver par le calcul la valeur de la médiane. 4. La série statistique est représentée par le diagramme en boîte donné ci-dessous. 10 20 30 40 50 60 70 80 90 100 a. Lire la valeur de la médiane. b. Lire de même Q1 et Q3 et les valeurs extrêmes. 187 exercices résolus Réponses Lorsque la variable est discrète, 1) on commence par ranger les valeurs dans l’ordre croissant, 2) puis : • si N est un nombre impair, N = 2 n + 1, la médiane est la (n + 1)-ième valeur ; 1. a. On classe les valeurs dans l’ordre croissant : • si N est pair, la médiane est une valeur prise entre la n-ième et la (n + 1)-ième valeur. En général, on prend le centre. b. On procède comme dans l’exemple précédent en clas- On regarde sur l’axe des abscisses à quelles valeurs correspondent les différents segments de la courbe. On lit les fréquences sur l’axe des ordonnées. On calcule la fréquence d’une modalité en soustrayant de la fréquence cumulée la fréquence cumulée de la valeur précédente. Les résultats lus graphiquement sont des valeurs approchées. 2. a. Les différentes classes sont : [10 ; 20[, [20 ; 30[, 188 Les statistiques à une variable 3,6 ; 3,8 ; 3,9 ; 4,5 ; 4,9 ; 5,2 ; 5,3 ; 5,9 ; 6,1 ; 6,5 ; 7,8. Cette série a 11 individus, la valeur médiane est donc le poids du 6e bébé, soit 5,2. Si on a entré les valeurs dans la calculatrice ou un tableur : • en utilisant la fonction SortA, on peut classer les éléments ; • on peut aussi utiliser les valeurs statistiques pour obtenir la médiane. sant les éléments dans l’ordre croissant : 52 ; 54 ; 58 ; 59 ; 59 ; 60 ; 62 ; 64 ; 66 ; 67 ; 68 ; 70 ; 71 ; 74. La série comporte 14 éléments, on va donc prendre comme valeur médiane le centre entre la 7e et la 8e valeur, soit le centre de [62 ; 64]. La valeur médiane est donc 63. À l’aide d’une calculatrice, on trouve : [30 ; 40[, [40 ; 60[, [60 ; 80[ et [80 ; 120[. b. et c. Par lecture graphique, on trouve les valeurs des fréquences : Classes [10 ; 20[ [20 ; 30[ [30 ; 40[ [40 ; 60[ [60 ; 80[ [80 ; 120[ Fréquences cumulées 10 30 60 85 95 100 Fréquences 10 20 30 25 10 5 d. La valeur qui correspond à 10 % des fréquences cumulées croissantes est le premier décile D1, donc D1 = 20. La valeur qui correspond à 25 % des fréquences cumulées croissantes est le premier quartile Q1, soit Q1 = 27. La valeur qui correspond à 50 % des fréquences cumulées croissantes est la médiane, d’où M = 37. La valeur qui correspond à 75 % des fréquences cumulées croissantes est le troisième quartile Q3, soit Q3 = 52. La valeur qui correspond à 90 % des fréquences cumulées croissantes est le neuvième décile D9, soit D9 = 70. exercices résolus Lorsque la variable est continue : • on calcule les effectifs (ou les fréquences) cumulé(e)s croissant(e)s ; 3. La variable est continue : on complète le tableau d’effectifs par les fréquences et les fréquences cumulées croissantes : Classes [0 ; 1[ [1 ; 3[ [3 ; 6[ Effectifs 6 5 11 5 3 6 5 11 5 3 = 0,2 = 0,167 = 0,366 = 0,167 = 0,1 30 30 30 30 30 Fréquences Fréquences cumulées croissantes • on détermine graphiquement la médiane en regardant à quelle valeur correspond la fréquence cumulée croissante de 50 % ; [6 ; 10[ [10 ; 15] 0,2 0,367 0,733 0,9 1 ;;;;;;; ;;;;;;; ;;;;;;; ;;;;;;; ;;;;;;; ;;;;;;; On construit la courbe des fréquences cumulées croissantes : 1 0,5 0,2 0,1 0 1 Me 5 10 15 On constate graphiquement que la valeur correspondant à une fréquence cumulée croissante de 0,5 est légèrement supérieure à 4. • on peut aussi la déterminer de façon plus précise en appliquant la méthode d’interpolation linéaire ainsi que le montre le calcul fait ci-contre. Un calcul nous donnera une valeur plus précise. 3 0,376 Me 0,5 6 0,733 Les trois points de coordonnées (3 ; 0,376), (Me ; 0,5) et (6 ; 0,733) sont alignés. Les coefficients directeurs des segments définis par ces points sont égaux. 0,733 – 0,376 0,5 – 0,376 On en déduit : = . 6–3 Me – 3 Soit : 0,357 0,124 = 3 Me – 3 0,124 ¥ 3 = 1,042. 0,357 On en conclut : Me = 4,042. ce qui donne : Me – 3 = Lorsque la série est déterminée par un diagramme en boîte, la valeur qui est représentée par un trait central dans la boîte est la médiane. 4. 10 20 30 40 50 60 70 80 90 100 a. Ici la médiane est représentée par un trait rouge. On lit : M = 32. 189 exercices résolus Les extrémités de la boîte correspondent aux quartiles. Comment calculer une moyenne et un écart type ? b. Q1 = 20 et Q3 = 46. La valeur minimale est 10 et la valeur maximale est 100. 2 1. Charlène a noté pendant un mois le nombre de textos qu’elle a reçus par jour sur son téléphone portable : Nombre de textos 0 1 2 3 4 5 6 7 Nombre de jours 3 2 5 8 5 4 2 1 a. Quel est le nombre moyen de textos que Charlène reçoit par jour ? b. Déterminer l’écart type de cette série. 2. La documentaliste a fait un relevé du nombre de livres empruntés par les élèves qui viennent au CDI dans un trimestre : Nombre de livres Fréquences 1 2 3 4 5 15 % 21 % 34 % 18 % 12 % a. Sachant que 221 élèves ont emprunté 3 livres au CDI, quel est le nombre total d’élèves ayant emprunté au moins 1 livre au CDI au cours de ce trimestre ? b. Quel est le nombre moyen de livres empruntés par un élève s’étant rendu au CDI au cours de ce trimestre ? c. Préciser l’écart type. 3. Déborah fait du baby-sitting. Elle a noté la durée, exprimée en heures, des gardes qu’elle a effectuées ces derniers mois : Durée [0 ; 2[ [2 ; 3[ [3 ; 4[ [4 ; 7] Effectif 5 11 15 9 a. Quelle est la durée moyenne d’une garde ? b. Déterminer l’écart type. 4. Corentin a constaté que sur 900 km la consommation moyenne de sa voiture a été de 9,61 L par 100 km. Après avoir fait effectuer des réglages sur son moteur, il constate que sur les 1 100 km suivants, sa voiture n’a consommé en moyenne que 7,43 L par 100 km. Quelle a été sa consommation moyenne par 100 km sur les 2 000 km parcourus ? Réponses Quand la variable est discrète, on applique la formule : ∑ ni xi ⁄X = — . N 190 Les statistiques à une variable 1. a. L’effectif total est : N = 3 + 2 + 5 + 8 + 5 + 4 + 2 + 1 = 30. 3¥0+2¥1+5¥2+8¥3+5¥4+4¥5+2¥6+1¥7 ⁄X = 30 95 ⁄X = = 3,2 à 0,1 près par excès. 30 exercices résolus Attention : sur un tableur, la fonction moyenne ne donne la moyenne que si tous les effectifs sont égaux à 1. Dans tous les autres cas, il faut calculer les produits ni x i et ensuite calculer la moyenne en divisant la somme des nombres obtenus par la somme des ni . La calculatrice permet d’obtenir directement la valeur de la moyenne et de l’écart type. À l’aide d’un tableur comme Excel : Sur une calculatrice : La calculatrice donne s(X) = 1,77. 2. a. On sait que 221 représente les 34 % de l’effectif total. 221 D’où N = = 650. 0,34 Si on ne connaît que les fréquences, on applique la formule : ⁄ X = ∑ fi x i . b. ⁄ X = 0,15 ¥ 1 + 0,21 ¥ 2 + 0,34 ¥ 3 + 0,18 ¥ 4 + 0,12 ¥ 5 ⁄ X = 2,91. Un élève a emprunté en moyenne 2,9 livres. On peut vérifier les calculs sur une calculatrice : On trouve ainsi que s(X) = 1,21. Si la variable est continue, on calcule les centres des classes puis on procède comme dans les exemples précédents. Le centre ci de la classe [ai , ai + 1 [ a + ai + 1 est le nombre ci = i . 2 3. Durée [0 ; 2[ [2 ; 3[ [3 ; 4[ [4 ; 7] Centre 1 2,5 3,5 5,5 Effectif 5 11 15 9 5 ¥ 1 + 11 ¥ 2,5 + 15 ¥ 3,5 + 9 ¥ 5,5 134,5 = = 3,36. 40 5 + 11 + 15 + 9 La durée moyenne d’une garde est donc de 3,36 h (soit 3h 22 min). Sur la calculatrice, on trouve : ⁄X = On trouve l’écart type sur la calculatrice : s(X) = 1,39. 191 exercices résolus Quand les populations sont disjointes, on utilise la formule : N1⁄ X1 + N2 ⁄ X2 ⁄X = — —. N1 + N2 4. Les données correspondent à une moyenne de 9,61 pour une population d’effectif 9 et à une moyenne de 7,43 pour une population d’effectif 11. Les kilomètres parcourus équivalent à deux populations n’ayant aucun élément en commun : 9 ¥ 9,61 + 11 ¥ 7,43 = 8,41 à 0,01 près par défaut. 9 + 11 La consommation moyenne de la voiture de Corentin sur les 2 000 km parcourus a donc été de 8,41 L par 100 km. ⁄X = Comment calculer une fréquence conditionnelle ? 3 Le chef du personnel de l’entreprise Altus a fait un relevé statistique sur les membres du personnel en fonction de leur âge : Inférieur à 30 ans Hommes Entre 30 et 50 ans 42 Total 42 Femmes Total Plus de 50 ans 52 100 72 250 1. Compléter le tableau. 2. a. Calculer la fréquence des femmes de moins de 50 ans parmi les membres du personnel. b. Calculer la fréquence des hommes de plus de 30 ans parmi les membres du personnel. c. Calculer la fréquence des moins de 30 ans, celle des personnes entre 30 et 50 ans, puis celle des personnes de plus de 50 ans. 3. a. On considère l’ensemble des femmes. Calculer la fréquence des femmes de moins de 30 ans. Faire de même avec les deux autres tranches d’âge. b. Compléter le tableau de fréquences suivant : Inférieur à 30 ans Entre 30 et 50 ans Plus de 50 ans Total Hommes 100 % Femmes 100 % 4. a. On considère l’ensemble des employés de moins de 30 ans. Calculer la fréquence des femmes et celle des hommes. b. Compléter l’arbre pondéré suivant : 28,8 % Inférieur à 30 ans Entre 30 et 50 ans 24 % 192 Les statistiques à une variable Plus de 50 ans 70 % F H F H F H exercices résolus Réponses Pour compléter le tableau, on commence par calculer, par exemple, • l’effectif des hommes ; • l’effectif des hommes entre 30 et 50, etc. 1. Pour un calcul de fréquence, le plus important est de regarder quelle est la population considérée : dans cette question, c’est l’ensemble du personnel d’effectif 250. 2. a. Il y a 30 + 52 = 82 femmes de moins de 50 ans dans Hommes Femmes Total Inférieur à 30 ans 42 30 72 l’entreprise, donc f = Entre 30 et 50 ans 66 52 118 Plus de 50 ans 42 18 60 Total 150 100 250 82 41 = = 0,328 = 32,8 %. 250 125 b. On compte 66 + 42 + 108 hommes de plus de 30 ans 108 54 dans l’entreprise, donc f = = = 0,432 = 43,2 %. 250 125 c. 72 personnes ont moins de 30 ans, d’où : 72 36 f1 = = = 0,288 = 28,8 %. 250 125 118 personnes ont entre 30 et 50 ans, d’où : 118 59 f2 = = = 0,472 = 47,2 %. 250 125 60 personnes ont plus de 50 ans, d’où : 60 6 f3 = = = 0,24 = 24 %. 250 25 La somme des fréquences vaut 1. La population considérée est l’ensemble des femmes d’effectif 100. On prend en compte les effectifs de la deuxième ligne du tableau. Vérifions : 0,288 + 0,472 + 0,24 = 1. 3. a. Parmi les femmes, la fréquence des moins de 30 ans 30 = 0,3 = 30 %. 100 Parmi les femmes, la fréquence de celles qui ont entre 30 et 52 50 ans est donc : f©2 = = 0,52 = 52 %. 100 Parmi les femmes, la fréquence des plus de 50 ans est 18 donc : f©3 = = 0,18 = 18 %. 100 est donc : f©1 = Pour remplir le tableau, on procède de la même façon pour les hommes en ne prenant en compte que les effectifs de la première ligne. La population considérée est l’ensemble des personnes de moins de 30 ans, d’effectif 72. On prend en compte les effectifs de la première colonne du tableau. 4. a. Parmi les employés de moins de 30 ans, la fréquence Hommes Femmes Inférieur à 30 ans 28 % 30 % Entre 30 et 50 ans 44 % 52 % Plus de 50 ans 28 % 18 % Total 100 % 100 % 30 5 = = 0,417 = 41,7 %. 72 12 Parmi les employés de moins de 30 ans, la fréquence des 42 7 hommes est donc : f 2¢ = = = 0,583 = 58,3 %. 72 12 des femmes est donc : f 1¢ = b. On procède de même pour les deux autres tranches d’âge. 28,8 % 47,2 % 24 % Inférieur à 30 ans Entre 30 et 50 ans Plus de 50 ans 41,7 % 58,3 % 56 % 44 % 30 % 70 % F H F H F H 193 exercices Contrôle des notions de base Sur une calculatrice 1 5 c Pour chaque affirmation, répondre par vrai ou c a. Entrer dans une calculatrice les 40 nombres de la liste suivante : faux. 10 ; 6 ; 7 ; 4 ; 6 ; 13 ; 14 ; 14 ; 4 ; 9 ; a. La somme des effectifs des valeurs est l’effectif total. 8 ; 11 ; 12 ; 13 ; 13 ; 5 ; 6 ; 7 ; 8 ; 15 ; 7 ; 6 ; 14 ; 11 ; 10 ; 18 ; 7 ; 9 ; 10 ; 4 ; b. La moyenne sépare la population en deux sousensembles de même effectif. 14 ; 5 ; 8 ; 8 ; 9 ; 10 ; 12 ; 15 ; 16 ; 3. c. L’intervalle interquartile contient la moitié de l’effectif. b. Trier les nombres dans l’ordre croissant. d. Une fréquence est un réel compris entre 0 et 1. d. Quelle est la somme des nombres de la liste ? e. L’intervalle ] ⁄ X – s, ⁄ X + s [ contient 50 % de l’effectif total. e. Quelle est la valeur moyenne des nombres de cette liste ? f. La moyenne est toujours comprise entre la valeur minimale et la valeur maximale. c. Quel est l’effectif de la valeur 8 ? 6 a. Recopier sur une calculatrice les données du tableau suivant : 2 xi yi c On considère la liste de notes suivante : 6 ; 9 ; 12 ; 13 ; 11 ; 8 ; 10. Pour chaque question, déterminer la bonne réponse. 1. La note médiane est : a. 10 b. 13 2 3 5 4 8 2 13 5 25 2 b. Dans une liste 3, faire apparaître les produits xi yi . c. Dans une liste 4, faire apparaître les réels xi divisés par la somme des réels yi . c. 9,8. 7 2. La moyenne est : a. 10 b. 9,8 a. Recopier sur une calculatrice les données du tableau suivant : c. 13. 3 Valeurs Effectifs c On considère la liste de notes suivante : 8 ; 9 ; 12 ; 15 ; 13 ; 13 ; 7 ; 10. Pour chaque question, déterminer la bonne réponse. –3 1 4 7 6 14 10 9 15 3 b. À l’aide des fonctions statistiques, donner : • N, l’effectif de la série ; • la moyenne de la série ; • la médiane et les quartiles. 1. La note médiane est : a. 14 b. 11 c. 10. c. Dans la liste 3, faire apparaître les fréquences. 2. La moyenne est : a. 13 b. 10,9 c. 10. Effectifs – Fréquences – Représentations 4 8 c On considère la liste de notes suivante : Notes Effectifs 8 1 9 4 10 2 12 2 14 1 Un hôtelier a remarqué que, sur l’année 2004, 32 % de ses clients étaient français, 42 % venaient de la CE, 18 % des États-Unis et les autres de divers autres pays. Pour chaque question, déterminer la bonne réponse. 1. Faire un diagramme circulaire représentant la répartition des pays d’origine des clients. 1. La note médiane est : a. 9 b. 9,5 2. Sachant que l’hôtel a eu 31 145 clients en 2004, quel a été le nombre de clients : 2. La moyenne est : a. 10 b. 10,2 194 Les statistiques à une variable c. 10. a. français ? c. 10,6. b. venant des États-Unis ? exercices CHAPITRE 8 9 c On considère la série statistique suivante : Valeurs Effectifs 5 2 7 3 8 7 10 5 11 3 121 c Le graphique indique la répartition des salaires dans 13 2 ;;;;;;; ;;;;;;; ;;;;;;; ;;;;;;; ;;;;;;; ;;;;;;; une entreprise. On dénombre 5 classes différentes. 15 1 a. Calculer l’effectif total. 10 b. Déterminer les fréquences de chaque valeur. c. Calculer les effectifs cumulés croissants. d. Calculer les fréquences cumulées décroissantes. e. Faire une représentation en bâtons. 10 Un pompiste a fait un relevé des types de carburants pris par les 140 clients d’une journée : Sans plomb 95 Sans plomb 98 Super Gazole 1 000 c. La répartition en volume a donné les résultats suivants : Le tableau ci-dessous présente les espèces animales connues, menacées ou protégées en 2004 pour les vertébrés. Espèces Espèces vulnérables protégées 68 364 39 33 20 524 1. Déterminer pour chaque type de vertébrés le pourcentage des espèces connues qui sont : a. vulnérables ; Effectifs Une municipalité a fait un relevé statistique des inscrits aux différentes activités proposées par l’association sportive : Volume en litres 1 960 1 660 706 1 614 14 52 4 8 25 103 3 000 13 Sports Danse Natation Tennis Autres collectifs Effectifs 180 135 55 78 92 a. Déterminer la fréquence de chaque modalité. b. Faire un diagramme circulaire et faire un diagramme en barres. 11 121 375 40 40 420 1 000 2 600 b. Justifier que le nombre de salariés de l’entreprise est 200. Les fréquences en volume correspondent-elles aux fréquences en clients ? Mammifères Oiseaux Reptiles Amphibiens Poissons Total 2 200 Salaires mensuels (en €) [1 000 ; 1 400[ [1 400 ; 1 800[ [1 800 ; 2 200[ [2 200 ; 2 600[ [2 600 ; 3 000[ b. Faire une représentation circulaire. Espèces connues 1 800 a. Recopier et compléter le tableau suivant : Fréquence 35 % 27,8 % 12,2 % 25 % a. Calculer les effectifs de chaque valeur. Sans plomb 95 Sans plomb 98 Super Gazole 1 400 b. protégées. 14 Une série est représentée par l’histogramme donné ci-dessous. ;;;;;;;;;;;;;;;; ;;;;;;;;;;;;;;;; ;;;;;;;;;;;;;;;; ;;;;;;;;;;;;;;;; ;;;;;;;;;;;;;;;; ;;;;;;;;;;;;;;;; ;;;;;;;;;;;;;;;; ;;;;;;;;;;;;;;;; ;;;;;;;;;;;;;;;; ;;;;;;;;;;;;;;;; 6 0 2 4 6 8 10 12 14 a. d’espèces connues ; b. d’espèces protégées. a. Déterminer graphiquement : • les différentes classes ; • les fréquences relatives à chaque classe. 3. Construire le diagramme circulaire des espèces protégées pour les vertébrés. b. Sachant que l’effectif de la première classe est 36, déterminer l’effectif de chaque classe. 2. Déterminer en pourcentage les types : 195 exercices Moyenne – Écart type 191 Le tableau ci-dessous donne les caractéristiques des résidences principales en France, en 2002. 151 c On considère la série statistique suivante : Valeurs Effectifs 2 1 3 5 6 7 9 8 10 5 12 3 15 2 b. Calculer la moyenne. c. Calculer l’écart type. d. Déterminer le nombre d’éléments de cette série appartenant à l’intervalle ] ⁄ X – s, ⁄ X + s [. 161 Voici le relevé des températures des matins de février : –2 2 –1 6 0 7 2 5 3 2 5 4 7 2 a. Calculer la température moyenne. b. Calculer l’écart type. c. Déterminer le nombre de jours où la température appartient à l’intervalle ] ⁄ X – s, ⁄ X + s [. 171 On considère la série statistique suivante : Valeurs Fréquences 1 6 2 3 4 5 et plus 12,3 21,8 25,2 34,7 a. Peut-on calculer avec ces données le nombre de pièces moyen ? a. Calculer l’effectif total. Valeurs Effectifs Nombre de pièces Fréquence 15 18 23 28 32 37 45 3 % 15 % 19 % 27 % 23 % 8 % 5 % b. Calculer ce nombre ainsi que l’écart type de cette série en assimilant la dernière modalité à « entre 5 et 8 pièces ». 201 Le tableau suivant donne le chiffre d’affaires, en k€, de la société Altan sur six années : Année 1999 C.A. 205 2000 221 2001 237 2003 219 2004 234 a. Représenter graphiquement cette série chronologique. b. Calculer le chiffre d’affaires moyen et l’écart type. 211 c On considère la série statistique suivante : Classes Effectifs [0 ; 4[ 2 [4 ; 6[ 3 [6 ; 9[ 8 [ 9 ; 14 ] 5 a. Calculer l’effectif total. a. Calculer la moyenne. b. Calculer la moyenne. b. Calculer l’écart type. c. Calculer l’écart type. 221 181 Au cours de son voyage en Indonésie, David a changé en plusieurs fois les dollars qu’il avait emportés. Le cours du dollar a beaucoup fluctué au cours de son séjour. On peut résumer ses échanges par le tableau suivant : Valeur du dollar exprimée en roupies Nombre de dollars échangés Valeur du dollar exprimée en roupies Nombre de dollars échangés 2002 198 9 950 10 245 9 500 9 820 50 100 70 120 9 776 9 850 9 300 9 650 80 75 110 95 a. Déterminer la somme totale de dollars échangés. b. Déterminer la valeur moyenne, exprimée en roupies, du dollar pendant le mois de vacances de David. Il a rapporté de son voyage pour 850 000 roupies d’achats. À quelle somme en dollars peuton estimer ses achats ? 196 Les statistiques à une variable Jonathan joue sur son ordinateur à un jeu d’adresse et note les scores obtenus, en milliers de points, dans le tableau suivant : Scores Effectifs [0 ; 20[ [20 ; 40[ [40 ; 50[ [50 ; 60[ 6 12 15 23 Scores [60 ; 70[ [70 ; 90[ [90 ; 120[ [120 ; 150[ Effectifs 17 13 11 3 a. Déterminer les effectifs cumulés croissants. b. Déterminer le score moyen et l’écart type. 231 Le tableau donne, en euros, le montant des achats effectués par 2 000 personnes dans un supermarché un jour donné. Montants des achats Effectifs [0 ;15[ 150 [15 ; 30[ [30 ; 50[ 380 800 Montants des achats [50 ; 80[ [80 ; 120[ [120 ; 200] Effectifs 320 300 50 a. Calculer à 0,1 près la moyenne ⁄ X et l’écart type s de cette série statistique.