République Tunisienne Présidence du Gouvernement Ecole Nationale d’Administration 24, Avenue du Dr Calmette Mutuelle-ville 1082 Tunis Tél. (+216) 848 300 Fax (+216) 794 188 www.ena.nat.tn STATISTIQUE ET CALCUL DE PROBABILITE (EXAMENS & EXERCICES) Par Hassen MZALI Professeur en méthodes quantitatives Septembre 2013 1 Exercice 1 Enoncé 1 Durant le mois d’avril, nous avons relevé, pour un échantillon d’étudiants de la première années sciences économiques et gestion, le nombre de jours d’absences : Nombre de jours d’absences Nombre d’étudiants 0 5 1 8 2 6 3 3 4 2 5 1 1°) Représenter graphiquement cette distribution. 2°) Déterminer la fonction de répartition. 3°) Calculer le mode, la médiane et la moyenne arithmétique de cette distribution. 4°) Déterminer le nombre d’étudiants ayant un nombre d’absence : i) inférieur à 4 ? ii) au plus égal à 3 ? iii) inférieur à 4 et supérieur ou égal à 1 ? 2 Corrigé 1 Nombre de jours d’absences Effectifs Fréquences Fréquences ni fi cumulées Fi 0 5 0,2 0 1 8 0,32 0,2 2 6 0,24 0,52 3 3 0,12 0,76 4 2 0,08 0,88 5 1 0,04 0,96 Total 25 1 1 ni 8 6 5 3 2 1 0 1 2 3 4 5 Nombre d’absences Diagramme en bâtons des effectifs 1) Le caractère étudié ici est quantitatif discret (nombre d’absences de chaque étudiant), alors la représentation graphique correspondante est le diagramme en bâtons. 2) La formulation de la fonction de répartition de cette distribution statistique est : 0 0,2 0,52 F ( x ) 0,76 0,88 0,96 1 3 si x 0 si 0 x 1 si 1 x 2 si 2 x 3 si 3 x 4 si 4 x 5 si x 5 3) Le mode de cette série est : Mo=1. Il signifie que pour la plupart des étudiants ont une seule abscence. La médiane, dans ce cas, correspond à la cinquième valeur : Mé 1. En effet, la série comporte un nombre impair de valeurs, soit 25 valeurs, la médiane sera la 13ème valeur. 00000 1111111 1 222222 333 44 5 13 ième 6 n x i La moyenne de cette distribution est : x i 1 N i 42 1,68 . 25 Ce résultat indique que le nombre moyen d’absence est de l’ordre de 1,68 (soit 168 jours d’absence en moyenne par 100 étudiants). 4°) Le nombre d’étudiants ayant un nombre d’absence inférieur à 3 est égal à : 5 8 6 19 . Le nombre d’étudiants ayant un nombre d’absence au plus égal à 3 est : 5 8 6 3 22 . Le nombre d’étudiants ayant un nombre d’absence inférieur à 4 et supérieur ou égal à 1 est: 8 6 3 17 . Exercice 2 Enoncé 2 La répartition de 100 ménages selon leurs dépenses de consommation mensuelles exprimées en dinars se présente comme suit : Classes de dépenses Nombre de ménages [20-40[ 15 [40-60[ 20 [60-100[ 20 [100-200[ 45 4 1°) Quelle est la nature de ce caractère. 2°) Représenter graphiquement cette distribution. 3°) Calculer la moyenne arithmétique. 4°) Déterminer la proportion de ménages ayant des dépenses mensuelles appartenant à l’intervalle suivant x x , x x où x représente la moyenne arithmétique et x désigne l’écart type. Corrigé 2 Le caractère étudié est la dépense de consommation mensuelle. Les modalités sont les classes de dépenses. 1) Le caractère étudié est quantitatif continu. ci ni ci ni ci2 0,15 30 450 13500 0,2 0,2 50 1000 50000 0,2 0,1 80 1600 128000 0,09 150 6750 1012500 9800 1204000 dépenses de consommation mensuelles ni 20-40 15 20 0,15 40-60 20 20 60-100 20 40 100-200 45 Total 100 ai Fréquences fi corrigées f i 100 0,45 c 1 2) La représentation graphique de cette distribution se fait au moyen de l’histogramme. Nous allons représenter l’histogramme des fréquences. Les amplitudes des classes étant inégales, nous devons alors calculer les fréquences corrigées. Pour ce cas, nous retenons la valeur de l’amplitude de référence ai* 20 . f i corrigées 5 fi f a* i 20 ai ai Fréquences corrigées 0,2 Histogramme des fréquences O,15 O,1 0,09 0 20 3) x 40 c n i N i 60 100 200 Classes de dépenses 9800 98 dinars 100 La dépense mensuelle de consommation moyenne par ménage est égale à 98 dinars. 4) Détermination de l’intervalle l’écart type. 1 2 ni ci x ² x N x n c ² x ² i i N x , x x , où x désigne 12040 9604 49,35 dinars D’où l’intervalle x x , x x 98 49,35 , 98 49,35 48,65 , 147,35 Détermination de la proportion P de ménages ayant des dépenses mensuelles appartenant à l’intervalle x x , x x : Par interpolation linéaire, on trouve : F (147,35 ) 0,763 et F (48,65 ) 0,236 6 d’où P F (147,35 ) - F (48,65 ) 0,763 0,236 0,527 52,7% Exercice 3 Enoncé 3 Une étude sur la répartition de 700 exploitations ayant chacune une surface inférieure à 450 ha fournit les informations suivantes : 120 exploitations ont une superficie inférieure à 60 ha 190 exploitations ont une superficie inférieure à 120 ha 250 exploitations ont une superficie inférieure à 180 ha 340 exploitations ont une superficie inférieure à 240 ha 480 exploitations ont une superficie inférieure à 300 ha 520 exploitations ont une superficie inférieure à 360 ha 600 exploitations ont une superficie inférieure à 400 ha Calculer la superficie moyenne. Corrigé 3 Pour calculer la surface moyenne d’une exploitation, nous allons d'abord reporter ces informations dans un tableau statistique : Effectifs Effectifs centres ni ci ni ci cumulés Superficie croissants Ni [0 - 60[ 120 120 30 3600 [60 - 120[ 190 70 90 6300 [120 - 180[ 250 60 150 9000 [180 - 240[ 340 90 210 18900 [240 - 300[ 480 140 270 37800 [300 - 360[ 520 40 330 13200 [360 - 400[ 600 80 380 30400 [400 - 450[ 700 100 425 52500 Total x 700 1 8 1 ni ci 171700 245,28 ha . 700 i 1 700 7 171700 Exercice 4 Enoncé 4 Une enquête statistique chez 1 000 commerçants porte sur le nombre d’heures d’ouvertures hebdomadaire. On a obtenu les résultats suivants : Nombre d'heures Nombre de commerçants [30-35 [ 50 [35-37 [ 100 [37-39 [ 200 [39-40 [ 150 [40-41 [ 120 [41-43 [ n6 [43-45 [ 130 [45-50 [ n8 1°) Déterminer les effectifs n6 et n8 sachant que le nombre moyen d’heures d’ouverture hebdomadaires = 40,38 h ? 2°) Quelles sont les valeurs modale et médiane de cette distribution ? on justifiera chaque réponse ? 3°) En prenant comme hebdomadaire, calculer la distribution ? moyenne provisoire 40h d’ouverture variance puis l’écart type de cette 4°) Le 250ième établissement qui a le moins d’heures d’ouverture hebdomadaire reste ouvert 38h par semaine. Quelle est la durée d’ouverture du 250ième établissement qui a le plus d’heures d’ouverture ? Corrigé 4 1) L’enquête porte sur 1000 commerçants : N 1000 Le nombre moyen d’heures d’ouverture hebdomadaires est égal à 40,38h : x 40,38 N 1000 ci ni 40,38 x N n6 n8 250 n6 150 n8 100 42n6 47,5n8 11050 8 * 2) L’amplitude de référence est : a 1 ni ai fi nicorrigés Fi ci (ci x )2 f i (ci x )2 30-35 50 5 0,05 10 0,05 32,5 56,25 2,8125 35-37 100 2 0,1 50 0,15 36 16 1,6 37-39 200 2 0,2 100 0,35 38 4 0,8 39-40 150 1 0,15 150 0,50 39,5 0,25 0,0375 40-41 120 1 0,12 120 0,62 40,5 0,25 0,03 41-43 150 2 0,15 75 0,77 42 4 0,6 43-45 130 2 0,13 65 0,9 44 16 2,08 45-45 100 5 0,1 20 1 47,5 56,25 5,625 TOT 1000 Nombr e d’heure s 1 13,585 a) Mode et classe modale : La classe modale est la classe ayant la fréquence corrigée la plus élevée. C’est la classe [39 40[ . Ce résultat signifie que pour la majorité des commerçants, le nombre d’heures d’ouverture hebdomadaire est compris entre 39 et 40 heures. Dans ce cas, le mode peut être calculé par : 50 M 0 39 39,625h. 50 30 b) Médiane et classe médiane : La classe médiane est : [39 40[ . Concernant la médiane, on peut lire directement cette valeur dans le tableau ( 4ième ligne): Mé 40h C’est à dire que 50% des commerçants travaillent pendant moins de 40 heures par semaine. 3) En prenant comme moyenne x 40 h , la variance est calculée par : 9 V X f c i i x ² f c i i 40 ² 13,585 et l’écart-type est : X 13,585 3,685 h 4) Le 250ième établissement qui a le moins d’heures d’ouverture hebdomadaire reste ouvert 38 heures par semaine. En d’autres termes 25% des commerçants restent ouverts pendant moins de 38 heures par semaine. Il s’agit du premier quartile : 0,25 0,15 Q1 37 2 38 h 0,35 0,15 La durée d’ouverture du 250ième établissement qui a le plus d’heures d’ouverture correspond au troisième quartile. Déterminons le troisième quartile par la méthode de l’interpolation linéaire : Si Q3 appartient à [41 , 43[ alors : 0,75 0,62 ~ Q3 41 2 42,75 h 0,77 0,62 Exercice 5 Enoncé 5 1°) Soit la série : 5, 50, 50 et 50. Déterminer la moyenne arithmétique, harmonique et géométrique. 2°) Soit la série : 3, 18, 3, et 3. Déterminer la moyenne arithmétique, harmonique et géométrique. 3°) Peut-on déterminer la médiane des deux séries ordonnées suivantes : i) 15, 20, 25, 30, 35 ii) 15, 20, 25, 30, 35, 40 Corrigé 5 1) Les moyennes arithmétique, géométrique et harmonique de la série suivante : 5, 50, 50, 50 sont : 10 x 5 50 50 50 38,75 4 G 4 5 50 50 50 28,11 H 4 1 1 1 1 5 50 50 50 15,38 On remarque que : H G X 2) Les moyennes arithmétique, géométrique et harmonique de la série suivante : 3, 18,3,3 sont : x 6,75 , G 4,7 , H 3,75 3) Détermination de la médiane : i) Soit la série : 15, 20, 25, 30, 35 Série 15 20 25 30 35 Rang (ordre croissant) 1 2 3ième 4 5 Mé 2 observations 2 observations La médiane, dans ce cas, correspond à la troisième valeur : Mé= 25 ii) Soit la série : 15, 20, 25, 30, 35, 40 Série 15 20 Rang (ordre croissant) 1 2 2 observations 25 30 3ième 4ième Intervalle médian 35 40 5 6 2 observations Dans ce cas on parle plutôt d’intervalle médian ]25 , 30], correspondant à la ]troisième valeur , quatrième valeur]. Exercice 6 Enoncé 6 Vous achetez, dans un premier temps, dans une banque (A) des devises étrangères (FF) pour 2000 dinars au cours suivant : 1.900 dinars la 11 devise. Dans un second temps, vous achetez de la banque (B) pour 2000 dinars les mêmes devises (FF) au cours suivant : 1.800 dinars la devise. 1°) Quel est le cours moyen de la devise que vous avez subi entre les deux opérations. 2°) Répondez à la même question si vous achetez 1000 FF dans la banque (A) et 1000 FF dans la banque (B) sachant que les cours restent inchangés. Corrigé 6 1°) Le cours moyen de la devise, dans ce cas, est donné par la moyenne harmonique : Cours moyen montant en dinars montant en FF Cours moyen : H 4000 1,84 dinars la devise 2000 2000 1,9 1,8 2°) Le cours moyen, dans ce cas, est calculé à partir de la moyenne arithmétique : Cours moyen : x (1000 1,9) (1000 1,8) 1,850 dinars la devise 2000 Exercice 7 Enoncé 7 Soient les deux données x1 et x2 distinctes 1°) Classer en justifiant ce classement les moyennes arithmétique x , géométrique G et harmonique H de ces deux données. 2°) Monter que la moyenne géométrique de x1 et x2 est également la moyenne géométrique des deux autres moyennes considérées. 3°) Etablir que la moyenne harmonique H de x1 et x2 est également la moyenne harmonique H de ( H x1 ) et ( H x2 ) . Existe–t-il une propriété équivalente pour la moyenne arithmétique ? 12 Corrigé 7 1°) x x1 x2 , G 2 2 x1 .x2 , H 2 1 1 x1 x2 Ces moyennes vérifient la relation suivante : H G X . En effet : 2 Gx 2 x x2 x x2 x1 .x2 1 x1 .x2 1 ( x1 x2 )2 0 2 2 et 2 H G 2 2 x .x 2 x1 .x2 x1 .x2 x1.x2 1 2 ( x1 x2 )2 0 x1 x2 x1 x2 2) En développant la formule de la moyenne harmonique on aura : 2 x1 x2 x1 x2 2 G2 H 1 1 x1 x2 x1 x2 x1 x2 x x1 x2 x1 x2 2 2 G2 2 On a : H , d’où G x.H G x x.H Ainsi, la moyenne géométrique des données est égale à la moyenne géométrique de deux autres moyennes considérées. Démontrons que En remplacent H par 2 1 1 H x1 H x2 2 1 1 H x1 H x2 H 2 x1 x2 on obtient : x1 x2 2 1 1 2 x1 x2 2 x1 x2 x1 x2 x1 x2 x1 x2 13 2 1 1 x1 x2 x12 x1 x2 x22 x1 x2 x1 x2 2 1 1 x1 ( x2 x1 ) x2 ( x1 x2 ) x1 x2 x1 x2 2 2 x1 x2 1 1 x1 x2 x1 x2 x x x x2 1 1 2 2 x1 x2 H ( C.Q.F.D). x1 x2 Cette propriété n’est pas valable pour la moyenne arithmétique. En effet : Comme x ( x x1 ) ( x x2 ) x1 x2 2 x ( x1 x2 ) 0 , alors 2 2 Exercice 8 Enoncé 8 Dans un atelier, le coût unitaire de la main d’œuvre est de O,500D. Une heure supplémentaire revient à 0,625D (soit 0,500 1,250 ) et le service de paie indique que le coût total des heures supplémentaires représente 30% du coût total de la main d’œuvre. Calculer le coût horaire moyen en indiquant le type de moyenne utilisée. Corrigé 8 Dans ce cas le coût horaire moyen n’est pas la moyenne arithmétique des coûts horaires. En effet, le coût total ( CT ) est composé par les coûts des heures de service ( CT1 )et des coûts des heures supplémentaires ( CT2 ). Par ailleurs, le nombre total d’heures est h h1 h2 , où h1 et h2 désignent respectivement le nombre d’heures de service et le nombre d’heures supplémentaires. h1 CT1 CM 1 CT2 CT2 CT1 et h1 CM 2 0,625 0,500 coût moyen heure de service coût mouen heure sup On a : CT CT1 CT2 avec CT2 0,30 CT et CT1 0,70 CT . Ainsi, le coût horaire moyen est: 14 CT CT CT CT h h1 h2 CT1 CT2 0,7CT 0,3CT CM CM CM CM 1 2 1 2 1 1 0,5319 0,3 0,7 0,3 0,7 0 , 500 0 , 625 CM CM 1 2 H Le coût horaire moyen est donc la moyenne harmonique des différents coûts horaires. Exercice 9 Enoncé 9 Un phénomène économique a un taux annuel d’accroissement de 6% pendant 3 années consécutives, puis de 8% par an pendant 2 années, puis de 5% par an pendant 4 ans, enfin 3% pendant 2 ans. Calculer le taux annuel moyen d’accroissement observé pendant les 11 ans. Corrigé 9 g 1 6% g 2 8% g 3 5% g 4 3% Soit g le taux annuel moyen d’accroissement observé pendant les 11 ans. On détermine ce taux de la manière suivante : 11 1 g 3 2 4 2 1 g1 1 g 2 1 g 3 1 g 4 3 2 4 2 g 11 1 g1 1 g 2 1 g 3 1 g 4 1 3 2 4 2 g 11 1,06 1,08 1,05 1,03 1 1,0543 1 0,0543 Le taux de croissance annuel moyen est à l’ordre de 5,43%. Remarque : (1 g ) est la moyenne géométrique des (1 g i ) . 15 Exercice 10 Enoncé 10 Une entreprise effectue les placements de fonds suivants : 8000 dinars à 3% par jour pendant 115 jours. 12500 dinars à 2% par jour pendant 80 jours. 9500 dinars à 1,75% par jour pendant 55 jours. Calculer le taux journalier moyen résultant de cette série de placements. Corrigé 10 Le taux moyen (g) résultant de cette série de placements est tel que : g1 3% , g 2 2% et g 3 1,75% 250 300001 g 115 80001 g1 80 55 125001 g 2 95001 g 3 1 115 80 55 250 8000 1 g 12500 1 g 9500 1 g 1 2 3 g 1 30000 1 80001,03115 125001,0280 95001,0175 55 250 g 1 30000 Exercice 11 Enoncé 11 Une compagnie de télécommunication étudie la tarification des appels. Le tarif actuel est donné par R 0,12 X 2 où R décrit le tarif et X le temps en minutes d’une communication. On relève pour 100 appels effectués dans une journée, le temps de chaque communication. 16 Temps en mn Nombre d’appels 0 , 10 10 , 20 20 , 30 30 , 60 60 , 90 20 Total 100 50 10 15 5 1) Calculer le tarif moyen par communication. 2) La compagnie se propose d’augmenter ses tarifs. Elle a le choix entre 2 propositions : R1 0,13 X 3 et R2 0,15 X 2,5 Sachant que la compagnie voudrait maximiser son revenu moyen par appel, laquelle des deux formules a-t-elle intérêt à choisir ? Corrigé 11 Temps en mn ci ni ni c i 0 , 10 10 , 20 20 , 30 30 , 60 60 , 90 5 20 100 15 50 750 25 10 250 45 15 675 75 5 375 100 2150 Total 1) Comme la tarification des appels est donnée R 0,12 X 2 , alors Le tarif moyen par communication est R 0,12 X 2 . Par ailleurs, on a: X nc i N i 2150 21,5 . D’où R (0,12 21,5) 2 4,58 100 2) La première alternative donne un revenu moyen par appel égal à : R1 0,13 X 3 (0,13 21,5) 3 5,795 17 3) La deuxième alternative donne un revenu moyen par appel égal à : R2 0,15 X 2,5 (0,15 21,5) 2,5 5,725 . En somme, Si la compagnie voudrait maximiser son moyen par appel, elle doit choisir la première alternative, c’est-à-dire R1 . Exercice 12 Enoncé 12 Dans une entreprise A travaillent 20 hommes et 10 femmes. Dans l’entreprise B, ces effectifs sont respectivement 30 et 20. Les salaires moyens sont donnés par le tableau suivant: Hommes Femmes Entreprise A 600 D 550 D Entreprise B 650 D 500 D Quelle est l’entreprise qui offre le salaire moyen le plus élevé ? Corrigé 12 Pour calculer le salaire moyen le plus élevé, il faut calculer le salaire moyen dans l'entreprise A et celui dans l’entreprise B. Soit x H et x F le salaire moyen des hommes et des femmes respectivement. i) Pour l'entreprise A : xA n F x F n H x H 20 600 10 550 583,33 dinars nF nH 20 10 ii) Pour l'entreprise B xB n F x F n H x H 30 650 20 50 410 dinars nF nH 30 20 On remarque que x A x B l'entreprise A offre un salaire moyen plus élevé que l'entreprise B. 18 Exercice 13 Enoncé 13 Une entreprise E est composée de trois établissements, E1 , E 2 et E 3 . L’effectif n1 de E1 est de 40 salariés. Le salaire mensuel moyen dans E1 est x1 90. L’écart type de la distribution des salaires dans E 1 est 1 10 . Pour E 2 on a: n2 50, x 2 80, 2 15, et E 3 on a n3 30, x3 75, 3 5. Calculer la variance inter-établissements, intra-établissement et la variance totale des salaires. Commenter. Corrigé 13 On a : n1 40, x1 90, 1 10 n2 50, x2 80, 2 15 n3 30, x3 75, 3 5. Il faut tout d'abord calculer la moyenne x dans E. x 1 n1 x1 n2 x2 n3 x3 avec N n1 n2 n3 N x 1 (40 90) (50 80) (30 75) 82,08 120 La variance inter-établissements des salaires (la variance des moyennes): V xi 1 n1 ( x1 )2 n2 ( x2 )2 n3 ( x3 )2 ( x )2 35,79 N La variance variances): V xi intra-établissement des salaires 1 n1 V x1 n2 V x1 n3 V x1 133,33 N On remarque que : V x V x . 19 (la moyenne des La variance totale des salaires : V x V x V x =169,12 Commentaire : La dispersion totale des salaires =169,12. Celle ci s'explique en grande partie par la dispersion des salaires au sein de chaque établissement car V x V x . La dispersion des salaires entre les établissements est faible par rapport à la dispersion des salaires à l'intérieure d'un même établissement. Exercice 14 Enoncé 14 On a relevé les températures ( x ) maximales suivantes dans certaines villes françaises: le 01/01/1999. Les classes de température Nombre de villes Moins de 2° 10 2 4 20 4 6 10 6 9 7 9°et plus n5 1) Calculer la valeur de n5 sachant que i 5 i 1 n i x i2 1715,75 . 2) Déterminer le mode et la classe modale de cette distribution. 3) Quelle est la forme de la distribution des températures? Justifier votre réponse. 4) Quelle est la variance des températures. Corrigé 14 On a : i 5 i 1 ni x 2 1715,75 , où xi désigne le centre de classe. i Avant de calculer n5 , il faut préciser la borne inférieure de la première classe et la borne supérieure de la dernière classe. La borne inférieure de la première classe est égale à 0 (afin d’avoir la même amplitude que celle de la deuxième). La borne supérieure de la 20 dernière classe est égale à 12 (pour avoir la même amplitude que celle de l’avant dernière classe). Ainsi, x1 Comme 02 9 12 1 et x5 10,5 2 2 i 5 i 1 ni x 2 1715,75 , i 10 12 20 3 2 10 5 2 7 7,5 2 n5 10,5 2 1715,75 alors n5 8 classes ni xi ai di centres 0 2 2 4 4 6 6 9 9 12 Effectifs cumulés a*=6 Ni ni xi 10 1 2 10 30 10 10 20 3 2 20 60 30 60 10 5 2 10 30 40 50 7 7,5 3 4,66 14 47 52,5 8 10,5 3 5,33 16 55 84 Total Effectifs c corrigés ni 55 256,5 2) Mode et classe modale : La classe modale est la classe ayant l’effectif corrigé le plus élevé. C’est la classe [2 4[ . Ce résultat signifie que pour la majorité des villes françaises, la température maximale enregistrée le 01/01/1999 est supérieure ou égale à 2° et strictement inférieure à 4°. Dans ce cas, le mode peut être calculé par : 30 M 0 2 2 3. 30 30 3) Pour répondre à cette question, nous allons comparer la moyenne et la médiane. Mé 2 27 ,5 10 2 3,75 et 30 10 21 x 1 N 5 n x i i 1 i 256,5 4,66 55 Comme Mé x La distribution est oblique à gauche. 4) La variance des températures : V x ( 1 N 5 n x i 2 i ) x2 i 1 1 1715,75 4,66 2 9,479 . 55 Exercice 15 Enoncé 15 Le tableau suivant la distribution des salaires journaliers dans une entreprise. Classes (dinars) Effectifs cumulés croissants [4-10[ 30 [10-14[ 55 [14-16[ 70 [16-20[ 90 [20-26[ 100 1°) Déterminer la médiane et le mode de cette distribution. 2°) Déterminer la variance et l’écart-type des salaires. 3°) Que peut-on dire de la concentration des salaires dans cette entreprise Corrigé 15 22 Classe n i Fi fi ai f i / ai xi f i xi f i xi2 Qi Qi 1 f i (Qi Qi 1 ) s [4-10[ 30 0,30 0,30 6 0,05 7 2,1 14,7 0,16 0 0,048 [10-14[ 55 0,55 0,25 4 0,062 12 3 36 0,39 0,16 0,1375 [14-16[ 70 0,70 0,15 2 0,075 15 2,25 33,75 0,56 0,39 0,1425 [16-20[ 90 0,90 0,20 4 0,05 18 3,6 64,8 0,83 0,56 0,278 0,016 23 2,3 52,9 1 0,83 0,183 [20-26[ 100 1 0,10 6 13,25 202,15 1 Total 0,789 1) -La médiane est : Mé [10 14[ Mé 10 0,5 0,30 (14 10) 13,2 D 0,55 0,30 50% des salariés gagnent moins de 13,2D par jour. - Le mode est : Mo [14 16[ Mo 14 0,0125 (16 14) 14,66 D 0,0125 0,025 Le salaire journalier le plus fréquent est de 14,66D 2) - La variance et l’écart-type des salaires sont : x fx V ( x) i 13,25 i fx i 2 i x 2 202,15 13,25 2 26,58 x 5,15 3) -La concentration des salaires est faible. : I G 1 f i (Qi Qi 1 ) 1 0,789 0,21 21% 23 Exercice 16 Enoncé 16 La distribution des salaires par semaine de 80 employés dans une entreprise est donnée dans le tableau suivant : Classes des salaires (en dinars) [6-14[ [14-22[ [22-30 [30-38[ [38-46[ Fréquences cumulées croissantes 0,1 0,25 0,375 0,5625 1 1) Quel est le nombre d’employés qui gagnent moins de 30D ? 2) Calculer le salaire moyen. Corrigé 16 classes Fi fi ni ni xi ni x i [6 - 14[ 0,10 0,10 8 8 10 80 [14 - 22[ 0,25 0,15 12 20 18 216 [22 - 30[ 0,375 0,125 10 30 26 260 15 45 34 510 0,4375 35 80 42 1470 1 80 [30 - 38[ 0,5625 0,1875 [38 - 46[ 1 Total 2536 1) D’après ce tableau, on peut facilement remarquer qu’il y a 30 employés qui gagnent moins de 30D. i k n x i 2) X i 1 n i 2536 31,7 D 80 Exercice 17 Enoncé 17 Les données suivantes donne la distribution des impôts nets payés par 1000 contribuables d’une région donnée: 24 Impôts nets Contribuables en % [0 , 100[ 12 [100 , 300[ 18 [300 , 500[ 25 [500 , 700[ 20 [700 , 1000[ 12 [1000 , 1200[ 6 [1200 , 1500[ 4 [1500 , 2000[ 3 1°) Calculer le montant total des impôts payés par l’ensemble des contribuables. 2°) Sachant que l’impôt moyen de l’ensemble des contribuables est de 536,5 D et que l’impôt moyen de ceux qui payent moins de 1000 D d’impôts est de 418,39 D, en déduire l’impôt moyen de ceux qui payent plus de 1000 D d’impôt. Corrigé 17 Impôts nets f i en % ni xi ni xi [0 , 100[ 12 120 50 6000 [100 , 300[ 18 180 200 36000 [300 , 500[ 25 250 400 100000 [500 , 700[ 20 200 600 120000 [700 , 1000[ 12 120 850 102000 [1000 , 1200[ 6 60 1100 66000 [1200 , 1500[ 4 40 1350 54000 [1500 , 2000[ 3 30 1750 52500 Total 1000 536500 1) Le montant total des impôts payés par les contribuables est : 8 n x i i 536500 dinars. i 1 25 2) On note par x F le montant moyen de l’impôt pour la catégorie des contribuables payant moins de 1000 D d’impôts et par x S le montant moyen de l’impôt pour la catégorie des contribuables payant un montant supérieur ou égal à 1000 D. D’après le tableau, il y a 87% des contribuables qui payent moins de 1000 D d’impôts. En appliquant la formule de la moyenne d’une population constituée de deux sous-échantillons, on a: x 1 (n S x S n F x F ) avec N nS n F . N Comme x 536,5 D et x F 418,39 alors : x nS x S nF x F f S x S f F x F 536,5 (1 0,87) x S 0,87 x F N 536,5 0,13 x S (0,87 418,39) x S 1326,92 L’impôt moyen de ceux qui payent plus de 1000 D d’impôt est de 1326,92D. Exercice 18 Enoncé 18 Le tableau suivant donne la distribution des salaires dans une entreprise. Salaires en dinars Effectifs cumulés croissants Ni [200 – 400[ 15 [400 – X [ 43 [X - 900[ 73 [900 - 1100[ 87 [1100 - Y [ 100 1) Déterminer X sachant que le salaire médian est égal à 594 D. 2) En retenant la valeur X obtenue et sachant que le salaire moyen des 100 personnes est de 683,5 D, calculer Y. 26 Corrigé 18 Classes Eff. cumulés croissants Ni ni ci ni ci [200 – 400[ 15 15 300 4500 [400 – 500[ 43 28 450 12600 [500 –900[ 73 30 700 21000 [900 – 1100[ 87 14 1000 14000 [1100 -1500[ 100 13 1250 16250 Total 1) Calcul de X . 100 68350 N 50 . Donc, la classe médiane est [ X 900[ , 2 Mé X 50 43 594 X 50 43 X 500 900 Mé 73 50 900 594 73 50 2) Calcul de Y. Le salaire moyen est égal à 683,5 D : i 5 1 i 5 n c 683 , 5 ni ci N 683,5 100 683,5 68350 i i i 1 N i 1 n1c1 n2 c2 ......... n5 c5 68350 x 1100 y n1c1 n2 c2 ......... n5 ( ) 68350 Y 1400 2 Exercice 19 Enoncé 19 Soit la distribution suivante des salaires d’une entreprise. On note par ni les effectifs correspondant en nombre de salariés et F (x ) la fonction de répartition de cette distribution. 27 Classes des salaires F (x ) [500-700[ 0,04 [700-1100[ 0,14 [1100-1300[ 0,44 [1300-1500[ 0,96 [1500-1900[ 1 Total Sachant que V x 4,93 ; f i xi 166,22 et 2 n x i i 1905 1) Calculer l’effectif de chaque classe ainsi que l’effectif total. 2) Cette distribution est-elle symétrique ? 3) Calculer l’indice de Gini et juger de la concentration des salaires de cette entreprise. Corrigé 19 Il faut faire attention à l’unité de mesure (dinars). On a : V x 4,93 ; f i xi 166,22 et ni xi 1905 . Ces valeurs correspondent à des salires en centaine de dinars alors que dans le tableau, les classes des salaires sont exprimées en dinars. 2 f i Fi x Fi 1 x avec F5 x 1 et Fo x 0 ni xi ni x i Classes des salaires Fi fi ni xi nixi [500-700[ 0,04 0,04 6 600 3600 0,0189 0,0189 0,0008 [700-1100[ 0,14 0,10 15 900 13500 0,0709 0,0898 0,0109 [1100-[1300[ 0,44 0,30 45 1200 54000 0,2835 0,3732 0,1389 [1300-1500[ 0,96 0,52 78 1400 109200 0,5732 0,9465 0,6862 [1500-1900[ 1 0,04 6 1700 10200 0,0535 1,0000 0,0779 190500 1,0000 Total 150 qi Qi A partir de la colonne des fréquences relatives, on constate que 28 f i (Qi Qi 1 ) 0,9146 f1 f 5 n1 n5 et f 3 3 f 2 n3 3n2 D’une part on a : fx i 2 i V x f i xi2 ( x )2 49300 , d’autre part : 1662200 Il vient donc : ( x )2 fx i 2 i V x 1662200 49300 1612900 Ainsi : x 1270 Par ailleurs, d’où n x i N N i x 1270 N n x i i x 190500 150 1270 L’effectif total est donc égal à 150 salariés. A partir de l’effectif total on peut retrouver l’effectif de chaque classe : n1 f1 N n1 0,04 150 6 n1 6 n5 6 car n1 n5 n2 f 2 N n2 0,10 150 15 n2 15 . n3 3n2 n3 45 . n4 f 4 N n4 0,52 150 78 . 2) Cette distribution n’est pas symétrique car : Mé x . On peut 1323 calculer d’autre indicateurs en se basant sur les quartiles . Q1 940 , Mé 1323 , Q3 1419,23 3) L’indice est donné par : p I G 1 f i (Qi Qi 1 ) i 1 l’indice de Gini est égal à : I G 1 0,9146 0,0854 . 29 1270 On peut dire qu’il y a une faible concentration des salaires dans cette entreprise. Exercice 20 Enoncé 20 Reconstruisez la répartition des 150 ha sur les exploitations agricoles, selon des classe de surface d’amplitudes égales. On donne : Ni : effectifs cumulés 4 7 9 10 2 15 6,5 15 11,5 15 1 croissants Qi Valeurs globales relatives cumulées croissantes Corrigé 20 D’après l’énoncé on a : Le nombre total des exploitations est égal à 10 : N La superficie totale est égale à 150 : VGT n x i i n i 10 . 150 . Reconstruire la distribution de ces exploitations agricoles revient à retrouver les 4 classes de surface ainsi que les effectifs correspondants 30 Ni ni i Qi qi ni x qi ni xi ni xi n i xi 150 qi Centre de classe xi Classes des salaires ni x i ni 4 4 2 15 2 15 20 5 [0 - 10[ 7 3 6,5 15 6,5 2 15 15 45 15 [10-20[ 9 2 11,5 15 11,5 6,5 15 15 50 25 [20-30[ 10 1 1 35 35 [30-40[ 1 10 11,5 15 1 150 Total Exercice 21 Enoncé 21 Dans un village, on a relevé les superficies (en hectares) des exploitations agricoles selon le nombre d’exploitants (propriétaires) : Superficies ni (hectares) [0-5[ 110 [5-10[ 150 [10-15[ 90 [15-20[ 130 [30-40[ 60 [40-50[ 50 [50-100[ 40 [100-200[ 20 Total 650 31 1°) Tracer l’histogramme des effectifs. Calculer le mode, la médiane et la variance de cette distribution. 2°) Tracer les courbes des fréquences cumulées croissantes (fonction de répartition) et décroissantes sur le même graphique. Représenter le point l’intersection des deux courbes. 3°) Calculer les trois quartiles, ainsi que le 1er et le 9ième décile. Donner une interprétation de chacun de ces paramètres. 4°) Calculer la médiale et donner son interprétation. En vous basant sur la différence Mle Mé , que peut-on dire sur la concentration ? 5°) Tracer la courbe de concentration et calculer l’indice de concentration (Indice de Gini). Que peut-on conclure ? 6°) Calculer le pourcentage p1 des propriétaires qui ont des exploitations dont la surface est comprise entre 13 et 18 hectares ? 7°) Quelle est la surface totale possédée par les 10% les plus riches ? Corrigé 21 1°) D’abord, il faut compléter le tableau par l’insertion d’une classe [20 - 30[ ayant un effectif égal à 0. Pour tracer l’histogramme des effectifs, il faut calculer les effectifs corrigés. Nous avons choisit comme * amplitude de référence : ai 5 . nicorrigées 32 ni n a* i 5 ai ai Superficie en ha ni ci ai ni fi Fi Gi fréquences cumulées croissante s fréquences cumulées décroissantes ni ci ni ci2 corrigé s [0 – 5[ 110 2,5 5 110 0,17 0,17 1 275 687,5 [5 – 10[ 150 7,5 5 150 0,23 0,40 0,83 1125 8437,5 [10 – 15[ 90 12,5 5 0,14 0,54 0,60 1125 14062,5 130 17,5 5 130 0,20 0,74 0,46 2275 39812,5 [15 – 20[ 90 [20– 30[ 0 25 10 0 0,00 0,74 0,26 0 0 [30 – 40[ 60 35 10 30 0,09 0,83 0,26 2100 73500 [40 – 50[ 50 45 10 25 0,08 0,91 0,17 2250 101250 [50 – 100[ 40 75 50 4 0,06 0,97 0,09 3000 225000 [100 – 200[ 20 150 100 1 0,03 1,00 0,03 3000 450000 Total 650 15150 912750 1,00 a) Mode et classe modale : La classe modale est la classe ayant l’effectif corrigé le plus élevé. C’est la classe [5 10[ . Ce résultat signifie que la plupart des exploitations ont une superficie comprise entre 5 et 10 hectares. Dans ce cas, le mode peut être calculé par : 40 M 0 5 5 7 ha. 60 40 b) Médiane et classe médiane : La classe médiane est : [15 10[ . Concernant la médiane, on peut la calculer par interpolation linéaire : 0,5 0,4 Mé 10 5 13,57 ha. C’est à dire que 50% des 0 , 54 0 , 4 exploitations ont une superficie inférieure à 13,75 hectares. 33 c) Moyenne : x c n i i N 15150 23,3 hectares 650 La superficie moyenne d’une exploitation est de 23,3 hectares. Effectifs corrigés 150 130 110 90 Histogramme des effectifs 30 25 4 1 0 5 10 15 20 30 40 50 100 200 Superficie 2°) Les courbes des fréquences cumulées croissantes et décroissantes: Fréquences cumulées croissantes 1,2 1 0,8 0,6 0,5 0,4 Fréquences cumulées décroissantes 0,2 0 0 5 10 15 20 30 40 34 50 100 200 Superficie en ha ni ci fi Fi nici [0 – 5[ 110 2,5 0,17 0,17 275 [5 – 10[ 150 7,5 0,23 0,40 [10 – 15[ 90 12,5 0,14 130 17,5 [15 – 20[ ni ci ni ci Qi f i (Qi Qi 1 ) 0,018 0,018 0,003 1125 0,074 0,092 0,026 0,54 1125 0,074 0,167 0,036 0,20 0,74 2275 0,150 0,317 0,097 qi [20– 30[ 0 25 0,00 0,74 0 0,000 0,317 0,000 [30 – 40[ 60 35 0,09 0,83 2100 0,139 0,455 0,071 [40 – 50[ 50 45 0,08 0,91 2250 0,149 0,604 0,081 [50 – 100[ 40 75 0,06 0,97 3000 0,198 0,802 0,087 [100 – 200[ 20 150 0,03 1,00 3000 0,198 1,000 0,055 Total 650 15150 1,000 1,00 0,456 3°) Calcul des trois quartiles, ainsi que le 1er et le 9ième décile : Le premier quartile Q1 appartient à [5 , 10[ alors : 0,25 0,17 Q1 5 5 6,74 hectares 0,4 0,17 Ce qui signifie que 25% des exploitations ont une superficie inférieure à 6,75 hectares. Le troisième quartile Q3 appartient à [30 , 40[ alors : 0,75 0,74 Q3 30 10 31,11 hectares 0,83 0,74 Ce qui signifie que 75% des exploitations ont une superficie inférieure à 31,11 hectares. Le premier décile : 0,10 0 D1 [0 5[ D1 0 5 5,58 hectares 0,17 0 35 Ce qui signifie que 10% des exploitations ont une superficie inférieure à 5,58 hectares. Le 9ième décile D9 appartient à [40 , 50[ alors : 0,9 0,83 D9 40 10 48,75 hectares 0 , 91 0 , 83 Ce qui signifie que 90% des exploitations ont une superficie inférieure à 48,75 hectares. 4°) Le calcul de la médiale par interpolation linéaire donne : Mle 40 0,50 0,455 50 40 0,604 0,455 0,50 0,455 Mle 40 10 43,02ha 0,604 0,455 On interprète en disant que les exploitations qui ont individuellement moins de 43,02 ha totalisent 50% de la superficie totale. L’écart médiale-médiane M est égale à : M Mle Mé 43,02 13,57 29,45ha M 29,45 0,147 étendue 200 L’écart médiale-médiane représente 14,7% de l’étendue. Ceci indique que la concentration est assez forte. 5) L’indice de Gini est égal à : I G 1 0,456 0,544 . Cette valeur de l’indice indique que la concentration est assez forte. 6°) Le pourcentage p1 des propriétaires qui ont des exploitations dont la surface est comprise entre 13 et 18 hectares est : p1 2 3 (0,14) (0,20) 0,176 17,6% 5 5 7°) Le 9ième décile D9 48,75 ha indique que 90% des exploitations ont 36 une superficie inférieure à 48,75 ha. En d’autres termes les 10% les plus riches ont individuellement des exploitations dont la superficie est supérieure à 48,75 ha. On peut déterminer, par interpolation linéaire, la proportion de la surface totale possédée par les 90% des exploitations dont la surface est inférieure à 48,75 ha. 40 0,455 48,75 Q(48,75) 50 0,604 Q(48,75) 0,455 48,75 - 40 0,604 0,455 50 - 40 d’où Q(48,75) 0,455 (0,604 0,455) 48,75 - 40 0,585 50 - 40 Ainsi, la proportion de la surface totale possédée par les 10% les plus riches est égale à : 1 Q(48,75 ) 1 0,585 0,415 Par conséquent, la surface totale possédée par les 10% des exploitants les plus riches est : 0,415 15150 6287,25 ha Exercice 22 Enoncé 22 1) La distribution des salaires annuels nets en 1998 dans les secteurs privé et semi-public est telle que : 44% des salariés gagnent moins de 100 D. 52% des salariés gagnent moins de 142 D. 2) Déterminer, par interpolation linéaire, le salaire médian de la distribution On note par D1 , D2 ,...D9 les déciles de cette distribution. On connaît, pour chaque classe de salaire définie à partir des déciles, la masse des salaires versée à chaque classe divisée par le nombre total N de salariés, Soit Mi . Cette information est donnée dans le tableau suivant : N 37 Mi N Classe de salaires 12 D1 [ D1 , D2 [ [ D2 , D3 [ [ D3 , D4 [ [ D4 , D5 [ [ D5 , D6 [ [ D6 , D7 [ [ D7 , D8 [ [ D8 , D9 [ D9 25 27,5 32,5 37 40 44 45 52 60 a) Trouver le salaire moyen de la distribution b)Sachant qu’il était égal à 300 dinars en 1980, calculer le taux d’accroissement annuel moyen du salaire moyen. c) Nous cherchons à déterminer la courbe de concentration des salaires. Calculer Fi et Qi (fréquences cumulées croissantes et valeurs globales relatives cumulées croissantes). d) Déterminer la proportion de la masse salariale versée aux salariés qui gagnent moins que le salaire médian. Corrigé 22 44% des salariés gagnent moins de 100 D. , alors le 52% des salariés gagnent moins de 142 D. 1) sachant que : salaire médian peut être déterminé par interpolation linéaire : Mé 100 2) a) x i b) La 142 100 (0,50 0,44) 131,5 dinars 0,52 0,44 Mi 375 dinars N période 1980-1998 couvrent 18 ans. Donc, d’accroissement annuel moyen du salaire moyen est : g 18 le taux 375 1 300 c) Pour déterminer les valeurs globales relatives cumulées croissantes 38 Qi , il faut d’abord, retrouver les valeurs globales relatives qi . On a : Mi nx Mi qi i i N . ni x i M i M i N Pour la détermination des fréquences cumulées croissantes Fi , il suffit de constater que les bornes supérieures des classes correspondent aux différents déciles ( on connaît, par exemple, pour la première ligne, que la proportion des individus qui ont un salaire inférieur à D1 .est égale à 0,10. De même, pour la deuxième ligne, la proportion des individus qui ont un salaire inférieur à D2 .est égale à 0,20, ainsi de suite. Classe de salaires D1 [ D1 , D2 [ [ D2 , D3 [ [ D3 , D4 [ [ D4 , D5 [ [ D5 , D6 [ [ D6 , D7 [ [ D7 , D8 [ [ D8 , D9 [ D9 Mi N Mi cumulées N qi Qi Fi 12 croissantes 12 0,03 0,03 0,10 25 37 0,07 0,10 0,20 27,5 64,5 0,07 0,17 0,30 32,5 97 0,09 0,26 0,40 37 134 0,10 0,36 0,50 40 174 0,10 0,46 0,60 44 218 0,12 0,58 0,70 45 263 0,12 0,70 0,80 52 315 0,14 0,84 0,90 60 375 0,16 1,00 1,0 c) La proportion de la masse salariale versée aux salariés qui gagnent moins que le salaire médian est égale à 0,36 ou 36% (c’est la valeur de Qi correspondant à Fi 0,5 . Exercice 23 Enoncé 23 Les salariés de l’entreprise DJAZ produisant des bijoux sont répartis en trois catégories : Cadre, employés et ouvriers. Afin d’étudier la dispersion et la concentration des salaires, nous avons collecter de l’information qui concerne les trois catégories (h) de salariés, que nous présentons dans deux tableaux. 39 On note par D1 , D2 ,...D9 les déciles de cette distribution, et par Q1 , Q2 et Q3 les quartiles de cette distribution. On connaît, pour chaque classe de salaire définie à partir des déciles et des quartiles, la masse des salaires versée à chaque classe de salaire, soit M h . nh Mh n hi xhi i 1 Classes de salaire Masse salariale (toutes (dinars) catégories confondues) D1 1500 [ D1 , Q3 [ 2500 [Q3 , D7 [ 5500 [ D7 , Q3 [ [Q3 , D9 [ 3000 D9 3500 Cadres Employés Ouvriers 5 15 30 3500 6000 7500 Effectifs n h nh Mh n hi xhi i 1 nh Sh n hi xhi2 2450125 2400135 1875480 i 1 1°) Déterminer la valeur du tableau. Ensuite, calculer le salaire moyen pour chaque catégorie de salariés. 2°) Déterminer l’effectif de la première classe de salaire et l’effectif de la deuxième classe de salaire. 3) Calculer l’écart-type du salaire pour chaque catégorie de salariés. 4°a) Déterminer le salaire moyen dans cette entreprise. 4°b) Déterminer la variance des salaires entre les catégories de salariés. (variance inter-catégories) 4°c) Déterminer la variance des salaires à l’intérieur des catégories de 40 salariés. (variance intra-catégories). 4°d) Déduire à partir de (4 b) et (4 c) l’écart-type des salaires de cette entreprise. 5°) Nous cherchons à déterminer la courbe de concentration des salaires de cette entreprise. Calculer Fi et Qi . Corrigé 23 1°) Détermination de la valeur : La masse salariale globale est égale à : 3500 6000 7500 17000 . Elle est aussi égale, en faisant la somme des lignes de la deuxième colonne du premier tableau, à 16000 . D’où, 1000 . 2°) Pour déterminer l’effectif de la première classe de salaire et l’effectif de la deuxième classe de salaire, il suffit de constater que la première classe ( D1 ) contient 10% de l’effectif total, et que la deuxième classe ( [ D1 , D3 [ ) contient 20% de l’effectif total. L’effectif total étant égale à : 5 15 30 50 . Donc, l’effectif de la première classe est égal à 5. Celui de la deuxième classe de salaire est égal à 10. 3) Pour calculer l’écart-type du salaire de chaque catégorie de salariés, nous allons compléter le deuxième tableau : Cadres Employés Ouvriers 5 15 30 3500 6000 7500 Effectifs n h nh Mh n hi xhi i 1 nh Sh n hi xhi2 2450125 2400135 1875480 i 1 Vh Sh M ( h )2 N N h Vh 25 9 16 5 3 4 4°a) Le salaire moyen de l’entreprise est : x M N h 3500 6000 7500 17000 340 dinars 50 50 41 4°b) La variance des salaires entre les catégories de salariés. (variance inter-catégories) est égale à la variance des moyennes: VM 1 n1 ( x1 )2 n2 ( x2 )2 n3 ( x3 )2 ( x )2 N 1 5(700)2 15(400)2 30(250)2 (340)2 18900 50 4°c) La variance des salaires à l’intérieur des catégories de salariés. (variance intra-catégories). C’est la moyenne des variances MV 1 n1 V x1 n2 V x1 n3 V x1 N 1 (5 25) (15 9) (30 16) 14,8 50 4°d) L’écart-type des salaires de cette entreprise est : x MV VM 18900 14,8 137,53 dinars. 5°) Pour la détermination des fréquences cumulées croissantes Fi , il suffit de constater que les bornes supérieures des classes correspondent aux différents déciles ( on connaît, par exemple, pour la première ligne, que la proportion des individus qui ont un salaire inférieur à D1 .est égale à 0,10. De même, pour la troisième ligne, la proportion des individus qui ont un salaire inférieur à Q3 .est égale à 0,75, ainsi de suite. Classes de salaire nh Mh n hi xhi qi i 1 Mh 17000 Qi Fi D1 [ D1 , D3 [ [Q3 , D7 [ [ D7 , Q3 [ [Q3 , D9 [ D9 1500 0,089 0,089 0,10 2500 0,147 0,236 0,30 5500 0,323 0,559 0,70 1000 0,059 0,618 0,75 3000 0,177 0,795 0,9 3500 0,205 1 1 Total 17000 1 42 Exercice 24 Enoncé 24 L’indice trimestriel du coût de la construction de bâtiment a connu l ‘évolution suivante base 100 au mois d’août 1998. Troisième trimestre 1998 Mois Indices élémentaires Quatrième trimestre 1998 Août Sept. Oct. Nov. Premier trimestre 1999 Déc. Janv. Fév. 1434 1428 1458 1488 1494 1503 1509 1°) Calculer les taux de croissance mensuel successifs de l’indice. 2°) Déterminer le taux de croissance mensuel moyen sur l’ensemble de la période. 3°) Calculer le taux de croissance global. Corrigé 24 1°) D’une manière générale, le taux de croissance mensuel entre deux mois successifs est donné par : g C f Ci Ci , avec C i et C f respectivement les coûts pendant le mois initial et le mois final. Les taux de croissance mensuels successifs de l’indice sont : Le taux de croissance mensuel entre le mois d’août et le mois de septembre 1998 est : g1 1428 1434 0,418% 1434 Ceci traduit une diminution de 0,418% de l’indice mensuel du coût de construction de bâtiment. Le taux de croissance mensuel entre le mois de septembre 1998 et le mois d’octobre 1998 est : g2 1458 1428 2,1% 1428 43 Ceci traduit une augmentation de 2,1% de l’indice mensuel du coût de construction de bâtiment. Le taux de croissance mensuel entre le mois d’octobre 1998 et le mois de novembre 1998 est : g3 1488 1458 2,057% 1458 Ceci traduit une augmentation de 2,057% de l’indice mensuel du coût de construction de bâtiment. Le taux de croissance mensuel entre le mois de novembre et le mois de décembre 1998 est : g4 1494 1488 0,403% 1488 Le taux de croissance mensuel entre le mois de décembre 1998 et le mois de janvier 1999 est : g5 1503 1494 0,602% 1494 Le taux de croissance mensuel entre le mois de janvier 1999 et le mois de février est : g6 1509 1503 0,399% 1503 2°) Le taux de croissance mensuel moyen sur l’ensemble de la période est : gm 7 C fév 99 C août 98 1 7 1509 1 0,73% 1434 Sur l’ensemble de la période le taux de croissance a été en moyenne et par mois égal à 3°) Le taux de croissance global sur toute la période est : G 1509 1434 5,23% 1434 En somme, le taux de croissance global s’élève à 5,23 : 44 Exercice 25 Enoncé 25 Le tableau suivant donne les indices élémentaires pour trois biens de 1998 par rapport à 1997 et les coefficients budgétaires correspondants. Indices élémentaires Coefficients budgétaires en % i I 98 ( p) / 97 Biens W97i W98i A 120 25 20 B 135 40 30 C 105 35 50 100 100 Total 1°) Calculer les indices de Laspeyres, de Paasche et de Fisher de 1998 par rapport à 1997 de ces trois biens. Corrigé 25 1) Calcul des indices i) Indice de Laspeyres i 5 P 98 / 97 L i 97 W i I 98 / 97 ( p ) i 1 (0,25 120 ) (0,4 135 ) (0,35 105 ) 120,75 ii) Indice de Paasche 1 i 5 P 98 / 97 P (0,20 i 98 W i 1 1 I i 98 / 97 ( p) 1 1 1 ) (0,3 ) (0,5 ) 0,00865 120 135 105 P D’où : P98 / 97 115,6 iii) Indice de Fisher F98p / 94 p P98p / 97 L98 / 97 118,147 45 Exercice 26 Enoncé 26 Un agriculteur mobilise deux exploitations agricoles pour produire trois légumes différents. Le tableau suivant indique, pour ces deux exploitations, les coûts et les quantités produites de légumes par hectare. Quantités Prix Légumes Exploitation 1 Exploitation 2 Exploitation 1 Exploitation 2 A 250 150 2,4 3,04 B 250 200 3,35 4,5 C 350 300 4,2 4,5 1°) Calculer les indices de prix de Laspeyres et de Paasche de l’exploitation 2 par rapport à l’exploitation 1 sur l’ensemble de ces trois légumes. 2°) Calculer les indices de quantité de Laspeyres et de Paasche de l’exploitation 2 par rapport à l’exploitation 1 sur l’ensembles de ces trois légumes. 3°) Calculer les indices de prix de Laspeyres et de Paasche de l’exploitation 1 par rapport à l’exploitation 2 sur l’ensemble de ces trois légumes. 4°) Calculer les indices de quantité de Laspeyres et de Paasche de l’exploitation 1 par rapport à l’exploitation 2 sur l’ensemble des ces trois légumes. Corrigé 26 Bien 1995 : (0) 1998 : (t) p1 q1 p2 q2 A 2,4 250 3,04 150 600 B 3,35 250 4,5 200 C 4,2 350 4,5 300 Total p1q1 p1q2 p2q1 p2q2 360 760 456 875 700 1125 900 1470 1260 1575 1350 2945 2320 3640 2706 1) Indice de prix de Laspeyres de l’exploitation 2 par rapport à 46 l’exploitation 1 sur l’ensemble de ces trois légumes: i 3 L2p /1 i 2 p q1i i 1 i 3 100 i 1 i 1 pq 3640 100 123,6 2945 i 1 Indice de prix de Paasche de l’exploitation 2 par rapport à l’exploitation 1 sur l’ensemble de ces trois légumes : i 3 P2p/1 p i 2 q2i i 1 i 3 100 i 1 pq i 2 2706 100 116,64 2320 i 1 2) Indice de quantité de Laspeyres de l’exploitation 2 par rapport à l’exploitation 1 sur l’ensembles de ces trois légumes.: i 3 i 1 Lq2 /1 pq i 2 i 1 i 3 100 i 1 i 1 pq 2320 100 78,8 2945 i 1 Indice de quantité de Paasche de l’exploitation 2 par rapport à l’exploitation 1 sur l’ensembles de ces trois légumes.: i 3 P2q/1 p i 2 q 2i i 1 i 3 p 100 i 2 q1i 2706 100 74,34 3640 i 1 3) Indice de prix de Laspeyres de l’exploitation 1 par rapport à l’exploitation 2 sur l’ensembles de ces trois légumes.: i 3 i 1 L1p/ 2 pq i 2 i 1 i 3 p 100 i 2 q 2i 2320 100 85,73 2706 i 1 Indice de prix de Paasche de l’exploitation 1 par rapport à l’exploitation 2 sur l’ensembles de ces trois légumes: 47 i 3 i 1 P1/p 2 i 1 pq i 1 i 3 100 p i 2 q1i 2945 100 80,9 3640 i 1 4) Indice de quantité de Laspeyres de l’exploitation 1 par rapport à l’exploitation 2 sur l’ensembles de ces trois légumes : i 3 L1q / 2 p i 2 q1i i 1 i 3 100 p i 2 q 2i 3640 100 134,5 2706 i 1 Indice de quantité de Paasche de l’exploitation 1 par rapport à l’exploitation 2 sur l’ensembles de ces trois légumes: i 3 i 1 P1q/ 2 i 1 pq i 1 i 3 100 i 1 pq i 2 2945 100 126,93 2320 i 1 Il est à remarquer les formules suivantes : L1q / 2 100 P2q/1 , L1p/ 2 100 , P2p/1 P1q/2 100 Lq2 /1 , P1/p 2 100 L2p /1 Exercice 27 Enoncé 27 Soit I l’indice de la production annuelle d’une entreprise observée en 1993, 1994, 1995, 1996, 1996, 1997 et 1998. L’année de base étant 1993. On sait que la production a augmenté de 3% entre 93 et 94, de 4% entre 94 et 95, de -2% entre 95 et 96, de 5% entre 96 et 97 et de 8% entre 97 et 98. 1°) Trouver les valeurs de l’indice pour les années 1993, 1994, 1995, 1996, 1996, 1997 et 1998. 2°) Calculer le taux de croissance annuel moyen de la production entre 1993 et 1998. Corrigé 27 1) Les indices élémentaires vérifient la propriété de circularité. D’une manière générale on a : 48 I 1/ 0 I t / t 1 I t 1/ t 2 I t 2 / t 3 I t / 0 100 100 100 100 100 L’année de base étant 1993 alors I 93 100 I 94 / 93 103 1 100 1 I 95 / 93 ) 100 1 I 96 / 93 ) 100 1 I 97 /93 ) 100 1 107,12 100 1 (98 107,12) 104,97 100 1 (105 104,97) 110,22 100 1 (108 110,22) 119 100 I 95 / 93 ( I 95 /94 I 94 / 93 ) I 96 / 93 ( I 96 / 95 I 97 / 93 ( I 97 /96 I 98 / 93 ( I 98 /97 (104 103) 1) Le taux de croissance annuel moyen de la production entre 1993 et 1998, noté g, est tel que : P98 P93 (1 g )5 , où Pi désigne le niveau de production de l’année i. On peut aussi écrire : g 5 P98 1 P93 5 P98 100 P93 1 P93 100 P93 5 I 98 / 93 I 93 Exercice 28 Enoncé 28 On donne le tableau suivant : 49 1 5 119 1 0,0354 3,54% 100 Indices élémentaires Indices élémentaires Pondération Pondération Produits I94/0( p) I98/0(p) W94i W98i A 129 0,2179 164,1 0,2139 B 125,6 0,0378 165,9 0,0377 C 120 0,0815 168 0,0854 D 127 0,3678 155,2 0,3584 E 127,3 0,2950 167,5 0,3046 Total 1 1 1°) Calculer les indices synthétiques des prix de Laspeyres, de Paasche et de Fisher. 2°) Calculer l’indice général des prix en 1994 et en 1998 en utilisant, pour chaque année, les pondérations correspondantes. Corrigé 28 1°) Calcul des indices synthétiques i) Indice de Laspeyres P 98 / 94 L i 5 i 94 W I i 98 / 94 i 5 ( p) i 1 i 94 W i I 98 ( p) /0 i 1 i I 94 (p /0 164,1 165,9 168 155,2 ) (0,0378 ) (0,0815 ) (0,3678 ) 129 125,6 120 127 167,5 (0,2950 ) 127,8 127,3 (0,2179 ii) Indice de Paasche 1 P98P / 94 i 5 i 98 W i 1 1 i I 98 / 94 ( p ) i 5 W i 1 i 98 1 i I 98 /0 ( p) i I 94 ( p) /0 50 i 5 W i 1 i 98 i I 94 /0 ( p ) i I 98 /0 ( p ) 129 125,6 120 127 ) (0,0377 ) (0,0854 ) (0,3584 ) 164,1 165,9 168 155,2 127,3 (0,3046 ) 167,5 P D’où : P98 / 94 128 (0,2139 iii) Indice de Fisher F98p / 94 p P98p / 94 L98 / 94 127,9 2°) Calcul de l’indice général des prix en 1994 en utilisant les pondérations de 1994 i 5 I P 94 / 0 i W94i I 94 /0 ( p ) i 1 (0,2179 129) (0,0378 125,6) (0,0815 120 ) (0,3678 127 ) (0,2950 127,3) 126,95 Calcul de l’indice général des prix en 1998 en utilisant les pondérations de 1998 i 5 I P 98 / 0 i 98 W i I 98 /0 ( p ) i 1 (0,2139 164,1) (0,0377 165,9) (0,0854 168 ) (0,3584 155,2) (0,3046 167,5) 162,35 Exercice 29 Enoncé 29 Exercice II. On donne le tableau de répartition suivant : X : nombre de fréquentations hebdomadaires d’un magasin Y : montant des achats Yj [0,50[ [50,100[ [100,200[ Xi 1 40 60 51 150 2 60 90 140 3 80 70 60 4 220 20 10 1) Calculer les distributions jointe et marginales en fréquence. Calculer les moyennes et variances de ces distributions marginales. Conclure sur l’indépendance de ces deux variables. 2) Calculer les distributions conditionnelles de X /Y 25 et Y / X 3 . Calculer les moyennes et variances de ces distributions. Corrigé 29 iL j K 1) Calculons d’abord l’effectif total : N n ij 1000 ; f ij i 1 j 1 nij N i) la distribution jointe en fréquence Yj [0,50[ [50,100[ [100,200[ 0,040 0,060 0,080 0,220 0,4 0,060 0,090 0,070 0,020 0,24 0,150 0,140 0,060 0,010 0,36 Total Xi 1 2 3 4 Total 0,25 0,29 0,21 0,25 1 ii) Distribution marginale en fréquence de X Xi f i. xi f i . f i. xi2 1 0,25 0,25 0,25 2 0,29 0,58 1,16 3 0,21 0,63 1,89 4 0,25 1 4 Total 1 2,46 7,3 iii) Distribution marginale en fréquence de Y 52 ci f . j f . j ci2 25 10 250 0,24 75 18 1350 [100,200[ 0,36 150 54 8100 Total 1 82 9700 f. j centres [0,50[ 0,4 [50,100[ Yj ci Pour calculer les moyennes et variances de ces distributions marginales, on peut compléter les deux tableaux relatives à chaque distribution marginale. Xi f i. f i. xi2 xi f i . 1 0,25 0,25 0,25 2 0,29 0,58 1,16 3 0,21 0,63 1,89 4 0,25 1 4 Total 1 2,46 7,3 Yj f. j centres ci f . j f . j ci2 ci [0,50[ 0,4 25 10 250 [50,100[ 0,24 75 18 1350 [100,200[ 0,36 150 54 8100 Total 1 82 9700 iv) Moyenne marginale de X : 4 x f i. xi 2,46 i 1 v) La variance marginale de X : 4 V x ( f i. xi2 ) x 2 7,3 (2,46)2 1,24 i 1 vi) Moyenne marginale de Y : 53 3 y f . j y j 82 j 1 vii) La variance marginale de Y : 3 V y ( f . j y 2j ) y 2 9700 (82)2 2976 j 1 Les deux variables ne sont pas indépendantes. En effet, on peut remarquer que : f11 f .1 f1. 0,040 0,4 0,25 . 2) Les distributions conditionnelles de X /Y 25 et Y / X 3 . i) Distribution conditionnelle de X /Y 25 . Xi ni1 1 40 2 60 3 80 4 220 Total 400 ii) Distribution conditionnelle de Y / X 3 Yj n3 j [0,50[ 80 [50,100[ 70 [100,200[ 60 210 Total Pour calculer les moyennes et variances de ces distributions conditionnelle, on peut compléter les deux tableaux relatives à chaque distribution conditionnelle de la même manière que celle de la première question. On peut ainsi vérifier que La notation ( Y variable 25 ) signifie tout simplement la première classe des valeurs de la Y où le centre de cette classe est égale à 25. 54 ni1 xi f i . f i. xi2 1 40 40 40 2 60 120 240 3 80 240 720 4 220 880 3520 Total 400 1280 4520 Xi La moyenne conditionnelle de X /Y 25 est égale à : 3,2 La variance conditionnelle de X /Y 25 est égale à : 1,06 Exercice 30 Enoncé 30 le tableau suivant donne le coût moyen d’entretien d’un équipement industriel en fonction de son âge. Age en années Coût d’entretien en dinars 1 170 2 180 3 230 4 280 5 320 6 360 7 410 8 440 9 470 10 530 1) Déterminer l'équation de la droite des moindres carrés des coûts d’entretien Y en fonction de l’âge X . Interpréter la pente et la constante de l'équation de la droite obtenue. 2) Calculer le coefficient de corrélation linéaire r ; conclure sur le sens et l'intensité de la liaison entre le coût d’entretien et l’âge de l’équipement industriel. 55 3) Calculer le coefficient de détermination. Conclure quant à la qualité de l'ajustement entre ces deux variables. 4) A combien peut-on estimer le coût d’entretien de cet équipement au bout de 15 ans de son utilisation. 5) Déterminer l'équation de la droite des moindres carrés des coûts d’entretien Y en fonction de l’âge de l’équipement X si on est certain que si X 0 alors Y 0 Corrigé 30 1) Calcul de la valeur de â et de b̂ de la droite de régression y ax b : xi yi xi y i xi2 y i2 1 170 170 1 28900 2 180 360 4 32400 3 230 690 9 52900 4 280 1120 16 78400 5 320 1600 25 102400 6 360 2160 36 129600 7 410 2870 49 168100 8 440 3520 64 193600 9 470 4230 81 220900 10 530 5300 100 280900 55 3390 22020 385 1288100 On a : x aˆ 1 N iN xi i 1 1 1 55 5,5 et y 10 N iN y i 1 i 1 3390 339 10 22020 10 (5,5 339) 40,9 385 10 (5,5)2 bˆ 339 (40,9 5,5) 114,05 Donc, la droite de régression est: y i 40,9 xi 114,05 56 Cette droite signifie que pour un équipement neuf (c’est à dire xi 0 ), le coût d’entretien moyen est de 114,05 dinars alors que le coût pour un équipement ayant un an (c’est à dire xi 1 ) est estimé à 40,9 1 114,05 154,95 dinars. La valeur de la pente de la droite signifie que le coût d’entretient augmente en moyenne de 40,9 dinars par an. 2) Coefficient de corrélation : rV ,D Cov( x, y ) V ( x) V ( y ) 337,5 0,997. 8,25 13889 La valeur de r est proche de 1. Ceci traduit une forte corrélation linéaire positive entre les deux variables. 2 2 3) Le coefficient de détermination R (r ) 0,994 . R 2 étant très proche de 1 : signifie que la qualité d'ajustement linéaire est très bonne. 4) Cette droite de régression permet de faire des prévisions. Le coût d’entretien moyen pour un équipement de 15 ans (c’est à dire xi 15 ), s’élève à : (40,9 15 ) 114,05 727,55 dinars. 5) Dans ce cas, l'équation de la droite des moindres carrés des coûts d’entretien Y en fonction de l’âge de l’équipement X passe par le point de coordonnées (0 , 0) . L’équation est donc du type : y i axi La méthode MCO revient à minimiser la somme des carrés des résidus ( i ). La somme des carrés des résidus est donnée par : N iN i 1 i 1 i2 ( yi axi )2 f (a ) La condition de premier ordre de la minimisation de cette fonction f par rapport à a donne : iN i2 i 1 a i N i 1 iN (y x i i 1 iN 2 ( y i axi )( xi ) 0 i iN i N i 1 i 1 (y i 1 axi2 ) y i xi a xi2 0 57 i axi )( xi ) 0 Ainsi, on obtient la valeur estimée de la pente de la droite de d’ajustement : iN yx i i 1 iN aˆ x i 2 i i 1 Dans ce cas, aˆ 22020 57,19 385 Donc, la droite de régression est: y i 57,19 xi Exercice 31 Enoncé 31 b 1 b Soit la fonction de production suivante : Q aK L , a 0 et b 0 où K et L désignent respectivement le facteur capital et le facteur travail. On note par q la production par tête et par k l’intensité capitalistique. On donne 30 30 Log (q ) 7, Log (k ) 26 i i i 1 i 1 30 Log (k ) 2 i i 1 30 25 , Log (q )Log (k ) 5 i i i 1 Comment peut-on estimer les coefficients aˆ et bˆ de la fonction de production par tête ?. Donner la signification du coefficient b̂ . En déduire l’élasticité de la production par rapport au travail. Corrigé 31 La fonction de production par tête s’exprime par : Q aK b L1b q ak b L L Cette relation n’étant pas linéaire. Il nous faut d’abord retrouver une relation linéaire. Pour cela, nous allons passer en Logarithme : Log (q ) Log (a ) bLog (k ) 58 En posant Log (q ) y , Log (k ) x et Log (a ) , on obtient : y b x En utilisant la méthode des MCO, on peut retrouver l’expression b̂ : i 30 bˆ yx i i 1 i 30 x i Nx 2 i 1 ˆ y aˆ x 7 26 ) 30 30 0,43 2 26 (25) 30 30 (5) 30( Nxy 2 i ̂ et de 7 26 (0,43 ( )) 0,6 30 30 On peut maintenant retrouver la valeur de â : Log(a ) aˆ eˆ . D’où aˆ e 0,6 0,54 Donc, la droite de régression est : y i 0,43 xi 0,6 qi 0,54(k i )0,43 D’où Le coefficient b représente l’élasticité de la production par rapport au facteur capital. On peut dire qu’une augmentation du facteur capital de 10% entraîne une augmentation de la production de 4,3%. L’élasticité de la production par rapport au facteur travail est : eQ / L 1 b 1 0,43 0,57 . On peut dire qu’une augmentation de 10% du facteur travail entraîne une augmentation de la production de 5,7%. Exercice 32 Enoncé 32 Considérons les données suivantes sur le prix affiché et les quantités vendues d’un certain bien. Quantités ( y ) 104 58 59 37 22 12 9 Prix (x) 95 130 148 210 250 330 1) Représenter le nuage de points ( xi , y i ) . 2) Compte tenue de cette représentation, donner la forme de l’ajustement de ce nuage de points et retrouver la relation entre les deux variables. 3) Donner une estimation de la demande lorsque le prix du bien est égal à 50 puis lorsque le prix est égal à 300. Corrigé 32 1) Représentation du nuage de points y 100 80 60 40 20 0 0 100 200 300 x 2) Il est clair que la forme de ce nuage ne suggère pas un ajustement du type : y ax b . La fonction permettant de représenter ce nuage de points est une fonction hyperbolique du type : y x Afin d’estimer les coefficients de cette fonction par la méthode des MCO, on peu passer d’abord par le logarithme népérien qui nous donne une relation linéaire. On a : y x x Logy Logx Log En posant Log b et a on obtient la forme linéaire suivante : 60 Logy aLogx b x y Logx Logy Log( x )Log( y ) (Logx )2 95 104 4,554 4,644 21,150 20,738 130 58 4,868 4,060 19,764 23,693 148 37 4,997 3,611 18,045 24,972 210 22 5,347 3,091 16,528 28,592 250 12 5,521 2,485 13,720 30,487 330 9 5,799 2,197 12,742 33,629 31,086 20,089 101,949 162,110 Total On a : Logx 31,086 20,089 5,181 , Logy 3,348 6 6 En utilisant les expressions de aˆ et bˆ obtenus par la méthode des MCO, on trouve : aˆ 101,949 6 5,181 3,348 2 162,110 6 (5,181)2 bˆ 3,348 (2) 5,181 13,71 L’équation de la droite de régression de Logy sur Logx est de la forme : Log ( y ) 2Log ( x ) 13,71 Le coefficient a représente l’élasticité de la demande de ce bien par rapport à son prix, c’est-à-dire la variation relative de la demande par rapport à la variation relative du prix. Dans ce cas, on peut dire que si le prix du bien augmente de 1%, alors la demande diminuera de 2%. On peut maintenant retrouver la valeur de ̂ et de ̂ : 13 ,71 899864 . Log b Log 13,71 ˆ e 61 a ˆ aˆ ˆ 2 . Enfin, l’équation de la courbe donnant les quantités demandées en fonction du prix est : y 899864 x 2 899864 x2 On remarque que la quantité est une fonction décroissante du prix. 3) Lorsque le prix du bien est égal à 50, la demande s’élève à 360 unités. Lorsque le prix du bien est égal à 300, la demande sera de l’ordre à 10 unités. 62 EPREUVE DE STATISTIQUE I SESSION PRINCIPALE MAI 98 Le tableau suivant donne les relevés des ventes de jus de fraise et de jus d'orange du 1er semestre de l'année 1997. Mois Temps (T) Vente de jus de fraise Vente de jus d'orange en en 103 litres ( X 1 ) 103 litres ( Y1 ) Janvier 1 16 9 Février 2 17 10 Mars 3 17 Avril 4 18 10 Mai 5 17 12 Juin 6 20 14 1) Déterminer le mode, la médiane, la moyenne et l'écart-type de la variable X 1 . 2) Exprimer, en fonction de , l'équation de la droite des moindres carrés des ventes de jus d'orange Y1 en fonction du temps (T), au cours du premier semestre. 3) La valeur de la pente de la droite de régression des ventes de jus d'orange en fonction du temps étant égale à 1, retrouver la valeur de (). 4) Utiliser les résultats précédents pour déterminer la valeur du coefficient de corrélation linéaire entre le temps et les ventes de jus d'orange. Le tableau suivant donne les relevés des ventes de jus de fraise et de jus d'orange du second semestre de l'année 1997. Mois Vente de jus de fraise en Vente de jus d'orange 103 litres ( X 2 ) en 103 litres ( Y2 ) Juillet Fermeture exceptionnelle Fermeture exceptionnelle Août 30 25 Septembre 25 20 63 Octobre 20 18 Novembre 20 15 Décembre 15 10 5) Exprimer théoriquement, pour les ventes de jus de fraise, l'écart-type calculé sur l'année 1997, en fonction des écarts-types et des moyennes calculés sur chaque semestre. 6) En déduire la quantité de jus de fraise que l'usine aurait pu vendre en juillet si la même tendance du premier semestre avait été respectée. Profitant de certaines mesures gouvernementales, le directeur de l'usine a pu augmenter le prix de vente de ses produits. Périodes Prix du litre de jus Prix du litre de jus de fraise d'orange en dinars en dinars 1er trimestre 0,680 0,500 2e trimestre 0,700 0,530 3e trimestre non communiqué 0,550 4e trimestre 0,720 0,560 7) Déterminer les valeurs de l'indice élémentaire du prix du litre de jus d'orange, base 100 au premier trimestre. 8) Sachant que le taux global d'accroissement du prix du jus de fraise entre le troisième et le premier trimestre a été de 5%, retrouver le prix du litre de jus de fraise au troisième trimestre. 9) Calculer l'indice des prix de laspeyres au troisième trimestre, base 100 au premier trimestre. Interpréter. 10)Calculer l'indice des prix de Paasche au premier trimestre, base 100 au troisième trimestre. 11) Retrouver la relation qui existe entre les deux indices précédents. 64 CORRECTION DE L'EPREUVE DE STATISTIQUE I SESSION PRINCIPALE MAI 98 1) Paramètres de X 1 Mode : Il suffit de remarquer que la valeur de X 1 la plus fréquente (observée 3 fois) est : M O ( X 1 ) 17.10 3 litres b) Médiane : Après avoir classé les valeurs observées de X 1 par ordre croissant : 16-17-[17-17]-18-20, on constate que la 3e et la 4e (c'est à dire de rang ( n n ) et ( 1 )) sont égales à 17. D'où : 2 2 Mé( X 1 ) 17.10 3 litres c) Moyenne 6 X 1, i i 1 X1 6 16 17 17 18 17 20 17.5 . 103 litres 6 d) Ecart-type 6 ( X 1 ) 1 X 2 1,i i 1 6 X 12 1,258 . 103 litres 2) Equation des moindres carrés de Y1 en fonction de T : La pente de cette droite de régression est obtenue par : 6 aˆ 6 6 Y1,i .Ti 6T .Y1 i 1 avec T 6 .T i 2 Y Ti i 1 6T 2 6 1,i 3,5 et Y1 i 1 6 i 1 55 6 aˆ 20,5 0,5 17,5 91 6 3,5 3,5 213 3 6 .3,5 aˆ L'ordonnée à l'origine est égale à : 65 55 6 30,4 1,6 bˆ Y1 aˆT 6 L'équation s'écrit : Y1 ( 20,5 0,5 30,4 1,6 )T 17,5 6 3) Détermination de 20,5 0,5 aˆ 1 6. 103 litres . 17,5 On donne la valeur de ni T X1 Y1 T2 TY1 Y12 Janvier 1 1 16 9 1 9 81 Février 1 2 17 10 4 20 100 Mars 1 3 17 9 3 36 Avril 1 4 18 10 16 40 100 Mai 1 5 17 12 25 60 144 Juin 1 6 20 14 36 84 196 91 231 657 Mois Tota l 6 2 1 105 61 4) Coefficient de corrélation : 6 Y 1,i (rY ,T )2 aˆ.aˆ' aˆ.( i 1 6 .Ti 6T .Y1 2 1,i .Y 6Y12 i 1 (1).( 61 ).3,5 6 ) aˆ 2 61 657 6 6 231 6 ( 17,5 ) (1).(0,475) rY ,T 0,475 0,69 69% 36,833 5) Ecart-type annuel (X ) X 2 1,i X 22,i X 2, 11 On sait par ailleurs que : 66 avec, X 6( X 1 5 X 2 11 ( X ) 2 1 ( X ) 2 2 X 2 1,i i 6 X 2 X1 X 2 1,i 6 ( X 1 ) X 1 2 X 2 2,i 5 ( X 2 ) X 22 2 i 2 2,i i 5 X 22 2 i Il vient donc : 6 5 30 30 60 ( X 1 )2 ( X 2 )2 2 X 12 2 X 22 2 X 1 . X 2 11 11 11 11 11 6 X1 5 X 2 avec, X 11 (X ) 6 ( X 1 )2 5 ( X 2 )2 6( X 1 X )2 5( X 2 X )2 11 11 ou encore (X ) avec X 6X1 5X 2 11 6) Valeur estimée pour le mois de juillet L'équation étant : Y1 T 40 6 En remplaçant T par 7, on obtient : Y1,7 7 40 13,66. 103 litres 6 7) Indice élémentaire du prix du litre de jus d'orange. I1/1 I 2 /1 I 3 /1 I 4 /1 PY ,1 PY ,1 PY ,2 PY ,1 PY ,3 PY ,1 PY ,4 PY ,1 100 100 100 0530 100 106 0,5 100 0,550 100 110 0,5 100 0,560 100 112 0,5 8) Prix du litre de jus de fraise au 3e trimestre. 67 On cherche PX,3 , sachant que : PX ,3 PX ,1(1 0,05) 0,680 1,05 0,714 9) Indice des prix de laspeyres au troisième trimestre, base 100 au premier trimestre. Pour pouvoir calculer cet indice, il faut connaître les quantités trimestrielles vendues de chaque produit. Soient : Q X , j : La quantité de jus de fraise vendue durant le jème trimestre QY , j : La quantité de jus d'orange vendue durant le jème trimestre. LP 3/1 Q X,1 .PX,3 QY,1 .Py,3 Q X,1 .PX,1 QY,1 .Py,1 100 0,714 (16 + 17 + 17).10 3 + 0,550 (9 + 10 + 6).10 3 100 183,1 0,680 (16 + 17 + 17).10 3 + 0,500 (9 + 10 + 6).10 3 10) Indice des prix de Paasche au premier, base 100 au troisième trimestre PP 1/ 3 Q X,1 .PX,1 QY,1 .Py,1 Q X,1 .PX,3 QY,1 .Py,3 100 0,680 (16 + 17 + 17).10 3 + 0,500 (9 + 10 + 6).10 3 100 54,6 0,714 (16 + 17 + 17).10 3 + 0,550 (9 + 10 + 6).10 3 11) le produit de ces deux indices est égale à (100)2. EPREUVE DE STATISTIQUE I SESSION DE REMPLACEMENT JUIN 98 Exercice I Le tableau suivant donne la distribution des salaires par classe de salaire 68 hebdomadaire d'une société. L'effectif total N est égal à 60. Salaire Fréquence en dinars en % [40 , 50[ 15 [50 , [ 40 [ , 80[ 25 [80 , 110[ 15 [110 , 170[ 5 Total 100 1) Retrouver la valeur de 78 dinars. sachant que le troisième quartile Q3 est égal à 2) Utiliser le résultat précédent pour déterminer le mode et le salaire médian Mé . 3) On note par mi le moment non centré d'ordre i. Calculer m1 et m2 . En déduire l'écart-type des salaires. 4) On note par i le moment centré d'ordre i. Exprimer, d'abord, 3 en fonction de m1 , m2 et m3 , puis calculer le coefficient d'asymétrie de Fisher 1 . Conclure. 5) Calculer D9 et D 9 D1 (l'écart entre le 9ème décile et le 1er décile). D1 Conclure. 6) Calculer la médiale MLe . Interpréter. 7) Calculer le coefficient de Gini I G . Conclure 8) Quelle sera la valeur du coefficient de Gini si l'on augmente tous les salaires de 12%. Exercice II Au cours du premier trimestre, 6 observations d'un certain caractère quantitatif X ont donné une moyenne égale à 4 et une variance égale à 5. 69 Au second trimestre, 14 observations du même caractère donnent une variance égale à 7 et une moyenne égale à 5. Quel est l'écart-type de ce caractère pour l'ensemble de ces observations du premier semestre ? CORRECTION DE L'EPREUVE DE STATISTIQUE I SESSION DE REMPLACEMENT JUIN 98 Exercice I 1) Détermination de Q3 appartient à la classe : , 80 . On a 78 80 78 55 75 20 78 2 70 80 75 5 2 .a) Mode : C'est la classe modale [70 , 80[ (on prend 60 comme amplitude de référence : c'est l'amplitude de la dernière classe) 2 .b) Médiane Mé appartient à la classe : [50 , 70[. On a : Mé 50 50 15 35 Mé 50 20 67,5 dinars 70 50 55 15 40 70 Classes xi fi Fi nicorr f i xi xi2 f i x i2 xi3 f i x i3 [40 , 50[ 45 0,15 0,15 54 6,75 2025 303,75 91125 13668,75 [50 , 70[ 60 0,40 0,55 72 24 3600 1440 216000 86400 [70 , 80[ 75 0,25 0,80 90 18,75 5625 1406,2 5 421875 105468,7 5 [80 , 110[ 95 0,15 0,95 18 14,25 9025 1353,7 5 857375 128606,2 5 1 3 7 19600 980 2744000 137200 70,75 39875 5483,7 5 4330375 471343,7 5 [110 , 170[ 140 0,05 Total 1 3) Calcul de m1 et m2 i 5 m1 x fx i i 70,75 i 1 i 5 m2 2 i fx i 5483,75 i 1 2 V ( x ) m2 m1 i 6 2 i fx i x 2 5483,75 (70,75)2 21,86 dinars i 1 4) Moment centré d'ordre 3. et coefficient d'asymétrie. i 6 i 6 i 1 i 1 3 f i xi3 3 x f i xi2 2 x 3 m3 3m1.m2 2m13 3 471343,75 (3 70,75 5483,75) 2(70,75)3 15704,906 1 3 15704,906 1,5 3 (21,86)3 1 0 : Ceci traduit la dissymétrie de la distribution des salaires à droite. 71 5) Calcul de D9 et D 9 D1 D1 D1 appartient à la classe : [40 , 50[. On a D1 40 10 0 10 D1 40 10 46,66 50 40 15 0 15 D9 appartient à la classe : [80 , 110[. On a D9 80 90 80 10 D9 80 30 100 110 80 95 80 15 D9 100 2,15 D1 46,66 Signifie que les 10% les mieux payés gagnent au moins 2,15 fois plus que les 10% les moins payés. D9 D1 53,34 Signifie qu'il y a 53,34 dinars d'écart entre le mieux payé des 10% les plus pauvres et le moins bien payé des 10% les plus riches. 6) Valeur de la médiale Par interpolation linéaire on a : Ml 70 0,5 0,4346 0,0654 Ml 70 10 72,46 dinars 80 70 0,6996 0,4346 0,265 Signifie que les salariés qui perçoivent individuellement et par semaine mois que 72,46 se partagent la moitié de la masse salariale totale. 7) Indice de Gini. 72 Classes xi fi f i xi f i xi f i xi ( pi ) ( qi ) (qi 1 ) f i (qi q i 1 ) [40 , 50[ 45 0,15 6,75 0,0954 0,15 0,0954 0 0,01431 [50 , 70[ 60 0,40 24 0,3392 0,55 0,4346 0,0954 0,212 [70 , 80[ 75 0,25 18,75 0,2650 0,80 0,6996 0,4346 0,28355 [80 , 110[ 95 0,15 14,25 0,2014 0,95 0,901 0,6996 0,024009 7 0,099 1 1 0,901 0,09505 70,75 1 1 0,845 [110 , 170[ 140 0,05 Total 1 L'indice de Gini est égal à : I G 1 f i (qi qi 1 ) 1 0,845 0,155 On peut dire que la concentration des salaires est faible. 8) Impact de l'augmentation des salaires : Si pour chacun des salariés le salaire augmente de 12%. La part de chacun d'entre eux dans la masse salariale totale ne sera pas modifiée. Par conséquent, l'indice de Gini ne sera pas modifié. Exercice II (X ) X 2 1,i X 22,i X 2, 20 avec, X 6 X 1 14 X 2 20 On sait par ailleurs que : ( X ) 2 1 ( X ) 2 2 X 2 1,i i 6 X 2 X1 X 2 1,i 6 ( X 1 ) X 1 6(5 16) 126 X 2 2, i 14 ( X 2 ) X 22 14(7 25) 448 2 2 i 2 2,i i 14 D'autre part, X X 22 2 i 6 X 1 14 X 2 ((6 4) (14 5) 94 20 20 20 73 2 126 448 94 Il vient donc : ( X ) 2,57 20 20 Remarque : On peut appliquer directement la formule de la variance inter-populations et la variance intra-population. 6V ( X 1 ) 14V ( X 2 ) 6( X 1 X )2 14( X 1 X )2 V(X ) , 20 20 moyenne des variances avec, X 6 X 1 14 X 2 20 Variance des moyennes 94 2 94 2 6 ( 4 ( )) 14 ( 5 ( )) (6 5) (14 7) 20 20 V(X ) 20 20 D’où : ( X ) V ( X ) 2,57 . EPREUVE DE STATISTIQUE I SESSION DE RATTRAPAGE DE JUILLET 98 Le tableau suivant donne la distance de freinage d'un véhicule automobile sur route sèche, en fonction de sa vitesse. Vitesse en Km/h ( V ) Distance en m ( D ) 40 8 50 12 60 18 80 32 100 48 1) Calculer, pour les deux variables V et D , le moment non centré d'ordre 1 et le moment centré d'ordre 2. 2) Calculer la covariance entre la vitesse ( V ) et la distance ( D ) ; que peut-on en déduire sur la relation entre V et D . 3) Calculer le coefficient de corrélation linéaire rVD ; conclure sur le sens et l'intensité de la liaison entre V et D . 74 4) Déterminer, en utilisant la méthode des moindres carrés, l'équation de la droite de régression permettant d'estimer la distance de freinage en fonction de la vitesse du véhicule. 5) Interpréter la pente et la constante de l'équation de la droite obtenue. 6) A combien peut-on estimer la distance de freinage d'un véhicule roulant à 120 km/h. 7) Déterminer cette même droite sachant qu'une sixième mesure a donné pour : Vi 0 ; Di 0 . 8) A quel indicateur doit-on se référer pour rendre compte de la qualité de l'ajustement entre les variables D et V . Donner sa valeur. 9) On note par Y le logarithme de D et par X le logarithme de V . Les résultats de la méthode des moindres carrés sont les suivantes : i) Y a1 X b1 ii) X a 2Y b2 Donner une interprétation aux coefficients a1et a 2 . CORRECTION DE L'EPREUVE DE STATISTIQUE I SESSION DE RATTRAPAGE DE JUILLET 98 1) Calcul de m1 et de 2 Pour V i 5 D i Vi m1 V i 5 Vi m2 i 1 N i 1 N i 1 m1 D i 5 66 i 5 N 23,6 2 i D m2 2 4820 i 1 N 772 2 2 V ( D ) m 2 m1 215,04 2 2 V (V ) m 2 m1 464 Pour D 75 Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 76 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives 2) Covariance : Cov(V , D ) 1 N E.s.c. de Tunis 5 D .V i i V .D 314,4 i 1 La vitesse et la distance de freinage varient dans le même sens. 3) Coefficient de corrélation : rV , D Cov( D, V ) V ( D ) V (V ) 0,99. Les variables D varient dans le même sens. La valeur de r , proche de 1, cela traduit une forte corrélation linéaire entre les deux variables. 4) Equation des moindres carrés de D en fonction de V. Vitesse en Km/h Distance en m (V ) (D) 40 V2 VD D2 8 1600 320 64 50 12 2500 600 144 60 18 3600 1080 324 80 32 6400 2560 1024 100 48 10000 4800 2304 330 118 24100 9360 3860 La pente de cette droite de régression est obtenue par : 5 D .V i aˆ i 5V .D i 1 5 .V i 2 5V 2 9360 5 66 23,6 0,67 24100 5 66 66 i 1 L'ordonnée à l'origine est égale à : bˆ D aˆV 20,62 Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 77 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis L'équation s'écrit : D 0,67V 20,62 5) Interprétation de la pente â : lorsque la vitesse augmente de 1 km/h la distance de freinage augmente de 0,67m. En effet, D 0,67V . 6) Valeur estimée L'équation étant : D 0,67V 20,62 En remplaçant V par 120, on obtient : D 0,67 120 20,62 59,78 7) Equation des moindres carrés avec ( Vi 0 ; Di 0 ) Il suffit de refaire les calculs avec les mêmes sommes mais en divisant par le nouveau nombre d'observations qui est égal à 6. 5 D .V i aˆ i 6V .D i 1 5 .V i 2 5V 2 9360 6 55 19,66 2872,2 0,48 . 24100 6 55 55 5950 i 1 bˆ D aˆV 19,66 0,48 55 6,74 . 8) Qualité d'ajustement 2 2 On doit utiliser le coefficient de détermination R (rD,V ) 0,98 . R 2 étant très proche de 1 : signifie que la qualité de l'ajustement est très bonne. 9) Interprétation de a1 et de a2 . Pour la première équation, a1 correspond à l'élasticité de D par rapport à V. C'est aussi le rapport entre la variation relative de D et la variation relative de V. Pour la deuxième équation, a2 représente l'élasticité de V par rapport à D. En d'autre termes, il s'agit de la variation en pourcentage de V Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 78 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis engendrée par une variation de D de 1%. EPREUVE DE STATISTIQUE I SESSION PRINCIPALE DE MAI 99 Exercice 1 le tableau suivant donne le coût moyen d’entretien d’un équipement industriel en fonction de son âge. Age en années Coût d’entretien en dinars 1 200 2 250 3 400 4 500 5 550 1) Déterminer l'équation de la droite des moindres carrés des coûts d’entretien Y en fonction de l’âge X du bateau. Interpréter la pente et la constante de l'équation de la droite obtenue. 2) Calculer le coefficient de corrélation linéaire rx , y . Interpréter. 3) Calculer le coefficient de détermination Interpréter. 4) A combien peut-on estimer le coût d’entretien de ce bateau au bout de 1O ans de son utilisation. 5) Déterminer l'équation de la droite des moindres carrés des coûts d’entretien Y en fonction de l’âge X du bateau si on est certain que si X 0 alors Y 0 Exercice 2 Une étude relative à la distribution des salaires au sein d’une entreprise a abouti aux résultats suivants : Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 79 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis Hommes Femmes Etendue 640 600 Q3 Q1 233 140 D9 D1 2,16 1,8 Comparer la dispersion des salaires des hommes et des femmes chez les ouvriers de cette entreprise. Analyser brièvement la cohérence des conclusions obtenues à partir des différents indicateurs de dispersion utilisés. CORRECTION DE L'EPREUVE DE STATISTIQUE I SESSION PRINCIPALE DE MAI 99 Exercice 1 1) Calcul de la valeur de â et de b̂ de la droite de régression y ax b : xi yi xi y i xi2 y i2 1 200 200 1 40000 2 250 500 4 62500 3 400 1200 9 160000 4 500 2000 16 250000 5 550 2750 25 302500 15 1900 6650 55 815000 On a : x aˆ 1 N i 5 x i 1 i 1 1 15 3 et y 5 N 6650 5 (3 380) 95 55 5 (3)2 ; i 5 y i 1 i 1 1900 380 5 bˆ 380 (95 3) 95 Donc, la droite de régression est: y i 95 x i 95 Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 80 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis Cette droite signifie que pour un bateau neuf (c’est à dire xi 0 ), le coût d’entretien est de 95 dinars. La valeur de la pente de la droite signifie que le coût d’entretient augmente en moyenne de 95 dinars par an. 2) Coefficient de corrélation : rV , D Cov( x, y ) V ( x) V ( y ) 190 0,985. 2 18600 La valeur de r est proche de 1. Ceci traduit une forte corrélation linéaire positive entre les deux variables. 2 2 3) Le coefficient de détermination R (r ) 0,97 . R 2 étant très proche de 1 : signifie que la qualité d'ajustement linéaire est très bonne. 4) Le coût d’entretien pour un bateau de 10 ans (c’est à dire x i 10 ), s’élève à : (95 10 ) 95 1045 dinars. 5) Dans ce cas, l'équation de la droite des moindres carrés des coûts d’entretien Y en fonction de l’âge X du bateau passe par le point de coordonnées (0 , 0) . L’équation est donc du type : y i axi La méthode MCO revient à minimiser la somme des carrés des résidus ( i ). La somme des carrés des résidus est donnée par : N i 1 2 i iN (y i axi )2 f (a ) i 1 La condition de premier ordre de la minimisation de cette fonction f par rapport à a donne : iN yx i aˆ i 1 iN x i 1 2 i i Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 81 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives Dans ce cas, aˆ E.s.c. de Tunis 6650 120,92 121. Donc, la droite de régression 55 est: y i 121 x i Exercice 2 Hommes Femmes Dispersion Femmes (%) Dispersion Hommes Etendue 640 600 93 Q3 Q1 233 140 60 D9 D1 2,16 1,8 83 i) Les trois caractéristiques de dispersion utilisées indiquent que les salaires des femmes sont mois dispersés que ceux des hommes. ii) Les mesures quantitatives de la dispersion fournies par les trois indicateurs ne concordent pas : 93%, 60% et 83%. iii) L’étendue est une caractéristique de dispersion imprécises et très sensible au valeurs extrêmes : il suffit d’un seul salaire masculin très faible pour rendre l’étendue des salaires des femmes égale à l’étendue des salaires des hommes. Selon cet indicateur la dispersion des salaires des femmes est égale à 93% de celle des salaires des hommes. iv) L’écart interquartile Q3 Q1 , dépend de l’unité de mesure, exprimé en dinars est un indicateur de dispersion absolue. Selon cet indicateur la dispersion des salaires des femmes est égale à 60% de celle des salaires des hommes. v) Le rapport D9 est un indicateur de dispersion relative qui peut être D1 utilisé pour comparer la dispersion de variables statistiques qui ne sont pas exprimées dans la même unité. Selon cet indicateur la dispersion des salaires des femmes est égale à 83% de celle des salaires des hommes. EPREUVE DE STATISTIQUE I SESSION DE RATTRAPAGE DE JUIN 99 Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 82 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis Exercice 1 La répartition par sexe des salaires annuels des employés de l’entreprise DJO est présentée dans le tableau 1. Nous donnons, également, dans le tableau 2 l’effectif, la moyenne et la variance de chaque sous-population. Tableau 1 Fréquences f i Classes de salaire Hommes Femmes 200 0,12 0,21 [200 , 280[ 0,29 0,39 [280 , 360[ 0,24 0,20 [360 , 520[ 0,18 0,14 [520 , 840[ 0,11 0,05 840 0,06 0,01 Hommes Femmes Effectifs 320 180 Moyenne 383,14 286,48 Variance 0,0040 0,0011 Tableau 2 1°) Déterminer pour l’ensemble des employés : a) La fréquence de la première classe de salaire. b) La moyenne des salaires. c) La variance des salaires (en précisant inter-populations et la variance intra-population). la variance Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 83 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis 2°) Déterminer le mode de la distribution des salaires des hommes. 3°) Déterminer la médiane, le 1er décile et le 9ième décile de la distribution des salaires des hommes. Interpréter. 4°) Calculer l’écart interquartiles de la distribution des salaires des hommes. Interpréter. 5°) En se basant sur un indicateur approprié, comparer la dispersion des salaires des hommes et des femmes chez les employés de cette entreprise. 6°) Si le taux d’accroissement mensuel moyen du salaire de cette entreprise est égal à 0,5%, quel sera le salaire moyen de cette entreprise deux années plus tard. CORRECTION DE L'EPREUVE DE STATISTIQUE I SESSION DE RATTRAPAGE DE JUIN 99 1°) Déterminer : a) La fréquence de la première classe de salaire pour l’ensemble des employés est : fT n1h n1 f Nh N f N h f1h N f f1 f Nh N f (320 0,12) (180 0,21) 0,152 500 b) La moyenne des salaires est : XT Nh X h N f X f Nh N f (320 383,14) (180 286,48) 348,34 D 500 c) La variance des salaires (en précisant populations et la variance intra-population).est : la variance inter- Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 84 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives V(X ) N hV ( X h ) N f V ( X f ) N N ( X h h E.s.c. de Tunis X T )2 N f ( X f X T )2 N moyenne des variances Variance des moyennes (320 0,004) (180 0,0011) 320(383,14 348,34)2 180(286,48 348,34)2 500 500 2152,66 Fréquences Classes de salaire fi Fréquences Fréquences Amplitudes corrigées cumulées croissantes Hommes [120 , 200[ 0,12 80 0,12 0,12 [200 , 280[ 0,29 80 0,29 0,41 [280 , 360[ 0,24 80 0,24 0,65 [360 , 520[ 0,18 160 0,09 0,83 [520 , 840[ 0,11 320 0,027 0,94 [840 , 1160[ 0,06 320 0,015 1 2°) Le mode de la distribution des salaires des hommes : M O [200 , 280[ M O 200 80 0,29 0,12 262D (0,29 0,12) (0,29 0,24) 3°) La médiane de la distribution des salaires des hommes : Mé [280 , 360[ Mé 280 80 0,5 0,41 310 D 0,65 0,41) Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 85 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis Le 1er décile de la distribution des salaires des hommes: D1 [120 , 200[ D1 120 80 0,1 187 D 0,12) Le 9ième décile de la distribution des salaires des hommes: D9 [520 , 840[ D9 520 320 0,9 0,83 724D 0,94 0,83) On dit que 80% des hommes perçoivent un salaire compris entre 187D et 740D. 4°) L’écart interquartiles de la distribution des salaires des hommes : Q1 200 80 0,25 0,12 236 D 0,41 0,12) Q3 360 160 0,75 0,65 449 D 0,83 0,65) 5°) Pour comparer la dispersion des salaires des hommes et des femmes chez les employés de cette entreprise, on doit se baser sur le coefficient de variation : CVh CV f h 0,000165 Xh f Xf . 0,000115 On remarque que la dispersion des salaires est plus forte chez le hommes que chez les femmes 6°) Si le taux d’accroissement mensuel moyen du salaire de cette entreprise est égal à 0,5%, le salaire moyen de cette entreprise deux années plus tard est égale à : Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 86 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis X T* X T (1 0,005)24 EPREUVE DE STATISTIQUE I SESSION PRINCIPALE ESSEC 99 Exercice I Soit ni le nombre de ménage ayant une résidence secondaire enquêtés par un institut de sondage, et xi le montant en centaine de dinars que ces ménages ont déclaré avoir dépenser pour l’entretient de leur résidence secondaire. Dépense (centaine de dinars) Effectif [0 , 4[ 6 [4 , 8 [ n2 [8 , 12[ n3 [12 , b4 [ 17 [ b4 , 22[ 14 [22 , 30[ 11 [30 , 42[ 3 Total 100 9) Calculer les valeurs de n2 et n3 sachant que le quatrième décile est égale à 9,5. 10) Soit n2 25 et n3 24 , monter que la borne b4 est égale à 16 sachant que x 13 . 11) Construisez l’histogramme de cette distribution. Calculer le mode. Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 87 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis 12) Calculer la médiane et le troisième quartile. Interpréter. 13) Etudier l’asymétrie de cette série. 14) Calculer l’indice de concentration de Gini I G . Conclure CORRECTION DE L'EPREUVE DE STATISTIQUE I SESSION PRINCIPALE ESSEC 99 Exercice I 1) Pour calculer les valeurs de n2 et n3 , il faut calculer les effectifs cumulés croissants Dépense (centaine de dinars) Effectif Effectif cumulés croissants [0 , 4[ 6 6 [4 , 8 [ n2 n2 6 [8 , 12[ n3 n2 n 3 6 [12 , b4 [ 17 n2 n3 6 17 [ b4 , 22[ 14 n2 n3 6 17 14 [22 , 30[ 11 n2 n3 6 17 14 11 [30 , 42[ 3 Total 100 n2 n3 6 17 14 11 3 100 Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 88 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis On sait que n2 n3 51 100 . D’autre part, le quatrième décile, D4 , est égale à 9,5 appartient à la classe [8 , 12[. Ainsi, par interpolation linéaire entre les bornes supérieures des classes et l’effectifs cumulés croissant on a : 8 n2 6 9,5 40 12 n2 n3 6 Comme n2 n3 51 100 alors n2 n3 6 55 . On peut donc écrire : (n2 6) 40 8 9,5 1,5 n2 34 15 25 . 55 40 12 9,5 2,5 A partir de n2 n3 6 55 , on trouve n3 55 6 25 24 . 2 Sachant que x 13 , on peut, après avoir calculer les centres des classes, vérifier que : x nc i N i 1052 15,5b4 13 . Ce qui revient à : b4 16 100 Classes ci ni ni c i [0 , 4[ 2 6 12 [4 , 8 [ 6 25 150 [8 , 12[ 10 24 240 [12 , b4 [ b4 12 2 17 102+8,5 b4 [ b4 , 22[ b4 22 2 14 154+7 b4 Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 89 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis [22 , 30[ 26 11 186 [30 , 42[ 36 3 108 100 1052+15,5 b4 Total 3) Pour la détermination du mode, il faut calculer les effectifs corrigés puisque les amplitudes des classes sont inégales. Le mode de cette distribution : M O [4 , 6[ MO 4 4 25 6 7,8 . La plupart des ménage dépenses (25 6) (25 24) 780 dinars pour l’entretient de leur résidence secondaire. Classes ai ni nicorr 4 ni ai N i :effectifs cumulés croissants [0 , 4[ 4 6 6 6 [4 , 8 [ 4 25 25 31 [8 , 12[ 4 24 24 55 [12 , 16[ 4 17 17 72 [16 , 22[ 6 14 9,33 86 [22 , 30[ 8 11 5,5 97 [30 , 42[ 12 3 1 100 Total 100 4) La médiane de la distribution : Mé [8 , 12[ Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 90 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives Mé 8 4 E.s.c. de Tunis 55 30 11,17 . Ceci signifie que 50% des ménages 55 31 dépensent mois de 1117 dinars par ans pour l’entretient de leurs résidence secondaire. Le 3er quartile de cette distribution : Q3 [16 , 22[ Q3 16 6 75 72 17,3 . On dit que 75% des ménages dépensent 86 72 mois de 1730 dinars par ans pour l’entretient de leurs résidence secondaire. 5) On a Mo 7,8 , Mé 11,17 et distribution est étalée vers la droite. x 13 . On peut dire que la 7) Indice de Gini. Classes xi ni ni x i fi qi qi 1 f i (q i q i 1 ) [0 , 4[ 2 6 12 0,06 0,092 0 0,00052 [4 , 8 [ 6 25 150 0,25 0,1246 0,092 0,03345 [8 , 12[ 10 24 240 0,24 0,3092 0,1246 0,104112 [12 , 16[ 14 17 238 0,17 0,4923 0,3092 0,136255 [16 , 22[ 19 14 266 0,14 0,6970 0,4923 0,166502 [22 , 30[ 26 11 286 0,11 0,9169 0,6970 0,177529 [30 , 42[ 36 3 108 0,03 1 0,9169 0,057507 100 1300 1 1 0,6759 Total L'indice de Gini est égal à : Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 91 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis I G 1 f i (q i qi 1 ) 1 0,679 0,3241 32% On peut dire que la concentration des dépenses est relativement faible. EPREUVE DE STATISTIQUE I SESSION DE RATTRAPAGE ESSEC 99 Une entreprise fabrique deux produits A et B.Le tableau suivant indique l’évolution du volume des ventes des deux produits au cours de 11 mois d’une année : Mois 1 X i :ventes de A Yi :ventes de B 2 10 11 160 140 100 65 130 150 120 160 180 60 50 18 14 4 15 3 4 10 8 5 6 7 16 8 12 17 9 20 7 On utilisera les données suivantes, en précisant pour chaque calcul demandé la formule utilisée 11 11 X 2 i 177325 i 1 , 11 Y i i 1 2 2063 , XY i i 19100 i 1 1) Déterminer le mode, la médiane, la moyenne et l'écart-type de la variable X 1 .En comparant ces valeurs, que peut-on dire de la distribution de X ?. 2 2) Calculer V ( X ) , V (Y ) et Cov( X , Y ) à 10 près. 3) Calculer le coefficient de corrélation linéaire rx , y . Quelle est sa signification ? 4) Déterminer par la méthode des moindres carrés l'équation d’ajustement de Y en X. Que pensez-vous de la qualité de l’ajustement linéaire (justifier votre réponse) ? ème 5) Le 12 mois, on prévoit de vendre 200 unités de A. Si l’évolution se poursuit de la même façon, quel devrait être théoriquement le volume des ventes du produit B au cours de ce mois ? Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 92 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis 6) Soient P1 et P2 les prix unitaires respectifs des produits A et B. Montrer que le coefficient de corrélation linéaire entre le chiffre d’affaires mensuel de A et celui de B est égal au coefficient de corrélation linéaire entre les ventes mensuelles de A et celles de B . 7) Soient Z i P1 X i P2Yi le chiffre d’affaires mensuel total. Exprimer la variance de Z i en fonction de P1 , P2 , V ( X ) , V (Y ) et Cov( X , Y ) . CORRECTION DE L'EPREUVE DE STATISTIQUE I SESSION DE RATTRAPAGE ESSEC 99 1) Mode : Il suffit de remarquer que la valeur de X la plus fréquente (observée 2 fois) est : M O ( X ) 160 b) Médiane : Après avoir classé les valeurs observées de X 1 par ordre croissant : 50 X i :ventes de A 60 65 100 120 130 140 150 160 160 180 on constate que la 6ème observation (c'est à dire de rang ( n 1 ) est égale 2 à 130. D'où : Mé( X 1 ) 130 . c) Moyenne 11 x x i 1 11 i 1315 119,55 . 11 d) Comme X Mé M O , alors on peut dire que la distribution est étalée vers la gauche. Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 93 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives x2 2) 1 N iN x 2 i i 1 2 2 2 2 E.s.c. de Tunis 1 177325 16120,45 11 2 V ( x ) x ( x ) 16120,455 (119,55 ) 1828,25 V ( y) y ( y ) 1 xy N iN x y i i i 1 2063 141 2 ( ) 23,19 11 11 1 19100 1736,36 11 Cov( x, y ) xy x. y 1736,36 (119,55 12,82) 203,73 3) Coefficient de corrélation : rx , y Cov( x, y ) 203,73 0,989 x y 42,76 4,82 On dit qu’il y a très forte corrélation linéaire positive entre les deux notes obtenues. 4) Equation des moindres carrés de Y en fonction de X aˆ Cov( x, y ) 203,73 0,11 V ( x) 1828,25 bˆ y aˆ.x 12,82 (0,11 119,55) 0,33 Donc, la droite de régression est : y 0,11x 0,33 2 2 R (rx , y ) 0,978 indique une très bonne qualité de l’ajustement linéaire. 5) Valeur estimée des ventes du produit B, pour le 12ième mois, si les ventes du produit A sont de 200 : L'équation étant : y 0,11x 0,33 En remplaçant X par 200, on obtient : y (0,11 200 ) 0,33 21,67 6) Le coefficient de corrélation linéaire entre le chiffre d’affaires mensuel Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 94 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis de A et celui de B est : rP x,P y 1 2 p1 p2 p1 p2 Cov( p1 x, p2 y ) V ( p1 x ) V ( p 2 y ) ( p1 p 2 ).Cov( x, y ) p1 V ( x ) p2 V ( y ) Cov( x, y ) rx, y V ( x) V ( y ) Ainsi, le coefficient de corrélation linéaire entre le chiffre d’affaires mensuel de A et celui de B est égal au coefficient de corrélation linéaire entre les ventes mensuelles de A et celles de B . 8) Soient Z i P1 X i P2Yi le chiffre d’affaires mensuel total. La variance de Z i est égale à : V(Z) V(P1 X P2Y) V(P1 X) V(P2Y) 2Cov( P1 X , P2Y ) P12V(X) P22V(Y) 2P1 P2 Cov( X , Y ) . Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 95 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis EPREUVE DE STATISTIQUE I SESSION PRINCIPALE IHEC 2001 Exercice 1 On a relevé, dans une entreprise, pendant 90 jours successifs les niveaux de productions, exprimés en milliers d’unités de produit, de deux présentations notées G (gel) et L (liquide) d’un même produit. Les résultats sont résumés dans les deux tableaux suivants. : Présentation G Présentation L Classes de Nombre Classes de Nombre production de jours production de jours 5 9 10 10 [5 , 10[ 36 [10 , 12[ 50 [10 , 12[ 30 [12 , 16[ 20 [12 , 20[ [16 , 20[ 10 1°) Déterminer la valeur du tableau. Ensuite, déterminer la classe modale, la médiane, le premier quartile et le premier décile des niveaux de productions pour la présentation G. 2°) Calculer les moyennes, écart-types des niveaux de productions pour chacune des deux présentations. 3) La production totale de cette entreprise pour toute la période de l’étude est composée de 25% du produit en gel et de 75% du produit en liquide. Quel est le niveau de production moyen peur cette entreprise ? 4°) Donner, pour chacune des présentations G et L, les valeurs des Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 96 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis moyennes et des écarts-types si on veut exprimer les niveaux de productions en centaines d’unités de produit. 5°) Si le taux d’accroissement trimestriel moyen de la production de cette entreprise est égal à 1%, quelle sera la production de cette entreprise une année plus tard.(exprimée en centaines d’unités) ? CORRECTION DE L'EPREUVE DE STATISTIQUE I SESSION PRINCIPALE IHEC 2001 Exercice 1 1°) D’après l’énoncé on a N G N L 90 . Donc : 9 36 30 90 15 . Présentation G Classes de Nombre production de jours [0 , 5[ 9 ai nicorr 5 ni ai N i :effectifs cumulés croissants 9 5 9 [5 , 10[ 36 5 36 45 [10 , 12[ 30 2 75 75 [12 , 20[ 15 8 9 90 a) La classe modale est : [10 , 12[ . On peut remarquer que l’effectif corrigé de cette classe est le plus élevé. Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 97 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis La médiane de la distribution : Mé 10 . On peut remarquer que l’effectif cumulé croissant de la deuxième classe est de 45 (la moitié de l’effectif total). Donc, on peut retenir comme médiane, la borne supérieure de cette classe. b) Le premier quartile de cette distribution : Q1 [10 , 12[ Q1 5 5 22,5 9 6,875 . 45 9 c) Le premier décile de cette distribution est : D1 5 . On peut remarquer que l’effectif cumulé croissant de la première classe est de 9 (le dixième de l’effectif total). Donc, on peut retenir comme premier décile, la borne supérieure de cette classe. 2°) Calculer les moyennes, écart-types des niveaux de productions pour chacune des deux présentations. 3) La production totale de cette entreprise pour toute la période de l’étude est composée de 25% du produit en gel et de 75% du produit en liquide. Quel est le niveau de production moyen peur cette entreprise ? 4°) Donner, pour chacune des présentations G et L, les valeurs des moyennes et des écarts-types si on veut exprimer les niveaux de productions en centaines d’unités de produit. 5°) Si le taux d’accroissement trimestriel moyen de la production de cette entreprise est égal à 1%, quelle sera la production de cette entreprise une année plus tard.(exprimée en centaines d’unités) ? On sait que n2 n3 51 100 . D’autre part, le quatrième décile, D4 , est égale à 9,5 appartient à la classe [8 , 12[. Ainsi, par interpolation linéaire entre les bornes supérieures des classes et l’effectifs cumulés croissant on a : 8 n2 6 9,5 40 12 n2 n3 6 Comme n2 n3 51 100 alors n2 n3 6 55 . On peut donc écrire : Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 98 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis (n2 6) 40 8 9,5 1,5 n2 34 15 25 . 55 40 12 9,5 2,5 A partir de n2 n3 6 55 , on trouve n3 55 6 25 24 . 2 Sachant que x 13 , on peut, après avoir calculer les centres des classes, vérifier que : x nc i N i 1052 15,5b4 13 . Ce qui revient à : b4 16 100 Classes ci ni ni c i [0 , 4[ 2 6 12 [4 , 8 [ 6 25 150 [8 , 12[ 10 24 240 [12 , b4 [ b4 12 2 17 102+8,5 b4 [ b4 , 22[ b4 22 2 14 154+7 b4 [22 , 30[ 26 11 186 [30 , 42[ 36 3 108 100 1052+15,5 b4 Total 3) Pour la détermination du mode, il faut calculer les effectifs corrigés puisque les amplitudes des classes sont inégales. Le mode de cette distribution : M O [4 , 6[ MO 4 4 25 6 7,8 . La plupart des ménage dépenses (25 6) (25 24) 780 dinars pour l’entretient de leur résidence secondaire. Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007- 99 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives ai Classes ni E.s.c. de Tunis nicorr 4 ni ai N i :effectifs cumulés croissants [0 , 4[ 4 6 6 6 [4 , 8 [ 4 25 25 31 [8 , 12[ 4 24 24 55 [12 , 16[ 4 17 17 72 [16 , 22[ 6 14 9,33 86 [22 , 30[ 8 11 5,5 97 [30 , 42[ 12 3 1 100 Total 100 4) La médiane de la distribution : Mé [8 , 12[ Mé 8 4 55 30 11,17 . Ceci signifie que 50% des ménages 55 31 dépensent mois de 1117 dinars par ans pour l’entretient de leurs résidence secondaire. Le 3er quartile de cette distribution : Q3 [16 , 22[ Q3 16 6 75 72 17,3 . On dit que 75% des ménages dépensent 86 72 mois de 1730 dinars par ans pour l’entretient de leurs résidence secondaire. 5) On a Mo 7,8 , Mé 11,17 et x 13 . On peut dire que la Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007-100 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis distribution est étalée vers la droite. EPREUVE DE STATISTIQUE I SESSION PRINCIPALE IHEC 2002 FORMATION CONTINUE Exercice 1 (7 points) Afin de mieux connaître sa clientèle, le gérant du cinéma ELFORJA procède à une enquête auprès d’un échantillon de 100 individus. Il obtient la répartition par âge suivante : Age effectif 15 6 [15 , 20[ 24 [20 , 30[ 40 [30 , 40[ 40 et 10 plus 1°) Déterminer le nombre . Ensuite, déterminer la classe modale, le premier décile, la médiane et le neuvième décile. Interpréter ; On Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007-101 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis supposera l’age minimum égal à 10 ans et l’âge maximum égal à 60 ans. (2,5 points) 2°) Calculer l’âge A tel que 75% des individus de l’échantillon ait un âge supérieur à A. Comment s’appelle cette valeur A ? (1point) 3°) Déterminer la proportion des individus de l’échantillon ayant un âge compris entre 24 et 38 ans .(1point) 3°) Calculer le coefficient de variation. De quel type d’indicateur s’agit-il ? Dans quels cas son utilisation est-elle utile ? (2,5 points) Exercice 2 (4 points) Pour recruter deux étudiants saisonniers, une entreprise décide de faire passer pour chacun des six candidats qui se sont présentés un test écrit en économie (noté sur 20) et un écrit en gestion (noté sur 20). Les résultats sont donnés dans le tableau suivant : 8 X (Note en économie 10 12 13 15 10 8 7 7 ) 13 Y (Note en gestion) 1) Calculer la covariance entre X et Y. Que peut–on en déduire sur la relation entre ces deux variables. (1point) 2) Calculer le coefficient de corrélation linéaire rx , y . Conclure sur le sens et l’intensité de la liaison entre X et Y. (1point) 3) Déterminer l'équation de la droite des moindres carrés D : Y a X b .(1point) 4) A combien peut-on estimer la note en économie X d’un étudiant ayant obtenu une note en gestion Y 7 .(1point) Exercice 3 (5 points) Le tableau ci-dessous donne la répartition des exploitations agricoles d’un pays donné selon la superficie agricole utilisée pour les années 1970, 1979, 1990, 2001 : Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007-102 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives Superficie en hectares E.s.c. de Tunis 1970 1979 Nombre Nombre Nombre Nombre [2 , 10[ 3500 2400 1800 1500 [10 , 40[ 3900 3100 2400 2000 4200 4300 4100 4300 [40 , 80[ 1990 2001 1) Calculer, en pourcentage les taux de croissance annuels moyens des exploitations agricoles de 1970 à 1979, 1979 à 1990, et de 1990 à 2001. (1,5 points) 2) Exprimer le taux de croissance annuel moyen de 1970 à 2001 en fonction des trois taux calculés en 1). De quel type de moyenne s’agit- il ? Calculer sa valeur. (1,5 points) 3) Déterminer la médiale et l’indice de Gini pour l’année 1990. (2 points) Exercice 4 (4 points) Le tableau suivant donne les indices élémentaires de prix de 2000 par rapport à 1999 pour quatre biens et les coefficients budgétaires correspondants. Indices élémentaires Biens i I 2000 ( p) /1999 Coefficients budgétaires en % i W1999 i W2000 A 120 25 20 B 105 10 20 C 95 35 50 D 100 30 10 1°) Calculer les indices de prix de Laspeyres, de Paasche et de Fisher de 1999 par rapport à 2000 de ces quatre biens. Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007-103 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis EPREUVE DE STATISTIQUE I SESSION DE RATTRAPAGE IHEC 2002 FORMATION CONTINUE Exercice 1 (12 points) Soit la répartition suivante des exploitations agricoles d’une région A : Taille de Nombre l’exploitatio en n en centaines hectares 15 10 [15 , 10[ 20 [10 , 20[ 30 [20 , 50[ [50 , 100[ 40 10 1°) Tracer l’histogramme de cette distribution. Ensuite, déterminer la classe modale, le premier décile, la médiane et le neuvième décile. Interpréter. (3 points) 2°) Calculer la superficie S tel que 25% des exploitations ait une superficie supérieure à S. Comment s’appelle cette valeur S ? (1point) 3°) Tracer la courbe des fréquences relatives cumulées croissantes. (1point) 4°) Calculer la moyenne et l’écart-type de cette distribution. Interpréter (2 points) 5°) Sachant que pour deux autres régions B et C, les données sont les Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007-104 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis suivantes : Région B Région C Moyenne : 30,6 ha moyenne : 16,84 ha Ecart-type : 36,9 ha Ecart-type : 23,4 ha. Comparer, en utilisant un indicateur approprié, la dispersion entre ces trois régions A, B et C. (1,5 points). 6°) Tracer la courbe de concentration pour la distribution des exploitations agricoles de la région A. (1,5 points). 7°) Calculer la médiale ainsi que l’indice de Gini de cette distribution. Interpréter. (2 points). Exercice 2 (5 points) Le tableau ci-dessous, donne, pour neuf régions agricoles, des informations sur la surface moyenne et la valeur de la production par exploitation : X :Surface moyenne (ha) 375 Y : valeur de la 218 118,2 83,7 131,4 80,2 141 45,3 136,6 80,8 39 274 169 122 116 51,5 119 191 production (milliers de dinars) 1) Calculer la covariance entre X et Y. Interpréter. (1 point) 2) Calculer le coefficient de corrélation linéaire rx , y . Conclure sur le sens et l’intensité de la liaison entre X et Y. (2 points) 3) Déterminer l'équation D : Y a X b .(2 points) Exercice 3 (3 points) de la droite des moindres carrés Statistique et Calcul de Probabilité (Examens&Exercices) Année Universitaires 2007-105 2008 Hassen Mzali ; Professeur en Méthodes Quantitatives E.s.c. de Tunis Répondre par Vrai ou Faux. 1) L’indice synthétique de Paasche peut être défini comme étant la moyenne arithmétique des indices élémentaires pondérés par les coefficients budgétaires de la date courante. 2) On dit que deux variables statistiques sont linéairement indépendantes si la covariance entre ces deux variables est égale à l’unité. 3) Une étude des notes obtenues par deux classes d’une école à un test commun a fourni les résultats suivants : Classe Classe 1 2 Effectifs 20 30 Moyenne 12 10 Ecart-type 4 6 Médiane 12 12 La note moyenne des deux classes réunies est égale à 11.