Université Ibn Zohr d’Agadir Ecole Supérieure de Technologie de Laâyoune Filière: Génie Informatique Elément: Statistique descriptive Réalisé par: Mohamed Ali Hafdi Année: 2019 2 Table des matières 1 Distribution et représentation de séries univariées. 1.1 Introduction. . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Vocabulaires et définitions. . . . . . . . . . . . 1.1.2 Typologie des caractères. . . . . . . . . . . . . 1.2 Représentation d’une série statistique. . . . . . . . . 1.2.1 Cas qualitatif. . . . . . . . . . . . . . . . . . . 1.2.2 Cas quantitatif. . . . . . . . . . . . . . . . . . 2 Eléments caractéristiques des séries statistiques 2.1 Paramètres de position ou de tendance centrale. . . . 2.1.1 Le mode. . . . . . . . . . . . . . . . . . . . . 2.1.2 La médiane. . . . . . . . . . . . . . . . . . . . 2.1.3 La médiale. . . . . . . . . . . . . . . . . . . . 2.1.4 La moyenne. . . . . . . . . . . . . . . . . . . . 2.2 Paramètres de dispersion. . . . . . . . . . . . . . . . 2.2.1 L’étendue. . . . . . . . . . . . . . . . . . . . . 2.2.2 Quartiles, déciles et percentiles. . . . . . . . . 2.2.3 L’écart absolu moyen. . . . . . . . . . . . . . 2.2.4 Variance, écart-type, coefficient de variation et . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . moments. 3 Statistique descriptive bivariée et Série chronologique. 3.1 Présentation, covariance et corrélation d’une série à deux entrée. 3.2 Ajustement linéaire d’une série à deux entrées. . . . . . . . . . . 3.3 Série chronologique. . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Définition et exemples. . . . . . . . . . . . . . . . . . . . 3.3.2 Les composantes d’une série chronologique. . . . . . . . . 3.3.3 Les modèles de décomposition d’une série. . . . . . . . . 3.3.4 Prévision. . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Les indices statistiques. 4.1 Indice élémentaire. . . . . . 4.2 Les indices synthétiques. . . 4.2.1 Indices de valeur. . . 4.2.2 Indices de Laspeyres. 4.2.3 Indices de Paasche. . . . . . . . . . . . . . . . . 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 5 6 6 6 7 . . . . . . . . . . 9 9 9 10 11 11 13 13 13 14 15 . . . . . . . 17 17 18 19 19 20 21 22 . . . . . 25 25 28 28 28 29 4 TABLE DES MATIÈRES 4.2.4 Indices de Fischer. . . . . . . . . . . . . . . . . . . . . . . . . 29 Chapitre 1 Distribution et représentation de séries univariées. 1.1 Introduction. La statistique est l’étude de la collecte de données, leur analyse, leur traitement, l’interprétation des résultats et leur présentation afin de rendre les données compréhensibles. C’est à la fois une science, une méthode et un ensemble de techniques. L’analyse des données est utilisée pour d’écrire les phénomènes étudiés, faire des pré- visions et prendre des décisions à leur sujet. En cela, la statistique est un outil essentiel pour la compréhension et la gestion des phénomènes complexes. Les données étudiées peuvent être de toute nature, ce qui rend la statistique utile dans tous les champs disciplinaires et explique pourquoi elle est enseignée dans toutes les filières universitaires, de l’économie à la biologie en passant par la psychologie et bien sûr les sciences de l’ingénieur. La statistique consiste à : - Recueillir des données. - Présenter et résumer ces données. - Tirer des conclusions sur la population étudiée et d’aider à la prise de décision. Les statistiques descriptives visent à étudier les caractéristiques d’un ensemble d’observations comme les mesures obtenues lors d’une expérience. L’expérience est l’étape préliminaire à toute étude statistique. Il s’agit de prendre ”contact” avec les observations. 1.1.1 Vocabulaires et définitions. 1- Epreuve statistique: est une expérience que l’on provoque. 2- Population: est l’ensemble sur lequel porte notre étude statistique, notée Ω. 3- Individus ou unité statistique: sont les éléments de la population. 5 6 CHAPITRE. 1 : Distribution et représentation de séries univariées 4- Caractère ou variable statistique: (notée V.S) est une application X : Ω −→ C. L’ensemble C est l’ensemble des valeurs du caractère X (c’est ce qui est mesuré ou observé sur les individus) (cette notion est similaire à celle d’une variable aléatoire en probabilité). 5- Modalités: sont les différentes valeurs que peut prendre une variable statistique. 6- Série statistique: c’est la suite des valeurs prises par une variable sur les unités d’observation. 1.1.2 Typologie des caractères. Nous distinguons deux types des caractères: 1- Caractère qualitatif: ses modalités sont des catégories (exemple: type de voiture, groupe sanguin, couleur des yeux, mention du diplôme, stade d’une maladie,... ). Il est soit: - nominal: si ses modalités ne peuvent pas être ordonnées (exemple: type de voiture, groupe sanguin, couleur des yeux). - ordinale: si les modalités peuvent être ordonnées (exemple: mention du diplôme, stade d’une maladie). 2- Caractère quantitatif: si toute ses valeurs possibles sont numériques (exemple: nombre d’enfants par famille, taille, poids, ...). Il est soit: - discréte: si l’ensemble des valeurs possibles est dénombrable (exemple: nombre d’enfants par famille). - continue: si l’ensemble des valeurs possibles est continu (exemple: taille, poids). 1.2 1.2.1 Représentation d’une série statistique. Cas qualitatif. On considère une série statistique: (M1 , n1 ), (M2 , n2 ),...,(MN , nN ), où les Mi sont les modalités du caractère qualitatif X, et les ni sont les effectifs correspondants. Cette peut être présenter par deux diagrammes: 1- Diagramme en tuyaux d’orgue: 1.2 Représentation d’une série statistique 2- Diagramme en secteurs: 1.2.2 Cas quantitatif. 1- Diagramme en bâtons (caratère discrète): 7 8 CHAPITRE. 1 : Distribution et représentation de séries univariées 2- Histogramme (caratère continu): Application: On considère une classe de 40 étudiants avec leurs mentions de Bac: Mention de Bac Effectif Passable 18 Assez-bien 16 1- Représenter par un diagramme en tuyaux d’orgue. 2- Calculer les fréquences de cette série. 3- Représenter cette série par un diagramme sectoriel. Bien 4 Trés bien 2 Chapitre 2 Eléments caractéristiques des séries statistiques 2.1 Paramètres de position ou de tendance centrale. Les paramètres de position, mode (pour tout caractère) , médiane, et moyenne (seulement pour les caractères quantitatifs)), permettent de savoir autour de quelle valeur se situent les valeurs d’une variable statistique. 2.1.1 Le mode. Définition 2.1.1 1)- Le mode, noté M0 , est la modalité qui admet le plus grand effectif ou fréquence. 2)- Dans le cas d’un caractère quantitatif continu, on parle d’une classe modale. Si la classe modale est [xi , xi+1 [, alors le mode M0 vérifie: M0 − xi xi+1 − M0 xi+1 − xi = = , ∆1 ∆2 ∆1 + ∆2 (2.1) où ∆1 = N0 −Ni et ∆2 = N0 −Ni+1 avec N0 , Ni , et Ni+1 sont respectivement les effectifs associés à la classe modale, à la classe précedente et à la classe suivante de la classe modale. ∆1 De l’équation (3.1) le mode sera donc: M0 = xi + (xi+1 − xi ) . ∆1 + ∆2 Exemples: 1)- On considère la série statistique suivante: xi 3 6 8 15 20 ni 1 8 3 5 2 9 10 CHAPITRE. 2 : Eléments caractéristiques des séries statistiques Le mode de cette série est M0 = 6 car il correspond à l’effectif le plus élevé (=8). 2)- On considère un caractère quantitatif continu dont les modalités et les effectifs correspondants sont les suivants: Ii [5, 20[ [20, 35[ [35, 50[ [50, 65[ ni 20 26 30 10 Il est clair que la classe modale est [35, 60[. Calculons le mode M0 de cette série. On a: ∆1 M0 = 35 + (50 − 35), ∆1 + ∆2 avec ∆1 = 30 − 26 = 4 et ∆2 = 30 − 10 = 20. Ce qui donne: M0 = 35 + 2.1.2 15 × 15 = 44.375 4 + 20 La médiane. N Définition 2.1.2 La médiane Me est la modalité qui correspond à l’effectif , telle 2 que N est le nombre des unités statistiques. En d’autres tèrmes: c’est la modalité qui permet de couper une série statistique en deux groupes contenant le même nombre d’individus. Comment calculer la médiane d’une série? a- Cas d’un caractère discrét. Soit n le nombre d’individus dont les modalités sont ordonnées dans l’ordre croissant. - si n est impaire, (n = 2k + 1), alors Me est la modalité d’ordre k + 1. - si n est paire (n = 2k), alors M1 + M2 , 2 telle que M1 et M2 sont les modalités d’ordres k et k + 1. Me = Exemples: 1- On considère la série de notes d’une classe: 15-2-7-8-4-11-18-10-3-2-4-4-1. La série ordonnée est: 1-2-2-3-4-4-4-7-8-10-11-15-18. Alors Me = 4. 2- On considère la série de valeurs suivantes: 7.2-1.5-8.5-4.8-0.5-9.8. 4.8 + 7.2 = 6. La série ordonnée est: 0.5-1.5-4.8-7.2-8.5-9.8. Alors Me = 2 Remarque 2.1.1 On peut utiliser les effectifs cumulés pour déterminer Me . Me sera N la modalité qui correspond au premier effectif cumulé qui dépasse . 2 11 2.1 Paramètres de position ou de tendance centrale b- Cas d’un caractère continu. 1- En calculant les effectifs cumulés, on détermine la classe médiane Ie . On a Me ∈ Ie . 2- Par interpolation linéaire, l’expression suivante nous permet le calcul de Me : Me = xi + (xi+1 − xi ) N/2 − Ni−1 , Ni − Ni−1 telle que: - Ii = [xi , xi+1 [ est la classe médiane. - N est l’effectif total. - Ni−1 est l’effectif cumulé de la classe Ii−1 . - Ni est l’effectif cumulé de la classe Ii . 2.1.3 La médiale. Définition 2.1.3 La médiale, notée Ml , n’est que la P Pmédiane qui correspond à 50% de la masse totale s = ni xi (cas discret) ou = ni ci (cas continu) où ci est le entre de la classe Ii . i i Exemple: Les classes des salaires des employés d’une entreprise, ainsi que leurs effectifs, sont données dans le tableau suivant: Ii [1000, 2000[ [2000, 3000[ [3000, 4000[ [4000, 5000[ ni 20 40 30 10 Calculons la médiane, ainsi que la médiale, de cette série. 2.1.4 La moyenne. Le calcul d’une moyenne permet de résumer l’information chiffrée dont on dispose. Dans ce paragraphe on verra quatre types de moyennes. a- La moyenne arithmétique. Définition 2.1.4 1)- On dispose d’une série de p valeurs: x1 ,...xp d’une variable statistique discrète X. Le réel p 1X 1 xi , ma = (x1 + ... + xp ) = p p i=1 la moyenne arithmétique de cette série. 12 CHAPITRE. 2 : Eléments caractéristiques des séries statistiques 2)- Si les valeurs x1 ,...,xp sont affectées respectivement des effectifs n1 ,...,np telles que n1 + ... + np = N, alors la moyenne X̄ = ma = p 1 X 1 (n1 x1 + ... + np xp ) = , N N i=1 est appelée la moyenne arithmétique pondérée de cette série. 3)- Si X est continue, alors les xi utilisées pour calculer la moyenne de X, sont les centres des modalités de X. Exemples: 1)- La moyenne arithmétique de la série: 11-14-8-9, est 1 42 m = (11 + 14 + 8 + 9) = = 10.5 4 4 2)- Soit X la variable des salaires des employés (exemple précédent). Calculons sa moyenne. On a 1 m= (20 × 1500 + 40 × 2500 + 30 × 3500 + 10 × 4500) = 2800. 100 a- La moyenne géométrique. Définition 2.1.5 1- Soit x1 ,...,xp les valeurs, supposées strictement positives, d’une série. La moyenne géométrique mg de cette série, est: ! p1 p Y 1 . xi mg = (x1 × ... × xp ) p = i=1 2- Si les valeurs xi sont affectées des effectifs ni telle que n1 + ... + np = N, alors ! N1 p p Y Y ni mg = xi xfi i , = i=1 i=1 ni . N Exemple: Calculons la moyenne géométrique de la série: 11-14-8-9. On a: 1 mg = (11 × 14 × 8 × 9) 4 ≃ 10.26156 où fi = On remarque que mg est proche de ma = 10.5. Application: Une quantité positive Q0 évolue de 5% une anne puis de 7% l’année suivante. Calculer le taux moyen annuel d’évolution de Q0 . 13 2.2 Pramètres de dispersion a- La moyenne harmonique. Définition 2.1.6 1- Soit x1 ,...,xp les valeurs, supposées non nulles, d’une série. La moyenne harmonique mh de cette série, est: mh = p =P . 1 1 1 p + ... + i=1 x1 xp xi p 2- Si les valeurs xi sont affectées des effectifs ni telle que n1 + ... + np = N, alors où fi = ni . N N 1 mh = n1 np = Pp fi . + ... + i=1 x1 xp xi Exemple: Calculons la moyenne harmonique de la série: 11-14-8-9. Application: Une voiture parcourt la distance d entre deux villes A et B à une vitesse de 100km/h, mais au retour, et à cause du brouillard, le conducteur a baissé la vitesse à 60km/h. Calculer sa vitesse moyenne sue le trajet aller-retour. 2.2 Paramètres de dispersion. Les paramètres de dispersion sont calculés pour les variables statistiques quantitatives. 2.2.1 L’étendue. Définition 2.2.1 Soit X un caractère quantitatif discrét. L’étendue w de X , est la différence entre la plus grande valeur et la plus petite valeur de X. On a: w = xmax − xmin . 2.2.2 Quartiles, déciles et percentiles. Définition 2.2.2 Soit X un caractère quantitatif. On appelle Quartiles les nombres réels Q1 , Q2 , et Q3 qui partagent l’étendue w en quatres intervalles qui ont le même effectif N/4. L’intervalle interquartile est la différenceentre Q3 et Q1 (Q3 − Q1 ). Propriétés 2.2.1 1- Q1 , Q2 , et Q3 sont respectivement les valeurs de X qui correspondent aux effectifs N/4, N/2, et 3N/4 (ou aux fréquences 0.25, 0.5, et 0.75). 14 CHAPITRE. 2 : Eléments caractéristiques des séries statistiques 2- Le deuxième quartile Q2 n’est que la médiane de la série statistique. 3- L’intervalle [Q1 , Q3 ] contient 50% des valeurs de X. Exemple: On considère la série statistique suivante: xi 2 5 6 9 10 ni 3 2 6 7 2 Calculons les quartiles Q1 , Q2 , et Q3 . Définition 2.2.3 1- Les déciles D1 , D2 ,..., D9 sont les réels qui partagent l’étendue en dix intervalles de même effectif. 2- Les percentiles P1 , P2 ,..., P99 sont les réels qui partagent l’étendue en 100 intervalles de même effectif. Remarque 2.2.1 1- D1 , D2 ,..., D9 correspondent respectivement aux effectifs N/10, 2N/10,..., 9N/10. 2- P1 , P2 ,..., P99 correspondent respectivement aux effectifs N/100, 2N/100,..., 99N/100. 2.2.3 L’écart absolu moyen. Définition 2.2.4 1- Soit X = {(xi , ni )}i=1,...,p une variable statistique quantitative. On appelle écart absolu moyen de X, la valeur p 1 X e= ni |xi − ma |, N i=1 (2.2) où ma est la moyenne arithmétique de X. 2- Si la variable statistique est continue, on remplace les xi dans (3.2) par les centres des classes. Exemple: On considère la série statistique de l’exemple précedent. Calculons l’écart absolu moyen. On a: 1 (3 × 2 + 2 × 5 + 6 × 6 + 7 × 9 + 2 × 10) = 6.75, ma = 20 alors 1 (3 × |3 − 6.75| + 2 × |5 − 6.75| + 6 × |6 − 6.75| + 7 × |9 − 6.75| + 2 × |10 − 6.75|) e = 20 = 2.225 15 2.2 Pramètres de dispersion 2.2.4 Variance, écart-type, coefficient de variation et moments. Définition 2.2.5 1- Soit X = {(xi , ni )}i=1,...,p une variable statistique quantitative. i- On appelle variance de X, le nombre ! p p 1 X 1 X 2 2 2 ni (xi − ma ) = ni xi − m2a . S (X) = N i=1 N i=1 p ii- L’écart-type de X est S(X) = S 2 (X). iii- Le coefficient de variation de X est le nombre c= (2.3) S(X) . ma 2- Si la variable statistique est continue, alors sa variance (par consequent son écarttype et son coefficient de variation) se calcule en remplaçant les xi dans (3.3) par les centres des classes. Exemple: La variance de la variable X de l’exemple précedent est 1 3 × 22 + 2 × 52 + 6 × 62 + 7 × 92 + 2 × 102 − 6.752 = 6.6875 S 2 (X) = 20 Donc l’écart-type de X est √ S(X) = 6.6875 ≃ 2.58602 et son coefficient de variation est c= . 2.58602 ≃ 0.3831 6.75 Définition 2.2.6 Soit X = {(xi , ni )}i=1,...,p une variable statistique quantitative. 1- On appelle moment d’ordre r de X, la quantité p 1 X mr = ni xri . N i=1 2- On appelle moment centré d’ordre r de X, la quantité p 1 X ni (xi − ma )r . µr = N i=1 Remarque 2.2.2 - Pour r = 0, m0 = µ0 = 1. - Pour r = 1, m1 = ma et µ1 = 0. - Pour r = 2, µ2 = S 2 (X) = m2 − m21 . Exemple: Calculons m3 et µ3 de X de l’exemple précedent. 16 CHAPITRE. 2 : Eléments caractéristiques des séries statistiques Chapitre 3 Statistique descriptive bivariée et Série chronologique. 3.1 Présentation, covariance et corrélation d’une série à deux entrée. Définition 3.1.1 On considère une population d’effectif n. Si on étudie deux caractères X et Y de cette population, on dit que l’on étudie une série statistique à deux entrée. A chaque individu i (1 ≤ i ≤ n) correspond un couple (xi , yi ), où xi est la modalité du caractère X et yi est la modalité du caractère Y associé à l’individu i. L’ensemble des couples (xi , yi ) définit une série statistique à deux entrée. Remarque 3.1.1 Si les couples (xi , yi ) sont affectés des effectifs, alors la série statistique se présente par un tableau de contingence. Exemples: 1- Chaque mois, une entreprise consacre une somme X à des opérations publicitaires. On met en regard le montant des ventes Y chaque mois. Une étude portant sur 8 mois a donné les résultats suivants exprimés en milliers de dirhams: Mois Jan Fev Mars Avril Mai Jui Jui Août X 0.24 0.31 0.25 0.32 0.35 0.2 0.18 0.3 Y 38 42 39 44 46 35 34 41 2- Le tableau de contingence suivant, présente une série bivariée: XY 2 4 7 T otal 12 15 20 25 T otal 11 6 8 15 40 12 16 7 5 40 5 6 8 1 20 28 28 23 21 100 Définition 3.1.2 Soit (X, Y ) une série statistique bivariée dont les modalités sont (xi , yi ) pour i ∈ {1, ..., N}. 17 18 CHAPITRE. 3 : Statistique descriptive bivariée et Série chronologique - On appelle covariance de (X, Y ), le nombre σXY N 1 X xi − X̄ yi − Ȳ = N i=1 ! N 1 X = xi yi − X̄ Ȳ , N i=1 où X̄ et Ȳ sont respectivement les moyennes arithmétiques de X et Y . - Le nombre ρXY = σXY , σX σY où σX et σY sont respectivement les écart-types de X et Y , est appelé la corrélation linéaire de (X, Y ). Remarque 3.1.2 Si la série est présenté par un tableau de contingence, alors sa covariance est σXY q r 1 XX nij xi − X̄ yj − Ȳ = N i=1 j=1 q r 1 XX nij xi yj − X̄ Ȳ , = N i=1 j=1 où nij est l’effectif qui correspond au couple (xi , yj ) dans le tableau de contingence. Exemples: On va calculer la covariance et la corrélation des deux séries de l’exemple précédent. 3.2 Ajustement linéaire d’une série à deux entrées. Soit (X, Y ) une série à deux entrées dont les modalités sont (xi , yi ) et qui se présente graphiquement par le nuage de points M(xi , yi ) pour i ∈ {1, ..., N}. Lorsque ces points paraissent presque alignés, alors la série peut être ajuster linéairement. Définition 3.2.1 L’ajustement linéaire de la série (X, Y ), c’est la recherche de la droite (∆) : y = ax + b qui passe au plus près de tous les points M(xi , yi ) pour i ∈ {1, ..., N}. Proposition 3.2.1 La pente a et l’ordonnée à l’origine b de la droite (∆), obtenus par la méthode des moindres carrées, sont a= σXY , b = Ȳ − aX̄. 2 σX 19 3.3 Série chronologique 42 40 38 34 36 montant des ventes 44 46 Exemple: On considère la série des opérations publicitaires et le montant des ventes (exemple précédent). La représentation graphique de cette série est la suivante: 0.20 0.25 0.30 0.35 opérations publicitaires Il est clair que tous les points du nuage de cette série semblent presque alignés. Soit (∆) : Y = aX + b la droite de l’ajustement linéaire de cette série. Les valeurs, par la méthode des moindres carrées, de a et b sont: a= σXY , b = Ȳ − aX̄. 2 σX Calculons X̄, Ȳ , σX et σXY . 3.3 Série chronologique. 3.3.1 Définition et exemples. Définition 3.3.1 La série chronologique est une série à deux entrée, dont l’un des deux caractères est le temps (jours, mois, année,...) et on la note (Xt ). Exemple 1 1)- cours journalières d’une action en bourse. - consommation mensuelle d’électricité. - nombre trimestriel de chômeurs. - chiffre annuel des bénéfices des exportations. 20 CHAPITRE. 3 : Statistique descriptive bivariée et Série chronologique 2)- Considérons la série trimestrielle du chiffre d’affaires en milliers de dirhams des ventes d’un magasin de 1978 à 1982: trim.1 trim.2 trim.3 trim.4 anneé 1 année 2 année 3 430 480 510 600 670 840 820 930 1010 550 640 730 La représentation graphique de cette série est la suivante: 3.3.2 Les composantes d’une série chronologique. Le but de la décomposition d’une série chronologique est de distinguer dans l’évolution de la série, une tendance, des variations saisonnières qui se répètent chaque année (semestre, trimestre, mois,...) et des variations accidentelles imprévisibles. L’intérêt de ceci est d’une part de mieux comprendre, de mieux décrire l’évolution de la série, et d’autre part de prévoir son évolution (à partir de la tendance et des variations saisonnières). a- La tendance ou composante tendancielle (Tt ): qui correspond à l’évolution à long terme de la série, l’évolution fondamentale de la série. Généralement, elle est linéaire: Tt = at + b. b- La composante saisonnière (St ): qui correspond aux variations saisonnières (par exemple: les fluctuations périodiques à l’intérieur d’une année). 21 3.3 Série chronologique c- La composante résiduelle (εt ): correspond à des fluctuations irrégulières et imprévisibles. Elles sont supposées en général de faible amplitude. 3.3.3 Les modèles de décomposition d’une série. a- Modèle additif. Définition 3.3.2 Soit (Yt ) une série chronologique. On dit que (Yt ) suit un modèle additif si et seulement si Yt s’écrit Yt = Tt + St + εt , où (Tt ) est une tendance, (St ) est une composante saisonnière, et (εt ) est la composante résiduelle et qui sont supposées indépendantes deux à deux. Propriétés 3.3.1 1- Graphiquement, l’amplitude des variations des tèrmes de la série, est constante autour de la tendance. 2- Le modèle additif est convenable à une série chronologique si la droite passant par les minima du graphe de la série, et celle passant par les maxima, sont à peu prés parallèles (voir Figure 4.1 comme exemple). Figure 3.1: b- Modèle multiplicatif. Définition 3.3.3 Soit (Yt ) une série chronologique. On dit que (Yt ) suit un modèle multiplicatif si et seulement si Yt s’écrit Yt = Tt × St + εt , où (Tt ) est une tendance, (St ) est une composante saisonnière (on suppose que (St ) dépend de (Tt )), et (εt ) est la composante résiduelle. Propriétés 3.3.2 22 CHAPITRE. 3 : Statistique descriptive bivariée et Série chronologique 1- Graphiquement, l’amplitude des variations des tèrmes de la série, varie en fonction du temps. 2- Le modèle multiplicatif est convenable à une série chronologique si la droite passant par les minima du graphe de la série, et celle passant par les maxima, ne sont pas parallèles (voir Figure 4.2 comme exemple). Figure 3.2: 3.3.4 Prévision. a- Détermination de la tendance (Tt ): Proposition 3.3.1 Les coefficients a et b de la tendance Tt = at + b pour les deux modèles additif et multiplicatif, sont a= où Ȳ = cov(T, Y ) = cov(T, Y ) , b = Ȳ − aT̄ , V (T ) N N 1 X 1 X Yi , T̄ = ti , N i=1 N i=1 N N 1 X 1 X 2 Yi ti − Ȳ T̄ , V (T ) = t − T̄ 2 . N i=1 N i=1 i Exemple 2 Cherchons la tendance pour la série de l’exemple 1 précédent: La première chose à faire, il faut indexer les trimestres des trois année. Le tableau obtenu est le suivant: temps 1 2 3 4 5 6 7 8 9 10 11 12 chiffre d’affaires 430 600 820 550 480 670 930 640 510 840 1010 730 On a Ȳ = 1 (430 + 600 + 820 + 550 + 480 + 670 + 930 + 640 + 510 + 840 + 1010 + 730) = 684.1667, 12 3.3 Série chronologique T̄ = cov(T, Y ) = 23 1 (1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 + 11 + 12) = 6.5, 12 1 (430 × 1 + 600 × 2 + 820 × 3 + 550 × 4 + 480 × 5 + 670 × 6 + 930 × 7 12 +640 × 8 + 510 × 9 + 840 × 10 + 1010 × 11 + 730 × 12) − Ȳ T̄ = 4766.667 − 684.1667 × 6.5 = 319.5831, 1 2 1 + 22 + 32 + 42 + 52 + 62 + 72 + 82 + 92 + 102 + 112 + 122 −6.52 = 11.91667. 12 Donc les coefficients de la tendance sont 319.5831 a= = 26.81815, b = 684.1667 − 26.81815 × 6.5 = 509.8487 11.91667 Par conséquent la tendance est Tt = 26.81815t + 509.8487. V (T ) = b- Détermination de la composante saisonnière. Etape 1: On calcule les coefficients saisonniers Sij = Yij − Tij (par exemple: i c’est l’année et j c’est la saison (trimestre, semestre,...)) si le modèle est additif, ou St = YTtt si le modèle est multiplicatif. Etape 2: Pour chaque saison j (trimestre, semestre,...), on calcule la composante saisonnière brute sj correspondant et qui est la moyenne des coefficients saisoniers en cette saison. Etape 3: On centre la composante saisonnière brute pour avoir finalement la composante saisonnière qu’on va utiliser dans le modèle. Exemple 3 Cherchons la composante saisonière de la série de l’exemple 1. Tout d’abord quel est le modèle (additif ou multiplicatif) convenable pour cette série. Le graphique suivant montre que les droites passant par les minima et les maxima de la série sont parallèles. Par conséquent le modèle additif est convenable: Le tableau de la tendance est: temps 1 2 3 4 5 6 7 8 9 10 11 12 chiffre d’aff. 430 600 820 550 480 670 930 640 510 840 1010 730 Tendance 537 563 590 617 644 671 698 724 751 778 805 832 Donc le tableau des coefficients saisoniers et la composante saisonière brute est le suivant: anneé 1 année 2 année 3 C.S.B C.S. trim.1 −107 −164 −241 −170.67 −133.505 trim.2 37 −1 62 32.67 69.835 trim.3 230 232 −241 73.67 110.835 trim.4 −67 −84 −102 −84.33 −47.165 24 CHAPITRE. 3 : Statistique descriptive bivariée et Série chronologique 1 La moyenne de C.S.B est (−170.67 + 32.67 + 73.67 − 84.33) = −37.165. Donc la 4 composante saisonière qu’on va utilisé dans le modèle est C.S.. c- Prévision. Soit t un temps donné. La valeur prédite de Yt est Ŷt = at + b + Si , où i est la saison qui correspond à t. Exemple 4 On veut prédire la valeur du chiffre d’affaires pour l’anné 4 en trimestre 4. Le t ici est t = 16. Donc Tt = 26.81815 × 16 + 509.8487 = 938.9391 et Si = S4 = −47.165. Ce qui donne Ŷt = 938.9391 − 47.165 = 891.7741. Chapitre 4 Les indices statistiques. On d’écrit souvent des phénomènes plus ou moins complexes en utilisant une seule valeur qu’on appelle un indice. L’objectif d’un indice, est comparer des grandeurs numériques qui evoluent au cours du temps et/ou de l’espace. On trouve des indices dans de nombreux domaines. On peut citer l’indice des prix à la consommation, l’indice des cours des titres à la bourse, l’indice de confiance des consommateurs, l’indice de compétitivité des nations,... etc. Deux catégories d’indices peuvent être distinguées selon le type de grandeur étudiée. Ainsi, si l’on considère le prix d’un produit, il s’agit de grandeurs simples au sens où la grandeur est un nombre ne prenant qu’une seule valeur dans une situation donnée. Les indices calculés sur la base de ces grandeurs sont appelés indices élémentaires. En revanche, le niveau général des prix, la production industrielle, le cours des actions sont des grandeurs complexes dans la mesure où leur calcul nécessite d’agréger un ensemble de valeurs hétérogènes (prix des différents produits, production de diverses industries, cours de différentes actions). Les indices calculés sur la base de ces grandeurs sont appelés indices synthétiques. 4.1 Indice élémentaire. Définition 4.1.1 L’indice élémentaire d’une grandeur V à la date t base 100 à la date 0 est Vt V It/0 = × 100. V0 Exemple 5 Quel est l’indice du prix en 2012 base 100 en 2010 d’un produit valant 200 DH en 2017 et 300 DH en 2019? On a P19 300 P I19/17 = × 100 = × 100 = 150. P17 200 V Interpretation: Soit It/0 l’indice élémentaire d’une valeur V à la date t base 100 à V la date 0 et soit ∆ = It/0 − 100. 1- Si ∆ > 0 alors la valeur V a augmenté de ∆% de la date 0 à la date t. 25 26 CHAPITRE. 4 : Les indices statistiques 2- Si ∆ < 0 alors la valeur V a diminué de −∆% de la date 0 à la date t. P Exemple 6 Rprenons l’exemple : On a I19/17 = 150 donc ∆ = 50 et par conséquent le prix à augmenté à 50% de 2017 à 2019. Proposition 4.1.1 (Circularité) Si une grandeur numériques V prend les valeurs V0 , Vt et Vt1 aux instants 0, t, t1 , alors 1 It/0 = It/t1 × It1 /0 × . 100 Prenve: On a It/t1 × It1 /0 × Vt 1 Vt 1 = × 100 × 1 × 100 × 100 Vt1 V0 100 = Vt × 100 V0 It/0 Exemple 7 Le chiffre d’affaires d’une entreprise a augmenté de 30% de 2017 à 2018 et a diminué de 25% de 2018 à 2019. Le C.A. a-t-il diminué ou augmenté de 2017 à 2019? On a I18/17 = 100 + 30 = 130 et I19/18 = 100 − 25 = 75, alors par la propriété de circularité, on a: I19/17 = I19/18 × I18/17 × 130 × 75 1 = = 97.5 100 100 Autrement dit le C.A. a diminué de 2.5% Proposition 4.1.2 (Réversibilité) Si une grandeur numérique V prend les valeurs V0 et Vt aux instants 0 et t, alors It/0 = 1002 . I0 /t Preuve: On a 1002 V0 × 100 Vt Vt = × 100 V0 1002 = I0/t = It/0 27 4.1 Indices élémentaire Exemple 8 Si un prix augmente de 20% de 2017 à 2019, que dire de son evolution de 2019 à 2017? On a I19/17 = 100 + 20 = 120, alors suivant la propriété de réversibilité, on a: I17/19 = 1002 1002 = ≃ 83.33. I19/17 120 Autrement dit, le prix a diminué de 16.67% de 2019 à 2017. Proposition 4.1.3 (Produit des grandeurs) Soit A, B, et C trois grandeurs. 1- Si At = Bt × Ct pour tout instant t, alors A B C It/0 = It/0 × It/0 × 2- Si At = 1 . 100 Bt pour tout instant t, alors Ct A It/0 = B It/0 C It/0 × 100. Preuve: 1- On a B C It/0 × It/0 × Bt Ct 1 1 = × 100 × × 100 × 100 B0 C0 100 = = Bt × Ct × 100 B0 × C0 At × 100 A0 A = It/0 . 2- Le résultat de 2- se déduit en suivant la même démarche suivi en 1-. Exemple 9 Soit P et Q les prix et quantités d’un produit vendu par une entreprise. Si le prix de ce produit augmente de 60% de 2005 à 2010 et si les quantités vendues ont diminué de 50% de 2005 à 2010, alors quelle est l’évolution des recettes R de 2005 à 2010? Q P On a : I10/05 = 100 + 60 = 160 et I10/05 = 100 − 50 = 50 et on a aussi R = P × Q en tout instant, alors d’aprés la propriété du produit des quantités, on a Q R P I10/05 = I10/05 × I10/05 × 160 × 50 1 = = 80. 100 100 Autrement dit les recettes ont diminué de 20%. 28 4.2 CHAPITRE. 4 : Les indices statistiques Les indices synthétiques. En économie, les grandeurs étudiées sont souvent complexes, c’est-à-dire composées de plusieurs grandeurs simples qu’il faut synthétiser. Ainsi, l’indice des prix à la production dans une industrie, est calculé sur la base des prix de 240 produits. Il s’agit d’un indice synthétique résumant les 240 indices élémentaires relatifs au prix de chacun des produits considérés. 4.2.1 Indices de valeur. En économie, on étudie souvent l’évolution des prix, des quantités et de leur produits, appelés valeurs. Trois types d’indices peuvent alors être calculés: indice des prix, indice des quantités et indice de valeur. Définition 4.2.1 On considère une grandeur g composée de k éléments g i , i = 1, ..., k. Pi0 , Pit , Qi0 , et Qit sont respectivement les prix et les quantités à l’instant 0 et t d’un élément g i . L’indice de valeur Pk Pit Qit V It/0 = Pki=1 × 100. i=1 Pi0 Qi0 Exemple 10 Considérons une entreprise qui vend les produits b1 , b2 , b3 , et b4 . On veut expliquer l’évolution du chiffre d’affaires réalisé entre 2 dates 0 et t à partir de l’évolution des prix pratiques et celle des quantités vendues. Les données sont consignées dans le tableau suivant: b Pi0 Qi0 Pit Qit b1 5 20 8 15 b2 6 30 7 20 b3 8 40 9 30 b4 10 10 11 20 On a V It/0 = 8 × 15 + 7 × 20 + 9 × 30 + 11 × 20 × 100 ≃ 107.14. 5 × 20 + 6 × 30 + 8 × 40 + 10 × 10 Donc le chiffre d’affaires a augmenté de 0 à t de 7.14%. 4.2.2 Indices de Laspeyres. Définition 4.2.2 Les indices de Laspeyres des prix et des quantités sont respectivement d efinis par: LPt/0 = Pk Pit Qi0 Pki=1 i=1 Pi0 Qi0 × 100 , LQ t/0 Pk = Pki=1 i=1 Pi0 Qit Pi0 Qi0 × 100. 29 4.2 Les indices synthétiques Exemple 11 Calculons les indices de Laspeyres des prix et des quantités des données de l’exemple précédent. On a 8 × 20 + 7 × 30 + 9 × 40 + 11 × 10 LPt/0 = × 100 = 120, 5 × 20 + 6 × 30 + 8 × 40 + 10 × 10 5 × 15 + 6 × 20 + 8 × 30 + 10 × 20 × 100 ≃ 90.71. LQ t/0 = 5 × 20 + 6 × 30 + 8 × 40 + 10 × 10 Intérpretation: - LPt/0 = 120 implique que à quantités fixées de 0 à t, les prix ont augmenté de 120-100=20%. - LQ t/0 ≃ 90.71 implique que à prix fixées de 0 à t, les quantités ont diminué de 100-90.71=9.29%. 4.2.3 Indices de Paasche. Définition 4.2.3 Les indices de Paasche des prix et des quantités sont respectivement définis par: P Pt/0 = Pk Pit Qit Pki=1 i=1 Pi0 Qit × 100 , Q Pt/0 Pk = Pki=1 Pit Qit i=1 Pit Qi0 × 100. Exemple 12 Calculons les indices de Paasche des prix et des quantités des données de l’exemple précédent. On a 8 × 15 + 7 × 20 + 9 × 30 + 11 × 20 P Pt/0 = × 100 ≃ 118.11, 5 × 15 + 6 × 20 + 8 × 30 + 10 × 20 8 × 15 + 7 × 20 + 9 × 30 + 11 × 20 Q × 100 ≃ 89.29. Pt/0 = 8 × 20 + 7 × 30 + 9 × 40 + 11 × 10 Intérpretation: P - Pt/0 ≃ 118.11 implique que à quantités fixées de 0 à t, les prix ont augmenté de 118.11-100=18.11%. Q - Pt/0 ≃ 89.29 implique que à prix fixées de 0 à t, les quantités ont diminué de 100-89.29=10.17%. 4.2.4 Indices de Fischer. Définition 4.2.4 L’indice de Fisher des prix (resp. des quantités) est défini comme la moyenne géométrique des indices de Laspeyres et de Paasche des prix (resp. des quantit es), et on a: q q Q Q P P Ft/0 = LPt/0 × Pt/0 et Ft/0 = LQ t/0 × Pt/0 . 30 CHAPITRE. 4 : Les indices statistiques Exemple 13 Les indices de Fischer des prix et des quantités (exemple précédent) de 0 à t, sont: √ √ Q P Ft/0 = 120 × 118.11 ≃ 119.05 et Ft/0 = 90.71 × 89.29 ≃ 90. On résume les trois indices dans le tableau suivant: Q Q V P P It/0 LPt/0 Pt/0 Ft/0 LQ Pt/0 Ft/0 t/0 107.14 120 118.11 119.05 90.71 89.29 90 Intérpretation: D’une vue globale, l’augmentation du chiffres d’affaires est à cause de l’augmentation des prix est importante par rapport à la dimunition des quantités. Proposition 4.2.1 (Relation entre les indices) On a: V It/0 = LPt/0 × LQ t/0 Q P = Pt/0 × Pt/0 Q P = Ft/0 × Ft/0