Mesures de tendance centrale • • • • • • Moyenne arithmétique Médiane Mode Moyenne géométrique Moyenne harmonique Quantiles A. Mattei 1 Moyenne arithmétique (MA) 1+ 3 + 3 + 4 + 5 + 5 + 5 + 6 =4 8 x ∑ i n ∑X =x N A. Mattei i =µ 2 Propriétés • Dépend de toutes les valeurs • Facile à calculer • C’est la valeur attendue (voir plus tard) 1 cxi = c x ∑ n 1 ( x i ± c) = x ± c ∑ n ∑ ( x − x) = 0 i A. Mattei 3 Moyenne pondérée ∑ w x = ∑ω x ∑w i i i i i wi → ωi = ∑ wi 1× 1 + 2 × 3 + 1× 4 + 3 × 5 + 1× 6 =4 1+ 2 +1+ 3 +1 1 2 1 3 1 1+ 3 + 4 + 5 + 6 = 4 8 8 8 8 8 A. Mattei 4 Défauts • Peut ne correspondre à aucune des valeurs • Peut donner une fausse image d’une majorité de valeurs • Est influencée par les valeurs extrêmes: 9 x 1000 + 1 x 20000 donne 2900 • Prendre alors la moyenne tronquée (sans les valeurs extrêmes). On obtient 1000 A. Mattei 5 Commande TI-83/84 • Introduire les valeurs dans la liste L1 et les fréquences dans L2 en utilisant la commande STAT / EDIT. • Aller dans CALC et choisir 1-Var Stats • Presser ENTER et taper L1,L2 • En pressant ENTER vous obtenez la moyenne (x) et d’autres mesures. • Si vous voulez uniquement la moyenne, choisissez LIST /MATH et ensuite 3:mean(. A. Mattei 6 • Introduire L1,L2) et presser ENTER. Commandes MINITAB et EXCEL • Pour MINITAB, aller dans CALC / Statistiques par colonne et choisir Moyenne. Si vous allez dans Stat / Statistiques élémentaires / Afficher les statistiques descriptives, vous obtenez aussi la moyenne tronquée (Moyenne TR), sans le 5% des valeurs les plus petites et 5% des valeurs les plus grandes). • Pour EXCEL, chercher Moyenne dans les fonctions statistiques ou taper par exemple, A. Mattei 7 dans une cellule: =MOYENNE(A1:A20) Médiane • Sépare les valeurs en deux parties égales lorsqu’elles sont ordonnées (de manière croissante ou décroissante) • Meilleur indice pour les valeurs asymétriques • Correspond à une des valeurs dans le cas d’un nombre impair d’éléments • 13579 • 1 3 5 7 9 12 : médiane 6 = (5+7)/2 A. Mattei 8 REVENU MENSUEL DES MENAGES Effectif 1000 500 0 0 10000 20000 REVENU • Médiane 7522 , MoyenneA. 8387 Mattei 9 Propriétés • N’est pas influencée par les valeurs extrêmes • La somme des écarts absolus par rapport à une valeur est minimale lorsque cette valeur est la médiane: • Min ∑ abs( x − c) ⇒ c = médiane • Min ∑ ( x − c) i i 2 ⇒ c = moyenne A. Mattei 10 A. Mattei 11 Commande TI-83/84 • Introduire les valeurs dans la liste L1 en utilisant la commande STAT / EDIT. • Aller dans CALC et choisir 1-Var Stats • Presser ENTER et taper L1 • En pressant ENTER vous obtenez la médiane (Med) et d’autres mesures. • Si vous voulez uniquement la médiane, choisissez LIST /MATH et ensuite 4:median(. • Introduire L1) et presser ENTER. A. Mattei 12 Commandes MINITAB et EXCEL • Pour MINITAB, aller dans CALC / Statistiques par colonne et choisir Médiane. Si vous allez dans Stat / Statistiques élémentaires / Afficher les statistiques descriptives, vous obtenez aussi la médiane. • Pour EXCEL, chercher MEDIANE dans les fonctions statistiques ou taper par exemple, dans une cellule: =Mediane(A1:A20) A. Mattei 13 Mode • C’est la valeur la plus fréquente • C’est le sommet d’une distribution de fréquence • Distribution unimodale: un seul sommet • Distribution bimodale: deux sommets • Défaut: valeur pas très stable A. Mattei 14 Distribution bimodale Kernel density plot 0.035 0.030 Density 0.025 0.020 0.015 0.010 0.005 0.000 10 20 30 40A. Mattei 50 60 70 80 15 Commande TI-83/84 • Introduire les valeurs dans la liste L1 en utilisant la commande STAT / EDIT. • Aller dans PRGM et choisir MODE • Presser ENTER et taper L1 • Ce programme ne fait pas partie des programmes standard de la TI. Vous devez le télécharger (voir page du cours). A. Mattei 16 Commandes MINITAB et EXCEL • Pour MINITAB, aller dans Stat / Tableaux / Tri à plat. Choisir Dénombrements. Le mode est la valeur qui a la fréquence la plus élevée. • Pour EXCEL, chercher MODE dans les fonctions statistiques ou taper par exemple, dans une cellule: =MODE(A1:A20) A. Mattei 17 Moyenne géométrique • C’est la n-ième racine des valeurs: MG = x1 × x2 × ⋅ ⋅ ⋅ × xn n 1 ln(MG ) = ∑ ln( xi ) n • Uniquement pour des valeurs positives • A utiliser pour le calcul du taux moyen de variation A. Mattei 18 Commande TI-83/84 • Introduire les valeurs dans la liste L1 en utilisant la commande STAT / EDIT. • Aller dans PRGM et choisir MGEO • Presser ENTER et taper L1 • Ce programme ne fait pas partie des programmes standard de la TI. Vous devez le télécharger (voir page du cours). A. Mattei 19 Commandes MINITAB et EXCEL • Pour MINITAB: taper, dans la fenêtre Session %MGEO C1 (Ce programme ne fait pas partie des commandes MINITAB standard) • Pour EXCEL, chercher MOYENNE GEOMETRIQUE dans les fonctions statistiques ou taper par exemple, dans une cellule: =MOYENNE.GEOMETRIQUE(A1:A20) A. Mattei 20 Calcul du taux moyen de variation pt rt = −1 pt −1 MG = n (1 + r1 ) × (1 + r2 ) ⋅ ⋅ ⋅ (1 + rn ) • Taux moyen: MG-1 pn = po (1 + taux.moyen) = po MG n pn p1 p2 p3 ⋅⋅⋅ p n = po po p1 p2 pn −1 A. Mattei n 21 Exemple • • • • • 4 Rendement SPI en 2002: -25.95% Rendement SPI en 2003: 22.06% Rendement SPI en 2004: 6.86% Rendement SPI en 2005: 35.65% Rendement moyen: 0.7405 ×1.2206 ×1.0686 ×1.3565 = 1.0699 → 6.99% • SPI en 2001: 4382.94. En 2005: 4382.94 ×1.0699 = 5742.99 4 A. Mattei 22 (1+r)5 = 2.8357 r = 0.2318 (23.18%) 5 ln(1+r)=ln(2.8357) ln(1+r)=ln(2.8357)/5 = 0.2085 e0.2085 = 1.2318 A. Mattei 23 [ MG≤MA x1 − x2 ] =x +x 2 1 − 2 x x ≥ 0 2 1 2 x1 + x2 ≥ 2 x1 x2 • MA≥MG A. Mattei 24 Moyenne harmonique MH = • • • • n 1 1 1 + + ⋅⋅⋅ + x1 x2 xn = Peu utilisée Formule des moyennes: avec α=-1,0,1 Inégalités: n 1 ∑x i ∑ xi M. = n α 1 α MH ≤ MG ≤ MA A. Mattei 25 Vitesse moyenne MH = 2 1 1 + 80 120 = 96 • 120 Km à 80 km/h 1.5 h • 120 Km à 120 Km/h 1.0 h • 240 Km et 2.5 h (240/2.5) = 96 Km/h A. Mattei 26 MH ≤ MG 2 1 1 1 2 1 − + ≥0 = − x1 x2 x1 x2 x2 x1 1 1 + ≥ x1 x2 • x1 x2 ≥ 2 1 1 + x1 x2 2 x1 x2 ⇒ MG ≥ MH A. Mattei 27 Quantiles • Quartiles: division de la série ordonnée en 4 parties égales • Qk=(1-Ө)xs + Өxs+1 k=1,2,3 ; r=k(n+1)/4 ; s=ent(r) ; Ө=r-s ; médiane: k=2 • 1 3 5 7 9 12 14 15 17 18 25 • Q1 = 5 ; Q2 =ME=12 ; Q3 = 17 • Quintiles: division en 5 parties • Déciles: division en 10 parties • Centiles: division en 100 parties A. Mattei 28 Exemple • Qk = (1-Ө)xs + Өxs+1; r=k(n+1)/4 ;s=ent(r) ; Ө=r-s • 5 6 10 14 15 17 19 22 26 30 (n=10) • k=1r=(11/4)=2.75 ; s=2 ;Ө=0.75 Q1=0.25 x 6 + 0.75 x 10 = 9 • k = 2r=(2x11/4)=5.5 ; s=5 ; Ө=0.5 Q2 = 0.5 x 15 + 0.5 x 17 = 16 (médiane) • k=3r=(33/4)=8.25 ; s=8 ; Ө=0.25 x 26 = 23 Q3= 0.75 x 22+0.25A. Mattei 29 Revenu des nouveaux diplômés universitaires en 2001 • salaire brut annuel pondéré Quartile Quartile inférieur Médiane supérieur 60'000 76'500 90'000 Hommes Sciences humaines + sociales Femmes 55'000 72'000 83'000 56'000 74'000 86'000 Total 75'000 83'000 91'000 Hommes Sciences économiques 70'000 80'000 86'500 Femmes 72'000 80'000 90'000 Total 30'000 60'000 80'000 Hommes Droit 28'000 60'000 78'000 Femmes 30'000 60'000 80'000 Total 50'000 62'000 80'000 Hommes Sciences exactes + naturelles Femmes 43'000 60'000 74'000 49'000 60'000 78'000 Total 62'000 73'000 80'000 Hommes Médecine + pharmacie 60'000 73'000 80'000 Femmes 60'500 73'000 80'000 Total 60'000 73'000 85'000 Hommes Sciences techniques 54'000 61'500 75'000 Femmes 58'000 71'000 83'000 Total 57'500 66'500 74'000 Hommes Interdisciplinaire + autre 62'000 72'000 83'000 Femmes 60'000 70'000 80'000 Total 56'000 74'000 85'000 Hommes A. Mattei Total 53'000 70'000 80'000 Femmes 55'000 72'000 84'000 Total 30 A. Mattei 31 • A. Mattei 32 Commande TI-83/84 • Introduire les valeurs dans la liste L1 en utilisant la commande STAT / EDIT. • Aller dans PRGM et choisir QUARTILE • Presser ENTER et taper L1 • Ce programme ne fait pas partie des programmes standard de la TI. Vous devez le télécharger (voir page du cours). • Les quartiles obtenus avec CALC / 1-var Stat peuvent ne pas êtreA.correctes. Mattei 33 Commandes MINITAB et EXCEL • Pour MINITAB, aller dans Stat / Statistiques élémentaires / Afficher les statistiques descriptives. Les quartiles sont Q1 et Q3 • Pour EXCEL, chercher Quartile dans les fonctions statistiques ou taper par exemple, dans une cellule: =QUARTILE(A1:A20;1) • Même commande pour CENTILE. • On peut aussi obtenir les quantiles en utilisant la commande Kième minimum et Kième maximum avec Utilitaire d’analyse / Statistiques descriptives. A. Mattei 34 Indices de dispersion • Etendue (range): valeur la plus grande – valeur la plus petite • Intervalle interquartile: IR = Q3 – Q1 contient le 50% des valeurs • Diagramme en forme de boîte (boxplot) • Variance • Ecart-type , erreur absolue • Coefficient de variation A. Mattei 35 Boxplot • Lignes verticales: quartiles • Ligne horizontale: moustaches (Qk±1.5 IR) ou fin (sans valeurs exentriques: *) AGE DES ASSUREES POUR LES FRAIS DE MATERNITE 10 20 30 40 50 A. age 60 Mattei 70 80 36 • A. Mattei 37 Commande TI-83/84 • Introduire les données dans la liste L1 en utilisant la commande STAT / EDIT. • Ajuster les dimensions du graphique avec la touche WINDOW. En pressant la touche Stat Plot, choisir 1:Plot1 et le quatrième type de graphique. Mettre L1 dans Xlist. Presser GRAPH. A. Mattei 38 Commande MINITAB • Pour MINITAB, aller dans Graphique / Boîte à moustaches. Dans Variables du graphique, sélectionner le vecteur C1 pour Y. Cliquer sur Options et cocher Transposer X et Y. • Il n’y a pas de commande Boxplot pour EXCEL. A. Mattei 39 Variance • Population: σ2 = (1/N)Σ (Xi – µ)2 • Echantillon: 1 2 s = ( xi − x) ∑ n −1 2 • Unité de mesure: u2 → prendre √ : σ ou s • Principale mesure de dispersion • Ne peut pas être négative A. Mattei 40 • A. Mattei 41 Exemple X (X-µ) (X-µ)2 x1 1 -5 25 x2 3 -3 9 x3 5 -1 1 x4 7 1 1 x5 14 8 64 Σ 30 0 100 • Q1=2 ; ME=5 ; Q3=10.5, µ=6 ;σ2 = 20; s2 = 25 A. Mattei 42 Propriétés • • • • • • • Soit x={x1,x2,…,xn} Var(cx) = c2 Var(x) Var(x+c) = Var(x) Var[(x-µ)/σ]=1 Var(c)=0 Dépend des unités de mesure Prendre alors le coefficient de variation: CV = σ/µ A. Mattei 43 Commande TI-83/84 • Introduire les valeurs dans la liste L1 en utilisant la commande STAT / EDIT. • Aller dans CALC et choisir 1-Var Stats • Presser ENTER et taper L1 • En pressant ENTER vous obtenez l’écart-type de l’échantillon (Sx) et de la population (σx). • Si vous voulez uniquement l’écart-type de l’échantillon, choisissez LIST /MATH et ensuite 7:stdDev(L1). • Pour la variance de l’échantillon, presser ensuite la touche x2. A. Mattei 44 Ecart-type et variance de la population • Si vous voulez uniquement l’écart-type de la population, après la commande Calc 1-Var Stats, presser la touche Vars. Choisir 5:Statistics et ensuite 4:σx. • Si vous voulez la variance de la population, il suffit d’élever au carré l’écart-type obtenu cidessus (touche x2). A. Mattei 45 Commandes MINITAB et EXCEL • Pour MINITAB, aller dans CALC / Statistiques par colonne et choisir Ecart-type. Vous obtenez s. Si vous allez dans Stat / Statistiques élémentaires / Afficher les statistiques descriptives, vous obtenez aussi s (EcarType). • Pour EXCEL, chercher ECARTYPE dans les fonctions statistiques ou taper, dans une cellule: =ECARTYPE(A1:A20). Pour σ, choisir ECARTYPEP. Pour la variance, choisir Var 2 Mattei . 46 pour s2 ou Var.P pourA. σ La semi-variance • La variance prend le carré des différences positives et négatives par rapport à la moyenne. Parfois, les différences positives n’ont pas la même valeur que les différences négatives. On peut alors calculer la semi-variance qui ne considère que les différences négatives. A. Mattei 47 Exemple • • • • • Rendement de deux titres: A: 0 0 0 0 50 B: -11.103 -10 10 18.103 43 Dans les deux cas, µ=10% ,σ=20% En finance, σ représente le risque. Or, on pourrait préférer A qui n’a pas de rendement négatif. Si l’on prend la semi-variance, on obtient un écart-type de 8.94 pour A et 13 pour B. Résultat équivalent avec la moyenne géométrique pour les rendements. A. Mattei 48 Indices de forme • Le moments • Le coefficient d’asymétrie • Le coefficient d’aplatissement A. Mattei 49 Les moments • Moments 1 µr = N ∑X r i → µ1 = moyenne • Moments centrés 1 µ = N c r ∑(X − µ) → µ = σ r i A. Mattei c 2 2 50 Coefficient d’asymétrie • Distribution symétrique: moments d’ordre impair =0 • Coefficient pour un échantillon 3 xi − x n g1 = ∑ (n − 1)(n − 2) s • Distribution étalée vers la droite: g1 >0 mode < médiane < moyenne • Distribution étalée vers la gauche: g1<0 moyenne < médiane < mode A. Mattei 51 Distributions asymétriques • Etalée vers la: • droite (g1 > 0) • MO<ME<MA gauche (g1 < 0) MA<ME<MO Kernel density plot Kernel density plot 0.00010 Density Density 0.00010 0.00005 0.00000 0.00005 0.00000 0 10000 20000 30000 40000 A. Mattei 0 10000 20000 30000 40000 52 Commande TI-83/84 • Introduire les valeurs dans la liste L1 en utilisant la commande STAT / EDIT. • Aller dans PRGM et choisir ASYM • Presser ENTER et taper L1 • Ce programme ne fait pas partie des programmes standard de la TI. Vous devez le télécharger (voir page du cours). • La valeur obtenue est le coefficient d’asymétrie pour unA.échantillon. Mattei 53 Commandes MINITAB et EXCEL • Pour MINITAB, aller dans Stat / Statistiques élémentaires / Afficher les statistiques descriptives. Cliquer sur Graphiques et choisir récapitulatif graphique. • Pour EXCEL, choisir Outils / Utilitaire d’analyse / Statistiques descriptives. Introduire la plage et choisir rapport détaillé. • Vous pouvez aussi taper, dans une cellule: =COEFFICIENT.ASYMETRIE(A1:A9). • Il s’agit des coefficients pour un échantillon. 54 A. Mattei Coefficient d’aplatissement • Kurtosis: xi − x (n − 1) n(n + 1) g2 = − 3 ∑ 3 s (n − 2)(n − 3) (n − 1) 4 2 • Mesocurtique (normale): g2=0 • Platicurtique (aplatie): g2<0 • Leptocurtique (mince): g2>0 A. Mattei 55 Kurtosis • Platicurtique (g2<0) Leptocurtique (g2>0) Kernel density plot Kernel density plot 0.8 0.7 0.6 Density Density 0.2 0.1 0.5 0.4 0.3 0.2 0.1 0.0 0.0 -4 -3 -2 -1 0 1 2 3 4 -4 -3 -2 -1 Kernel density plot 0 1 2 3 4 0.4 • Mesocurtique (g2=0) Density 0.3 0.2 0.1 A. Mattei 56 0.0 -4 -3 -2 -1 0 1 2 3 4 Commande TI-83/84 • Introduire les valeurs dans la liste L1 en utilisant la commande STAT / EDIT. • Aller dans PRGM et choisir KURTOSIS • Presser ENTER et taper L1 • Ce programme ne fait pas partie des programmes standard de la TI. Vous devez le télécharger (voir page du cours). A. Mattei 57 Commandes MINITAB et EXCEL • Pour MINITAB, aller dans Stat / Statistiques élémentaires / Afficher les statistiques descriptives. Cliquer sur Graphiques et choisir récapitulatif graphique. • Pour EXCEL, choisir Outils / Utilitaire d’analyse / Statistiques descriptives. Introduire la plage et choisir rapport détaillé. • Vous pouvez aussi taper, dans une cellule: =KURTOSIS(A1:A9). • Il s’agit des coefficients pour un échantillon. 58 A. Mattei Relations entre les variables • • • • Graphique: nuage de points (scatterplot) Covariance Corrélation Corrélation des rangs A. Mattei 59 LIEN ENTRE PIB ET CONSOMMATION (1949-2005) 230 210 CONSOMMATION 190 170 150 130 110 90 70 50 100 200 300 PIB A. Mattei 400 60 Commande TI-83/84 • Introduire les données de X et Y dans les listes L1 et L2 en utilisant la commande STAT / EDIT. • Ajuster les dimensions du graphique avec la touche WINDOW. En pressant la touche Stat Plot, choisir 1:Plot1 et le premier type de graphique. Mettre L1 et L2 dans Xlist et Ylist. Presser GRAPH. A. Mattei 61 Commandes MINITAB et EXCEL • Pour MINITAB, aller dans Graphique / Diagramme. Introduire les deux variables. Cliquer sur OK. • Pour EXCEL, introduire les données dans les colonnes A et B. Cliquer sur Assistant graphique. Choisir nuage de points dans soustype de graphique et cliquer sur Terminer. A. Mattei 62 Covariance 1 Cov( X , Y ) = ∑ ( X i − µ X )(Yi − µY ) N 1 cov( x, y ) = ( xi − x)( yi − y ) ∑ n −1 • Lien positif Cov > 0 • Lien négatif Cov < 0 • Pas de lien Cov = 0 A. Mattei 63 Exemple i,j X Y (X-µx) (Y-µy) (X-µx)(Y-µy) 1 1 2 -5 -5 25 2 3 8 -3 1 -3 3 5 9 -1 2 -2 4 7 3 1 -4 -4 5 14 13 8 6 48 Σ 30 35 0 0 64 • µx=6;σx=4.47;µy=7;σy=4.05 ;σxy=12.8 ;ρ=0.707 A. Mattei 64 Propriétés • • • • • • • Dépend des unités de mesure Lien entre les variables cov(ax,by)=ab cov(x,y) cov(x+a,y+b)=cov(x,y) cov(ax+by,z)=a cov(x,z) + b cov(y,z) var(ax+by)=a2 var(x)+b2var(y)+2ab cov(x,y) var(x+y)+var(x-y)=2 var(x)+2 var(y) A. Mattei 65 Commande TI-83/84 • Introduire les valeurs de X dans la liste L1, celles de Y dans L2 et les fréquences dans L3 en utilisant la commande STAT / EDIT. • Aller dans PRGM et choisir COV • Presser ENTER • Ce programme ne fait pas partie des programmes standard de la TI. Vous devez le télécharger (voir page du cours). A. Mattei 66 Commandes MINITAB et EXCEL • Pour MINITAB, aller dans Stat / Statistiques élémentaires / Covariance. On obtient la matrices des variances-covariances de l’échantillon. • Pour EXCEL, chercher covariance dans les fonctions statistiques. • Vous pouvez aussi taper, dans une cellule: =COVARIANCE(A1:A9;B1:B9). • Il s’agit des covariances pour un échantillon. A. Mattei 67 Exemple i,j Xi Yj P=0.8X+0.2Y 1 7 -3 5 2 5 5 5 3 3 13 5 4 8 -7 5 5 6 1 5 µ x = 5.8; σ x2 = 2.96; µ y = 1.8; σ y2 = 47.36; σ xy = −11.84 σ P2 = 0.82 × 2.96 + 0.2 2 × 47A..36 − 11.84 × 2 × 0.8 × 0.2 = 0 68 Mattei Corrélation ρ= cov(X,Y)/(σxσy)=cov(x,y)/(sxsy) • Ne dépend pas des unités de mesure • Entre -1 et +1 • lien linéaire positif parfait: ρ=1 • lien linéaire négatif parfait: ρ=-1 • approximation si lien non linéaire parfait • ρ(ax,by)=ρ(x,y) • ρ(x+a,y+b)=ρ(x,y) • var(ax+by)=a2var(x)+b2var(y)+2ab ρ σxσy A. Mattei 69 │ρ(x,y)│≤ 1 • Soient les variables standardisées: Zx = X − µx σx ; Zy = Y − µy σy ; σ Zx = σ Z y = 1 • on a: 1 ρ ( X ,Y ) = N ∑(X i − µ x )(Yi − µ y ) σ xσ y 1 = N ∑Z Z x y = σ zx z y Var ( Z x ± Z y ) = Var ( Z x ) + Var ( Z y ) ± 2σ Z x Z y ≥ 0 2(1 ± ρ ) ≥ 0 → ρ ≤ 1 A. Mattei 70 • Corrélation positive RHO=0.568 8 7 6 Y 5 4 3 2 1 0 1 2 3 4 5 6 7 8 X • Corrélation négative RHO=-0.764 8 7 6 Y 5 4 3 2 1 0 0 1 2 3 4 X 5 6 7 8 A. Mattei 71 Pas de corrélation RHO=0 RHO=0 8 15 7 6 10 4 C2 C3 5 3 5 2 1 0 0 1 2 3 4 5 6 7 8 0 C4 1 2 3 4 5 6 7 8 C1 A. Mattei 72 Corrélation parfaite RHO=1 RHO=-1 20 10 10 5 Y y 0 -10 0 -20 -30 0 1 2 3 4 5 6 7 0 8 1 2 3 4 5 6 7 8 X x A. Mattei 73 A. Mattei 74 A. Mattei 75 Commande TI-83/84 • Introduire les valeurs de X dans la liste L1, celles de Y dans L2 et les fréquences dans L3 en utilisant la commande STAT / EDIT. • Mettre des 1 dans L3 si les valeurs ne sont pas regroupées. • Aller dans PRGM et choisir CORR • Presser ENTER • Ce programme ne fait pas partie des programmes standard de la TI. Vous devez le télécharger (voir page du cours). A. Mattei 76 Commandes MINITAB et EXCEL • Pour MINITAB, aller dans Stat / Statistiques élémentaires / Corrélation. • Pour EXCEL, chercher COEFFICIENT.CORRELATION dans les fonctions statistiques. • Vous pouvez aussi taper, dans une cellule: =COEFFICIENT.CORRELATION(A1:A9;B1:B9) • Il y a un seul coefficient de corrélation (population ou échantillon). A. Mattei 77 Le rang • Classer les données par ordre croissant • Calculer ensuite le rang • Si les données xs,…,xt sont identiques, leur rang sera (t+s)/2 • Exemple: xi 1 2 3 4 5 6 7 8 9 10 11 • 3 7 9 10 10 10 12 14 19 19 20 • rang: 1 2 3 5 5 5 7 8 9.5 9.5 11 A. Mattei 78 Corrélation des rangs • Spearman: ranger les données (mettre un rang aux données) et ensuite calculer la corrélation • N’est pas influencée par les valeurs extrêmes: • x: 1 3 5 6 ; y: 5 2 7 8 ρ= 0.653 ; ρR =0.8 • x: -5 3 5 6 ; y: 5 2 7 8 ρ= 0.366 ; ρR=0.8 • Meilleur résultat pour des valeurs non linéaires • Ex: y=x2 ρ<1 ; Spearman=1 • Peut être utilisée pour des données ordinales A. Mattei 79 • A. Mattei 80 Exemple: ρR = 0.976 Rest. A B C D E F G H Michelin **** *** ** ** * * * - rang 8 7 5.5 5.5 3 3 3 1 A. Mattei Gault-M. 19 18 17 15 13 13 9 8 rang 8 7 6 5 3.5 3.5 2 1 81 Commande TI-83/84 • Introduire les valeurs de X et de Y en utilisant la commande STAT / EDIT. • Aller dans PRGM et choisir RCORR • Introduire les valeurs de X et de Y • Presser ENTER • Ce programme ne fait pas partie des programmes standard de la TI. Vous devez le télécharger (voir page du cours). A. Mattei 82 Commandes MINITAB et EXCEL • Dans MINITAB, introduire les données dans C1 et C2 • Aller dans Manip et choisir RANG. • Calculer le rang des données et mettre le résultat dans deux colonnes différentes (C3 et C4). • Calculer le coefficient de corrélation de ces rangs (C3 et C4) • EXCEL a la commande RANG dans les formules statistiques mais elle donne un même rang, supérieur d’une unité à celui de la donnée précédante, lorsqu’il y a des données identiques. A. Mattei 83 Les indices statistiques • Une seule valeur pour résumer des phénomènes souvent très complexes: • indices des prix, indice de confiance des consommateurs, indice de compétitivité des nations, indice de développement humain, indice des cours, indice de masse corporelle, etc. • Indice élémentaire et indice synthétique A. Mattei 84 Indice élémentaire Rapport entre deux valeurs: it/0=pt/po Ex. cours de la livre sterling en francs iCH/£ = 2.5/1 Réversibilité : cours du franc en £ i£/CH=0.4=1/2.5 • Circularité: i£/€ =0.64 ; i€/CH = 0.625 i£/€ x i€/CH = i£/CH 0.64 x 0.625=0.4 • • • • A. Mattei 85 Indice synthétique • Combinaison d’indices élémentaires • Carli (1764): moyenne de 3 prix pour le calcul du taux d’inflation (blé, huile, vin) • Soit it un indice élémentaire par rapport à la période de base (it/0). On a: I = ∑ω i t t j j • où ωj est la pondération A. Mattei 86 Exemples • SMI: indice du cours de 20 titres. Pondération: capitalisation boursière (Novartis 15%, UBS 12%, Nestlé 19%, etc.) • ISPC: indice suisse des prix à la consommation. Pondération: 220 groupes de dépense (loyer 19.5%, repas dans les restaurants 3.6%, etc.) • HDI: indice de développement humain. Trois indices: taux d’alphabétisation, espérance de vie, PIB par tête. A. Mattei 87 Indice de Laspeyres • Indice de prix (pondération période de base) t L P pq ∑ = ∑p q t j o j o j o j = ∑ω i ;i = o t j j t j p p t j o j ;ω = o j o j p q o j ∑p q o j • Indice de quantité t L Q q ∑ = ∑q t j o j p p o j o j = ∑ ω i ; 〈i = o t j j A. Mattei t j q q t j o j 〉 88 o j Indice Paasche • Indice de prix (pondération variable) pq ∑ = ∑p q t j o j t P P • Indice de quantité t P Q q ∑ = ∑q A. Mattei t j o j t j t j p p t j t j 89 po qo po.qo p1 q1 p1.q1 p1.qo po.q1 2 3 4 15 10 10 30 30 40 100 3 4 4 20 15 20 60 60 80 200 45 40 40 125 40 45 80 165 125 165 PL = = 1.25 ; QL = = 1.65 100 100 200 200 PP = = 1.21...; QP = = 1.6 165 125 A. Mattei 90 Indice Fisher IF = IL × IP PF = 1.25 ×1.21 = 1.23..; QF = 1.6248 200 = H : hausse nominale •PF × QF = 2 = 100 • Réversibilité satisfaite (contrairement à Laspeyres qui devient Paasche ou Paasche qui devient Laspeyres) A. Mattei 91 Relations entre les indices • • • • • Soit H la hausse nominale. On a: PL x QP = H PP x QL = H PF x QF = H Si on connaît la hausse nominale et un indice, on peut obtenir l’autre en utilisant ces formules A. Mattei 92 Faiblesse de Laspeyres • En utilisant la pondération de base, l’indice Laspeyres ne tient pas compte des possibilités de substitution • Indice-chaîne: on change la pondération chaque année: 12.04 / 5.00 L P = 104.2; P 12.05 / 12.04 L = 101.0 PL12.04 / 5.00 × PL12.05 /12.04 = PL12.05 / 5.00 = 104.2 ×101.0 = 105.2 A. Mattei 93 Valeur nominale et réelle • Inflation = hausse généralisée des prix • Si tous les prix augmentent de 5% on dit que le taux d’inflation est de 5% • Dans le cas d’une hausse différenciée des prix on calcule le taux d’inflation en prenant un indice de prix • Valeur réelle=valeur nominale/indice des prix • Quantité=valeur réelle A. Mattei 94 po qo po.qo p1 q1 p1.q1 p1/PL x .q1 2 3 4 15 10 10 30 30 40 100 3 4 4 20 15 20 60 60 80 200 2.4 3.2 3.2 48 48 64 160 160 = 1.6 → QP 100 A. Mattei 95 po 2 4 6 • qo 5 2 4 po.qo 10 8 24 42 p1=1.05po 2.1 4.2 6.3 48.51 = 1.155 42 q1=1.1qo 5.5 2.2 4.4 p1.q1 11.55 9.24 27.72 48.51 (+15.5%: hausse nominale) 1.155 = 1.10 1.05 • (+10% hausse réelle) • taux réel= taux nominal – taux d’inflation • 1 + taux d’inflation • taux réel ~ taux nominal - taux inflation=10.5% A. Mattei 96 Illusion monétaire • Difficulté à saisir le concept de valeur réelle (consommateurs, syndicats, hommes politiques) • Taux d’intérêt nominal et taux réel • Hausse de salaire nominale ou réelle • 4% avec 2% inflation ou 3% avec 1%? • Turquie, 03: taux intérêt 37.7%, inflation 25.2% • Déflation: baisse généralisée des prix A. Mattei 97 TAUX D'INFLATION EN SUISSE 10 8 6 4 2 0 -2 1950 1960 1970A. Mattei1980 1990 2000 98 Indice des prix à la consommation • Calculé depuis 1922 en Suisse • Indice Laspeyres avec pondération tirée des budgets des ménages, changée chaque année • Prix relevés chaque mois pour alimentation et produits pétroliers, autres 3 ou 6 mois • 1046 biens et services • 12 groupes principaux, 83 groupes • Pondération pour 218 biens (ERC 2005) A. Mattei 99 A. Mattei 100 • 11 régions (Genève, Lausanne, Sion en Suisse romande) • 2200 points de vente • Décembre 2005=100 • Problème en cas de changement de qualité • Indice « plutocratique » • Pas de substitution surestimation du coût de la vie • Moyenne géométrique pour les prix des variétés. Ex: citrons et oranges pour les agrumes A. Mattei 101 Indice plutocratique et démocratique Ménages: 9 % Dépense 1 % Dépense Alimentation 20000 0.4 20000 0.16 Loyer 20000 0.4 20000 0.16 Autres 10000 0.2 85000 0.68 Total 50000 125000 • Pondération autres biens: • plutocratique 0.304 ; démocratique 0.248 A. Mattei 102 1939 1966 1977 1993 2000 2007 alimentation 40.7 30.4 17.1 14.3 11.5 11.0 logement 27.0 23.0 23.0 25.2 26.5 25.4 habillement 15.0 13.0 8.0 6.5 5.1 4.6 santé 2.0 7.0 7.0 10.2 13.4 15.9 transports 3.9 7.4 13.1 9.7 9.4 10.8 loisirs 3.0 5.0 13.8 7.7 10.3 9.2 restaurants 0.3 2.5 5.5 9.3 9.5 8.9 boissons al. 2.0 3.1 2.4 2.0 2.0 1.7 équipement 5.0 7.0 7.0 6.8 5.1 4.6 autres 1.1 1.6 A. Mattei3.1 8.3 7.2 9.1 103 Suisse France Etats-Unis alimentation logement habillement santé transports loisirs 11.0 25.4 4.6 15.9 10.9 9.2 16.3 14.4 5.8 9.1 16.0 8.6 9.7 33.7 4.2 6.0 16.6 5.9 restaurants boissons alcoolisées 8.9 1.7 7.7 3.9 8.1 2.4 enseignement 0.7 0.3 2.9 17.9 10.5 autres A. Mattei 11.7 104 Budgets des ménages • • • • • Environ 20000 adresses tirées au sort Demande téléphonique de participation 70% ne sont pas d’accord Échantillon aléatoire de 3300 ménages Relevé des dépenses quotidiennes pendant 1 mois (gros travail) A. Mattei 105 • A. Mattei 106 • A. Mattei 107 A. Mattei 108 Septembre 2007 • • • • • • • • ISPC=101.1 (décembre 05=100) +0.7% par rapport à septembre 06 Alimentation: -0.7% Habillement: +3.2% Communications: -3.4% Marchandises: +0.3% Services: +1.1% Biens importés: +0.7% A. Mattei 109 Indices de concentration • Distribution des revenus: courbe de Lorenz • Egalité parfaite: diagonale • Inégalité parfaite: axe horizontal jusqu’à la fin et ensuite rejoint la diagonale • Pas d’ambiguïté si pas de croisement • Indice de Gini • Indice d’Atkinson • Indice d’Herfindahl A. Mattei 110 COURBE DE LORENZ 1.0 0.9 • 0.8 0.7 0.6 EGALITE PARFAITE 0.5 0.4 0.3 0.2 0.1 0.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 A. Mattei INEGALITE PARFAITE 111 nombre revenu total 5 50 250 4 100 400 1 350 350 10 % 1000 % cumulés % revenu % cumulés 50% 50% 25% 25% 40% 90% 40% 65% 10% 100% 35% 100% 100% 100% A. Mattei 112 COURBE DE L0RENZ B 100 90 80 70 D 60 G=ABDE/ABC 50 40 30 E 20 10 0 A0 10 20 30 40 50 60A. Mattei 70 80 90 C 100 113 COURBES DE LORENZ 100 • 80 TAILLE 60 IQ 40 20 REVENU FORTUNE 0 25 50 A. Mattei 75 100 114 A. Mattei 115 A. Mattei 116 A. Mattei 117 Coefficient de Gini 1 G= 2 ∑ 2n µ i ∑y i − yj j 2 1 G = 2 ( y1 + 2 y2 + 3 y3 + ⋅ ⋅ ⋅ + nyn ) − − 1 n µ n y1 ≤ y2 ≤ y3 ≤ ⋅ ⋅ ⋅ ≤ yn • µ=moyenne, n=nombre individus • G=0 égalité parfaite; G=1 inégalité parfaite • 0 ≤ G ≤ 1 (avantage par rapport au CV) A. Mattei 118 Quelques coefficients de Gini • • • • • • • Suède: G=0.22 France: G=0.30 Suisse: G=0.32 Irlande: G=0.33 Etats-Unis: G=0.34 Taille: G=0.1 IQ: G=0.15 A. Mattei 119 Une faiblesse de cet indice • • • • • A 100 200 300 400 B 50 250 300 400 C 100 200 250 450 • Gini: 0.250 0.275 0.275 • Atkinson (ε=1.5) 0.175 0.344 0.190 A. Mattei 120 Commande TI-83/84 • Introduire les données par ordre croissant dans L1 et les fréquences dans L2 en utilisant la commande STAT / EDIT. • Aller dans PRGM et choisir GINI • Presser ENTER • Ce programme ne fait pas partie des programmes standard de la TI. Vous devez le télécharger (voir page du cours). A. Mattei 121 Commande MINITAB • Introduire les données dans C1 • Taper, dans la fenêtre Session %GINI C1 • (Ce programme ne fait pas partie des commandes MINITAB standard) • Il n’y a pas de commande spéciale dans EXCEL A. Mattei 122 Indice d’Atkinson 1−ε y i I = 1 − ∑ µ fi 1 /(1−ε ) • fi=proportion d’individus avec le revenu yi • Différence entre inégalité dans les bas et les hauts revenus • Dépend de l’importance attribuée à l’inégalité (ε=0 aucune I=0) A. Mattei 123 Indice d’Herfindahl • Herfindahl: concentration industrielle H = 10000∑ ω 2 i qi ; ωi = Q • 1200-1700: doutes sur la concurrence • > 1700 la concurrence est en danger A. Mattei 124 Indices pour la Suisse • • • • • • • Industrie chimique: 2571 Banques: 1781 Industrie textile: 1655 Industrie du papier: 1220 Commerce de gros: 570 Commerce de détail: 374 Restauration: 125 A. Mattei 125