8.10.07-22.10.07

publicité
Mesures de tendance centrale
•
•
•
•
•
•
Moyenne arithmétique
Médiane
Mode
Moyenne géométrique
Moyenne harmonique
Quantiles
A. Mattei
1
Moyenne arithmétique (MA)
1+ 3 + 3 + 4 + 5 + 5 + 5 + 6
=4
8
x
∑ i
n
∑X
=x
N
A. Mattei
i
=µ
2
Propriétés
• Dépend de toutes les valeurs
• Facile à calculer
• C’est la valeur attendue (voir plus tard)
1
cxi = c x
∑
n
1
( x i ± c) = x ± c
∑
n
∑ ( x − x) = 0
i
A. Mattei
3
Moyenne pondérée
∑ w x = ∑ω x
∑w
i i
i i
i
wi
→ ωi =
∑ wi
1× 1 + 2 × 3 + 1× 4 + 3 × 5 + 1× 6
=4
1+ 2 +1+ 3 +1
1 2
1
3
1
1+ 3 + 4 + 5 + 6 = 4
8 8
8
8
8
A. Mattei
4
Défauts
• Peut ne correspondre à aucune des valeurs
• Peut donner une fausse image d’une
majorité de valeurs
• Est influencée par les valeurs extrêmes:
9 x 1000 + 1 x 20000 donne 2900
• Prendre alors la moyenne tronquée (sans les
valeurs extrêmes). On obtient 1000
A. Mattei
5
Commande TI-83/84
• Introduire les valeurs dans la liste L1 et les
fréquences dans L2 en utilisant la commande
STAT / EDIT.
• Aller dans CALC et choisir 1-Var Stats
• Presser ENTER et taper L1,L2
• En pressant ENTER vous obtenez la
moyenne (x) et d’autres mesures.
• Si vous voulez uniquement la moyenne,
choisissez LIST /MATH et ensuite 3:mean(.
A. Mattei
6
• Introduire L1,L2) et presser
ENTER.
Commandes MINITAB et EXCEL
• Pour MINITAB, aller dans CALC / Statistiques
par colonne et choisir Moyenne. Si vous allez
dans Stat / Statistiques élémentaires / Afficher
les statistiques descriptives, vous obtenez aussi
la moyenne tronquée (Moyenne TR), sans le
5% des valeurs les plus petites et 5% des
valeurs les plus grandes).
• Pour EXCEL, chercher Moyenne dans les
fonctions statistiques ou taper par exemple,
A. Mattei
7
dans une cellule: =MOYENNE(A1:A20)
Médiane
• Sépare les valeurs en deux parties égales
lorsqu’elles sont ordonnées (de manière
croissante ou décroissante)
• Meilleur indice pour les valeurs asymétriques
• Correspond à une des valeurs dans le cas
d’un nombre impair d’éléments
• 13579
• 1 3 5 7 9 12 : médiane 6 = (5+7)/2
A. Mattei
8
REVENU MENSUEL DES MENAGES
Effectif
1000
500
0
0
10000
20000
REVENU
• Médiane 7522 , MoyenneA. 8387
Mattei
9
Propriétés
• N’est pas influencée par les valeurs extrêmes
• La somme des écarts absolus par rapport à une
valeur est minimale lorsque cette valeur est la
médiane:
• Min
∑ abs( x − c) ⇒ c = médiane
• Min
∑ ( x − c)
i
i
2
⇒ c = moyenne
A. Mattei
10
A. Mattei
11
Commande TI-83/84
• Introduire les valeurs dans la liste L1 en
utilisant la commande STAT / EDIT.
• Aller dans CALC et choisir 1-Var Stats
• Presser ENTER et taper L1
• En pressant ENTER vous obtenez la
médiane (Med) et d’autres mesures.
• Si vous voulez uniquement la médiane,
choisissez LIST /MATH et ensuite 4:median(.
• Introduire L1) et presser ENTER.
A. Mattei
12
Commandes MINITAB et EXCEL
• Pour MINITAB, aller dans CALC / Statistiques
par colonne et choisir Médiane. Si vous allez
dans Stat / Statistiques élémentaires / Afficher
les statistiques descriptives, vous obtenez aussi
la médiane.
• Pour EXCEL, chercher MEDIANE dans les
fonctions statistiques ou taper par exemple,
dans une cellule: =Mediane(A1:A20)
A. Mattei
13
Mode
• C’est la valeur la plus fréquente
• C’est le sommet d’une distribution de
fréquence
• Distribution unimodale: un seul sommet
• Distribution bimodale: deux sommets
• Défaut: valeur pas très stable
A. Mattei
14
Distribution bimodale
Kernel density plot
0.035
0.030
Density
0.025
0.020
0.015
0.010
0.005
0.000
10
20
30
40A. Mattei
50
60
70
80
15
Commande TI-83/84
• Introduire les valeurs dans la liste L1 en
utilisant la commande STAT / EDIT.
• Aller dans PRGM et choisir MODE
• Presser ENTER et taper L1
• Ce programme ne fait pas partie des
programmes standard de la TI. Vous devez
le télécharger (voir page du cours).
A. Mattei
16
Commandes MINITAB et EXCEL
• Pour MINITAB, aller dans Stat / Tableaux / Tri à
plat. Choisir Dénombrements. Le mode est la
valeur qui a la fréquence la plus élevée.
• Pour EXCEL, chercher MODE dans les
fonctions statistiques ou taper par exemple,
dans une cellule: =MODE(A1:A20)
A. Mattei
17
Moyenne géométrique
• C’est la n-ième racine des valeurs:
MG = x1 × x2 × ⋅ ⋅ ⋅ × xn
n
1
ln(MG ) = ∑ ln( xi )
n
• Uniquement pour des valeurs positives
• A utiliser pour le calcul du taux moyen de variation
A. Mattei
18
Commande TI-83/84
• Introduire les valeurs dans la liste L1 en
utilisant la commande STAT / EDIT.
• Aller dans PRGM et choisir MGEO
• Presser ENTER et taper L1
• Ce programme ne fait pas partie des
programmes standard de la TI. Vous devez
le télécharger (voir page du cours).
A. Mattei
19
Commandes MINITAB et EXCEL
• Pour MINITAB: taper, dans la fenêtre Session
%MGEO C1
(Ce programme ne fait pas partie des
commandes MINITAB standard)
• Pour EXCEL, chercher MOYENNE
GEOMETRIQUE dans les fonctions
statistiques ou taper par exemple, dans une
cellule: =MOYENNE.GEOMETRIQUE(A1:A20)
A. Mattei
20
Calcul du taux moyen de variation
pt
rt =
−1
pt −1
MG = n (1 + r1 ) × (1 + r2 ) ⋅ ⋅ ⋅ (1 + rn )
• Taux moyen: MG-1
pn = po (1 + taux.moyen) = po MG
n
pn
p1 p2 p3
⋅⋅⋅
p n = po
po p1 p2
pn −1
A. Mattei
n
21
Exemple
•
•
•
•
•
4
Rendement SPI en 2002: -25.95%
Rendement SPI en 2003: 22.06%
Rendement SPI en 2004: 6.86%
Rendement SPI en 2005: 35.65%
Rendement moyen:
0.7405 ×1.2206 ×1.0686 ×1.3565 = 1.0699 → 6.99%
• SPI en 2001: 4382.94. En 2005:
4382.94 ×1.0699 = 5742.99
4
A. Mattei
22
(1+r)5 = 2.8357 r = 0.2318 (23.18%)
5 ln(1+r)=ln(2.8357) ln(1+r)=ln(2.8357)/5 = 0.2085
e0.2085 = 1.2318
A. Mattei
23
[
MG≤MA
x1 − x2
] =x +x
2
1
−
2
x
x
≥
0
2
1 2
x1 + x2 ≥ 2 x1 x2
• MA≥MG
A. Mattei
24
Moyenne harmonique
MH =
•
•
•
•
n
1 1
1
+ + ⋅⋅⋅ +
x1 x2
xn
=
Peu utilisée
Formule des moyennes:
avec α=-1,0,1
Inégalités:
n
1
∑x
i
 ∑ xi
M. = 
 n

α




1
α
MH ≤ MG ≤ MA
A. Mattei
25
Vitesse moyenne
MH =
2
1
1
+
80 120
= 96
• 120 Km à 80 km/h 1.5 h
• 120 Km à 120 Km/h 1.0 h
• 240 Km et 2.5 h (240/2.5) = 96 Km/h
A. Mattei
26
MH ≤ MG
2
 1
1 
1
2
1
−
+ ≥0

 = −
x1
x2 
x1 x2 x2
 x1
1 1
+ ≥
x1 x2
•
x1 x2 ≥
2
1 1
+
x1 x2
2
x1 x2
⇒ MG ≥ MH
A. Mattei
27
Quantiles
• Quartiles: division de la série ordonnée en 4
parties égales
• Qk=(1-Ө)xs + Өxs+1
k=1,2,3 ; r=k(n+1)/4 ;
s=ent(r) ; Ө=r-s ; médiane: k=2
• 1 3 5 7 9 12 14 15 17 18 25
• Q1 = 5 ; Q2 =ME=12 ; Q3 = 17
• Quintiles: division en 5 parties
• Déciles: division en 10 parties
• Centiles: division en 100 parties
A. Mattei
28
Exemple
• Qk = (1-Ө)xs + Өxs+1; r=k(n+1)/4 ;s=ent(r) ;
Ө=r-s
• 5 6 10 14 15 17 19 22 26 30 (n=10)
• k=1r=(11/4)=2.75 ; s=2 ;Ө=0.75
Q1=0.25 x 6 + 0.75 x 10 = 9
• k = 2r=(2x11/4)=5.5 ; s=5 ; Ө=0.5
Q2 = 0.5 x 15 + 0.5 x 17 = 16 (médiane)
• k=3r=(33/4)=8.25 ; s=8 ; Ө=0.25
x 26 = 23
Q3= 0.75 x 22+0.25A. Mattei
29
Revenu des nouveaux diplômés universitaires en 2001
•
salaire brut annuel pondéré
Quartile
Quartile
inférieur
Médiane
supérieur
60'000
76'500
90'000
Hommes
Sciences humaines + sociales Femmes
55'000
72'000
83'000
56'000
74'000
86'000
Total
75'000
83'000
91'000
Hommes
Sciences économiques
70'000
80'000
86'500
Femmes
72'000
80'000
90'000
Total
30'000
60'000
80'000
Hommes
Droit
28'000
60'000
78'000
Femmes
30'000
60'000
80'000
Total
50'000
62'000
80'000
Hommes
Sciences exactes + naturelles Femmes
43'000
60'000
74'000
49'000
60'000
78'000
Total
62'000
73'000
80'000
Hommes
Médecine + pharmacie
60'000
73'000
80'000
Femmes
60'500
73'000
80'000
Total
60'000
73'000
85'000
Hommes
Sciences techniques
54'000
61'500
75'000
Femmes
58'000
71'000
83'000
Total
57'500
66'500
74'000
Hommes
Interdisciplinaire + autre
62'000
72'000
83'000
Femmes
60'000
70'000
80'000
Total
56'000
74'000
85'000
Hommes
A.
Mattei
Total
53'000
70'000
80'000
Femmes
55'000
72'000
84'000
Total
30
A. Mattei
31
•
A. Mattei
32
Commande TI-83/84
• Introduire les valeurs dans la liste L1 en
utilisant la commande STAT / EDIT.
• Aller dans PRGM et choisir QUARTILE
• Presser ENTER et taper L1
• Ce programme ne fait pas partie des
programmes standard de la TI. Vous devez
le télécharger (voir page du cours).
• Les quartiles obtenus avec CALC / 1-var Stat
peuvent ne pas êtreA.correctes.
Mattei
33
Commandes MINITAB et EXCEL
• Pour MINITAB, aller dans Stat / Statistiques
élémentaires / Afficher les statistiques
descriptives. Les quartiles sont Q1 et Q3
• Pour EXCEL, chercher Quartile dans les
fonctions statistiques ou taper par exemple,
dans une cellule: =QUARTILE(A1:A20;1)
• Même commande pour CENTILE.
• On peut aussi obtenir les quantiles en utilisant
la commande Kième minimum et Kième
maximum avec Utilitaire d’analyse / Statistiques
descriptives.
A. Mattei
34
Indices de dispersion
• Etendue (range):
valeur la plus grande – valeur la plus petite
• Intervalle interquartile: IR = Q3 – Q1
contient le 50% des valeurs
• Diagramme en forme de boîte (boxplot)
• Variance
• Ecart-type , erreur absolue
• Coefficient de variation
A. Mattei
35
Boxplot
• Lignes verticales: quartiles
• Ligne horizontale: moustaches (Qk±1.5 IR) ou fin
(sans valeurs exentriques: *)
AGE DES ASSUREES POUR LES FRAIS DE MATERNITE
10
20
30
40
50
A.
age
60
Mattei
70
80
36
•
A. Mattei
37
Commande TI-83/84
• Introduire les données dans la liste L1 en
utilisant la commande STAT / EDIT.
• Ajuster les dimensions du graphique avec la
touche WINDOW. En pressant la touche Stat
Plot, choisir 1:Plot1 et le quatrième type de
graphique. Mettre L1 dans Xlist. Presser
GRAPH.
A. Mattei
38
Commande MINITAB
• Pour MINITAB, aller dans Graphique / Boîte à
moustaches. Dans Variables du graphique,
sélectionner le vecteur C1 pour Y. Cliquer sur
Options et cocher Transposer X et Y.
• Il n’y a pas de commande Boxplot pour EXCEL.
A. Mattei
39
Variance
• Population: σ2 = (1/N)Σ (Xi – µ)2
• Echantillon:
1
2
s =
( xi − x)
∑
n −1
2
• Unité de mesure: u2 → prendre √ : σ ou s
• Principale mesure de dispersion
• Ne peut pas être négative
A. Mattei
40
•
A. Mattei
41
Exemple
X
(X-µ)
(X-µ)2
x1
1
-5
25
x2
3
-3
9
x3
5
-1
1
x4
7
1
1
x5
14
8
64
Σ
30
0
100
• Q1=2 ; ME=5 ; Q3=10.5, µ=6 ;σ2 = 20; s2 = 25
A. Mattei
42
Propriétés
•
•
•
•
•
•
•
Soit x={x1,x2,…,xn}
Var(cx) = c2 Var(x)
Var(x+c) = Var(x)
Var[(x-µ)/σ]=1
Var(c)=0
Dépend des unités de mesure
Prendre alors le coefficient de variation:
CV = σ/µ
A. Mattei
43
Commande TI-83/84
• Introduire les valeurs dans la liste L1 en utilisant la
commande STAT / EDIT.
• Aller dans CALC et choisir 1-Var Stats
• Presser ENTER et taper L1
• En pressant ENTER vous obtenez l’écart-type de
l’échantillon (Sx) et de la population (σx).
• Si vous voulez uniquement l’écart-type de
l’échantillon, choisissez LIST /MATH et ensuite
7:stdDev(L1).
• Pour la variance de l’échantillon, presser ensuite la
touche x2.
A. Mattei
44
Ecart-type et variance de la population
• Si vous voulez uniquement l’écart-type de la
population, après la commande Calc 1-Var
Stats, presser la touche Vars. Choisir
5:Statistics et ensuite 4:σx.
• Si vous voulez la variance de la population, il
suffit d’élever au carré l’écart-type obtenu cidessus (touche x2).
A. Mattei
45
Commandes MINITAB et EXCEL
• Pour MINITAB, aller dans CALC / Statistiques
par colonne et choisir Ecart-type. Vous obtenez
s. Si vous allez dans Stat / Statistiques
élémentaires / Afficher les statistiques
descriptives, vous obtenez aussi s (EcarType).
• Pour EXCEL, chercher ECARTYPE dans les
fonctions statistiques ou taper, dans une
cellule: =ECARTYPE(A1:A20). Pour σ, choisir
ECARTYPEP. Pour la variance, choisir Var
2
Mattei .
46
pour s2 ou Var.P pourA. σ
La semi-variance
• La variance prend le carré des différences
positives et négatives par rapport à la
moyenne. Parfois, les différences positives
n’ont pas la même valeur que les
différences négatives. On peut alors
calculer la semi-variance qui ne considère
que les différences négatives.
A. Mattei
47
Exemple
•
•
•
•
•
Rendement de deux titres:
A:
0
0 0 0
50
B: -11.103 -10 10 18.103 43
Dans les deux cas, µ=10% ,σ=20%
En finance, σ représente le risque. Or, on
pourrait préférer A qui n’a pas de rendement
négatif. Si l’on prend la semi-variance, on
obtient un écart-type de 8.94 pour A et 13
pour B. Résultat équivalent avec la moyenne
géométrique pour les rendements.
A. Mattei
48
Indices de forme
• Le moments
• Le coefficient d’asymétrie
• Le coefficient d’aplatissement
A. Mattei
49
Les moments
• Moments
1
µr =
N
∑X
r
i
→ µ1 = moyenne
• Moments centrés
1
µ =
N
c
r
∑(X
− µ) → µ = σ
r
i
A. Mattei
c
2
2
50
Coefficient d’asymétrie
• Distribution symétrique: moments d’ordre impair =0
• Coefficient pour un échantillon
3
 xi − x 
n


g1 =
∑


(n − 1)(n − 2)  s 
• Distribution étalée vers la droite: g1 >0
mode < médiane < moyenne
• Distribution étalée vers la gauche: g1<0
moyenne < médiane < mode
A. Mattei
51
Distributions asymétriques
• Etalée vers la:
• droite (g1 > 0)
• MO<ME<MA
gauche (g1 < 0)
MA<ME<MO
Kernel density plot
Kernel density plot
0.00010
Density
Density
0.00010
0.00005
0.00000
0.00005
0.00000
0
10000
20000
30000
40000
A. Mattei
0
10000
20000
30000
40000
52
Commande TI-83/84
• Introduire les valeurs dans la liste L1 en
utilisant la commande STAT / EDIT.
• Aller dans PRGM et choisir ASYM
• Presser ENTER et taper L1
• Ce programme ne fait pas partie des
programmes standard de la TI. Vous devez
le télécharger (voir page du cours).
• La valeur obtenue est le coefficient
d’asymétrie pour unA.échantillon.
Mattei
53
Commandes MINITAB et EXCEL
• Pour MINITAB, aller dans Stat / Statistiques
élémentaires / Afficher les statistiques
descriptives. Cliquer sur Graphiques et choisir
récapitulatif graphique.
• Pour EXCEL, choisir Outils / Utilitaire d’analyse
/ Statistiques descriptives. Introduire la plage et
choisir rapport détaillé.
• Vous pouvez aussi taper, dans une cellule:
=COEFFICIENT.ASYMETRIE(A1:A9).
• Il s’agit des coefficients
pour un échantillon. 54
A. Mattei
Coefficient d’aplatissement
• Kurtosis:




xi − x
(n − 1)
n(n + 1)




g2 =
−
3
∑
3
 s 
(n − 2)(n − 3)  (n − 1)





4
2
• Mesocurtique (normale): g2=0
• Platicurtique (aplatie): g2<0
• Leptocurtique (mince): g2>0
A. Mattei
55
Kurtosis
• Platicurtique (g2<0)
Leptocurtique (g2>0)
Kernel density plot
Kernel density plot
0.8
0.7
0.6
Density
Density
0.2
0.1
0.5
0.4
0.3
0.2
0.1
0.0
0.0
-4
-3
-2
-1
0
1
2
3
4
-4
-3
-2
-1
Kernel
density
plot
0
1
2
3
4
0.4
• Mesocurtique (g2=0)
Density
0.3
0.2
0.1
A. Mattei
56
0.0
-4
-3
-2
-1
0
1
2
3
4
Commande TI-83/84
• Introduire les valeurs dans la liste L1 en
utilisant la commande STAT / EDIT.
• Aller dans PRGM et choisir KURTOSIS
• Presser ENTER et taper L1
• Ce programme ne fait pas partie des
programmes standard de la TI. Vous devez
le télécharger (voir page du cours).
A. Mattei
57
Commandes MINITAB et EXCEL
• Pour MINITAB, aller dans Stat / Statistiques
élémentaires / Afficher les statistiques
descriptives. Cliquer sur Graphiques et choisir
récapitulatif graphique.
• Pour EXCEL, choisir Outils / Utilitaire d’analyse
/ Statistiques descriptives. Introduire la plage et
choisir rapport détaillé.
• Vous pouvez aussi taper, dans une cellule:
=KURTOSIS(A1:A9).
• Il s’agit des coefficients
pour un échantillon. 58
A. Mattei
Relations entre les variables
•
•
•
•
Graphique: nuage de points (scatterplot)
Covariance
Corrélation
Corrélation des rangs
A. Mattei
59
LIEN ENTRE PIB ET CONSOMMATION (1949-2005)
230
210
CONSOMMATION
190
170
150
130
110
90
70
50
100
200
300
PIB
A. Mattei
400
60
Commande TI-83/84
• Introduire les données de X et Y dans les
listes L1 et L2 en utilisant la commande
STAT / EDIT.
• Ajuster les dimensions du graphique avec la
touche WINDOW. En pressant la touche Stat
Plot, choisir 1:Plot1 et le premier type de
graphique. Mettre L1 et L2 dans Xlist et Ylist.
Presser GRAPH.
A. Mattei
61
Commandes MINITAB et EXCEL
• Pour MINITAB, aller dans Graphique /
Diagramme. Introduire les deux variables.
Cliquer sur OK.
• Pour EXCEL, introduire les données dans les
colonnes A et B. Cliquer sur Assistant
graphique. Choisir nuage de points dans soustype de graphique et cliquer sur Terminer.
A. Mattei
62
Covariance
1
Cov( X , Y ) = ∑ ( X i − µ X )(Yi − µY )
N
1
cov( x, y ) =
( xi − x)( yi − y )
∑
n −1
• Lien positif Cov > 0
• Lien négatif Cov < 0
• Pas de lien Cov = 0
A. Mattei
63
Exemple
i,j
X
Y
(X-µx)
(Y-µy) (X-µx)(Y-µy)
1
1
2
-5
-5
25
2
3
8
-3
1
-3
3
5
9
-1
2
-2
4
7
3
1
-4
-4
5
14
13
8
6
48
Σ
30
35
0
0
64
• µx=6;σx=4.47;µy=7;σy=4.05 ;σxy=12.8 ;ρ=0.707
A. Mattei
64
Propriétés
•
•
•
•
•
•
•
Dépend des unités de mesure
Lien entre les variables
cov(ax,by)=ab cov(x,y)
cov(x+a,y+b)=cov(x,y)
cov(ax+by,z)=a cov(x,z) + b cov(y,z)
var(ax+by)=a2 var(x)+b2var(y)+2ab cov(x,y)
var(x+y)+var(x-y)=2 var(x)+2 var(y)
A. Mattei
65
Commande TI-83/84
• Introduire les valeurs de X dans la liste L1,
celles de Y dans L2 et les fréquences dans
L3 en utilisant la commande STAT / EDIT.
• Aller dans PRGM et choisir COV
• Presser ENTER
• Ce programme ne fait pas partie des
programmes standard de la TI. Vous devez
le télécharger (voir page du cours).
A. Mattei
66
Commandes MINITAB et EXCEL
• Pour MINITAB, aller dans Stat / Statistiques
élémentaires / Covariance. On obtient la
matrices des variances-covariances de
l’échantillon.
• Pour EXCEL, chercher covariance dans les
fonctions statistiques.
• Vous pouvez aussi taper, dans une cellule:
=COVARIANCE(A1:A9;B1:B9).
• Il s’agit des covariances pour un échantillon.
A. Mattei
67
Exemple
i,j
Xi
Yj
P=0.8X+0.2Y
1
7
-3
5
2
5
5
5
3
3
13
5
4
8
-7
5
5
6
1
5
µ x = 5.8; σ x2 = 2.96; µ y = 1.8; σ y2 = 47.36; σ xy = −11.84
σ P2 = 0.82 × 2.96 + 0.2 2 × 47A..36
− 11.84 × 2 × 0.8 × 0.2 = 0 68
Mattei
Corrélation
ρ= cov(X,Y)/(σxσy)=cov(x,y)/(sxsy)
• Ne dépend pas des unités de mesure
• Entre -1 et +1
• lien linéaire positif parfait: ρ=1
• lien linéaire négatif parfait: ρ=-1
• approximation si lien non linéaire parfait
• ρ(ax,by)=ρ(x,y)
• ρ(x+a,y+b)=ρ(x,y)
• var(ax+by)=a2var(x)+b2var(y)+2ab ρ σxσy
A. Mattei
69
│ρ(x,y)│≤ 1
• Soient les variables standardisées:
Zx =
X − µx
σx
; Zy =
Y − µy
σy
; σ Zx = σ Z y = 1
• on a:
1
ρ ( X ,Y ) = N
∑(X
i
− µ x )(Yi − µ y )
σ xσ y
1
=
N
∑Z Z
x
y
= σ zx z y
Var ( Z x ± Z y ) = Var ( Z x ) + Var ( Z y ) ± 2σ Z x Z y ≥ 0
2(1 ± ρ ) ≥ 0 → ρ ≤ 1
A. Mattei
70
• Corrélation positive
RHO=0.568
8
7
6
Y
5
4
3
2
1
0
1
2
3
4
5
6
7
8
X
• Corrélation négative
RHO=-0.764
8
7
6
Y
5
4
3
2
1
0
0
1
2
3
4
X
5
6
7
8
A. Mattei
71
Pas de corrélation
RHO=0
RHO=0
8
15
7
6
10
4
C2
C3
5
3
5
2
1
0
0
1
2
3
4
5
6
7
8
0
C4
1
2
3
4
5
6
7
8
C1
A. Mattei
72
Corrélation parfaite
RHO=1
RHO=-1
20
10
10
5
Y
y
0
-10
0
-20
-30
0
1
2
3
4
5
6
7
0
8
1
2
3
4
5
6
7
8
X
x
A. Mattei
73
A. Mattei
74
A. Mattei
75
Commande TI-83/84
• Introduire les valeurs de X dans la liste L1,
celles de Y dans L2 et les fréquences dans
L3 en utilisant la commande STAT / EDIT.
• Mettre des 1 dans L3 si les valeurs ne sont
pas regroupées.
• Aller dans PRGM et choisir CORR
• Presser ENTER
• Ce programme ne fait pas partie des
programmes standard de la TI. Vous devez
le télécharger (voir page
du
cours).
A. Mattei
76
Commandes MINITAB et EXCEL
• Pour MINITAB, aller dans Stat / Statistiques
élémentaires / Corrélation.
• Pour EXCEL, chercher
COEFFICIENT.CORRELATION dans les
fonctions statistiques.
• Vous pouvez aussi taper, dans une cellule:
=COEFFICIENT.CORRELATION(A1:A9;B1:B9)
• Il y a un seul coefficient de corrélation
(population ou échantillon).
A. Mattei
77
Le rang
• Classer les données par ordre croissant
• Calculer ensuite le rang
• Si les données xs,…,xt sont identiques, leur
rang sera (t+s)/2
• Exemple:
xi
1 2 3
4
5
6
7
8
9
10
11
•
3 7 9 10 10 10 12 14 19 19 20
• rang: 1 2 3 5 5 5 7 8 9.5 9.5 11
A. Mattei
78
Corrélation des rangs
• Spearman: ranger les données (mettre un rang
aux données) et ensuite calculer la corrélation
• N’est pas influencée par les valeurs extrêmes:
• x: 1 3 5 6 ; y: 5 2 7 8 ρ= 0.653 ; ρR =0.8
• x: -5 3 5 6 ; y: 5 2 7 8 ρ= 0.366 ; ρR=0.8
• Meilleur résultat pour des valeurs non linéaires
• Ex: y=x2 ρ<1 ; Spearman=1
• Peut être utilisée pour des données ordinales
A. Mattei
79
•
A. Mattei
80
Exemple: ρR = 0.976
Rest.
A
B
C
D
E
F
G
H
Michelin
****
***
**
**
*
*
*
-
rang
8
7
5.5
5.5
3
3
3
1
A. Mattei
Gault-M.
19
18
17
15
13
13
9
8
rang
8
7
6
5
3.5
3.5
2
1
81
Commande TI-83/84
• Introduire les valeurs de X et de Y en utilisant
la commande STAT / EDIT.
• Aller dans PRGM et choisir RCORR
• Introduire les valeurs de X et de Y
• Presser ENTER
• Ce programme ne fait pas partie des
programmes standard de la TI. Vous devez
le télécharger (voir page du cours).
A. Mattei
82
Commandes MINITAB et EXCEL
• Dans MINITAB, introduire les données dans C1 et C2
• Aller dans Manip et choisir RANG.
• Calculer le rang des données et mettre le résultat
dans deux colonnes différentes (C3 et C4).
• Calculer le coefficient de corrélation de ces rangs (C3
et C4)
• EXCEL a la commande RANG dans les formules
statistiques mais elle donne un même rang, supérieur
d’une unité à celui de la donnée précédante, lorsqu’il y
a des données identiques.
A. Mattei
83
Les indices statistiques
• Une seule valeur pour résumer des
phénomènes souvent très complexes:
• indices des prix, indice de confiance des
consommateurs, indice de compétitivité
des nations, indice de développement
humain, indice des cours, indice de masse
corporelle, etc.
• Indice élémentaire et indice synthétique
A. Mattei
84
Indice élémentaire
Rapport entre deux valeurs: it/0=pt/po
Ex. cours de la livre sterling en francs
iCH/£ = 2.5/1
Réversibilité : cours du franc en £
i£/CH=0.4=1/2.5
• Circularité: i£/€ =0.64 ; i€/CH = 0.625
i£/€ x i€/CH = i£/CH
0.64 x 0.625=0.4
•
•
•
•
A. Mattei
85
Indice synthétique
• Combinaison d’indices élémentaires
• Carli (1764): moyenne de 3 prix pour le calcul du
taux d’inflation (blé, huile, vin)
• Soit it un indice élémentaire par rapport à la
période de base (it/0). On a:
I = ∑ω i
t
t
j j
• où ωj est la pondération
A. Mattei
86
Exemples
• SMI: indice du cours de 20 titres. Pondération:
capitalisation boursière (Novartis 15%, UBS 12%,
Nestlé 19%, etc.)
• ISPC: indice suisse des prix à la consommation.
Pondération: 220 groupes de dépense (loyer
19.5%, repas dans les restaurants 3.6%, etc.)
• HDI: indice de développement humain. Trois
indices: taux d’alphabétisation, espérance de vie,
PIB par tête.
A. Mattei
87
Indice de Laspeyres
• Indice de prix (pondération période de base)
t
L
P
pq
∑
=
∑p q
t
j
o
j
o
j
o
j
= ∑ω i ;i =
o t
j j
t
j
p
p
t
j
o
j
;ω =
o
j
o
j
p q
o
j
∑p q
o
j
• Indice de quantité
t
L
Q
q
∑
=
∑q
t
j
o
j
p
p
o
j
o
j
= ∑ ω i ; ⟨i =
o t
j j
A. Mattei
t
j
q
q
t
j
o
j
⟩
88
o
j
Indice Paasche
• Indice de prix (pondération variable)
pq
∑
=
∑p q
t
j
o
j
t
P
P
• Indice de quantité
t
P
Q
q
∑
=
∑q
A. Mattei
t
j
o
j
t
j
t
j
p
p
t
j
t
j
89
po
qo
po.qo
p1
q1
p1.q1
p1.qo po.q1
2
3
4
15
10
10
30
30
40
100
3
4
4
20
15
20
60
60
80
200
45
40
40
125
40
45
80
165
125
165
PL =
= 1.25 ; QL =
= 1.65
100
100
200
200
PP =
= 1.21...; QP =
= 1.6
165
125
A. Mattei
90
Indice Fisher
IF = IL × IP
PF = 1.25 ×1.21 = 1.23..; QF = 1.6248
200
= H : hausse nominale
•PF × QF = 2 =
100
• Réversibilité satisfaite (contrairement à Laspeyres
qui devient Paasche ou Paasche qui devient
Laspeyres)
A. Mattei
91
Relations entre les indices
•
•
•
•
•
Soit H la hausse nominale. On a:
PL x QP = H
PP x QL = H
PF x QF = H
Si on connaît la hausse nominale et un
indice, on peut obtenir l’autre en utilisant
ces formules
A. Mattei
92
Faiblesse de Laspeyres
• En utilisant la pondération de base, l’indice
Laspeyres ne tient pas compte des possibilités de
substitution
• Indice-chaîne: on change la pondération chaque
année:
12.04 / 5.00
L
P
= 104.2; P
12.05 / 12.04
L
= 101.0
PL12.04 / 5.00 × PL12.05 /12.04 = PL12.05 / 5.00 = 104.2 ×101.0 = 105.2
A. Mattei
93
Valeur nominale et réelle
• Inflation = hausse généralisée des prix
• Si tous les prix augmentent de 5% on dit que
le taux d’inflation est de 5%
• Dans le cas d’une hausse différenciée des
prix on calcule le taux d’inflation en prenant
un indice de prix
• Valeur réelle=valeur nominale/indice des prix
• Quantité=valeur réelle
A. Mattei
94
po
qo
po.qo
p1
q1
p1.q1 p1/PL x .q1
2
3
4
15
10
10
30
30
40
100
3
4
4
20
15
20
60
60
80
200
2.4
3.2
3.2
48
48
64
160
160
= 1.6 → QP
100
A. Mattei
95
po
2
4
6
•
qo
5
2
4
po.qo
10
8
24
42
p1=1.05po
2.1
4.2
6.3
48.51
= 1.155
42
q1=1.1qo
5.5
2.2
4.4
p1.q1
11.55
9.24
27.72
48.51
(+15.5%: hausse nominale)
1.155
= 1.10
1.05
•
(+10% hausse réelle)
• taux réel= taux nominal – taux d’inflation
•
1 + taux d’inflation
• taux réel ~ taux nominal - taux inflation=10.5%
A. Mattei
96
Illusion monétaire
• Difficulté à saisir le concept de valeur réelle
(consommateurs, syndicats, hommes
politiques)
• Taux d’intérêt nominal et taux réel
• Hausse de salaire nominale ou réelle
• 4% avec 2% inflation ou 3% avec 1%?
• Turquie, 03: taux intérêt 37.7%, inflation 25.2%
• Déflation: baisse généralisée des prix
A. Mattei
97
TAUX D'INFLATION EN SUISSE
10
8
6
4
2
0
-2
1950
1960
1970A. Mattei1980
1990
2000
98
Indice des prix à la consommation
• Calculé depuis 1922 en Suisse
• Indice Laspeyres avec pondération tirée des
budgets des ménages, changée chaque
année
• Prix relevés chaque mois pour alimentation
et produits pétroliers, autres 3 ou 6 mois
• 1046 biens et services
• 12 groupes principaux, 83 groupes
• Pondération pour 218 biens (ERC 2005)
A. Mattei
99
A. Mattei
100
• 11 régions (Genève, Lausanne, Sion en
Suisse romande)
• 2200 points de vente
• Décembre 2005=100
• Problème en cas de changement de qualité
• Indice « plutocratique »
• Pas de substitution surestimation du coût
de la vie
• Moyenne géométrique pour les prix des
variétés. Ex: citrons et oranges pour les
agrumes
A. Mattei
101
Indice plutocratique et démocratique
Ménages:
9
%
Dépense
1
%
Dépense
Alimentation 20000
0.4
20000
0.16
Loyer
20000
0.4
20000
0.16
Autres
10000
0.2
85000
0.68
Total
50000
125000
• Pondération autres biens:
• plutocratique 0.304 ; démocratique
0.248
A. Mattei
102
1939
1966 1977 1993 2000
2007
alimentation
40.7
30.4 17.1
14.3
11.5
11.0
logement
27.0
23.0 23.0
25.2
26.5
25.4
habillement
15.0
13.0
8.0
6.5
5.1
4.6
santé
2.0
7.0
7.0
10.2
13.4
15.9
transports
3.9
7.4
13.1
9.7
9.4
10.8
loisirs
3.0
5.0
13.8
7.7
10.3
9.2
restaurants
0.3
2.5
5.5
9.3
9.5
8.9
boissons al.
2.0
3.1
2.4
2.0
2.0
1.7
équipement
5.0
7.0
7.0
6.8
5.1
4.6
autres
1.1
1.6 A. Mattei3.1
8.3
7.2
9.1
103
Suisse
France Etats-Unis
alimentation
logement
habillement
santé
transports
loisirs
11.0
25.4
4.6
15.9
10.9
9.2
16.3
14.4
5.8
9.1
16.0
8.6
9.7
33.7
4.2
6.0
16.6
5.9
restaurants
boissons alcoolisées
8.9
1.7
7.7
3.9
8.1
2.4
enseignement
0.7
0.3
2.9
17.9
10.5
autres
A. Mattei
11.7
104
Budgets des ménages
•
•
•
•
•
Environ 20000 adresses tirées au sort
Demande téléphonique de participation
70% ne sont pas d’accord
Échantillon aléatoire de 3300 ménages
Relevé des dépenses quotidiennes
pendant 1 mois (gros travail)
A. Mattei
105
•
A. Mattei
106
•
A. Mattei
107
A. Mattei
108
Septembre 2007
•
•
•
•
•
•
•
•
ISPC=101.1 (décembre 05=100)
+0.7% par rapport à septembre 06
Alimentation: -0.7%
Habillement: +3.2%
Communications: -3.4%
Marchandises: +0.3%
Services: +1.1%
Biens importés: +0.7%
A. Mattei
109
Indices de concentration
• Distribution des revenus: courbe de Lorenz
• Egalité parfaite: diagonale
• Inégalité parfaite: axe horizontal jusqu’à la fin
et ensuite rejoint la diagonale
• Pas d’ambiguïté si pas de croisement
• Indice de Gini
• Indice d’Atkinson
• Indice d’Herfindahl
A. Mattei
110
COURBE DE LORENZ
1.0
0.9
•
0.8
0.7
0.6
EGALITE PARFAITE
0.5
0.4
0.3
0.2
0.1
0.0
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
A. Mattei
INEGALITE PARFAITE
111
nombre
revenu
total
5
50
250
4
100
400
1
350
350
10
%
1000
% cumulés
% revenu
% cumulés
50%
50%
25%
25%
40%
90%
40%
65%
10%
100%
35%
100%
100%
100%
A. Mattei
112
COURBE DE L0RENZ
B
100
90
80
70
D
60
G=ABDE/ABC
50
40
30
E
20
10
0
A0
10
20
30
40
50
60A. Mattei
70 80
90
C
100
113
COURBES DE LORENZ
100
•
80
TAILLE
60
IQ
40
20
REVENU
FORTUNE
0
25
50
A. Mattei
75
100
114
A. Mattei
115
A. Mattei
116
A. Mattei
117
Coefficient de Gini
1
G= 2 ∑
2n µ i
∑y
i
− yj
j
2
1
G = 2 ( y1 + 2 y2 + 3 y3 + ⋅ ⋅ ⋅ + nyn ) − − 1
n µ
n
y1 ≤ y2 ≤ y3 ≤ ⋅ ⋅ ⋅ ≤ yn
• µ=moyenne, n=nombre individus
• G=0 égalité parfaite; G=1 inégalité parfaite
• 0 ≤ G ≤ 1 (avantage par rapport au CV)
A. Mattei
118
Quelques coefficients de Gini
•
•
•
•
•
•
•
Suède: G=0.22
France: G=0.30
Suisse: G=0.32
Irlande: G=0.33
Etats-Unis: G=0.34
Taille: G=0.1
IQ: G=0.15
A. Mattei
119
Une faiblesse de cet indice
•
•
•
•
•
A
100
200
300
400
B
50
250
300
400
C
100
200
250
450
• Gini:
0.250 0.275 0.275
• Atkinson (ε=1.5) 0.175 0.344 0.190
A. Mattei
120
Commande TI-83/84
• Introduire les données par ordre croissant
dans L1 et les fréquences dans L2 en
utilisant la commande STAT / EDIT.
• Aller dans PRGM et choisir GINI
• Presser ENTER
• Ce programme ne fait pas partie des
programmes standard de la TI. Vous devez
le télécharger (voir page du cours).
A. Mattei
121
Commande MINITAB
• Introduire les données dans C1
• Taper, dans la fenêtre Session %GINI C1
• (Ce programme ne fait pas partie des
commandes MINITAB standard)
• Il n’y a pas de commande spéciale dans
EXCEL
A. Mattei
122
Indice d’Atkinson
1−ε
 y 
i
I = 1 − ∑  
  µ 

fi 

1 /(1−ε )
• fi=proportion d’individus avec le revenu yi
• Différence entre inégalité dans les bas et les hauts
revenus
• Dépend de l’importance attribuée à l’inégalité
(ε=0 aucune I=0) A. Mattei
123
Indice d’Herfindahl
• Herfindahl: concentration industrielle
H = 10000∑ ω
2
i
qi
; ωi =
Q
• 1200-1700: doutes sur la concurrence
• > 1700 la concurrence est en danger
A. Mattei
124
Indices pour la Suisse
•
•
•
•
•
•
•
Industrie chimique: 2571
Banques: 1781
Industrie textile: 1655
Industrie du papier: 1220
Commerce de gros: 570
Commerce de détail: 374
Restauration: 125
A. Mattei
125
Téléchargement