Telechargé par Barbara Loui

C5-stat-des

publicité
Statistique Descriptive
L1 - Sciences Economiques
Chap 5 Tableaux et Diagrammes - II
Michel PAUL
February 10, 2017
Contents
1 Présentation
2 Les
2.1
2.2
2.3
2
distributions conditionnelles
. . . de y sachant xi . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . de x sachant yj . . . . . . . . . . . . . . . . . . . . . . . . . .
Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
6
10
13
3 Indépendance et liaison fonctionnelle
15
3.1 Indépendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.2 Liaison fonctionnelle . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4 Diagrammes
4.1 x et y sont qualitatifs . . . . . .
4.2 x est qualitatif, y est quantitatif
4.3 x et y sont quantitatifs . . . . . .
4.4 Autres représentations . . . . . .
1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
31
31
33
34
35
1
Présentation
On considère une population de n individus décrits simultanément selon 2 caractères :
le caractère x qui contient k modalités :
x1 ; x2 ; : : : ; xk
le caractère y qui contient p modalités :
y1 ; y 2 ; : : : ; yp
En termes de série :
Individus
1
2
..
.
i0
..
.
n
x
x1
x2
y
y1
y2
xi0
y i0
xn
yn
Remarque Dans ce qui suit, on indicera :
les individus par l’indice i0 , ce dernier variant de 1 à n,
les modalités du caractère x par l’indice i, ce dernier variant de 1 à k,
les modalités du caractère y par l’indice j, ce dernier variant de 1 à p.
Exemples Voir les tableaux 1 à 4.
2
Constitution du tableau statistique
(1) On compte le nombre d’individus pour lesquels on observe la valeur xi et
la valeur yj :
# f(xi0 ; yi0 ) = (xi ; yj )g = nij
(2) On fait ce comptage pour tous les couples de valeurs possibles (xi ; yj ), i
variant de 1 à k, j variant de 1 à p.
(3) On dresse un tableau à double entrée décrivant la répartition des n individus selon les di¤érents couples de modalités possibles (xi ; yj ).
(4) On complète le tableau par k sommations horizontales (voir dernière colonne)
et p sommations verticales (voir dernière ligne).
(5) On fait également …gurer dans la dernière cellule l’e¤ectif total n.
Format général du Tableau :
x1
x2
..
.
xi
..
.
xk
y1
n11
n21
y2
n12
n22
ni1
ni2
nk1
n:1
nk2
n:2
...
yj
n1j
n2j
:::
yp
n1p
n2p
n1:
n2:
nij
nip
ni:
nkj
n:j
nkp
n:p
nk:
n
Exemple : cf le tableau 5 - A (croisement de la réussite et de la bourse).
3
Rappel On a :
x1
x2
..
.
xi
..
.
xk
y1
n11
n21
y2
n12
n22
ni1
ni2
nk1
n:1
nk2
n:2
...
yj
n1j
n2j
:::
yp
n1p
n2p
n1:
n2:
nij
nip
ni:
nkj
n:j
nkp
n:p
nk:
n
Commentaires
(1) Le tableau ainsi obtenu est appelé tableau de contingence.
(2) On dispose d’une information :
– sur la distribution jointe des deux caractères (distribution du couple (x; y)) ;
– sur la distribution (marginale) du caractère x (dernière colonne),
– sur la distribution (marginale) du caractère y (dernière ligne).
(3) Formellement :
ni:
=
p
P
nij
j=1
n:j
=
k
P
nij
i=1
avec de plus :
n
= n:1 + n:2 + : : : + n:j + : : : + n:p =
p
P
n:j =
j=1
= n1: + n2: + : : : + ni: + : : : + nk: =
k
P
i=1
4
p P
k
P
nij
j=1 i=1
ni: =
p
k P
P
i=1 j=1
nij
Présentation alternative :
Calcul des fréquences :
fij =
nij
n
Calcul des fréquences marginales :
fi:
=
ni:
n
f:j
=
n:j
n
soit :
x1
x2
..
.
xi
..
.
xk
Total
y1
f11
f21
y2
f12
f22
fi1
fi2
fk1
f:1
fk2
f:2
...
yj
f1j
f2j
:::
yp
f1p
f2p
Total
f1:
f2:
fij
fip
fi:
fkj
f:j
fkp
f:p
fk:
1
Exemple Voir tableau 5 - B (les fréquences sont exprimées en %)
Remarque Formellement :
fi:
p
P
=
fij
j=1
f:j
k
P
=
i=1
pour i = 1; : : : ; k, j = 1; : : : ; p.
5
fij
2
2.1
Les distributions conditionnelles
. . . de y sachant xi
Exemple On reprend le tableau 5 :
ABI
13
18
31
boursier
non boursier
Admis
40
39
79
Ajourné
103
71
174
156
128
284
et l’on calcule :
(1) le taux de réussite global (ou général) :
t
=
nbre admis
nbre inscrits
=
79
= 27:8%
284
(2) le taux de réussite chez les boursiers :
tb
=
nbre boursiers admis
nbre boursiers inscrits
=
40
= 25:6%
156
(3) le taux de réussite chez les non boursiers :
tnb
=
nbre non boursiers admis
nbre non boursiers inscrits
=
39
= 30:8%
128
Le point :
(2) et (3) sont des fréquences conditionnelles.
6
De façon plus générale, connaissant la distribution (marginale) du caractère y :
fy = (f:1 ; f:2 ; f:3 ) =
31 79 174
;
;
284 284 284
= (10:92%; 27:82%; 61:27%)
on veut savoir ce qu’il advient de cette distribution :
) pour la sous-population des boursiers,
) pour la sous-population des non boursiers.
Tableau 5-A
boursier
non boursier
ABI
13
18
31
Admis
40
39
79
Ajourné
103
71
174
156
128
284
A ces …ns :
distribution de la réussite chez les (seuls) boursiers :
fyboursier
=
=
f1boursier ; f2boursier ; f3boursier
13 40 103
;
;
156 156 156
= (8:33%; 25:64%; 66:03%)
distribution de la réussite chez les (seuls) non-boursiers :
fynon
boursier
=
=
f1non
boursier
; f2non
18 39 71
;
;
128 128 128
boursier
; f3non
= (14:06%; 30:47%; 55:47%)
Au …nal :
boursier
non boursier
ABI
8.33
14.06
10.92
Admis
25.64
30.47
27.82
Tableau 6
7
boursier
Ajourné
66.03
55.47
61.27
100
100
100
Tableau 5-A
boursier
non boursier
ABI
13
18
31
Admis
40
39
79
Ajourné
103
71
174
156
128
284
Ajourné
66.03
55.47
61.27
100
100
100
+
Tableau 6
boursier
non boursier
ABI
8.33
14.06
10.92
Admis
25.64
30.47
27.82
A la lecture du tableau :
les étudiants boursiers se présentent plus souvent aux examens (comparé
aux non boursiers)
mais :
ils réussissent (en moyenne) moins bien.
Remarque Cette moindre réussite demeure lorsque l’on calcule les taux de
réussite e¤ ectifs :
f
tef
boursier =
f
tef
non
40
= 27:98%
40 + 103
boursier
tef f =
=
39
= 35:55%
39 + 71
79
= 31: 26%
79 + 174
mais attention au biais de sélection !
8
Généralisation Etant donné les ni: individus qui présentent la modalité xi ,
on veut la distribution (conditionnelle) du caractère y pour cette seule souspopulation :
fyi = f1i ; f2i ; : : : ; fji ; : : : ; fpi
avec :
ni1
ni:
f1i
=
f2i
ni2
ni:
..
.
nij
=
ni:
..
.
nip
=
ni:
fji
fpi
=
(fji se lit “f de j sachant i”).
Litérallement :
Dans la sous-population des individus qui présentent xi :
(1) f1i % présente y1
(2) f2i % présente y2
..
.
( p) fpi % présente yp
De plus :
Comme le caractère x présente k modalités, il existe k distributions
conditionnelles :
fyi = f1i ; f2i ; : : : ; fpi = fji
de la sorte.
9
p
j=1
2.2
. . . de x sachant yj
Reprenant le tableau 5 :
boursier
non boursier
ABI
13
18
31
Admis
40
39
79
Ajourné
103
71
174
156
128
284
on calcule :
(1) le pourcentage d’étudiants boursiers (dans la population totale),
(2) le pourcentage d’étudiants boursiers parmi les ABI,
(3) le pourcentage d’étudiants boursiers pami les Admis,
(4) le pourcentage d’étudiants boursiers pami les Ajournés
soit :
boursier
non boursier
ABI
41.94
58.06
100
Admis
50.63
49.37
100
Ajourné
59.20
40.80
100
54.93
45.07
100
Tableau 7
Littéralement :
Un peu moins de 55% des étudiants de première année d’économie sont
boursiers,
un peu plus de 40% des étudiants qui ne se présentent pas aux examens
sont boursiers,
un peu plus de 50% des étudiants qui réussissent sont boursiers,
un peu moins de 60% des étudiants qui échouent sont boursiers.
Remarque On note une légère sous-représentation des étudiants boursiers dans
la réussite (55% des e¤ ectifs au départ, 50% à l’arrivée).
10
(rappel)
boursier
non boursier
ABI
13
18
31
Admis
40
39
79
Ajourné
103
71
174
156
128
284
Ajourné
59.20
40.80
100
54.93
45.07
100
Tableau 4
+
boursier
non boursier
ABI
41.94
58.06
100
Admis
50.63
49.37
100
Tableau 7
Le point :
On est en train de calculer des distributions conditionnelles, dans
le cas présent celles du caractère x = Bourse selon les di¤ érentes
modalités du caractère y = Reussite.
En d’autres termes :
On ventile la population totale en p = 3 sous-populations, selon les
di¤ érentes modalités du caractère y = Reussite.
Puis :
On regarde dans chacune de ces p = 3 sous-population la distribution
du caractère x = Bourse.
11
De façon plus générale :
(1) On “découpe” la population P en p sous populations Pj au regard de la
valeur présentée pour le caractère y :
P1 = fi0 2 P jyi0 = y1 g
et #P1 = n:1
..
.
Pj = fi0 2 P jyi0 = yj g
..
.
et #Pj = n:j
Pp = fi0 2 P jyi0 = yp g
et #Pp = n:p
Puis :
(2) On calcule :
– le pourcentage d’individus qui présentent la valeur x = xi parmi les
n:j individus qui présentent la valeur y = yj :
fij =
nij
n:j
(lire “f de i sachant j”) ;
– de façon plus générale la distribution du caractère x dans Pj :
fxj = f1j ; f2j ; : : : ; fkj =
n1j n2j
nkj
;
;:::;
n:j n:j
n:j
Pour …nir :
(3) Le caractère y se divisant en p modalités :
y1 ; : : : ; y j ; : : : ; yp
il existe p distributions conditionnelles :
fx1 = f11 ; f21 ; : : : ; fk1 = fi1
k
i=1
..
.
n
o n ok
fxj = f1j ; f2j ; : : : ; fkj = fij
i=1
..
.
k
fxp = ff1p ; f2p ; : : : ; fkp g = ffip gi=1
de la sorte.
12
2.3
Propriétés
Propriété 1 :
fij
=
nij
n
=
nij
ni:
= fji
ni:
n
fi:
Propriété 2 :
fij
=
nij
n
=
nij
n:j
= fij
n:j
n
f:j
Littéralement :
(1) le pourcentage de la population qui a i et j est égale au pourcentage qui
a i que multiplie le pourcentage qui a j parmi ceux qui ont i ;
(2) le pourcentage de la population qui a i et j est aussi égale au pourcentage
qui a j que multiplie le pourcentage qui a i parmi ceux qui ont j.
13
Application On a :
Tableau 5-A
boursier
non boursier
ABI
13
18
31
Admis
40
39
79
Ajourné
103
71
174
156
128
284
Tableau 6
boursier
non boursier
ABI
8.33
14.06
10.92
Admis
25.64
30.47
27.82
Ajourné
66.03
55.47
61.27
100
100
100
Tableau 7
boursier
non boursier
ABI
41.94
58.06
100
Admis
50.63
49.37
100
Ajourné
59.20
40.80
100
54.93
45.07
100
Par la suite :
(1) Le taux de réussite des boursiers est de :
25:64%
(2) Les boursiers représentent :
54:93%
des étudiants.
(3) Les étudiants boursiers ayant réussi leur examen représentent :
25:64
100
54:93
= 14:08%
100
de la population totale.
Véri…cation :
f12 =
40
284
100 = 14: 085%
14
3
3.1
Indépendance et liaison fonctionnelle
Indépendance
Dé…nition Le caractère x est indépendant du caractère y si les fréquences conditionnelles :
nij
fij =
n:j
ne dépendent pas de j, cela 8i variant de 1 à k.
Application Si la réussite est indépendante de la bourse, alors :
la proportion d’individus qui ne vient pas doit être la même chez les boursiers et les non boursiers,
– ie le fait d’avoir une bourse ne modi…e pas la propension à se présenter
aux examens (taux de présence) ;
et :
la proportion d’individus qui vient mais qui échoue doit être la même chez
les boursiers et les non boursiers,
– ie le fait d’avoir une bourse ne modi…e pas le taux d’échec (apparent)
et :
la proportion d’individus qui vient et qui réussit doit être la même chez
les boursiers et les non boursiers,
– ie le fait d’avoir une bourse ne modi…e pas le taux de réussite (apparent).
En d’autres termes, si la réussite est indépendante de la bourse :
le taux de présence,
le taux d’échec (apparent),
le taux de réussite (apparent),
doivent être les mêmes chez les boursiers et les non boursiers.
15
Propriété Si le caractère x est indépendant du caractère y, les p distributions
conditionnelles :
n
o
fxj = f1j ; f2j ; : : : ; fkj
pour j variant de 1 à p, parce qu’elles sont toutes égales entre elles, sont égales
à la distribution marginale :
fx = ff1: ; f2: ; : : : ; fk: g
Preuve Par dé…nition, l’indépendance du caractère x par rapport au caractère
y implique :
8
>
f 1 = f12 = : : : = f1j = : : : = f1p
>
> 1
>
>
>
>
>
>
f21 = f22 = : : : = f2j = : : : = f2p
>
>
>
>
>
>
< .
..
>
> f1 = f2 = : : : = fj = : : : = fp
>
>
i
i
i
i
>
> .
>
>
.
>
.
>
>
>
>
>
>
: 1
fk = fk2 = : : : = fkj = : : : = fkp
On a ainsi :
ni1
ni2
nij
nip
=
= ::: =
= ::: =
n:1
n:2
n:j
n:p
8 i = 1; : : : ; k.
Par la suite . . .
16
Lemme Si :
c
a
=
b
d
alors :
a
c
a+c
= =
b
d
b+d
Preuve On a :
a
b
=
a+c
b+d
,
a (b + d) = b (a + c)
, ab + ad = ba + bc
,
ad = bc
,
a
c
=
b
d
17
Application du lemme :
a
c
a
c
a+c
= ) = =
b
d
b
d
b+d
Comme :
ni2
nij
nip
ni1
=
= ::: =
= ::: =
n:1
n:2
n:j
n:p
(par hypothèse), on a :
ni1
n:1
=
ni2
nij
nip
= ::: =
= ::: =
n:2
n:j
n:p
=
ni1 + ni2 + : : : + nij + : : : + nip
n:1 + n:2 + : : : + n:j + : : : + n:p
=
ni:
n
= fi:
En conclusion :
fi1 = fi2 = : : : = fij = : : : = fip = fi:
8i = 1; : : : ; k ou de façon compacte :
fij = fi:
8j = 1; : : : ; p, 8i = 1; : : : ; k.
18
En résumé :
Lorsque le caractère x est indépendant du caractère y, les p distributions conditionnelles :
n
o n ok
fxj = f1j ; f2j ; : : : ; fkj = fij
i=1
sont toutes égales à la distribution marginale :
k
fx = ff1: ; f2: ; : : : ; fk: g = ffi: gi=1
Exemple Voir les tableaux 8 et 9 pour lesquels on conclut très naturellement :
“Le caractère x est indépendant du caractère y”
car :
Le fait de présenter la modalité y = yj ne modi…e pas la distribution
du caractère x et cela est vrai pour toutes les valeurs possibles de y.
19
Question :
L’indépendance de x à y entraîne-t-elle l’indépendance de y à x ?
En d’autres termes :
Si x est indépendant de y, y est-il indépendant de x ?
La réponse (en statistique) est alors :
Oui !
20
Illustration Reprenant le tableau 8, on calcule :
non pas la distribution du caractère x pour chaque valeur de y
mais :
la distribution du caractère y pour chaque valeur de x.
Voir alors le tableau 10 et conclusion :
Le caractère y, parce que sa distribution n’est pas conditionnée par
les modalités du caractère x, ne dépend pas de x.
21
Preuve Si x est indépendant de y, on a :
fij = fi: ; 8j = 1; : : : ; p
Parallèlement :
fij
=
nij
nij n:j
=
= fij
n
n:j n
f:j
=
nij
nij ni:
=
= fji
n
ni: n
fi:
cela 8i = 1; : : : ; k, 8j = 1; : : : ; p.
Par la suite :
fij
f:j = fji
fi:
soit encore compte tenu de l’indépendance :
fi:
f:j = fji
fi:
et après simpli…cation :
f:j = fji
toujours 8i = 1; : : : ; k, 8j = 1; : : : ; p.
Conclusion :
Si :
fij = fi: ; 8i = 1; : : : ; k; 8j = 1; : : : ; p
(ie si x est indépendant de y), alors :
fji = f:j ; 8i = 1; : : : ; k; 8j = 1; : : : ; p
(ie y est indépendant de x).
22
En résumé :
L’indépendance statistique est une notion réciproque
de sorte que :
Les caractères x et y sont indépendants l’un de l’autre.
Interprétation de la propriété d’indépendance
Le fait de béné…cier d’une bourse ne modi…e pas la probabilité de
réussir qui demeure alors égale à la probabilité moyenne.
et de même :
Le fait d’avoir réussi ne modi…e pas la probabilité que l’étudiant considéré soit un boursier.
23
Test d’indépendance Comme :
fij = fi:
ou de façon équivalente :
fji = f:j
en cas d’indépendance, on peut tester l’existence de l’indépendance en regardant
si :
fij = fi:
f:j
soit encore si :
ni:
nij
=
n
n
n:j
n
cela en toute cellule (i; j), i = 1; : : : ; k; j = 1; : : : ; p.
24
Exemple Reprenant le tableau 8 :
y1
3
6
12
21
x1
x2
x3
y2
5
10
20
35
y3
2
4
8
14
y4
4
8
16
28
14
28
56
98
on a :
fx
=
14 28 56
; ;
98 98 98
fy
=
21 35 14 28
; ;
98 98 98 98
1
7
=
=
2
7
4
7
3
14
5
14
1
7
2
7
Le produit des fréquences marginales f1: , f2: et f3: par les fréquences marginales
f:1 , f:2 ,f:3 et f:4 donne alors :
0
-
B
B
B
B
B B
B
B
B
B B
@
3
14
-
-
-
-
-
-
5
14
1
7
2
7
1 1 0
7 C B
C B
C B
2 C
C B
B
7 C
C=B
C B
B
4 C
C B
C B
7 A @
3
98
5
98
1
49
2
49
3
49
5
49
2
49
4
49
6
49
10
49
4
49
8
49
avec un tableau des fréquences fij qui véri…e quant-à-lui :
0
3
B 98
B
B
B 6
B
B 98
B
B
@ 12
98
5
98
2
98
10
98
4
98
20
98
8
98
25
1
4
98 C
C
C
8 C
C
98 C
C
C
16 A
98
1
C
C
C
C
C
C
C
C
C
C
A
3.2
Liaison fonctionnelle
Dé…nition Le caractère x est lié fonctionnellement au caractère y s’il est observé, pour chaque modalité yj du caractère y, une et une seule modalité du
caractère x.
Formellement :
Il existe dans chaque colonne une et une seule cellule en laquelle
l’e¤ ectif nij est di¤ érent de 0.
Exemple Voir tableau 11 ) “si l’on connaît y, on connaît x”.
26
Propriété Contrairement à l’indépendance, le fait que x soit lié fonctionnellement à y n’implique pas “y est lié fonctionnellement à x”.
Exemple Cf tableau 11 : il y a 2 valeurs observées pour y, y1 et y3 , lorsque
x = x1 , ie “si l’on connaît x, on ne connaît pas nécessairement y”.
De plus :
Propriété Si x est lié fonctionnellement à y, les p distributions conditionnelles
du caractère x :
fx1
=
f11 ; : : : ; fi1 ; : : : ; fk1 = fi1
k
i=1
fx2
=
f12 ; : : : ; fi2 ; : : : ; fk2 = fi2
k
i=1
fxp
..
.
k
= ffip ; : : : ; fip ; : : : ; fkp g = ffip gi=1
sont dégénérées, ie elles prennent la valeur 1 (ou 100 si %) en un point et 0
sinon.
Exemple Voir les tableaux 11 et 12.
Remarque Attention ! Le fait que les p distributions conditionnelles :
n
o n ok
fxj = f1j ; : : : ; fij ; : : : ; fkj = fij
i=1
soient dégénérées n’implique pas que la distribution marginale :
k
fx = ff1: ; : : : ; fi: ; : : : ; fk: g = ffi: gi=1
soit dégénérée.
27
Remarque Le fait que x soit lié fonctionnellement à y n’implique pas “ y est
lié fonctionnellement à x” . . . mais il ne l’interdit pas non plus.
En d’autres termes, on peut avoir :
x est lié fonctionnellement à y
et :
y est lié fonctionnellement à x.
On parle alors de relation fonctionnelle réciproque.
Dans un tel cas de …gure :
(1) il correspond à chaque valeur de y une et une seule valeur de x en laquelle
nij 6= 0
et :
(2) il correspond à chaque valeur de x une et une seule valeur de y en laquelle
nij 6= 0.
de sorte que :
(3) il …gure dans chaque ligne et dans chaque colonne un et un seul terme non
nul.
Exemple : voir tableau 13.
Remarque Pour qu’une liaison fonctionnelle puisse être réciproque, il faut que
le tableau statistique soit carré, c’est-à-dire qu’il contienne autant de lignes que
de colonnes.
28
3.3
Conclusion
En conclusion :
On gardera à l’esprit que l’indépendance et la liaison fonctionnelle
sont deux cas extrêmes que l’on rencontre rarement dans la pratique.
En particulier :
L’indépendance rend compte d’une information nulle.
Dans ce cas de …gure en e¤et :
Savoir que l’individu i0 présente la modalité yj ne fournit aucune
information sur la valeur xi qu’il est susceptible de présenter.
A l’inverse :
La liaison fonctionnelle rend compte d’une information totale.
Ainsi :
Si x est liée fonctionnellement à y, connaître la modalité yj présentée par l’individu i0 permet de connaître la valeur xi qu’il présente.
Par la suite, entre ces deux cas extrêmes :
Il y a des situations intermédiaires où la connaissance de la modalité yj apporte une certaine information quant à la valeur xi que
l’individu i0 est susceptible de présenter.
Dans ce cas, on parle alors d’information partielle.
29
Exemple Voir tableaux 14 et 15.
En session I, le taux de réussite (apparent) d’un étudiant en Eco I est de :
79
284
100 = 27:82%
C/s :
Il y a un peu moins de 30% de chances pour qu’un étudiant tiré
au sort soit un étudiant qui passe en seconde année à l’issue de la
première session.
Après le tirage, on informe que ledit étudiant a eu son bac avec mention
AB.
C/s :
La probabilité pour que cet étudiant soit un étudiant qui passe en
seconde année à l’issue de la première session passe à :
18
51
100 = 35: 29%
Par la suite :
(1) si on assimile fréquences et probabilités
et :
(2) sous une hypothèse d’homogénéité entre générations (proches),
alors :
La connaissance de la valeur prise par la variable x, ici x = x2 =
AB, permet d’a¢ ner la prévision que l’on peut faire quant-à la probabilité de réussir d’un étudiant.
30
4
4.1
Diagrammes
x et y sont qualitatifs
Exemple 1 Cf Tableau 16 et …gure 1 (tirés de Calot, pages 195 et 198).
Indication de lecture :
Sont représentées (1) la distribution marginale et (2) les 10 distributions
conditionnelles du caractère “époque de construction ”.
Les bases des rectangles sont proportionnelles aux fréquences des différentes CSP :
bi = k fi:
Comme :
Aij
= bi
= kfi:
hij
fji
on a :
Aij
= k
ni:
n
= k
nij
n
nij
ni:
= kfij
et les aires des di¤érents rectangles sont bien proportionnels aux fréquences
jointes fij .
31
Exemple 2 : représentation par secteurs avec un caractère dichotomique
Cf Tableau 17 et …gure 2 (tirés de Calot, pages 197 et 200).
Indication de lecture :
Les rayons des demi-cercles sont proportionnels à
p
f1: et
p
f2: = 1
p
f1: .
et :
Les angles au centre sont donnés par :
1
j
= 180
fj1
2
j
= 180
fj2
pour j = 1; : : : ; 4.
de façon à ce que les aires des secteurs soient bien proportionnels aux fréquences
fij .
Par exemple :
Sj1
=
=
=
=
1
j
r12
2
180
180
fj1
180
2
k2
2
= k0
fj1
2
k
k 2 f1: =
n1j
n
f1j
32
p
f1:
k2
2
2
n1j
n1:
n1:
n
4.2
x est qualitatif, y est quantitatif
Exemple : Cf Tableau 18 et …gures 3 et 4 (tirés de Calot, pp 201-202).
33
4.3
x et y sont quantitatifs
Exemple 1 : x et y sont 2 variables discrètes
Cf Tableau 19 et …gure 5 (tirés de Calot, pp 209-210) ;
l’aire du cercle (ou dupcarré) est proportionnelle à fij (le rayon ou le côté
est proportionnelle à fij ):
Exemple 2 : x est une variable continue, y est une variable discrète
Cf Tableau 20 et …gure 6 (tirés de Calot, pages 209 et 212) :
On reporte en ordonnée la densité :
dij =
fij
aj
de façon à ce que :
Aij = dij
aj = fij
L’aire total d’un histogramme Hj vaut :
Hj =
k
X
Aij =
i=1
k
X
fij = f:j
i=1
Exemple 3 : x et y sont 2 variables continues
Cf Tableau 21 et …gure 7 (tirés de Calot, pages 213 et 214) :
Le diagramme obtenu s’appelle un stéréogramme.
La parallélépipède relatif à la classe (i; j) a pour hauteur :
hij =
fij
ai
aj
avec ai l’amplitude de la classe i de x et aj l’amplitude de la classe j de
y.
34
4.4
Autres représentations
En conclusion, cf :
(1) les nuages de points (voir chapitre 7),
(2) la représentation des séries chronologiques avec :
– les représentations simples
– les représentations superposées
– les représentations polaires
(3) les cartogrammes,
(4) les graphiques triangulaires.
35
Téléchargement