Telechargé par zoologiefpk

TECHNIQUES DANALYSES MULTIDIMENSIONNELLE

publicité
TECHNIQUES D’ANALYSES MULTIDIMENSIONNELLES DES DONNEES
Elaboré par : Hatem Dellagi
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte]
Page 1
I INTRODUCTION
II ANALYSE EN COMPOSANTES PRINCIPALES
III ANALYSE FACTORIELLE DES CORRESPONDANCES
IV LES METHODES DE CLASSIFICATION.
V L’ANALYSE FACTORIELLE DISCRIMINANTE.
I INTRODUCTION
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte]
Page 2
Les chapitres précédents ont exposé les phases qui conduisent aux traitements les plus usuels sur
une variable (analyse uni variée : tri à plat, étude de la distribution, tendance centrale et dispersion),
ou sur deux variables (analyse bi variée : t i ois , esu e d’asso iatio e t e deu a ia les . Nous
constatons la limite de ces méthodes due aux caractères combinatoires des analyses possibles dès
que le nombre de variables est assez important. Il est donc
essai e d’a oi e ou s à l’a al se
multi variée t aite e t si ulta d’u e se le de a ia les o
e complément indispensable à
toute étude en général et en marketing plus particulièrement. Les méthodes multi variées peuvent
être classées selon trois groupes principaux :
-
Les méthodes descriptives (analyse factorielle, typologie, analyse des correspondances, analyse
multidimensionnelle des similarités).
Les méthodes explicatives (régression, analyse de la variance, analyse discriminante, analyse
conjointe).
Les méthodes avancées (analyse canonique, modèles probabilistes : logit et probit, modèles loglinéaires, modèles de causalité : analyse des structures de covariances, la régression PLS).
Depuis que la gestion de la relation client est devenu la locomotive des études de marché, les
te h i ues d’a al se se so t la gies ; conséquences du fait que les machines de stockages et de
t aite e ts de l’i fo atio o t o seulement atteint un très haut niveau technologique mais ont
connu une large diffusion les mettant à la portée de très nombreuses organisations (Data Mining).
C’est la aiso pou la uelle les te h i ues d’analyses sont appelées à un très grand développement.
II Analyse en composantes principales
L’a al se e
o posa tes est l’u e des
thodes d’a al se fa to ielle des do
es
multidimensionnelles la plus ou a te. L’a al se e o posa tes p i ipales ACP s’ad esse au
données numériques quantitatives, elle a pour objectifs :
-
-
Analyser les liaisons entre les variables ou critères étudiés et les synthétiser par un nombre
restreint de nouvelles variables appelées composantes ou facteurs, ou encore indicateurs
synthétiques qui ne sont autres que des combinaisons linéaires des variables initiales.
Résumer les unités statistiques en formant des groupes homogènes.
O he he à ett e e
ide e les p op i t s fo da e tales des do
numériques et graphiques.
es à l’aide des pa a
t es
1. Données initiales
Ces do
es so t o stitu es d’o se atio s de plusieu s g a deu s, ot es X1, X2,… Xp sur un
e se le d’u it s statisti ues u
ot s i= ,…,n. Il est commode de présenter ces données sous
fo e d’u ta leau X dont les colonnes sont les variables Xj.
X1 ……. Xj …… Xp
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte]
Page 3
X =
Le terme générale xij du ta leau X o espo d à l’o se atio de la a ia le Xj pa l’i dividu i et le
vecteur xi = (xi1,…., ij,… ip ) est celui des observations des variables X1 , ….Xp par ce dernier . Si les
variables sont hétérogènes, elles seront centrées et réduites et on a le nouveau tableau Y de terme
générale :
ij
= (xij -
où Sj est l’ a t t pe de Xj
)/ Sj
2. Présentation de la méthode.
2.1. Formulation du problème.
Le problème consiste à réduire les p variables initiales étudiées en un nombre restreint de nouvelles
variables appelées composantes ou facteurs Fk . Ces facteurs devront répondre aux deux critères
suivants :
-
La linéarité :
-
L’i d pe da e :
2.2. Notio d’a e fa to iel
Δ1
A1
•
B
A
G
B1
L’i fo atio appo t e pa le poi t A est égale à la distance qui le sépare du centre G de [AB].
L’i fo atio appo t e pa le poi t A au facteur est égale à (GA1)2, de même celle apportée par le
point B est égale à (GB1)2, do l’i fo atio d te ue pa Δ1 est égale à :
I Δ1) = GA12 + GB12
Plus généralement, soit N le nuage des points xi i= ,….n, ayant pour centre de gravité G qui
est le point moyen =
= ( 1 , 2 ,……, p ), muni de la métrique euclidienne.
La dispersion ou l’information ou encore l’inertie du nuage de points autour de leur
centre est définie par :
2
i,
G) =
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte]
ij
-
j )2
Page 4
=
j
)2 =
où Sj 2 est la variance de la variable Xj .
Soit Δ un axer factoriel
xi
• G
Δ
i
L’i e tie du uage de poi ts N due à l’a e Δ est donnée par :
I (N, Δ) =
, G) + I (N, Δ)
I (N, G) =
, G) est l’inertie ou la variance expliquée par l’axe Δ, elle est aussi
La quantité
appelée valeur propre de la matrice de variance covariance et notée λ et on a :
I (N, G) =
j
= variance totale du nuage de points
2.3. Matrice de variances covariances
La matrice de variances covariance C a pour terme général :
C jj' 
1 n
 (x ij  X j )(x ij'  X j' )
n i 1
Il représente la covariance entre les variables Xj et Xj’ . Si les variables sont centrées et réduites on
obtient alors la matrice des corrélations de terme général :
Rjj’ =

1 n ( x ij  X j ) ( x ij'  X j' )
 S
n i ^1
S j'
j
La trace de la matrice des corrélations V est égale au nombre p de variables étudiées et on a :
p
trace (V)=
j1
j
 I( N, G )  p
où λj est la aleu p op e d’o d e j de la
at i e V
2.4. D fi itio de l’ACP.
L’a al se e o posa tes p i ipales est u e te h i ue ui s’ad esse au tableau de données
ua titati es et ui est la plus utilis e, ’est la ase de toutes les
thodes d’a al ses factorielles.
Elle a pour but :
-Analyser les liens existants entre les variables observées.
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte]
Page 5
-Former des groupes homogènes des unités statistiques étudiées.
Ceci en construisant m nouvelles variables C1 , …., ,Cm m ≤p appelées composantes
principales, qui sont centrées et non corrélées entre elle et qui résument
l’information détenu par p variables initiales observées par les n unités statistiques ou
individus.
La composante principale C1 est une combinaison linéaire des Xj
j=1,..,p . On a
alors : C1 = a 11X1  ......  a 1p X p .
La valeur de C1 pour l’individu i est : C1i  a 11 x 1i  .....  a 1p x ip et d’une manière générale
la kieme composante principale s’écrit : Ck = a 1k X1  ....  a kp X p
2.5. Détermination des composantes principales.
2.5.1. Da s l’espa e des i dividus.
La détermination du premier axe factoriel D1 de vecteur directeur a1 de coordonnées ( a 11 ,..., a 1p ) qui
correspond au premier vecteur propre de la matrice
1
X' X . L’a e Dk et de vecteur directeur ak keme
n
vecteur propre de la même matrice associé à la keme plus grande valeur propre, avec ak orthogonal à
ar pour r=1,..,k-1.
2.5.2. Da s l’espa e des va ia les.
R
p
La composante principale Ck est obtenue en maximisant
alors le keme vecteur propre de la matrice
j1
2
(C k , X j ) . La composante Ck est
1
XX' associé à la keme plus grande valeur propre. Cette
n
composante vérifie la condition : R(Ck ,Cj )=0 pour j=1,..,k-1.
2.5.2 ; Equivalence des deux analyses.
Dans l'espace des individus et à la keme étape, ak est le e teu p op e d’o d e k de la
at i e
1
X' X associé à la keme plus grande valeur propre λk . Da s l’espa e des a ia les Ck est le vecteur
n
1
propre de la matrice
XX' associé à la même valeur propre λk. . )
n
En effet on a :
1
X' X ak = λk ak , en multiplions des deux cotés par la matrice X on obtient :
n
1
1
XX' (Xak )= λk (Xak) d’où : XX' Ck = λk Ck.
n
n
Remarques :
a. Les matrices
1
1
XX' et X' X ont les mêmes valeurs propres λk , k=1,..,p mais de dimension
n
n
respectives (n,n) et (p,p) différentes , donc les n-p dernières valeurs propres sont nulles.
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte]
Page 6
 R (C k , X j )  
p
b.
p
C 'k X j X 'j C k
j1
nC 'k C k
2
j1

1 C 'k (XX ' C k )
 k
n
C 'k C k
2.5.3. Corrélation entre la composante Ck et la variable initiale Xj.
Le vecteur constitué par les corrélations des p variables initiales Xj avec la composante principale Ck
est égal au vecteur ak d’o d e k
ultipli pa λk1/2
En effet :
La corrélation entre la composante Ck et la variable Xj est donnée par :
'
1 X jC k
R(Ck ,Xj )=
n k
,le vecteur des corrélations j =1,..p est donné par :
[R (Ck , X1 , ….,R Ck , Xp )] =
a
1 X' C k 1 X' Xa k
=
 k k = k a k
n k n k
ak
2.6. Pa a t es d’aide à l’i te p tatio .
L’i te p tatio des a es fa to iels ou des o posa tes p i ipales issus de l’a al se est as e su
les paramètres suivants :
2.6.1 Indice de Kaiser Olkin Mayer (KMO) et test de Bartlett.
L’i di e KMO
L’i di ateu KMO de Kaise Olki Ma e est u e esu e de l’i po ta e des oeffi ie ts de
o latio o se es pa appo t à l’i po ta e des o latio s pa tielles des ariables initiales Xj
j= ,…p. Si la so
e des a s des o latio s pa tielles e t e toutes les pai es de a ia les est
nettement inférieure à la so
e des a s des o latio s, l’i di e KMO est p o he de et o peut
di e ue la te h i ue de L’ACP utilisée est adéquate ou validée. Un KMO inférieur à 0.5 montre que
L’ACP ’est pas o seill e.
Le test de sphéricité de Bartlett
Ce test pe et de
ifie l’h poth se selo la uelle la at i e de o latio s des a ia les Xj est
égale à la matrice identité. Autrement dit toutes les corrélations entre les variables Xj et Xj’ pour j≠j’
sont nulles ce qui entraîne une absence totale de relations. Le rejet de cette hypothèse permet de
alide la te h i ue de L’ACP utilis e. Ce test est as su la statistique de khi deux. Une valeur
calculée de khi deux supérieur à la valeur critique ou encore une signification inférieur au risque 
fi d’a a e a outit à la alidit de la
thode.
2.6.2. Matrice anti-image de corrélations.
La matrice anti-image de corrélation permet de mesurer les corrélations partielles des variables
i itiales deu à deu sous l’i flue e des aut es a ia les. L’i di ateu MSA Measu e of sa pli g
adequacy) est donné sur la diagonale de la matrice anti-image. Les variables Xj ayant une faible
aleu MSA peu e t t e li i es e ui fa o ise l’aug e tatio de l’i di e KMO.
2.6.3. Choix des composantes principales.
Le choix des composantes principales ou des axes factoriels selon leurs importances da s l’a al se
peut être réalisé selon les trois approches suivantes :
-Approche de Kaiser
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte]
Page 7
Le critère de Kaiser pour le choix des axes factorielles stipule que les axes qui peuvent retenus pour
l’i te p tatio des sultats so t eu ui o t u e a ia e expliqués ou valeur propre supérieur à 1.
Cepe da t e it e e tie t pas o pte de la pa t d’i fo atio ete ue pa ha ue o posa te
choisie.
-Approche graphique
L’histog a
e des aleu s p op es permet de repérer à quel niveau on remarque une dénivellation
ou encore un coude ou une chute des valeurs propres. Ce i eau s’il est lai e e t e a u
correspond au nombre de composantes retenues.
-Approche empirique
On note par : k = λk –λk+1 les différences d’o d e , ui so t st i te e t positi es entre deux valeurs
propres consécutives.
Βk =k - k°1 les diff e es d’o d e . Si les Βk changent de signe au niveau l on retiendra l+1 facteurs
utiles pou l’i te p tatio des sultats de l’a al se.
Il est aussi fort utile de regarder les pourcentages cumulés des variances expliquées. Généralement
on cherche à retenir des axes factoriels qui expliquent un minimum de 50% de la variance totale ou
de l’i fo atio o te ue da s le ta leau de données.
.6. . Pa t de l’i fo atio e pli u e pa u a e.
La variance totale est égale à la somme des p valeurs propres. La part (exprimée en pourcentage) de
l’i fo
atio d te ue pa l’a e Dj de variance expliquée λj est égal à :
j


j
j
p
.
2.6.5. Corrélations entre les variables initiales et la composante Ck .
Si les variables initiales sont centrées et réduites, le coefficient de corrélation R(Xj , Ck ) est un
i di ateu pou
esu e l’importance du rôle joué par la variable Xj da s l’i te p tatio de la
composante Ck .
Il est donc possible en identifiant les coefficients de corrélations les plus élevés de trouver les
variables initiales qui contribuent le plus à la formation de la composante ou du facteur Ck .
2.6.6. Rotation des axes Factorielles.
Si l’i te p tatio des fa teu s ’est lai e e t faite, le recours à la rotation des axes factoriels est
possible, ceci permet de mieux les interpréter les résultats. On distingue différents types de
rotation :
- La rotation Varimax : elle a pour but de réduire le nombre de variables initiales qui contribuent à
l’i te p tatio de l’a e tout e aug e ta t leu s o latio s a e e de ie . L’o thogo alit des
axes factoriels est gardée dans ce cas.
- La rotation Oblimin : elle a lmême objectif que la rotation Varimax mais les axes factorielles sont
suppos s o li ues da s e as. Ce ui sou e t les as e p ati ue as de l’ tude su le le to at d’u
journal de la place) bien que les facteurs en théorie sont orthogonaux par construction .
- La rotation Equamax : Elle a pou ut de i i ise les fa teu s da s l’i te p tatio des sultats et
de supprimer les variables initiales à cheval sur deux axes factoriels.
- La rotation Promax ; Est une combinaison des rotations Equamax et Varimax.
2.7. Etude de cas. Application avec SPSS.
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte]
Page 8
2.7.1. Etude su l’a hat i pulsif.
Da s le ad e du ou s d’a al se de do
es u e e u te a t faite pa les tudia ts aup s d’u
échantillon de 900 clients des magasins carrefour, géant, monoprix, magasin général et champion.
Le ut de ette tude est d’ide tifie les fa teu s d te i a ts de l’a hat i pulsif da s u e g a de
su fa e, à sa oi l’at osph e du agasi , la flâ e ie, l’hu eu du lie t, l’a ia e du point de
vente, le design et la sensibilité aux stimuli. Les résultats de cette enquête sont les suivants :
a. Analyse Uni variée
Dans le hapit e p
de t ous a o s fait l’ tude de la dist i utio des p oduits a het s
impulsivement, nous avons utilis pou ela le test de khi deu . Le test d’u ifo it de Kol ogo o
Smirnov est aussi applicable et donne les résultats suivants :
One-Sample Kolmogorov-Smirnov Test
prod11
N
500
Uniform Parameters
a,,b
Most Extreme Differences
Minimum
1,00
Maximum
5,00
Absolute
,446
Positive
,446
Negative
-,166
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
9,973
,000
La signification asymptotique est nulle donc inférieur à tout risque d’erreur. L’hypothèse
d’uniformité des produits achetés d’une manière impulsive est par conséquent rejetée.
b. Analyse bivariée.
Nous a o s tudi da s la hapit e p
relations suivantes :
de t et da s le ad e de l’ tude su l’a hat i pulsif les
-
croisement du magasin avec le produit acheté impulsivement et nous avons enregistré
l’e iste e d’u e elatio sig ifi ati e.
-
Croisement de la fréquence de visite avec le magasin et nous avons confirmé la dépendance
significative de la fréquence de visites du magasin.
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte]
Page 9
-
Croisement de la fréquence de visites avec à la fois le magasin et la catégorie
so iop ofessio elle. Nous a o s e a u ue ette de i e a ia le ’a pas d’effet sig ifi atif
sur la fréquence de visites.
D’aut es croisements peuvent être établis à partir du logiciel SPSS et de la même manière technique
en choisissant les outils statistiques convenables par exemple :
-
La f
ue e de isites ois e a e l’âge du lie t test Anova).
-
La pe eptio de l’a hat i pulsif ois e avec la nationalité du client (test Anova).
-
Croisement de la perception des prix du premier et du second produit achetés impulsivement
( test de corrélations des rangs de Spearman) ,les deux variables étant ordinales.
O
o t e à pa ti d’u test de khi deu ue le deu i e p oduit a het d’u e a i e i pulsi e
dépend significativement du premier produit. Les consommateurs ont tendance à acheter un
deuxième produit impulsivement dans la même gamme que le premier produit.
produit11 * produit22 Crosstabulation
Count
produit22
alimentation
produit11
textile
cosmétique
hygiène
autre
Total
111
12
48
19
29
219
textile
15
10
19
3
13
60
cosmétique
36
4
56
11
23
130
hygiène
22
2
12
11
9
56
autre
24
13
22
9
58
126
208
41
157
53
132
591
alimentation
Total
*
* 591 clients parmi les 900 ont fait un achat impulsif répété.
Chi-Square Tests
Value
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
df
Asymp. Sig. (2-sided)
a
16
,000
103,825
16
,000
44,240
1
,000
113,952
591
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte]
Page 10
Chi-Square Tests
Value
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
df
Asymp. Sig. (2-sided)
a
16
,000
103,825
16
,000
44,240
1
,000
113,952
591
a. 2 cells (8,0%) have expected count less than 5. The minimum expected
count is 3,88.
c. Analyse en composantes principales
Cette te h i ue est appli u e au ite s Q , Q ,…,Q e p i a t espe ti e e t oi uestio ai e
e a e e les fa teu s th o i ues de l’a hat i pulsif à sa oi : l’at osph e , la flâ e ie,l’humeur du
lie t, l’a ia e da s le agasi , le desig , et la se si ilit au sti uli. Elle tente de vérifier et
alide les fa teu s e pli atifs de l’a hat i pulsif da s le ad e tu isie . Le positio e e t des
consommateurs par rapport aux différents facteurs validés permet de les réduire en groupes
homogènes.
Les sultats de L’ACP à pa ti du logi iel SPSS d o pos es e a al se u i a i e afi de oi uels
sont les critères, dans ce cas les questions qui sont les mieux représentées, les mieux perçues.
L’a al se de la at i e de o latio s pe et de ep e les fo tes o latio s ui peu e t ous
aider à mieux interpréter les facteurs ou à supprimer des variables pour raison de colinéarité ou de
mauvaise qualité de représentation.
Tout ceci après avoir affiné les échelles de mesures en étudiant leurs fiabilités (voir chapitre 2)
p pa e le te ai pou u e o e i te p tatio des fa teu s issus d’u e ACP do t les sultats so t
les suivants :
Dans la rubrique « analyse » on sélectionne « dimension reduction » et « factor » ou analyse
factoriell
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte]
Page 11
Les variables initiales arrêtés après analyse de la fiabilité des échelles de mesure sont sélectionnées
comme le montre le tableau ci-dessus. Les rubriques suivantes sont ensuite utilisées : l’a al se
des ipti e u i a i e et i a i e , la
thode d’e t a tio des a es fa to ielles, la sau ega de des
coordonnées des individus sur les différents axes (scores), le remplacement des données
manquantes par la moyenne de la variable correspondante peuvent être établis dans « option ».
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte]
Page 12
D’autres méthodes d’e t a tio des a es fa to ielles peu e t t e utilis es dont des explications
peuvent être données en cliquant sur « help ». Le critère de Kaiser est utilisé dans ce cas pour le
choix des composantes.
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte]
Page 13
Résultats de L’ACP
La « communalities » ou la qualité de représentation donne le pourcentage de variance expliquée par
chaque variable initiale après extraction ou factorisation. On remarque que dans la question Q9
portant sur la sensibilité aux stimuli, seul l’ite
. et l’ite
. ui so t elati e e t ie
représentés. Les items q1.4, q2.3 ont étés supprimés pour améliorer la fiabilité des échelles de
mesure (voir chapitre 2). Les items q8.1,..,q8.4 qui correspondent au facteur ambiance ont été aussi
li i es a e fa teu ’a pas t alid . Les o so
ateu s tu isie s o fo de t a ia e et
atmosphère dans le magasin.
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy.
Bartlett's Test of Sphericity
Approx. Chi-Square
,780
4538,697
df
190
Sig.
,000
L’i di e KMO et le tes de Ba tlett o t e t la o e ad uatio de ette te h i ue au do
recueillies (KMO porche de 1, khi deux (Chi-Square) élevé et signification nulle).
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte]
e
Page 14
Initial Eigenvalues
Rotation Sums of Squared Loadings
Component
1
3,492
17,461
17,461
2,511
12,553
12,553
2
2,447
12,235
29,697
2,302
11,509
24,062
3
2,007
10,035
39,732
2,147
10,733
34,795
4
1,586
7,931
47,663
1,998
9,991
44,787
5
1,192
5,960
53,623
1,767
8,837
53,623
Ci
o posa tes p i ipales o t ete ues d’ap s le it e de Kaise ui stipule ue seules les
composantes ayant une valeur propre « Eingenvalues » dépassant 1 qui sont retenus ce qui
correspond exactement avec le nombre de facteurs recherchés et que l’o o fi e a pa la suite.
L’histog a
e des aleu s p op es e montre pas une dénivellation très claire à partir de la
cinquième valeur. Le critère de Kaiser est finalement retenu.
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte]
Page 15
Component Matrix
a
Rotated Component Matrix
Component
1
2
3
a
Component
4
5
1
2
q5.2
,614
q7.3
,808
q8.8
,596
q7.2
,807
q5.1
,593
q7.1
,778
q5.3
,586
q7.4
,730
q8.7
,572
q8.8
,810
q8.6
,557
q8.9
,767
q8.9
,541
q8.6
,740
,611
3
4
5
q7.3
-,630
q8.7
q7.1
-,625
q9.4
,726
q7.2
-,560
q9.5
,648
q7.4
-,532
q9.6
,573
q9.5
q9.1
,558
q9.3
q9.3
,554
q9.1
q9.2
q9.4
q5.2
,795
q9.6
q5.1
,759
q9.2
q5.3
,719
q6.4
-,580
q6.4
,754
q6.2
-,577
q6.1
,753
q6.1
-,544
q6.2
,749
Les deux tableaux précédents donnent les corrélations des composantes retenues avec les variables
initiales avant et après rotation Varimax. Le rôle de la rotation varimax est clair dans ce cas, la
s pa atio des diff e ts fa teu s e pli atifs de l’a hat i pulsif est o te ue pa o s ue t et la
validation est dont établie.
L’hu eu du lie t est l e p e ie fa teu ui e pli ue , % de l’i fo ation totale, suivi du design
ui e pli ue . %. Ces deu p e ie s fa teu s e pli ue t e i o
% de l’i fo atio . La otatio
a pe is aussi de do e plus d’i po ta e au t ois de ie s fa teu s (augmentation des variances
expliquées).
Le positionnement des consommateurs par rapport aux deux premiers facteurs humeur et design (à
partir des coordonnées sauvegardées dans le fichier de données et la
représentation
tridimensionnelle des variables initiales par rapport aux composantes (corrélations) permettent
d’a oi u e t pologie de la populatio tudi e et les a a t isti ues de ha ue g oupe. Cette tape
sera développé plus loin mais on donne ici un aperçue graphique.
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte]
Page 16
17
2.7.2. Etude su la pe eptio de l’e seig e e t vi tuel.
Cette tude te te d’a al se les pe eptio s et les atte tes des tudia ts d’u pa s à o o ie
émergente vis-à- is de ette fo e d’e seig e e t alte ati e au
thodes t aditio elles. Les
résultats de ce travail font apparaître plusieurs dimensions dans la perception des étudiants.
L’i te a tio appa aît o
e ta t la di e sio la ieu o sid e pa les tudia ts. L’utilit de
e t pe d’e seig e e t ie t e se o d lieu. D’aut e pa t, la aît ise de la te h ologie i fo ati ue
représente un souci majeur pour les étudiants. La flexibilité est le concept le moins bien perçu, la
gestio du te ps ’est pas ie o sid e pa les tudia ts.
Co te te et o je tif de l’ tude.
Le a h de l’i fo atio a désormais une dimension mondiale à telle enseigne que de
nombreuses questions relatives aux communications électroniques sont devenues des
préoccupations communes à de nombreux pays. Afin de promouvoir activement les atouts de la
so i t de l’i fo atio aup s de tous les ho
es, les o je tifs sui a ts doi e t t e pou sui is :
-
réduire la «fracture numérique» entre les pays riches et les pays pauvres en soutenant le
d eloppe e t de la so i t de l’i fo atio au sei des pa s e d eloppe e t.
e ou age la oissa e o o i ue et la p o otio des te h ologies de l’i fo ation et de la
communication par le biais de la coopération internationale.
reconnaître et relever les principaux défis grâce à une coopération dans la recherche en matière
de TIC.
créer un environnement favorable à la coopération internationale dans le domaine de la
recherche et permettre le transfert de connaissances, de technologies et des compétences.
L’ olutio spe ta ulai e du at iel et des logi iels i fo ati ues ai si ue l’i t g atio des
technologies dans notre vie quotidienne contribuent de façon continue et importante à la croissance
de la fo atio à dista e. L’i estisse e t à lo g te e da s les essou es hu ai es est t op
souvent négligé. Une mise à jour permanente des compétences et des connaissances est nécessaire
dans de nombreux domai es et pa ti uli e e t da s l’e seig e e t à dista e. Elle pe et de
s’adapte au
utatio s apides de la so i t
ode e et de o att e le hô age ui de eu e
u e p o upatio o
u e à l’Eu ope et à la gio
dite a e e.
Pour les pays du sud et de l’est de la M dite a e, le p o essus d’i t g atio euroméditerranéenne est à la fois un défi et un levier pour améliorer la compétitivité de leurs économies.
Pa o s ue t, la fo atio et l’i estisse e t da s le apital hu ai joue t u ôle primordial.
Mais o
e t ga a ti le su s et la p e it de ette fo e d’e seig e e t sa s p e d e e
o sid atio les esoi s, ai si ue les pe eptio s des app e a ts de l’e-enseignement ?
L’o je tif de ette tude pa e u te est d’ tudie l’i t t po t à ette fo e d’e seig e e t pa
les étudiants en Tunisie, pays à économie émergente et premier pays africain en termes de
o p titi it et d’ou e tu e o o i ue lasse e t fo u
o dial de Da os
.
M thodologie de l’e u te
Cette enquête se ase su les a a t isti ues p i ipales de ette ou elle fo e d’e seig e e t
ui ie d aie t i flue e le hoi de l’ tudia t e e s l’i t t u’il po te à l’e seig e e t i tuel.
Ces a a t isti ues o t t d fi ies da s les t ois tudes d’A augh (2000a, 2000b, 2000c), qui a
18
identifié quatre concepts essentiels de l'e-enseignement : la te h ologie, l’i te a tio , la flexibilité et
l’e gage e t.
a. La technologie
A augh
a,
,
e o aît le ôle de la te h ologie da s l’e seig ement virtuel. Il
s’appuie su le od le TAM Te h olog A epta e Model
is e pla e pa Da is, Bagozzi &
Wa sho e
, et ui et e
ide e deu di e sio s p i ipales de la e o aissa e d’u e
nouvelle technologie (cours administrés via Internet). La première dimension est la perception de
so utilit pa l’utilisateu ui doit do a lio e ses pe fo a es. La deu i e di e sio est la
aît ise de la te h ologie i fo ati ue. Ce od le stipule ue les o a es u’u e ou elle
technologie est utile et d’utilisatio fa ile i flue e t positi e e t l’attitude des utilisateu s.
. L’i te a tio
Arbaugh (2000a) d o pose le o ept de l’i te a tio e uat e di e sio s ui so t les elatio s :
étudiants - professeurs, étudiant - étudiant, étudiant - contenu du cours et étudiant - interface du
cours. Ethier et Payet (2001) retiennent les deux premières dimensions qui leur apparaissent
esse tielles da s leu o eptio de l’i t t po t à l’e seig e e t i tuel. Ces deu di e sio s
centrales, selon nous, pou la p e tio de l’a a do se o t ep ises da s ot e tude. E effet la
dimension humaine de type « face à face » qui dépasse les moyens techniques relationnels (courrier
le t o i ue, id o o f e e, ….. est i o tou a le.
c. La flexibilité
A augh
a d fi
dimensions spatiales
d’i fo atio . Ce o
te ps et d’espa e de
it la fle i ilit pou l’app e a t e fo tio de l’i po ta e u’il a o de au
et temporelles. Cette flexibilité est permise par les nouvelles technologies
ept est u i di ateu de d eloppement économique, en effet la notion de
ie t esse tielle pou les app e a ts ua d ils o upe t u e ploi.
d. L’e gage e t
Ethie et Pa et
d fi isse t l’e gage e t o
e ta t u e esti atio de l’effo t ue
l’ tudia t est p êt à investir dans cette activité. Est-il p t et d id à s’auto g e ? Son degré
d’e gage e t peut t e
alu pa l’i po ta e des elatio s e t ete ues a e les outils
technologiques ( Arbaugh 2000).
Cette tude su l’i t t po t à l’e seig e e t i tuel s’est d oul e au sei de la fa ult des
sciences économiques et de gestion de Tunis qui compte environ 11000 étudiants dont 2591 inscrits
e
aît ise et e
aste , te eau p opi e à ette ou elle fo e d’e seig e e t. Cette e u te a
été effectuée aup s d’u
ha tillo fi al de
tudia ts i s its e
aît ise et e
aste . Ils
ep se te t e i o
% de l’effe tif total des tudia ts o e s pa l’ tude et so t se s s a oi
assez de e ul pou app ie utile e t l’e seig e e t i tuel. La
thode d’ ha tillo age
retenue est celle de la « boule de neige » do
o p o a iliste. L’ tude ise à a al se les p ofils
des tudia ts, leu s pe eptio s des diff e ts o epts de l’e seig e e t à dista e et à e he he
les liens possibles ent e le p ofil et la pe eptio des tudia ts. Ce t a ail doit ous pe ett e d’u e
pa t de o p e d e les atte tes des tudia ts et d’aut e pa t de esu e leu oti atio et leu
deg d’e gage e t is-à-vis de cette nouvelle méthode de formation permanente.
19
Le uestio ai e i spi
concepts suivants :
de l’ tude d’Ethie et Pa et
a t
la o
e te a t o pte des
P ofils des tudia ts âge, se e, e ploi, utilisatio d’I te et, f ue tatio de la i lioth ue,
p f e es du st le d’e seig e e t, accès et disponibilité de la technologie informatique).
- La pe eptio de l’e seig e e t i tuel ep se t e (voir questionnaire en annexe) par les
dimensions suivantes :
a. l’utilit pe çue (questions ; v9,..., v11)
b. l’utilisatio et la aît ise de la te h ologie informatique ( ,…, v14).
c. La flexibilité ou la gestion du temps (v15, …,v20).
d. L’i te a tio e t e tudia ts et e t e e seig a ts étudiants (v2 ,…,
.
e. La motivation et l’e gage e t
,…,
.
La mesure de la perception des étudiants est basée sur une échelle psychométrique de Likert à cinq
deg s. La fia ilit de l’ helle de esu e est
ifi e à l’aide de l’alpha de C o a h ui est
supérieur à 0.79 pour chacune des cinq dimensions de la perception ce qui montre une bonne
homogénéité des items.
-
R sultats de l’e
u te
Analyse des profils des étudiants
Da s l’a al se des p ofils des tudia ts, des tests statisti ues test d’i d pe da e de khi deu , tests
de comparaison des moyennes) ont montré que les variables ayant des relations significatives avec
les di e sio s de la pe eptio de l’e-enseignement sont les suivantes :
- le statut des étudiants (travaille à plein temps, travaille à temps partiel, ne travaille pas).
- la maîtrise de la technologie informatique.
- le st le d’app e tissage.
Nous allons étudier dans une première étape les relations entre les différentes variables du profil
des étudiants. Dans une seconde étape, une analyse en composantes principales (ACP) nous a permis
de o fi e les i
di e sio s de la pe eptio de l’e seig e ent virtuel et de mettre en
évidence leur importance rlatieve.
a. Relatio e t e le st le d’app e tissage et l’e ploi.
emploi
150
oui
Effectifs
non
100
50
0
1
2
Style
d'apprentissage
Figure 1 : pa titio des tudia ts selo l’e ploi et le st le
d’app e tissage : enseignement virtuel, 2 : enseignement
classique)
Nous o stato s u’e i o la oiti des tudia ts ui souhaite t opte pou u e seig e e t
virtuel (voir Figure 1) comme complément et non comme substitut de formation, ne travaille pas. Ce
sultat i atte du peut s’e pli ue pa l’i suffisa e de l’i frastructure universitaire tunisienne et
20
l’i suffisa e de l’e ad e e t telles ue pe çues pa les tudia ts. La fo e a tuelle de
l’e seig e e t sup ieu a pou o jet de po d e au i ui tudes des tudia ts, de les oti e et
de les responsabiliser efficacement. Par ailleurs une partie des étudiants qui occupent un emploi
désire suivre un enseignement classique malgré tous les inconvénients que cela représente. Ceci
p o ie t aise la le e t d’u e
o aissa e de l’e seig e e t i tuel do d’u e méfiance à
so ga d. U e a pag e de se si ilisatio s’a e
essai e afi de d
stifie ette ou elle
fo e d’e seig e e t.
b. Relatio e t e le st le d’app e tissage et la aît ise de la te h ologie i fo ati ue.
Maîtrise de la technologie informatique
Total
Tableau 1 : croisement entre le style
d’app e tissage et la aît ise de la
Pas du
te h ologie i fo ati ue etoutte es d’effe
Un peutif
Presque
parfaitement
style
1(classique)
2(E.V)
Total
Figure 2 : C oise e t de la
2
27
47
32
108
5
75
77
35
192
7
102
124
67
300
aît ise de la te h ologie ave le st le d’app e tissage.
Il existe une relation significative entre la maîtrise de la technologie informatique et le style
d’app e tissage. E effet, les tudia ts ui hoisisse t le st le d’e seig e e t i tuel d la e t
aît ise o e a le e t l’outil i fo ati ue
% . I e se e t les tudia ts ui hoisisse t le
st le lassi ue, d la e t e pas aît ise l’outil i fo ati ue
% . L’a lio atio de la formation
en informatique représente une condition nécessaire pour motiver les étudiants et minimiser le taux
d’a a do ui ep se te le p i ipal o sta le au su s de ette
thode d’e seig e e t.
c. Analyse en composantes principales.
L’a al se e o posa tes p i ipales a te appli u e au a ia les ,…,
ep se ta t les
différents facteurs explicatifs (voir questionnaire en annexe). Elle a permis de confirmer les cinq
di e sio s de la pe eptio de l’E.V ui e pli ue t % de la a ia e totale et de mettre en
e e gue l’i te a tio et l’utilit pe çue ai si ue la aît ise de l’outil i fo ati ue. E effet,
l’i te a tio est le o ept le plus i po ta t au eu des tudia ts
% de la a ia e totale
expliquée). Cet échange entre enseignants et étudiants et entre les étudiants eux-mêmes est
o sid
o
e p i o dial pa es de ie s. C’est u aspe t t s i po ta t du o po te e t des
tudia ts ui peut s’e pli ue pa la sp ifi it de la ultu e tu isie e ui a o de u e g a de
importance à l’aspe t elatio el. Co
e t ga a ti le su s et la p e it de l’e-enseignement
sans compléter la dimension pédagogique par le facteur relationnel, le contact direct entre
enseignant ou tuteur et apprenant ?
Les tudia ts so t o s ie ts de l’utilit (14.2% de la variance totale expliquée) de cette
fo e d’e seig e e t ais ils i siste t fo te e t su le a ue de o e s et de fo atio su le
pla te h ologi ue. Il e peut a oi d’utilit sa s u e aît ise o e a le de l’outil i fo ati ue
(6.7%). La uat i e di e sio est l’e gage e t . % .La i ui e et de i e di e sio de la
pe eptio de l’e-e seig e e t est la fle i ilit
. % , les tudia ts se le t glige l’i po ta e
21
de la gestion du temps. Ceci est vraisemblablement dû à une conjoncture économique difficile où les
jeunes sont inquiets pour leur avenir.
Indice KMO et test de Bartlett
Mesure de précision de
l'échantillonnage de Kaiser-Meyer-Olkin.
Matrice des composantes après rotation
Composante
,860
1
Test de sphéricité
de Bartlett
Khi-deux
approximé
3342,227
v23
,917
ddl
231
v24
,873
Signification de
Bartlett
,000
v22
,861
v21
,568
2
3
4
5
v25
O ote la o e ad uatio de l’ACP
aux données recueillies dans cette
étude. Le KMO est très proche de 1 et
le test de sphéricité est très
significatif.
L’appli atio de la otatio a i a a
permis de distinguer clairement les
cinq facteurs explicatifs de la
pe eptio de l’e seig e e t i tuel à
savoir : l’utilit pe çue, l’i te a tio
entre étudiant et entre étudiant et
enseignant, la flexibilité, la maîtrise de
la technologie informatique et enfin
l’e gage e t.
Un filtrage des corrélations a permit
de faire apparaître un tableau des
composantes aussi clairement lisible
et interprétable.
v10
,754
v11
,689
v9
,619
v26
,609
v15
,608
v14
,827
v13
,816
v12
,755
v29
,794
v28
,762
v30
,732
v27
v17
,722
v18
,721
v19
,679
v16
,513
v20
,512
22
La elatio e t e les o posa tes t ou es p
de
e t et la uestio
atu e de l’e ploi
plein, 2 : temps partiel, 3 : ne travaille pas) est donnée par le tableau suivant :
: temps
ANOVA
Somme des carrés
ddl
Moyenne des carrés
Composante 2
Inter-groupes
11,617
2
5,809
Utilité perçue
Intra-groupes
287,383
297
,968
Total
299,000
299
Composante 1
Inter-groupes
2,194
2
1,097
Interaction
Intra-groupes
296,806
297
,999
Total
299,000
299
Composante 3
Inter-groupes
1,875
2
,938
Maîtrise de la
Intra-groupes
297,125
297
1,000
technologie
Total
299,000
299
Composante 4
Inter-groupes
7,804
2
3,902
291,196
297
,980
299,000
299
Intra-groupes
L’Engagement
Total
Composante 5
Inter-groupes
2,134
2
1,067
La flexibilité
Intra-groupes
296,866
297
1,000
Total
299,000
299
F
Signification
6,003
,003
1,098
,335
,937
,393
3,980
,020
1,068
,345
On note l’effet sig ifi atif de la atu e de l’e ploi seule e t su l’utilit pe çue et l’e gage e t
da s l’e seig e e t i tuel. Les sig ifi atio s so t espe ti e e t 0.03 et 0.02. En effet les
tudia ts e e ça t u e ploi se te t la
essit d’u e fo atio o pl e tai e, et ceux qui
’o t pas d’e ploi so t p t à toute fo atio leu pe etta t d’e t ou e u . Ce ui este
to a t, ’est ue la fle i ilit ’est toujou s pas ie o sid rée.
23
Positio
e e t des app e a ts pa appo t à l’utilit pe çue de l’E.V et de l’i te a tio
3,00
2,00
1,00
1,00
1,00
3,00
3,00
3,00
3,00
3,00
3,00
1,00
3,00
3,00 3,00 3,00
3,00
1,00 1,00 1,00
1,00
3,00
3,00
1,00
1,00
1,00 1,00
1,00
1,00
3,00
3,00
3,00
1,00 1,00
3,00
1,00
1,00
1,001,00
3,003,00
3,00
1,001,00
1,00
1,00
1,00
3,00
3,00
1,00
1,00 3,00
1,00
3,00 3,00
1,00
1,00
1,00 1,00
3,00
1,00 1,00
1,00
3,00
1,00
3,00
3,00 3,003,00
1,00
1,00
1,00
1,00
3,00 3,00
1,00
1,00
1,00
3,00
1,00
1,00
1,00
3,00
3,00
3,00
1,00
3,00
1,00
2,00
2,002,00
2,00 4,00 4,00
2,00 2,00
4,00
2,00
4,00 4,00 4,00
2,00
2,00
4,00
4,00
4,00
4,00
4,00
2,00 4,00
2,00
2,00
2,00
4,00 4,00
2,00
4,00 4,00
2,00
2,00
4,00
2,00
4,00
4,00
2,00 4,00
2,00
4,00
4,00
4,00
2,00
4,00
4,00
4,00
2,00
2,00
4,00
2,00
4,00
4,00
2,00
4,00
4,00
2,00
4,00
4,00
2,00
2,00
2,00
4,00 4,00
4,00
2,00
4,00
2,00
4,00
2,00
4,00
4,00
4,00
2,00
2,002,00
2,00
2,00
4,00
2,00 2,00 4,00 4,00
2,00
2,00
Utilité perçue de l'enseignement virtuel
1,00
1,00
1,00
0,00
-1,00
3,00
2,00
-2,00
1,00 1,00
1,00
4,00
2,00
2,00
4,00
2,00
-2,00
-1,00
0,00
1,00
2,00
Intéraction
Le positionnement des étudiants par rapport aux deux premiers facteurs les plus importants à
leurs yeux fait apparaître quatre groupes clairement positionnés dans cette carte factorielle.
-Legroupe1 (code 1) : composé par les étudiants aya t u e o e pe eptio de l’utilit de ette
fo e d’e seig e e t pa o t e l’i te a tio e se le pas p io itai e pou eu .
- Le groupe 2 (code 2) : est caractérisé par les, étudiants désintéressés par cette forme de
l’e seig e e t.
- Le groupe 3 (code 3) : est caractérisé par les étudiants tout à fait opposés aux précédents, il
s’agit des tudia ts d si eu de o pl te leu fo atio et ui atta he t eau oup
d’i po ta e à l’i te a tio tudia t e seig a t.
- Groupe 4 (code 4) : Il s’agit des tudia ts do t l’utilit de l’E.V ’est pas e o e lai e ta t
do
les o e s te h i ues ui so t e g
al a ua ts et u’ils e aît ise t pas e plus
puis u’ils o pte t eau oup su le o ta t di e t do l’e seig e e t lassi ue.
2.7.3.
Etude sur le le to at d’u jou al.
La di e tio d’u jou al souhaite t a sfo e à la fois le o te u et la fo e de so p oduit afi de
mieux répondre aux attentes de ses lecteurs et augmenter son lectorat. Un questionnaire a donc été
élaboré par des consultants en marketing et inséré dans le journal.
etou s o t t e egist s,
o t fait l’o jet d’u ti age al atoi e ;
correctement remplis, seuls 808 questionnaires ont été conservés.
uestio
ai es ’ ta t pas
24
L’o je tif, à t a e s ette tude elle, est de ala e les te h i ues d’a al se de do
es les plus
utilisées en marketing et de traiter le questionnaire afin de ressortir les conclusions en termes
a keti g. O se li ite a da s e ui suit à l’a ti it le to ielle et au
fi e o so
ateurs.
Analyse bivariée
Relatio e t e le
ode d’a hat et l’attitude le to ielle
Le croisement de ces deux variables qualitatives fait appel au test de khi deux. Le tableau suivant
montre que les lecteurs recevant leur journal par la poste penchent plutôt pour une lecture différée. En
effet l’effe tif th o i ue o espo da t atte du est gal à .
ais elui e egist
aut . De
e
sous l’h poth se d’i d pe da e o ote ue les le teu s a a t u a o e e t postal et ui de aie t
avoir une lecture immédiate compte 25.6 mais au fait ils ne sont que 14. Pour conclure, nous pouvons
dire que les lecteurs manquent d’assiduité.
Il esso t aussi ue l’a hat olo tai e du jou al i pli ue u e le tu e i
diate. En effet les lecteurs qui
achètent délibérément leurs journaux dans un kiosque ou chez un vendeur ambulant sont plus
nombreux en réalité (effectif) que ce qui est attendu (effectif théorique).
Tableau croisé mode d'achat * attitude lectorielle
attitude lectorielle
Total
lecture différée
feuilleté
lecture
immédiate
Effectif
23
68
14
105
Effectif théorique
16,1
63,3
25,6
105,0
Effectif
58
243
99
400
Effectif théorique
61,2
241,1
97,7
400,0
Effectif
14
73
37
124
Effectif théorique
19,0
74,7
30,3
124,0
Effectif
16
53
27
96
Effectif théorique
14,7
57,9
23,4
96,0
Effectif
111
437
177
725
Effectif théorique
111,0
437,0
177,0
725,0
abonnement postal
portage
mode
d'achat
dans la rue, vendeur
ambulant
kiosque
Total
25
Tests de 2
Valeur
2 de Pearson
Rapport de
vraisemblance
Association linéaire
Nombres
d’observations
df
Signification
12,728(a)
6
,048
13,437
6
,037
5,634
1
,018
0 cellules (0%) a un effectif
théorique inférieur à 5.
725
Il e iste do u e elatio sig ifi ati e e t e le ode d’a hat et l’attitude le to ielle. Ce i est o fi
par une signification gale à , % et i f ieu e au is ue fi d’a a e = % do o ejette l’h poth se
d’i d pe da e de es deu a a t es ualitatifs.
Relation entre la variable âge et la variable fréquence de non-lecture
L’âge est u e a ia le ua titati e, puis ue l’e u te a t faite d’u e a i e a o
e. Le fait de
donner exactement son âge ne présente aucun inconvénient pour les enquêtés. La fréquence de
non lecture (vous arrive t-il d’a hete le jou al et de ne pas le lire ?) doit obéir à une échelle
ualitati e e uat e odalit ja ais,…, f ue
e t.
Ce croisement doit être basé sur le test ANOVA. Il s’agit do de o pa e les o e es des âges
des lecteurs pour chaque modalité de fréquence de non lecture. Il ressort du tableau suivant que les
le teu s les plus âg s à ui il ’a i e ja ais d’a hete u jou al sa s le li e o pl te e t. Pa
o t e il a i e t de te ps e te ps ou e o e f ue
e t au plus jeu es d’a hete le jou al et
de ne pas le li e, lo s u’ils ’atte de t pas ou e so t pas à la e he he d’u e ou elle.
Tableau de bord
Fréquence de non-lecture
Moyenne
Ecart-type
Minimum
Maximum
jamais
53,8556
15,55348
17,00
84,00
rarement
51,1519
14,66787
16,00
85,00
de temps en temps
47,8224
12,40725
19,00
82,00
fréquemment
49,1000
14,37515
19,00
82,00
Total
51,9271
14,94015
16,00
85,00
26
ANOVA
âge
Somme des carrés
df
Moyenne des carrés
Intergroupes
3549,861
3
1183,287
Intragroupes
161624,20
737
219,300
Total
165174,06
740
La signification est égale à 0.1% do o o fi
l’âge du le teu et la f ue e de o le tu e.
F
Signification
5,396
,001
e l’e iste e d’u e elatio sig ifi ati e e t e
Une analyse en composantes principales appliquée aux questions ayant trait au bénéfice
consommateur pe ett a d’e d fi i les facteurs explicatifs.
Analyse en composantes principales.
Statistiques descriptives
La lecture du journal pour
vous est :
Indice KMO et test de Bartlett
Moyenne
Ecart-type
L1 un très grand plaisir
3,6299
,95441
L2 une vraie détente
3,6032
,91969
L3 un moment agréable
3,6566
,95414
L4 un divertissement
3,3025
1,04325
L5 de découvrir l'actualité
autrement
4,0623
,84104
L6 de comprendre le
monde
3,9520
,81835
L7 d’avoir du recul sur
l'information
3,5890
1,00980
L8 d’avoir des repères
solides
3,6584
1,00835
L9 de réfléchir sur
l'actualité
4,0694
,79020
Mesure de precision de l’échantillon
de Kaiser-Meyer-Olkin
Test de sphéricité de
Bartlett
,869
2
approché
df
Sig.
2189,825
36
,000
27
Qualité de représentation
Initial
Extraction
L1 un très grand plaisir
1,000
,659
L2 une vraie détente
1,000
,789
L3 un moment agréable
1,000
,729
L4 un divertissement
1,000
,596
L5 découvrir l'actualité autrement
1,000
,581
L6 comprendre le monde
1,000
,660
L7 avoir du recul sur l'information
1,000
,602
L8 avoir des repères solides
1,000
,636
L9 Réfléchir sur l'actualité
1,000
,588
Extraction Method: Principal Component Analysis.
Nous oto s l’ad uatio de ette te h i ue à
l’a al se des a ia les ui o e e t le
bénéfice tiré dans la lecture du journal. Les
variables les mieux représentés (moyenne la
plus élevée et écart type le plus bas) sont celles
qui représentent l’esp it d’a al se et de
e oupe e t de l’i fo atio
et de la
découverte (L9, L5). Ces variables sont toutes
relativement bien représentées après extraction
des axes.
Deux facteurs ou composantes du bénéfice
consommateur sont retenus.
Variance totale expliquée
Component
Valeurs propres initiales
Total
% of Variance
Cumulative %
1
4,290
47,662
47,662
2
1,551
17,231
64,894
3
,660
7,334
72,227
4
,552
6,129
78,356
5
,487
5,411
83,767
6
,472
5,244
89,011
7
,364
4,041
93,052
8
,340
3,780
96,831
9
,285
3,169
100,000
28
Matrice des composantes après rotation varimax
Matrice des composantes (a)
Composantes
1
Composantes
Lire le journal pour vous
est :
2
1
2
un très grand plaisir
,723
,354
L1 comprendre le monde
,798
,151
un moment agréable
,721
,448
L2 avoir des repères
solides
,760
,243
avoir des repères solides
,719
-,319
L3 réfléchir sur l'actualité
,759
,109
une vraie détente
,700
,518
comprendre le monde
,692
-,391
L4 avoir du recul sur
l'information
,750
,200
avoir du recul sur
l'information
,688
-,359
L5 découvrir l'actualité
autrement
,727
,230
découvrir l'actualité
autrement
,680
-,305
L6 une vraie détente
,173
,871
L7 un moment agréable
,253
,815
réfléchir sur l'actualité
,645
-,410
L8 un divertissement
,089
,767
un divertissement
,553
,500
L9 un très grand plaisir
,305
,752
Méthode d'extraction : Analyse en composantes
principales.
La rotation a i a a eu u effet t s positif su l’i te p tatio des deu fa teu s u
fi e
consommateur. En effet la matrice des corrélations sans rotation des axes factoriels ne permet pas
d’i te p te le se s de ha ue o posa te les o latio s so t uivalentes) Le tableau des
corrélations après rotation sépare clairement les deux facteurs du bénéfice consommateur à savoir :
-Composante 1 : caractérisée
a o d à l’i fo atio .
o
latio s les plus le es pa L ,.., L
ui ep se te l’i t
t
- Composante 2 : caractérisée par les critères L6,.., L9 qui représentent le plaisir éprouvé dans la
lecture du journal.
Théoriquement les deux facteurs du bénéfice consommateur sont indépendants, néanmoins on
e a ue suite à l’i te p tatio des deu o posantes qu’u lie t oit e iste e
alit e t e le
plaisir de lire et l’i t t à l’i fo atio . U e otatio o li i se ait tout à fait possi le da s e as.
Nous pouvons donc conclure en affirmant que deux facteurs expliquent le bénéfice consommateur
dans la lecture du journal à savoir : le plaisi de li e et l’i t t pou l’i fo atio .
Le positio e e t des le teu s pa appo t à es deu fa teu s pe et d’appo te la t pologie en
quatre groupes correspondant aux quatre cadrans du plan 1-2: suivant :
29
Plan 1-2
3
2
Axe 2
1
0
-1
-2
-3
-4
-4
-3
-2
-1
0
1
2
3
Axe 1
Nous nous limitons dans cette partie à l’aspe t g aphi ue de es g oupes, l’i te p tatio se a faite
plus loin.
2.7.4. Etude sur la gestion financière des communes.
Présentation des données
L’ tude de la gestio fi a cière des communes tunisiennes consiste à partir des ratios
fi a ie s et de di e s i di ateu s de taille et d’activités à ett e au poi t u outil d’aide à la
d isio . Ce i pe ett a au d ideu s de atio alise l’aide pu li à la fois financière mais
aussi et surtout technique.
La s th tisatio de l’i fo atio
ui doit p
de l’app o he d isio elle passe par
l’appli atio d’u e ACP puis ue les a ia les tudi es so t toutes ua titati es. La
population considérée comporte 187 communes et 43 variables (22 ratios financiers, 12
i di ateu s de taille et i di ateu s d’a ti it s . Les communes des grandes villes ont été
li i es pou des aiso s d’ho og
it .
.
30
Les indicateurs de taille de la commune reflètent la superficie, la population et les commodités :
31
Les i di ateu s d’a ti it s efl te t le deg
d’a ti it et de d eloppe e t de la o
u e:
32
Analyse en composantes principales.
L’a al se e o posa tes p i ipales appli u es au a ia les p
de tes pe et de s th tise
l’i fo ation représentée par plus de 43 variables en mettant en place un nombre restreint
d’i di ateu s synthétiques. Le positionnement des différentes communes par rapport à ces facteurs
aboutira à la formation des groupes de communs les plus homogènes possibles.
A a t d’appli ue l’ACP u e li i atio des a ia les fo te e t o
l’a al se :
l es pe
ett a d’affi e
Les
ratios
financiers
R1,
R6,
R11,
R18,
R21
et
les
indicateurs :
Uind,Uart,Ukio,Usani,Asso,Vhsf,micd,bipp,dipp,Vcsf, Iffg,Balg sont donc élimi s da s l’a al se. Les
fortes corrélations les éléments de la diagonale de la matrice anti-image ainsi que le pourcentage de
la variance expliquée de chaque variable après extraction des axes factoriels (communalities) sont les
raisons de cette élimination
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy.
Bartlett's Test of Sphericity
Approx. Chi-Square
,676
2618,684
df
153
Sig.
,000
Nous remarquons la bonne adéquation de la technique d’analyse en composantes principales
à ce tableau de données suite à cet affinement de l’information recueillie.
33
Communalities
Initial
Initial Eigenvalues
Extraction
Component
Total
% of Variance
Cumulative %
r4
1,000
,551
1
4,791
26,618
26,618
r7
1,000
,701
2
3,931
21,840
48,458
r10
1,000
,431
3
2,617
14,539
62,997
r13
1,000
,855
4
1,560
8,666
71,663
r15
1,000
,332
5
1,090
6,055
77,719
r16
1,000
,769
6
,869
4,830
82,549
r17
1,000
,538
7
,522
2,901
85,450
r5
1,000
,859
8
,493
2,740
88,191
r22
1,000
,881
9
,461
2,563
90,754
r23
1,000
,773
10
,372
2,066
92,820
r24
1,000
,823
11
,342
1,899
94,719
super
1,000
,106
12
,276
1,532
96,251
popu
1,000
,863
13
,233
1,297
97,548
logm
1,000
,672
14
,196
1,087
98,635
ucom
1,000
,133
15
,108
,599
99,234
unet
1,000
,544
16
,080
,446
99,679
scol
1,000
,811
17
,042
,233
99,912
etot
1,000
,697
18
,016
,088
100,000
Extraction Method: Principal
Component Analysis.
Trois indicateurs synthétiques sont retenus après consultation de la matrice des composantes, ils
expliquent 6 3 % de l’i fo atio .
La
thode des diff e es d’o d e et d’o d e pe et de ete i Deu a es fa to iels , le
troisième axe est retenue car il exprime un indicateur synthétique très important qui jouera un rôle
décisif dans la typologie des o
u es. C’est l’e dette e t ui o e e la ajo it des
communes.
La otatio a i a des a es fa to iels a pe
et variables initiales.
is d’aug e te les o
latio s e t e les o posa tes
34
Component Matrix
a
Rotated Component Matrix
Component
1
2
a
Component
3
1
2
r5
,888
r13
,924
r13
,888
r5
,920
r16
-,814
r16
-,848
r7
,761
r7
,805
r22
,675
r22
,669
r17
,660
r17
r10
3
r10
popu
,840
popu
,914
scol
,811
scol
,895
logm
,752
etot
,835
etot
,734
logm
,812
unet
unet
,737
ucom
ucom
r23
,738
super
r4
,682
r23
,862
r24
r24
,771
r15
r4
,739
super
r15
-
La composante 1: est caractérisée par les ratios de dépenses et de recettes. Elle représente le
budget.
-
La composante 2 : est caractérisée par les indicateurs de développement qui représente les
commodités.
-
La composante 3 : est caractérisée par les ratios r23, r24, r4 qui expriment l’e dette e t des
communes.
Nous e a uo s l’i po ta e de ette te h i ue ui ous a pe is de s th tise l’i fo atio . La
description des communes par 43 variables dont certaines sont fortement corrélées à été restreinte
à trois indicateurs synthétiques à savoir : Le udget, les o
odit s et l’endettement.
Le positionnement des différentes communes par rapport à ces indicateurs nous donnera une
approche graphique de la typologie que nous confirmerons par la suite.
35
Nous e a uo s l’i po ta e o
e ous l’a o s sig al aupa a a t de l’i di ateur de
l’e dette e t ui pe et de s pa e e t e les g oupes et des o
u es. L’i te p tatio et les
caractéristiques des groupes formés à ce stade graphiquement seront données plus loin.
36
III Analyse factorielle des correspondances.
1. Analyse factorielle des correspondances simples.
1.1.
Introduction.
L’a al se fa to ielle des correspondances simples (AFC) est u e te h i ue d’a al se de do
es
multidimensionnelles. C’est u e
thode des ipti e ui g
alise le test d’i d pe da e de Khideux de Pearson. L’AFC s’ad esse esse tielle e t au ta leau de o ti ge e ui oise les
odalit s de deu a ia les ualitati es. Elle s’ te d au de do
es ua titati es ho og es et
positi es de telle faço ue la so
e d’u e lig e ou u e olo e ait u se s.
Exemples :
-
Da s l’ tude su le le to at, le oise e t du ode d’a hat et de l’attitude le to ielle do t la
elatio est sig ifi ati e oi hapit e a a outit à u ta leau de o ti ge e. L’appli atio de
l’AFC à e ta leau ap s a oi o fi
l’e iste e d’u e elatio sig ifi ati e e t e les deu
a ia les ualitati es pe et d’ tudie les o espo da es e t e les odalit s, aut e e t dit
les associations et les oppositions des différentes modalités des deux variables.
-
Positionnement des différentes marques de téléphones portables par rapport aux différents
critères étudiés. Le croisement des différentes marques avec les différents critères étudiés
donne lieu à un tableau de notes, donc un tableau de données homogènes et positives. Chaque
case de ce tableau est égale à la moyenne des notes attribuées par la population étudiée
concernant une marque de mobile et un critère précis.
-
Evolution des ventes des hebdomadaires. On étudié dans ce cas les ventes des hebdomadaires
pe da t u e p iode do
e. L’appli atio de l’AFC pe et de o pa e les pa ts de a h s
des diff e tes e ues e t e deu a
es et de o pa e aussi l’ olutio des pa ts de
marchés de deux revues.
1.2.
Présentation de la méthode.
La transformation du tableau de données (Cij ) en un tableau de probabilités permet de comparer les
lignes et les colonnes. Soit :
● f ij 
 C
C ij
i
, la p opo tio de l’effe tif total C=∑∑Cij correspondant à la modalité i de la
ij
j
variable Q1 ou à la ieme ligne du tableau et à la modalité j de la variable Q2 ou à la colonne j.
● fi. =
 f ij , f . j   f ij , f ji 
p
n
f ij
j1
i 1
f i.
, f ij 
f ij
f.j
.
● fI =(f1. ,f2. ,…fn.) la distribution marginale en colonne qui correspond aux poids des
lignes.
● fJ = (f.1 ,f.2 ,…f.p ) la distribution marginale en ligne ou celle des poids des colonnes.
37
● f Ji  (f1i , f 2i ,...f pi ) la distribution conditionnelle en ligne ou profil ligne.
● f Ij  (f1j , f 2j ,...f nj ) la distribution conditionnelle en colonne ou profil colonne.
La distribution utilisée pour comparer deux profils lignes (  p ) est la distance de khi
deux définie par :
d 2 (i, i' )  
p
j1
p
1 i
1 f ij f i ' j
(f j  f ji ' ) 2   (  ) 2 .
f.j
f i '.
j1 f . j f i.
Dans l’espace  n des profils colonnes on a :
d 2 ( j, j' )  
n
i 1
1 j
(f i  f i j ' ) 2 .
f i.
L’AFC d’un tableau de contingence comprend plusieurs étapes :
-
Réaliser une ACP du tableau des profils lignes munis des poids fi. .
-
Réaliser une ACP du tableau des profils colonnes munis des poids f.J .
-
Etudier les liens entre les deux analyses.
-
Construire des graphiques qui ont l’avantage de représenter simultanément les
lignes et les colonnes mettant en évidence les proximités entre les profils lignes,
les proximités entre les profils colonnes et la nature de la liaison entre les lignes et
les colonnes.
1.3. Le nuage des profils lignes.
1.3.1. Inertie totale du nuage.
La variance totale ou l’information contenue dans le tableau des profils lignes ou
encore l’inertie s’exprime par :
I(N(I)) =
 f i.d 2 ( iJ , f J )   f i. 
n
n
p
i 1
i 1
j1
p (f  f f ) 2
n
khideux
1 f ij
ij
i. . j

(  f . j ) 2  
f i. f . j
C
f . j f i.
i 1 j1
Le point moyen GJ ou le centre de gravité du nuage N(I) s’écrit :
f f
n
GJ =
i 1
i
i. J
 (f .1,. ,....f .p )  f J
38
1.3.2. Construction du premier axe principal.
f d
Soit Δ1 le premier axe principal de vecteur directeur u1 obtenu à partir de la
minimisation de la variance par rapport à Δ1 : I( N, 1 ) 
i.
2
*
*
(f Ji , f Ji ) 2 avec f Ji la
projection orthogonale de f Ji sur Δ1 . u1 est le premier vecteur propre de la matrice
de variance covariance : V=X’DX -GJGJ’ associé à la plus grande valeur propre λ1 .
La matrice D est une matrice diagonale dont les éléments de la diagonale sont les
poids fi. des lignes.
On montre que GJ est le vecteur propre trivial associé à la valeur propre nulle.
1.3.3. Construction de la première composante principale.
La première composante F1 est une nouvelle variable définie pour chaque individu
*
ou ligne i par : F1(i) = <fJi – fJ , u1 > est la coordonnée de la projection f Ji sur Δ1 ayant
pour origine fJ du nuage N(I).
1 i
(f j  f . j )u 1 ( j) avec

j1 f . j
p
F1(i) =
f
n
i 1
F (i)  0 (F1 est centrée).
i. 1
La variance de F1 ui ’est aut e ue la a ia e e pli u e par Δ1 est égale à λ1 :
λ1 
f
n
i 1
F (i) . La part de l’information détenue par la première composante est
2
i. 1
1
.
 /C
égale à
2
1.4. Le nuage des profils colonnes.
Le point moyen du nuage des profils colonnes GI est donné par :
f
p
GI =
j1
f  (f1. ,....f n. )  f I
j
.j I
D’une manière similaire que le paragraphe précédent on obtient ( mutadis
mutandis) les résultats suivants :
I(N(J)) = khi deux /C = ∑λj .
T1 ( j)  
n
i 1
1 j
(f i  f i. ) v1 (i) , v1 est le premier vecteur propre associé à la valeur propre
f i.
λ1 de la matrice de variances covariances V1 = XD1X’-GIGI’, avec D1 une matrice
diagonale dont les éléments de la diagonale sont les poids f.j des colonnes .
39
1.5. Lien entre les deux analyses.
u1, …ur les vecteurs propres de la matrice des variances covariances du nuage des
profils lignes associés aux valeurs propres λ1 ,…λr . v1 , …vr ceux du nuage des profils
colonnes associés aux mêmes valeurs propres. r= min(p-1,n-1).
En effet la dimension de V est (p,p) et admet p-1 valeurs propres non triviales. La
dimension de V1 est (n,n) et admet n-1 valeurs propres dont n-p dernières valeurs
propres sont nulles.
F1 , …Fr les composantes principales du nuage des profils lignes N(I).
T1, ….Tr les composantes principales du nuage des profils colonnes N(J).
Avec :
Fh (i) =
h
v h (i)
et Th(j) =
f i.
h
u h ( j)
.
f.j
On a alors les relations de transition :
Fh(i) =
1
h
 f T ( j)
p
j1
i
j
h
et Th(j) =
1
h
f
n
i 1
j
i
Fh (i) .
L’analyse d’un des nuages des profils se déduit facilement de l’autre nuage. Il
convient alors d’analyser le tableau de données correspondant à la matrice de
variances covariances ayant la taille la plus petite.
1.6. Paramètres d’aide à l’interprétation des résultats.
Les paramètres d’aide à l’interprétation fournis par les différents logiciels statistiques
en général et SPSS en particulier se limitent à :
a. La contribution d’un profil ligne à la variance expliquée par l’axe Δh .
Le rôle joué par un profil ligne i, i=1,..n dans l’interprétation d’un axe est caractérisé
son poids, sa coordonnée sur cet axe et enfin la variance expliquée par celui-ci,
exprimée par sa contribution soit :
CTR  (i)  f i.
Fh2 (i)
.
h
De même on définit la contribution d’un profil colonne j par rapport au même axe,
soit :
G 2h ( j)
.
CTR  ( j)  f . j
h
40
Un profil ligne ou colonne est jugé important dans l’interprétation d’un axe si sa
contribution exprimée en pourcentage dépasse la contribution moyenne ou si elle
est supérieure au poids fi. (f.j)
b. La qualité de représentation du profil ligne i sur l’axe Δh .
La qualité du profil ligne est mesurée par le cosinus de l’angle que le vecteur profil f Ji
fait avec l’axe Δh et donnée par :
QLTh(i) =
Fh2 (i)
.
d 2 (f Ji , f J )
De la même façon , on définie la qualité de représentation du profil colonne fIj , soit :
G 2h ( j)
QLTh(j) = 2 j
.
d (f I , f I )
Le profil est jugée bien représenté sur l’axe factoriel si QLT est proche de 1 puisque
c’est exactement le carré du cosinus.
1.7 Applications et utilisation de SPSS.
Dans la fonction « Analyse » choisir la rubrique « Correspondence Analysis ».
On sélectionne après la variable deuxième produit acheté impulsivement pour la
colonne et le magasin pour la variable ligne.
41
L’optio « statistics » pe et de s le tio e et d’affi he le ta leau de o espo da e, les tableaux
de p ofils lig es et olo es ai si ue les pa a t es d’aide à l’i te p tatio pou ha ue variable.
L’optio « plots » permet de donner une représentation graphique des profils lignes et des profils
colonnes simultanément.
42
1.7.1 L’Achat impulsif.
O a justifi p
de
e t et da s le ad e de l’e u te su l’a hat i pulsif, l’e iste e de elatio s
sig ifi ati es e t e le lieu d’a hat et le p e ie p oduit a het d’u e pa t et le deu i e p oduit
d’aut e pa t., a het s tous les deu d’u e a i e i pulsi e Sig ifi atio = .
L’appli atio d’u e AFC au ta leau des effe tifs sui a t pe ett a de t ou e les o espo da es
entre les points de ventes et le deuxième produit acheté d »une manière impulsive.
Croisement entre le deuxième produit acheté (prod22) & lieu d’a hat
Correspondence Table
magasin
prod22
Monoprix
alimentation
SMG
Champion
Carrefour
Géant
Active Margin
30
21
17
14
16
98
2
1
1
5
7
16
16
12
7
12
28
75
hygiène
7
4
10
5
4
30
autre
7
8
1
22
19
57
62
46
36
58
74
276
textile
cosmétique
Active Margin
Summary
Dimension
Singular
Value
Inertia
Chi
Square
Sig.
Proportion of Inertia
Accounted for
Confidence Singular Value
Cumulative
Standard
Deviation
Correlation
2
1
,375
,141
,760
,760
,052
2
,163
,026
,143
,902
,060
3
,133
,018
,095
,998
4
,021
,000
,002
1,000
1,000
1,000
Total
,185
51,132
,000(a)
,175
a 16 degrees of freedom
Le o
e de odalit s est le
e pou les deu a ia les do L’AFC peut s'appliquer sur le
tableau des profils lignes ou colonnes. Quatre axes factoriels peuvent être construits (nombre de
43
modalités -1). Les deux premiers axes expliquent 90.2% de la variance totale du tableau égale à
0.185. Le premier explique 76% (0.141/0.185) et le deuxième 14.3% (0.26/0.185).
Overview Row Points(a)
Score in
Dimension
Contribution
Of Point to Inertia
of Dimension
prod22
Mass
1
2
Inerti
a
1
Of Dimension to Inertia of
Point
2
1
2
Total
alimentation
,355
-,526
,119
,043
,262
,031
,867
,019
,886
textile
,058
,814
-,162
,017
,102
,009
,824
,014
,838
cosmétique
,272
,198
,475
,018
,028
,378
,227
,568
,794
hygiène
,109
-,837
-,777
,043
,203
,404
,657
,246
,903
autre
,207
,857
-,375
,064
,404
,179
,886
,073
,959
,185
1,000
1,000
Active Total
1,000
a Symmetrical normalization
Overview Column Points(a)
magasin
Mass
Score in
Dimension
1
Inertia
Contribution
Of Point to
Inertia of
Dimension
2
1
Of Dimension to Inertia of
Point
2
1
2
Total
Monoprix
,225
-,467
,276
,023
,131
,105
,807
,122
,928
SMG
,167
-,253
,258
,010
,028
,068
,389
,175
,564
Champion
,130
-1,056
-,506
,064
,388
,206
,847
,084
,931
Carrefour
,210
,631
-,592
,045
,223
,453
,696
,265
,961
Géant
,268
,567
,319
,043
,230
,168
,759
,104
,863
,185
1,000
1,000
Active Total
1,000
a Symmetrical normalization
44
Axe 1 :
L’a e est a a t is pa les p oduits ali e tai es, d’h gi e et aut e p oduits le t o i ue,
matériel auto, bureautique,..) et les hypermarchés Carrefour Géant et Champion. Carrefour et Géant
s’asso ie t au p oduit aut e et s’oppose t à Cha pio ui s’asso ie au p oduits ali e tai e et
d’h gi e..
Axe 2 :
L’a e est a a t is pa l’opposition des points de ventes Carrefour et Champion au produit
cosmétique qui se situe entre les magasins Géant, Monoprix et SMG.
magasin
prod22
0,6
cosmétique
Dimension 2
0,4
Géant
Monoprix
0,2
SMG
alimentation
0,0
textile
-0,2
-0,4
Champion
autre
-0,6
Carrefour
hygiène
-0,8
-1,0
-0,5
0,0
0,5
Dimension 1
En o lusio ous pou o s affi e ue o e a t la atu e de l’a hat i pulsif p t et sa
relation avec le point de vente, les produits de première nécessité sont liées aux magasins Monoprix,
SMG et Cha pio . Les p oduits du se o d o d e ou d’utilit
oi d e so t li s au h pe a h s,
do la taille du agasi i flue e l’a hat et la atu e du deu i e p oduit a het i pulsi ement.
1.7.2 Accès et utilisation d’Internet.
Da s l’e u te <<I te et : accès et utilisation au Québec>> réalisée en septembre 1997(voir le site
http://www.risq.qc.ca/enquête , o s’i t esse entre autre à la relation entre les deux variables
suivantes :
-A ie
-No
et da s l’utilisatio d’I te et
e d’heu es de o
e io pa
ois
odalit s .
odalit s .
45
Le ta leau des effe tifs o te u à pa ti des do
variables est :
es de l’e
u te ui
oise les
odalit s des deux
Nombres d’heures de
connexion
Ancienneté
-3mois
3à6mois
6à12mois
1 à 2ans
2 à3ans
+3ans
Total
-2h
71
79
160
208
65
23
603
2 à5h
197
204
542
798
359
148
2248
5 à10h
251
234
491
762
427
227
2394
10 à20h
172
164
421
565
399
227
1948
+20h
79
98
239
397
272
241
1326
Total
770
776
1853
2730
1522
868
8519
Le nombre de liges est inférieur aux nombres de colonnes donc une analyse factorielle des
correspondances est appliquée au tableau des profils colonnes. Soit le tableau des variances
expliquées par les axes issus du nuage des profils colonnes :
Axes Valeur
propre
Pourcentage expliqué
Pourcentage
cumulé
1
0.0258
86.82
86.82
2
0.0022
7.24
94.06
3
0.0013
4.28
98.34
4
0.0005
1.66
100
5
0.00
0.00
100
La dernière valeur propre est nulle elle correspond à la valeur triviale. Les deux premiers axes
fa to iels e pli ue t . % de l’i fo atio totale. Nous ous li ite o s do à l’i te p tatio de
la première carte factorielle.
Soit les tableaux des contributions et des qualités de représentations relatives aux deux premiers
axes.
46
Profils lignes :
Heures
connexion
Poids relatifs
en (%)
Ctr1 (i)
Ctr2 (i)
Qlt1 (i)
Qlt2 (i)
-2h
7.08
0.26
0.01
0.91
0.00
2-5h
26.39
0.17
0.44
0.81
0.17
5-10h
28.10
0.01
0.33
0.15
0.66
10-20h
22.87
.0.05
0.09
0.64
0.09
+20h
15.57
0.51
0.12
0.96
0.02
Profils colmonnes :
Ancienneté
Poids relatifs
en (%)
Ctr1 (i)
Ctr2 (i)
Qlt1 (i)
Qlt2 (i)
-3mois
9.04
0.07
0.52
0.61
0.38
3-6mois
9.11
0.05
0.10
0.71
0.13
6-12mois
21.75
0.08
0.07
0.82
0.06
1-2ans
32.05
0.05
0.26
0.62
0.28
2-3ans
17.87
0.12
0.06
0.8
0.03
+3ans
10.19
0.63
0.00
0.98
0.00
Axe 1 :
Le premier axe factoriel est expliqué essentiellement par les modalités +3ans qui contribue à
da s la fo atio de et a e te la odalit + heu es d’utilisatio he do adai e d’I te et.
une moindre mesure et par opposition on trouve la modalité - heu s d’utilisatio . Do
et a
caractérisé par les internautes professionnels ou les a os d’I te et ui so t ie ep se t
l’a e QLT= . .
63%
Da s
e est
s su
Axe 2 :
Le deuxième axe factoriel est expliqué essentiellement par la modalité -3mois d’a ie
caractérise les novices.
et
ui
47
En examinant les trajectoires des deux variables dans le plan factoriel ci-dessous nous remarquons la
divergence entre dernières modalités des deux variables. Au début on enregistre une affluence sur
I te et ui s’att ue a e le te ps pou se li ite e fi au a os et au p ofessio els.
-3mois
facteur2(7.24%)
0,1
5_10h
0,06
3_6mois
2_3ans
+3ans
-2h
10_20h
0,02
6_12mois
-0,02
20+h
1_2ans
-0,06
-0,45
-0,30
-0,15
0,00
2_5h
0,15
0,30
Facteur1(86.62%)
1.7.3 Le Lectorat.
L’a al se fa to ielle des o espo da es e ige des a ia les ualitati es sig ifi ati es d pe da tes
test d’i d pe da e de 2 . P
de
e t, o a justifi l’e iste e d’u lie sig ifi atif e t e le
mode d’a hat te l’attitude le to ielle (sig=0.048<5%).
Proportion d'inertie
Valeur singulière de
confiance
Corrélation
Dimension
Valeur
singulière
Inertie
Khi-deux
Sig.
Expliqué
Cumulé
Ecart-type
1
,127
,016
,924
,924
,034
2
,036
,001
,076
1,000
,037
1,000
1,000
Total
,018
12,728
,048(a)
2
-,028
a 6 degrés de liberté
L’analyse factorielle est effectuée sur le tableau des profils colonnes puisque le nombre de
modalités de l’attitude lectorielle est égal à trois donc deux axes factoriels expliquent toute
48
l’information. Le premier axe détient à lui seul 92.4%(0.16/0.18) de l’information ou de la
variance totale égale à 0.018
Caractéristiques des points colonnes
attitude lectorielle
Score dans la
dimension
Masse
1
Inertie
Contribution
De point à inertie
de dimension
2
1
2
De dimension à
inertie de point
1
2
lecture différée
,153
-,538
,344
,006
,348
,499
,895
,105
feuilleté
,603
-,092
-,147
,001
,040
,357
,579
,421
lecture immédiate
,244
,565
,147
,010
,612
,144
,981
,019
,018
1,000
1,000
Total actif
1,000
Caractéristiques des points lignes
mode d'achat
Masse
Score dans la
dimension
1
Inertie
Contribution
De point à inertie
de dimension
2
1
2
De dimension à inertie
de point
1
2
abonnement
postal
,145
-,802
-,004
,012
,732
,000
1,000
,000
portage
,552
,046
-,082
,000
,009
,102
,520
,480
dans la rue,
vendeur
ambulant
,171
,421
-,105
,004
,237
,052
,983
,017
kiosque
,132
,144
,482
,001
,022
,846
,237
,763
,018
1,000
1,000
Total actif
1,000
a Normalisation principale symétrique
La consultation des deux tableaux précédents et en se basant sur les contributions et les
coordonnées des points linges et des points colonnes par rapport aux deux axes factoriels nous
permet de donner une interprétation de ces derniers. Les modalités ayant les contributions
a u es e g as et ui so t sup ieu es à la o t i utio
o e e so t elles a a t ise l’a e. Les
oo do
es se e t à p ise l’asso iatio ou l’oppositio des odalit s.
49
Axe 1 :
Les odalit s a o e e t postal et le tu e diff e ui s’asso ie t e s'opposa t au
lecture immédiate et achat dans la rue ou vendeur ambulant.
odalit s
Axe 2 :
La modalité Kiosque est celle qui contribue le plus à la fo atio de et a e
et dans une moindre mesure on trouve la lecture différée et feulletée.
0,5
. % et d’aut e pa t
kiosque
Dimension 2
0,4
lecture différée
0,3
0,2
lecture immédiate
0,1
0,0
abonnement postal
-0,1
dans la rue, vendeur
portage
-0,2
-0,9
-0,6
-0,3
0,0
0,3
0,6
Dimension 1
Pour conclure nous pouvons dire en se référant au plan factoriel ci-dessus que la liberté ou la
d isio d’a hat d’u jou al favorise une lecture immédiate. Par contre le portage donne une
le tu e feuillet e et l’a o e e t postal u e le tu e diff e.
2. Analyse factorielle des correspondances multiples
L’a al se fa to ielle des o espo da es ultiples (AFCM) pe et d’a al se un tableau de
variables nominales observées par une population de n individus. Ce tableau binaire est appelé
tableau disjonctif complet.
p
m
Soient X1 ,….Xm m variables qualitatives , chaque variable Xj po ssède pj modalités avec p=
j1
j
le
nombre total de modalités qui correspond au nombre de colonnes du tableau X étudié. Soit xijl le
terme général de ce tableau :
50
xijl =
si l’i di idu i opte pou la
odalit l de la a ia le Xj et 0 sinon.
Le tableau X est tel que la so
e de ha ue lig e est gale à et la so
e d’u e olo e jl ou l est
la modalité de la variable Xj est égale à njl ui est le le o
e d’i di idu ui o t hoisi la odalit l
de la variable Xj .
n jl
n
est la fréquence de la modalité l de la variable Xj .
O d fi it ais e t de la
e faço ue da s le d’u e AFC si ple les p ofils lig es et les p ofils
colonnes et on montre (Saporta 1990)que la variance totale du nuage des points lignes ou des points
colonnes est égale à :
I( N(I), f J ) 
p
1
m
L’i te p tatio des a es fa to iels se fait de la
e faço u’u e AFC si ple et elle est as e su
les mêmes paramètres (poids, coordonnées, contributions et qualité de représentation).
Application : Etudes de cas
Etude du comportement de l’i vestisseu tu isie à la BVMT ( [email protected]).
Lo s de l’i t odu tio e ou se pa off e publique de vente (OPV), une étude a été élaborée par
enquête auprès des investisseurs sur leurs comportements après l’eupho ie u’a connu la bourse
tunisienne à la fin des années 90 et les augmentations anormales de certaines valeurs. Les résultats
de cette étude sont su le site du Conseil du Marché tunisien dans la rubrique « Etude » .
51
IV.
La classification.
Le but des méthodes de classification est de construire une partition ou une suite de partitions
emboîtées d’u e se le d’o jets do t o o aît les dista es deu à deu . Les lasses fo
es
doivent être les plus homogènes possibles. Les méthodes de partitionnement sont :
-
La classification hiérarchique ascendante (CAH).
-
Les méthodes du type « nuées dynamiques ».
-
Les cartes de Kohenen (Approche neuronale).
1. La classification CAH.
La classification hiérarchique est autre manière de résumer les données elle consiste à construire une
typologie ou partition des individus en classes homogènes.
Soit la t pologie d’u e populatio E de taille e k lasse d’effe tifs 1 , …., k . Notons par G1 , …, Gk
cette typologie du nuage de points N(x1 ,… n ) et g ,….,gk les centres de ces cklasses.
L’i e tie du uage N ou la a ia e totale se d o pose ai si :
 nd
k
I(N,g) =
i 1
ni
(g i , g )  
k
2
i 1
ni
I(G i , g i ) = variance inter classe + variance intra classes.
n
L’i e tie i te lasses pe et de esu e la a i e do t les lasses s’ loig ent les unes des autres,
notée I(G1, …,Gk et ep se te l’i e tie e pli u e pa la t pologie.
L’i e tie i t a classe qui est la moyenne des variances des classes, mesure leur homogénéité.
Co st u tio d’u e t pologie selo le it e de Wa d.
On agrège les individus qui fo t le oi s a ie l’i e tie i te lasses. E d’aut es te es, o he he
à o te i à ha ue pas u
i i u lo al de l’i e tie i t a lasse ou u
a i u de l’i e tie i ter
classes. Lo s u’o e pla e deu lasses Gi et Gj de la typologie G1,….Gk par la réunion Gi UGj il y a
u e di i utio de l’i e tie i te lasses ot e pa D Gi ,Gj ) et égale à :
D(G i , G j ) 
Sachant que g ij 
nj
ni  n j 2
nin j
ni 2
d ( g i , g )  d 2 (g j , g ) 
d (g ij g) 
d 2 (g i , g j ).
n
n
n
n (n i  n j )
n i g i  n jg j
ni  n j
.
Ce critère est utilisé pour mesurer la distance entre deux classe Gi et Gj et s’appelle le it e
d’ag gatio de WARD.
52
Algorithme Itératif de la CAH.
La CAH est desti e à u e populatio de taille li it e <
ta t do
le o
e d’op atio s
effe tu pa l’algo ith e ie u& la p e i e tape ui o siste à o pa e les distances deux à
deux entre tous les individus.
Etape 1 : elle consiste à partir de la population entière comme seule et unique classe. Chaque
individu constitue un singleton. On compare les distances deux à deux de ces classes et on regroupe
les deux classes Gi et Gj correspondant à la distance minimale et dont les profils se ressemble le plus .
L’i e tie totale à ette tape est do
gale à l’i e tie i te lasses.
Etape 2 : Deux individus sont donc agrégé et constitue une classe notée Gij de centre gij . Cette étape
consiste à comparer les distances qui séparent le centre gij aux n- i di idus esta ts, l’i di idu le
plus proche y sera agrégé.
.
.
Etape finale : Il ’ a u’u e seule lasse ui eg oupe toute la populatio . L’i e tie i te lasse est
donc nulle, la somme des pe tes d’i e tie i te lasse des diff e tes tapes de l’algo ith e est do
gale à l’i e tie totale.
Les diff e tes tapes de l’algo ith e o stitue t u e hi a hie as e da te et u de d og a
e
est ainsi mis en place. A ha ue tape o al ule u i di e o te u e di isa t la pe te d’i e tie i te
lasse pa l’i e tie totale. O etie t la t pologie correspondant à une augmentation brutale de
l’i di e ou à la valeur maximale de
1 nk
où T est la variance intra classe et k le nombre d
T k 1
classes.
2. Méthode des k-means.
Cette méthode développée par Edwin Diday consiste à partir d’u e populatio de
choisir arbitrairement k points selon la représentation graphique du nuage de points.
i di idus de
Ces k points définissent k voisinages V1 ,…Vk . Soient c1 ,… k les centres respectifs de ces voisinages
qui diffèrent forcément avec les k points choisis arbitrairement. Une procédure itérative basée sur
la minimisation de la variance intra classes ou sur la minimisation des différences entre les
coordonnées des centres des classes obtenus à chaque étape itérative pe et d’a outi à u e
typologie optimale.
Algorithme de k-meanss
Etape 1 : k points sont choisis arbitrairement qui correspondent à k voisinages ou groupes V11 ,…Vk1
de centres respectifs c11 ,… k1 .
53
Etape 2 : à ces centres c11 ,…
nouveaux centres c12 ,…. k2 .
1
k
correspondent k nouveaux voisinages V12 , …Vk2 qui donnent k
.
.
Etape finale : La pa titio fi ale d’o d e p ui est opti ale vérifié la nullité des différences des
oo do
es des e t es des lasses o te ues à l’ tape p et à l’ tape p
de te p-1.
La méthode des k-meanss p se te l’i o
ie t de l’absence d’u i it de la t pologie ete ue. E
effet le choix arbitraire des centres initiaux des classes a une influence sur la typologie retenue.
La méthode des nuées dynamiques est une extension de la méthode précédente. Cette méthode
consiste à considérer un noyau des points les plus centraux ou un axe factoriel ou encore un plan
factoriel
La méthode des nuées dynamiques exige un nombre de classe que l’o doit fi e d’a a e
contrairement à la méthode da la classification ascendante hiérarchique qui propose une typologie
selon le critère de Ward par exemple.
3. Application. Utilisation de SPSS.
3.1 Gestion financière des communes.
Dans la rubrique « Analyse » on accède à la fonction « Classify » et on choisit la méthode des kmeans.
54
On sélectionne les trois facteurs arrêtés dans l’analyse en composante principale afin de
déterminer la typologie idéale. Nous pouvons effectuer l’analyse typologique sur les variables
initiales au lieu des composantes qu’il faut choisir minutieusement. Comme nous l’avons
signalé auparavant, un nombre de classe est demandé au départ ( dans ce cas c’est 4) ainsi
qu’un nombre d’itérations de l’algorithme qu’il faut prendre assez grand.
On cliquant sur « save » , ceci nous permet de sauvegarder l’appartenance de chaque
commune à la classe à la quelle elle est affectée sous forme d’une variable codée de 1 à 4.
L’option « statistics » permet de fournir les coordonnées des centres initiaux des classes ainsi
que les coordonnées finales.
55
a
Iteration History
Initial Cluster Centers
Change in Cluster Centers
Cluster
1
2
3
Iteration
4
1
2
3
4
Budget
-,16992 3,36705
-,65463
-1,30973
1
1,748
2,296
2,022 2,003
Commodités
4,10655 1,02667
-,51751
-1,10516
2
,206
,160
,164
,049
Endettement
-,61970 ,44987 3,72735
-2,06845
3
,000
,057
,100
,035
4
,000
,035
,036
,023
5
,000
,000
,000
,000
a. Convergence achieved due to no or
small change in cluster centers. The
maximum absolute coordinate change
for any center is ,000. The current
iteration is 5. The minimum distance
between initial centers is 4,810.
Cinq itérations ont permis à l’algorithme de converger selon le critère mentionné auparavant
et au bas du tableau des itérations.
Distances between Final Cluster Centers
Final Cluster Centers
Cluster
Cluster
1
2
3
4
1
1
2
2,753
Budget
-,11650 1,26725 -,45117
-,42797
2
2,753
Commodités
2,21214
-,14783 -,19467
-,34965
3
2,989
2,238
Endettement
-,24270
,06419 1,49737
-,54922
4
2,599
1,814
3
4
2,989
2,599
2,238
1,814
2,053
2,053
ANOVA
Cluster
Mean Square
Error
df
Mean Square
df
F
Sig.
Budget
31,384
3
,502
183
62,532
,000
Commodités
37,001
3
,410
183
90,284
,000
Endettement
34,813
3
,446
183
78,108
,000
The F tests should be used only for descriptive purposes because the clusters have been chosen to
maximize the differences among cases in different clusters. The observed significance levels are not
corrected for this and thus cannot be interpreted as tests of the hypothesis that the cluster means are
equal.
56
Une analyse de la variance en option dont la variable explicative ou facteur est l’appartenance
de la commune à la classe et la variable à expliquer est la composante ou l’indicateur
synthétique. Les trois ANOVA sont significatives (sig=0). C'est-à-dire les trois indicateurs
séparent significativement les communes en quatre classes. Les commodités séparent le
mieux les quatre classes (Fisher le plus élevé : 90.284).
Les caractéristiques des classes seront précisées dans le chapitre suivant.
Number of Cases in each
Cluster
Cluster
Valid
1
20,000
2
44,000
3
34,000
4
89,000
187,000
Missing
. T pologie des lie ts d’u e Ba
ue.
Une banque a élaboré une étude visant à mieux connaître la situation et le comportement de sa
clientèle. Elle souhaite notamment définir des types homogènes de clients afin de pouvoir
entreprendre des politiques différenciées pour chacun d’eux et aussi mettre en place un outil
d’aide à la décision pour l’octroi des crédits.
La banque a utilisé pour cela les données figurant dans les fichiers de gestion. Elle a constitué
un échantillon de cinquante titulaires d’un compte courant appartenant à des ménages
distincts. Onze variables quantitatives exprimant le comportement bancaire et deux autres
informations relatives à leur situation sociodémographique ont été arrêtées.
13 VARIABLES ACTIVES
_____________________________________________________________
V1 : solde moyen
V2 : montant moyen des chèques tirés
V3 : nombre de mois avec découvert
V4 : montant cumulé des découverts
V5 : nombre de produits de la banque utilisés
V6 : nombre d’emprunts divers effectués
V7 : montant total des emprunts effectués
V8 : variation des dépôts (en %)
V9 : montant total des dépôts
V10: montant total des retraits
V11: variation des retraits (en %)
V12: taille du ménage du client
V13: âge du client
_______________________________________________________________
57
L’ACP appli u e au t eize a ia les a permis de mettre en place deux indicateurs synthétiques (voir
tableau des corrélations) à savoir le comportement (client actif ou passif) et la situation financière.
-------------------------------------------------------------------------VARIABLES
| CORRELATIONS VARIABLE-FACTEUR
--------------------------------------------------------------------------VARIABLES ACTIVES
|
1
2
3
4
5
--------------------------------------------------------------------------V1
V2
V3
V4
V5
V6
V7
V8
V9
V10
V11
V12
V13
|
|
|
|
|
|
|
|
|
|
|
|
|
-.69
-.54
.74
.61
-.45
-.11
-.15
-.77
-.78
-.13
.37
-.49
-.54
.35
-.04
.18
.01
-.77
-.55
-.92
.30
.44
-.87
-.34
.01
-.24
-.36
-.17
-.46
-.62
-.24
.01
-.21
-.32
-.28
-.18
.10
.28
.27
-.01
.44
.27
.14
-.04
.52
-.09
-.22
-.15
-.19
-.31
.50
-.01
.14
.46
-.04
.10
-.01
-.37
.04
-.10
-.04
-.06
.68
.32
-.12
Une typologie en trois classes est obtenue selon le critère de Ward. On constate dans la description
suivante des classes formées la variation utale de l’i di e ui est passé de 1.2 à 2.54797. La
oupu e de l’a e se fait au i eau de la lasse
e ui do e la d o positio e t ois lasses 95,
96,97.
CLASSIFICATION HIERARCHIQUE : DESCRIPTION DES NOEUDS
HISTOGRAMME DES INDICES DE NIVEAU
NUM. AINE BENJ
EFF.
POIDS
INDICE
51
7
3
2
2.00
.00534
*
.
.
.
85
48
81
5
5.00
.13267 ****
86
69
80
6
6.00
.17360 *****
87
10
86
7
7.00
.19986 ******
88
49
44
2
2.00
.19998 ******
89
11
82
9
9.00
.23276 *******
90
84
88
11
11.00
.25713 *******
91
89
76
14
14.00
.28332 ********
92
85
57
7
7.00
.29194 ********
93
77
75
8
8.00
.41804 ************
94
92
93
15
15.00
.59377 ****************
95
90
83
13
13.00
.64597 ******************
96
91
46
15
15.00
.79515 **********************
97
94
87
22
22.00
1.20079 ******************************
--------------------------------------------------------------------------98
96
97
37
37.00
2.54797 ********************************
99
95
98
50
50.00
2.98148 ********************************
58
IV. l’A al se fa to ielle dis i i a te.
1. Introduction.
Le but des
thodes dis i i a tes est de p di e u e a ia le ualitati e à k at go ies à l’aide de
p variables explicatives généralement numériques. Soient P une population partitionnée en q
g oupes à l’aide d’u e a ia le ualitati e Y, ha ue u it statisti ue est d ite pa p a ia les
quantitatives X1, X2, ..., Xp. L’AFD pe et de alise les deu o je tifs sui a ts :
- Le premier est de distinguer parmi les variables quantitatives celles qui séparent le mieux les
groupes, de les comparer et de mettre en place des combinaisons linéaires de ses variables qui
pe ette t la dis i i atio des g oupes. C’est l’aspe t des iptif de l’AFD.
- Le second est d’affe te d’aut es u it s statisti ues au diff e ts g oupes selo
o se atio s des diff e tes a ia les ua titati es. C’est l’aspe t d isio el de l’AFD.
leu s
L’a al se fa to ielle dis i i a te, o t ai e e t à l’A al se e o posa tes p i ipales et l’a al se
factorielle des correspondances qui permettent la description des données, aboutit à une prise de
décision selon une démarche statistique.
Les do ai es d’appli atio de L’AFD so t o
eu et se o fo de t a e eu de la e o aissa e
des fo es. O utilise l’AFD o
e outil d’aide à la d isio , pa e e ple e fi a e pou la
détection de défaillance des entreprises [Bardos 97], ou pour évaluer le risque de crédit bancaire. En
marketing elle permet par exemple, la prévision de la décision d’a hat d’u p oduit oi III . E
milieu industriel cette technique peut être utilisée dans le domaine du contrôle de la qualité. Elle
pe et aussi d’esti e les po ses a ua tes.
2. Présentation de la méthode.
2.1 Exemple
A partir des valeurs prises par u i di idu pou
a ia les ua titati es, il s’agit de d te
laquelle des n classes de la variable qualitative il appartient.
i e à
Supposons que p =2 c'est-à-di e u’il a deu a ia les e pli ati es X1, X2 seulement et que q=2 c'està-dire que la variable qualitative ne possède que 2 classes.
Ces données sont représentées sur le graphique suivant, les axes étant constitués par les variables
quantitatives, les individus du premier groupe sont représentés par la lettre A, ceux du second
groupe par la lettre B.
X2
B3
B4
B1
B5 B6
A1
A2
A7
B2
A3
A4
X1
A5
a
D
59
L’a e D dis i i e les deu g oupes. Il est do possi le d’affe te u ou el l e t a à l’u des
deu g oupes e sa ha t sa oo do
e su l’a e D. L’a e D est u e o i aiso li ai e des
variables X1 et X2 appelé composante discriminante.
Le p o l e de l’a al se dis i i a te est juste e t la o st u tio d’u e ou plusieu s
combinaisons de variables permettant de discriminer les groupes, ces combinaisons linéaires sont
appelées variables discriminantes.
2.2 Décomposition de la variance
On note pour toute la population étudiée :
n : la taille de la population
p : le nombre de variables explicatives étudiées.
q : le nombre de groupes ou encore le nombre de modalités de la variable à expliquer.
mj :la moyenne de la variable Xj
Vj :la variance de la variable Xj
et pou ha ue g oupe k d’effe tif
k
k = ,… :
mjk : la moyenne de la variable Xj dans le groupe k.
vjk : la variance de variable Xj dans le groupe k.
O a pou tout j = ,….p
1 q
Vj   n k (m  m j )   n k v kj = Bj
n
k 1
1
k

 

q
1
n
k
j
Variance inter groupes
ou between
2
+ Wj
Variance intra groupes
ou within
On défini de même la covariance entre les deux variables Xj et Xl :
v( j , l ) 
q
nk k
1 q
k
k
[
(
)(
_
)
]
(m j  m j )(m kj  ml )
x

m
x
m




ij
j
il
l
n
n k 1 Gk
k 1
Soit la matrice des covariances totales :
V=B+W
B : la matrice des covariances inter groupes.
W : la matrice des covariances intra groupes.
60
En posant :
 x 11  m1 ...................................x 1p  m p 



.
.x i1  m1 ..........x ij  m j .............x ip  m p 

1 
R

.
n


.

.


x  m1 ...................................x np  m p 

 n1
it : V = R’R
La matrice de varia e o a ia e totale s’
Et en posant :
 n1
(m 11  m 1 )

n



 nk
S
(m 1k  m 1 )
n



 nq
(m 1q  m 1 )

 n
La








nk
k
(m j  m j ) 
n




at i e de o a ia es i te g oupes s’


n1
(m 1p  m p ) 
n




nk
k
(m p  m p )
n



nq

q
(m p  m p ) 
n

it : B = S’ S.
3. Composantes discriminantes.
Co
e ous l’a o s sig al p
de
e t, l’id e est de o st uire des composantes discriminantes
Z qui sont des combinaisons linéaires des variables explicatives X1,…..Xp .Soit la o posa te d’o d e l
Z l = X =j Xj qui sépare le mieux les q classes associées aux modalités de la variable à expliquer Y .
Cette combinaison linéaire  de composantes j j=1,.., p devra être :
de variance intra groupes minimum ce qui correspond à une homogénéité maximum des
classes.
- de variance inter groupes maximum ce qui signifie une séparation maximum des centres des
classes.
Pour cela on cherche la combinaison  minimisant le rapport :
-
T

 ' W
= variance intra de /variance inter de 
 ' B
 ' (V  B)  ' V
 '
 1.
 ' B
 B
61
Ce qui revient à maximiser le rapport R () =
 ' B
, donc à maximiser ’B sous la contrainte ’V=1.
'
 V
R est une fonction homogène en, R() =R(c ), où c est constante quelconque.
Soit à maximiser le Lagrangien :
L = ’B -(’V-1).
D’où :
B = V
ce qui implique (V-1B) =  avec ’B =.
Soit  le premier vecteur propre de la matrice V-1B associée à la plus grande valeur propre 1 de V-1B.
Ap s a oi t ou
ette p e i e o i aiso li ai e u’o ote a 1 on pourra chercher une
combinaison linéaire 2 non corrélée à 1 de variance 1 et de variance inter classes maximum. On
it e le p o essus e he ha t à l’ tape t la o i aiso t non corrélée à 1,…...  t-1 de variance 1
et de variance inter classes maximum, obtenus en calculant les vecteurs propres de V-1B associés aux
valeurs propres 1, …t de V-1B, t est au plus égal à q-1 car le rang de la matrice de covariances inter
groupes B est au plus égal à q-1.
Avec :
1 >2 …> …>t
et
0j 
j= ,…t.
en effet :
 ' B  ' (V  W)

 1 (’W0)
= '
'
 V
 V
1,…... t sont appelées combinaisons linéaires discriminantes.
4. Lie ave L’ACP
Soit  une combinaison linéaire discriminante. On pose U = V  et on désigne par  l’a e
engendré par le vecteur U de norme 1 par la métrique V-1 et on a :
(BV-1) U =B  =  V  = U
B étant la matrice associée aux centres gl l= ,… des classes Gl l= ,… , diago alise la at i e BV-1
ou V-1B revient à faire une analyse en composantes principales du nuage
{gl l= ,… } affe t s des
poids wl = {pj j  Gl }= (nl /n généralement).
62
5. C it e d’affe tatio ou tape d isionnelle.
Il s’agit de fai e le lasse e t d’u e o se atio ou i di idu da s l’u des g oupes à pa ti de la
o aissa e des aleu s des a ia les e pli ati es. L’i di idu à lasse
est suppos e t pa
rapport au centre de gravité global des individus.
L’affe tatio de se fait selo l’app o he g o t i ue : x est affecté au groupe pour lequel la
distance entre x et le centre de gravité du groupe est la plus faible.
D2(x,gk) = (x – gk)’ V-1 (x – gk)
appelée distance de Mahalanobis ce qui revient à minimiser la quantité gk’ V-1 (gk – 2x).
Remarque : Insuffisance du critère géométrique.
groupe1
x
groupe2
L’i di idu se ait affe t au g oupe selo le it e g o t i ue ie u’il soit g aphi ue e t plus
proche du groupe 1. Ceci est dû à la différence des variances des deux groupes.
6. Aut es it es d’affe tatio .
La métrique V-1 de l’AFD e t aî e de o
euses e eu s de lasse e t puis ue l’ galit des
matrices de variances covariances est rarement vérifiée en pratique. Elle ne tient pas compte en
out e de la fo e des lasses, ais elle a l’a a tage de fa ilite les al uls.
Pou e die à ette i suffisa e, l’id e est d’a o de da s le al ul des dista es au diff e ts
g oupes des poids d’auta t plus forts que le groupe est fortement dispersé. Cela revient à munir
ha ue g oupe d’u e
t i ue d fi ie pa u e fo e uad ati ue d fi ie positi e.
Soit la dista e d’u i di idu x au centre de la classe Gk définie par :
Dk2(x,gk) = (x – gk)’ Qk (x – gk)
avec :
63
Qk = [det Wk ]1/pWk-1 minimisant la moyenne des carrés des distances entre individus dans le groupe
Gk , où Wk est la matrice des covariances intra classes pour le groupe Gk.
7. App o he a esie e d’affe tatio .
Soient p1, p2,….pq les proportions des q groupes dans la population étudiée. La distribution de
p o a ilit d’u i di idu do t le e teu d’o se atio = 1,…, p), est donnée pour chaque groupe j
par la densité fj . O a d’ap s la fo ule de Ba es :
P (G j / x ) 
p jf j (x)
 p f (x)
q
j1
la probabilité pour que x  Gj .
j j
La gle a esie e o siste à affe te l’i di idu au g oupe ui a la p o a ilit à poste io i
maximale, c'est-à-dire maximiser le terme pjfj . Il est do
essai e d’esti e fj(x).
7.1 Estimation paramétrique.
On suppose que le vecteur x  N p ( j ,  j ) pour chaque groupe Gj . La loi normale
multidimensionnelle est donnée par :
f j (x) 
(2)
p/2
1
1
exp[  ( x   j )'  j 1 ( x   j )]
1/ 2
2
det( j )
donc maximiser pjfj(x) revient à minimiser le terme :
(x   j )'  j 1 (x   j )  2 ln(p j )  ln(det  j )
7.1.1 Hétéroscédasticité.
Dans le cas général, les matrices de covariances j so t diff e tes. Le it e d’affe tatio est alo s
quadratique en x. Les probabilités pj so t suppos es o ues ais il est
essai e d’esti e les
moyennes j ainsi que les matrices de covariances j en maximisant la vraisemblance compte tenu
de l’h poth se de o alit . Ce i o duit à esti e la o e e j* par gj le centre de la classe Gj et
j par la matrice de covariances empiriques :
S*j 
1
 (x i  g j )(x i  g j )'
n j  1 iG j
7.1.2 Homoscédasticité.
On suppose dans ce cas que les lois dans chaque groupe partagent la même structure de covariances
j =. Le terme à maximiser devient :
64
ln( p j ) 
1 ' 1
 j   j   'j  1 x
2
qui est linéaire en x . Les moyennes sont estimées comme précédemment, tandis que la matrice 
est estimée par la matrice de covariances intra classes empiriques :
1 q
S 
  (x i  g j )(x i  g j )'
n  q j1 iG j
*
Le
it e s’
it alo s :
1
Max[ x '  1 j   'j  1 j  ln( p j )]
2
7.2 Estimation non paramétrique.
O pa le d’esti atio fo tio elle lo s ue le o
e de pa a t es à esti e est i fi i. O au a
donc à estimer une fonction, par exemple la régression y=f(x) ou encore une densité de probabilité.
Da s e as, au lieu de suppose u’o a affai e à u e de sit de t pe o u o ale do t o
estime les paramètres, on cherche une estimation f de la densité f. Pour tout x de  , f(x) est donc


estimée par f (x).
Cette app o he t s souple a l’a a tage de e pas
essite d’h poth ses pa ti uli es su la loi, e
e a he elle ’est appli a le u’a e des ha tillo s de g a de taille d’auta t plus ue le o
e
de dimension est grand.
L’id e la plus atu elle o siste à esti e la de sit e u poi t
e o pta t le o
e
d’o se atio s situ es da s u oisi age de su  , on peut choisir un voisinage de la forme]x - hn/2
, x + hn/2[ où hn est u
el st i te e t positif, e ui o duit à l’esti ateu :
f n (x) 
Fn ( x  h n / 2)  Fn ( x  h n / 2)
hn
Fn désigne la fonction de répartition empirique associée à un échantillon de taille n. Cette expression
peut e o e s’ i e :
1
f n (x) 
nh n
 K(
n
i 1
x  Xi
)
hn
où X1,…,Xn so t les a ia les al atoi es de l’ ha tillo .
K est une fonction appelée <<noyau de convolution >> ou plus simplement <<noyau>> (kernels).
Exemples :
a. 1[-1/2 , 1/2] est un noyau de Parzen Rozenblatt positif cf[Bosq & Lecoutre 87].
65
b.
1
2
e x
2
/2
est un noyau de Parzen Rozenblatt positif défini sur  .
Le hoi du o au se le t e gl pa u
it e d’opti isatio oi Bos
.E
alit o peut
être amené à envisage d’aut es o au pou des aiso s de lissage ou de fa ilit de al ul. La fo e
du o au ’est pas t s d te i a te su la ualit de l’esti atio o t ai e e t à la aleu de h.
Le choix de h est crucial pour la précision locale ou globale de fn . Si K est la densité de la loi normale
réduite on a :

s
h n  1.059 1n/ 5 ; où sn est l’ a t t pe e pi i ue.
n
La méthode du noyau est utilisée pour calculer une estimation non paramétrique de chaque densité
fl(x) qui sont alors des fonctions définies dans  p. Le noyau K*doit donc être multidimensionnel :

f l (x) 
1
nlh p
K
iG l
*
(
x  xi
).
h
Un noyau multidimensionnel peut être défini à partir de la densité usuelle de lois : multi normale
Np(0,p) ou uniforme sur la sphère unité ou encore par produit de noyaux unidimensionnels :
 K(x )
p
K*(x) =
j1
j
8. Application :
66
8.1 Développement des communes tunisiennes à travers leurs gestions financières.
La situation financière des communes tunisiennes demeure dans une large mesure tributaire de la
qualité de gestion des ressources disponibles. Le développement des capacités locales, la
ode isatio de la gestio fi a i e pa le e ou s au te h i ues d’ aluatio , d’a al se et de
prospective sont des mesures de nature à permettre aux communes de rationaliser leurs choix
budgétaire.
Il s’agit à pa ti d’u
ha tillo de
o
u es d fi ies pa
atios fi a ie s et des i di ateu s
de taille et d’a ti it de ett e e pla e u outil d’aide à la d isio afi d’opti ise l’aide fi a i e
ou te h i ue des pou oi s pu li s. Cet outil est o te u e appli ua t l’a al se fa to ielle
dis i i a te ui passe
essai e e t pa u e ACP ui s th tise l’i fo atio e
su a t les
variables étudiées par les trois indicateurs synthétiques :
- Budget
- Commodités
- Endettement
Le positio e e t des o
u es pa appo t à es t ois fa teu s et l’appli atio de la
thode des
nuées dynamiques, nous permettent de faire une typologie des communes en trois classes :
-
-
-
-
Communes aisées (classe 1) : ce sont les communes à niveau de développement local
app ia le et au essou es fi a i es le es. Il s’agit pou es o
u es de ode ise
leu s outils de gestio i te e, d’a lio e les se i es e dus au ito e s et s’o upe des
aspects secondaires tels ue les p o l es d’e i o e e t, d’e ellisse e t et d’espa es
verts.
Communes en développement (classe 2) : ce sont les communes à niveau de développement
local appréciable mais aux ressources financières insuffisantes. Ces communes dynamiques
ne man ue t pas d’i itiati es ais ’o t pas les o e s de leu s a itio s. Il s’agit
d’a lio e la pla ifi atio da s es o
u es pou atio alise leu s d pe ses et
éventuellement améliorer leurs ressources budgétaires.
Co
u es a ua t d’i itiati es lasse 3) : Ce sont des communes à faible niveau de
développent local tout en enregistrant des ressources globalement moyennes et un faible
endettement. Ces communes manquent de dynamisme dans la mesure où leur aisance
fi a i e elati e ’est pas e ploit e à o es ie t. Pou es o
u es il s’agit su tout d’u
problème de gestion, une aide technique améliorerait la situation.
Communes en difficulté (classe 4) : ce sont des communes à niveau de développement et de
ressources faibles et un endettement élevé. Ce so t des o
u es u’il faut
impérativement aider tant au niveau financier (en augmentant leur quotte part du fond
o
u pou pe ett e u d eloppe e t sp ifi ue u’au i eau te h i ue.
67
La variable qualitative à expliquer est donc codée de 1 à
, elle d sig e l’appa te a e ou
l’affe tatio d’u e o
u e à l’u e des lasses fo
e. Cette affe tatio o stitue u e p ise de
d isio pou les pou oi s pu li s afi de atio alise l’aide u’elle soit fi a i e ou te h i ue.
L’a al se fa to ielle dis i i a te appli u e au si p e ie s fa teu s issus de l’ACP ous do
résultats suivants :
e les
L’optio « statistics » permet de donner les différents paramètres de chaque variable ou facteur
explicatif.
68
Tests d'égalité des moyennes des groupes
Lambda de
Wilks
F
ddl1
ddl2
Signification
REGR factor score
1 for analysis 2
,345
115,898
3
183
,000
REGR factor score
2 for analysis 2
,416
85,782
3
183
,000
REGR factor score
3 for analysis 2
,479
66,236
3
183
,000
REGR factor score
4 for analysis 2
,993
,442
3
183
,723
REGR factor score
5 for analysis 2
,997
,171
3
183
,916
REGR factor score
6 for analysis 2
,979
1,280
3
183
,283
Nous constatons que seuls les trois indicateurs synthétiques à savoir le budget, les commodités et
l’e dette e t ui so t sig ifi atifs da s la dis i i atio des lasses.
Pour étudier le pouvoir discriminant des variables explicatives qui sont dans ce cas les facteurs
o te us à pa ti d’u e ACP, le ta leau p
de t ous p se te les pa a t es sui a ts :
-
-
Le Fischer : F 
somme.des.carres. int er  classes /( k  1)
, les variables les plus
somme.descarrés. int ra  classes /( n  k )
discriminantes correspondent aux valeurs de F les plus élevées.
Le niveau de signification  = p(F(q-1,n-q)F) nous permet de préciser quelles sont
les variables significativement discriminantes.
Le Lambda de Wilks :w =1-2 , plus ce paramètre est faible plus le pouvoir
discriminant de la variable est fort. Le lambda de wilks peut être globale et concerne
les fonctions discriminantes :
   (1   2m )
q 1
m 1
Ce paramètre nous permet d’étudier le pouvoir discriminant dans le cas d’une d’un modèle
unique qui correspond à deux groupes .
-
Le rapport de corrélation :0  2 ( X j , Y ) 
var iance. int er  classes
1 ; plus le rapport
var iance.totale
est proche de 1 plus le pouvoir discriminant la variable Xj est important.
L’interprétation du pouvoir discriminant des fonctions ou des composantes discriminantes est
basée sur les paramètres suivants :
-
Egalité des matrices de variances / covariances des q groupes : Test de Box.
69
H0 : les matrices de variances / covariances des q groupes sont égales, les groupes sont
donc homogènes.
H1 : Il existe au moins deux groupes pour lesquels les matrices de variances/ covariances ne
sont pas égales, les groupes sont hétérogènes.
Ce tes est basé sur le calcul da la statistique F pour  fixé. La règle de décision consiste à
rejeter H0 si la signification p(F) < .
- Qualité des fonctions discriminantes ou capacité à différencier entre les groupes :
λi /λi est le % de la variance expliquée par la ieme composante discriminante.
λi / Vi est la corrélation canonique.
Indicateur statistique pour mesurer la relation de la variable à expliquer et les
variables explicatives :
ΛG =det(W)/ det(V), mesure la relation au niveau global (tous les facteurs).
-
Si le nombre de classes k est égal à 2 ou3, le lambda suit une distribution en F (Rao.1973),
ce qui permet de mesurer la signification :
Dans la cas de deux classe on a F(d1 , d2 ) avec d1 =p et d2 = n-p-1.
Dans le cas de 3 classes d1 =2q et d2 = 2n-2p-4(ou n-3 si p=1).
Dans les autres cas il est nécessaire de passer par une approximation donc par une fonction
de ΛG. Soit le V de Bartlett qui suit une distribution de khi-deux à p(q-1) ddl
V = -[ n-1 + ½(p+q)]log(ΛG )
q étant le nombre de groupes
Ce test p se te l’a a tage de pou oi
séparément.
-
ifie la elatio au i eau glo al puis pou
Significatio statisti ue des a es dis i i a ts afi
décrire les différences entre les groupes.
de
dui e l’espa e
ha ue a e
essai e pou
Co t ai e e t à l’AFD à deu g oupes ou u seul test est e uis, da s l’AFD à g oupes plusieu s
tests seront faits. Ces tests seront effectués en cascade, afin de déterminer le nombre de dimension
selon lesquelles les groupes se différencient significativement.
Le p e ie test po te su l’h poth se ulle d’ galit des e t oïdes, e ga da t toutes les fo tio s
discriminantes. Les tests suivants portant sur la même hypothèse nulle en éliminant successivement
la fonction F1 , F2 ,.., Fq-1 axes construits. Si p(khi-deux)< l’a e du i eau de la as ade se a ga d
sinon supprimé.
70
Valeurs propres
Résultats du test
M de Box
50,675
Fonction
F
Approximativement
Valeur
propre
% de la
variance
%
cumulé
Corrélation
canonique
2,695
ddl1
18
ddl2
20347,890
Signification
,000
1
2,043(a)
45,6
45,6
,819
2
1,456(a)
32,5
78,1
,770
3
,984(a)
21,9
100,0
,704
.
On rejette donc l’hypothèse d’égalité des matrices de covariances des quatre groupes
constitués car la signification est nulle donc inférieur à n’importe quel risque fixé d’avance.
T ois od les ou fo tio s dis i i a tes so t o st uites puis u’il e iste uat e g oupes de
communes. Les trois modèles ont un pouvoir discriminants des groupes significatifs et détiennent
respectivement 45.4, 32.5, 21.9% de la variance totale.
Lambda de Wilks
Test de la ou
des fonctions
Lambda de
Wilks
Khi-deux
ddl
Signification
de 1 à 3
,067
492,107
9
,000
de 2 à 3
,205
289,016
4
,000
3
,504
125,015
1
,000
Les trois modèles (de 1 à 3) sont utiles dans cette analyse, ils correspondent à la valeur la plus basse
du Lambda de Willks (0.067).
Coefficients des fonctions discriminantes canoniques standardisées
Fonction
1
2
3
REGR factor score
1 for analysis 2
,947
-,286
,183
REGR factor score
2 for analysis 2
,248
,918
,323
REGR factor score
3 for analysis 2
-,377
-,304
,885
71
Résultats du classement(b,c)
Classe
d'affectation
(nuées
dynamiques)
Original
Effectif
%
Validécroisé(a)
Effectif
%
Classe(s) d'affectation prévue(s)
1
2
3
4
Total
1
32
0
1
0
33
2
0
17
1
0
18
3
0
0
51
5
56
4
0
0
0
80
80
1
97,0
,0
3,0
,0
100,0
2
,0
94,4
5,6
,0
100,0
3
,0
,0
91,1
8,9
100,0
4
,0
,0
,0
100,0
100,0
1
32
0
1
0
33
2
1
16
1
0
18
3
0
0
51
5
56
4
0
0
0
80
80
1
97,0
,0
3,0
,0
100,0
2
5,6
88,9
5,6
,0
100,0
3
,0
,0
91,1
8,9
100,0
4
,0
,0
,0
100,0
100,0
b 96,3% des observations originales classées correctement.
c 95,7% des observations validées-croisées classées correctement.
72
Le pou e tage o se
des o
u es affe t es o e te e t da s la lasse d’o igi e est de
3.
L’e eu de lasse e t o se e est de l’o dre de 3.7% qui correspond au pourcentage des
o
u es do t le g oupe p u e o espo d pas au g oupe o igi al. L’e eu elle o te ue pa
la
thode de la alidatio
ois e est de l’o d e de . %.
8. La pe eptio de l’e seig e e t vi tuel.
Cette étude ahie de t a au di ig s te te d’a al se les pe eptio s et les atte tes des tudia ts
tunisiens vis-à- is de ette fo e d’e seig e e t alte ati e au
thodes t aditio elles. Les
résultats de ce travail font apparaître plusieurs dimensions dans la perception des étudiants.
L’i te a tio appa aît o
e ta t la di e sio la ieu o sid e pa les tudia ts. L’utilit de e
t pe d’e seig e e t ie t e se o d lieu. D’aut e pa t, la aît ise de la te h ologie i fo ati ue
représente un souci majeur pour les étudiants. La flexibilité est le concept le moins bien perçu, la
gestio du te ps ’est pas ie o sid e pa les tudia ts. U e t pologie de la oti atio is-à-vis
du e-Learning est proposée dans ce travail, de plus un indicateur de mesure de la motivation a été
élaboré.
Da s l’a al se des p ofils des tudia ts, des tests statisti ues test d’i d pe da e de khi deu , tests
de comparaison des moyennes) ont montré que les variables ayant des relations significatives avec
les dimensions de la pe eptio de l’e-enseignement sont les suivantes :
- le statut des étudiants (travaille à plein temps, travaille à temps partiel, ne travaille pas).
- la maîtrise de la technologie informatique.
- le st le d’app e tissage.
Nous allons étudier dans une première étape les relations entre les différentes variables du profil des
étudiants. Dans une seconde étape, une analyse en composantes principales (ACP) nous a permis de
o fi e les i di e sio s de la pe eptio de l’e seig e e t i tuel et de ett e e
idence
leur importance relative.
Relatio e t e le st le d’app e tissage et l’e ploi.
emploi
150
oui
Effectifs
non
100
50
0
1
2
Style
d'apprentissage
Figure 1 : pa titio des tudia ts selo l’e ploi et le st le d’app e tissage
virtuel, 2 : enseignement classique)
: enseignement
73
Nous o stato s u’e i on la moitié des étudiants qui souhaitent opter pour un enseignement
virtuel (voir Figure 1) comme complément et non comme substitut de formation, ne travaille pas. Ce
sultat i atte du peut s’e pli ue pa l’i suffisa e de l’i f ast u tu e u i e sitai e tunisienne et
l’i suffisa e de l’e ad e e t telles ue pe çues pa les tudia ts. La fo e a tuelle de
l’e seig e e t sup ieu a pou o jet de po d e au i ui tudes des tudia ts, de les oti e et
de les responsabiliser efficacement. Par ailleurs une partie des étudiants qui occupent un emploi
désire suivre un enseignement classique malgré tous les inconvénients que cela représente. Ceci
p o ie t aise la le e t d’u e
o aissa e de l’e seig e e t i tuel do d’u e
fia e à
son égard. Une a pag e de se si ilisatio s’a e
essai e afi de d
stifie ette ou elle
fo e d’e seig e e t.
Relatio e t e le st le d’app e tissage et la
Maîtrise de la technologie
informatique
style
1
2
Total
aît ise de la te h ologie i fo
ati ue.
Total
Pas
du
tout
Un
peu
Presque
2
27
47
32
108
5
75
77
35
192
7
102
124
67
300
parfaite
ment
Tableau 1 : oise e t e t e le st le d’app e tissage et la
te es d’effe tif
aît ise de la te h ologie i fo
ati ue e
Il existe une relation significative entre la maîtrise de la technologie informatique et le style
d’app e tissage. E effet, les tudia ts ui hoisisse t le st le d’e seig e e t i tuel d la e t
aît ise o e a le e t l’outil i fo atique (73%). Inversement les étudiants qui choisissent le
st le lassi ue, d la e t e pas aît ise l’outil i fo ati ue
% . L’a lio atio de la fo atio
en informatique représente une condition nécessaire pour motiver les étudiants et minimiser le taux
d’a a do ui ep se te le p i ipal o sta le au su s de ette
thode d’e seig e e t.
Analyse en composantes principales.
L’a al se e o posa tes p i ipales a pe is de o fi e les i
di e sio s de la
pe eptio de l’E.V ui e pli ue t % de la a ia e totale et de ett e e e e gue l’i te a tio et
l’utilit pe çue ai si ue la aît ise de l’outil i fo ati ue. E effet, l’i te a tio est le o ept le
plus important aux yeux des étudiants (32% de la variance totale expliquée). Cet échange entre
enseignants et étudiants et entre les étudiants eux-mêmes est considéré comme primordial par ces
74
de ie s. C’est u aspe t t s i po ta t du o po te e t des tudia ts ui peut s’e pli ue pa la
spécificité de la culture tunisienne ui a o de u e g a de i po ta e à l’aspe t elatio el.
Co
e t ga a ti le su s et la p e it de l’e-enseignement sans compléter la dimension
pédagogique par le facteur relationnel, le contact direct entre enseignant ou tuteur et apprenant ?
Les étudia ts so t o s ie ts de l’utilit
. % de la a ia e totale e pli u e de ette
fo e d’e seig e e t ais ils i siste t fo te e t su le a ue de o e s et de fo atio su le
pla te h ologi ue. Il e peut a oi d’utilit sa s u e aît ise o e a le de l’outil i fo ati ue
. % . La uat i e di e sio est l’e gage e t . % .La i ui e et de i e di e sio de la
pe eptio de l’e-e seig e e t est la fle i ilit
. % , les tudia ts se le t glige l’i po ta e
de la gestion du temps. Ceci est vraisemblablement dû à une conjoncture économique difficile où les
jeunes sont inquiets pour leur avenir.
Des tests statistiques de comparaison des moyennes ont montré des relations significatives
α< .
e t e d’u e pa t le p ofil des tudia ts ep se t pa l’e ploi, l’utilisatio et la aît ise de
la te h ologie i fo ati ue, l’a s et la dispo i ilit de l’outil i fo ati ue et d’aut e pa t l’utilit
perçue et l’e gage e t da s ette oie d’a e i . Ceci contredit le résultat annoncé par Ethier et
Pa et
ui a a e t ue les di e sio s du p ofil de l’ tudia t a adie
tudia t à te ps
partiel, âgé de moins de 35 ans et occupant un emploi à temps plein) ne contribuent pas à expliquer
so i t t glo al pou l’e seig e e t. Les deu auteu s ajoute t ue les pe eptio s de l’ tudia t
canadien vis-à-vis des quatre concepts : interaction, flexibilité, utilité et utilisation de la technologie
i fo ati ue e pli ue t d’u e
a i e sig ifi ati e R2 =0.76) son intérêt global pour
l’e seig e e t i tuel. Cette elatio sig ifi ati e ’est pas
ifi e da s ot e tude R2 =0.27). Ceci
peut s’e pli ue pa les diff e es de pe eptio e t e les tudia ts a adie s et les tudia ts
tunisiens puisque les méthodologies suivies sont semblables.
Les diff e tes fo
es de l’i t
t à l’e-enseignement.
L’i t t est g
ale e t d fi i o
e u e atte tio fa o a le à uel u’u ou à uel ue hose.
D’ap s Ethie et Pa et
, ette atte tio fa o a le se di ise e uat e i eau d’i t t ui
so t l’intérêt nul, théorique, pratique et exclusif.
L’i t t e lusif ’a pas t e p i
pa les tudia ts da s ot e tude ui a fait appa aît e u e
autre forme : l’i t t if. Ce i est dû o
e ous l’a o s e tio
p
de
e t à la
fia e
des étudiants tu isie s à s’e gage totale e t da s l’a e tu e i tuelle. A pa ti du positio e e t
des tudia ts pa appo t à l’utilit pe çue et à l’e gage e t fa teu s issus de l’a al se e
o posa tes p i ipales ous et ou o s les uat e fo es de l’i t t à l’e-enseignement :
L’i t t vif : ep se t pa les tudia ts ui t oig e t d’u e utilit pe çue et d’u
e gage e t le s sa s a a do e o pl te e t l’e seig e e t lassi ue (groupe 1 dans la
figure 2).
- L’i t t théorique : représenté par les étudia ts a a t pe çu u e g a de utilit pou l’ee seig e e t ais ui h site t ou ui o t peu de s’e gage pa
o aissa e ou pa
manque de moyens (groupe 2 dans la figure 2).
Ces deux cas de figure représentent pour les décideurs des clients potentiels u’il faut o u i e
répondant à leurs préoccupations.
-
75
L’i t t nul : ep se t pa les tudia ts ui ’ p ou e t au u i t t pou ette fo e
d’e seig e e t g oupe da s la figu e .
L’i t t pratique : ep se t pa les tudia ts ui so t p ts à s’e gage da s l’a e tu e
i tuelle de l’e seig e e t ou l’a e tu e de l’e seig e e t i tuel sa s e oi l’utilit peutt e pa e u’ils ’o t pas le hoi , pa e e ple : les étudiants pour lesquels un cours présentiel
est impossible à suivre (groupe 3 dans la figure 2).
-
Re a uo s l’ho og
it des tudia ts a a t u e pe eptio positi e de l’utilit a e ho izo tal
positif o t ai e e t à eu ui o t u e pe eptio
gati e de l’utilit ui so t ettement plus
dispersés (voir figure 2).
4
Intérêt global ou engagement
3
G1
2
G3
1
0
-1
-2
G4
G2
-3
-4
-2
0
Utilité perçue
Figure 2 : Positio
2
4
de l'e-enseignement
e e t des tudia ts pa appo t à l’utilit pe çue et à l’e gage e t.
Mise e pla e d’u i di e de
esu e de la
otivatio pou l’e-enseignement.
La de a de de espo sa ilisatio , d’i pli atio et d’i estisse e t des ito e s e g
al et des
tudia ts e pa ti ulie da s la fo atio et da s le t a ail de ie t i lu ta le, u l’i po ta e des
e jeu
o o i ues, so iau , et p dagogi ues ui l’a o pag e t. Ce i e d
essai e l’ aluation
de la oti atio des adultes à s’e gage da s la fo atio et da s l’a tio . C’est à la ha ilitatio
de la notion de motivation, reconstruite à partir des comportements cognitifs des apprenants que
nous devons concentrer tous nos efforts afin de maximiser les chances de réussite de cette méthode
d’e seig e e t.
Pour Claude Levy-Leboyer(1999), la motivation ne se limite pas à de simples recettes, elle se gère, se
construit en permanence à partir de multiples stratégies. La motivation est un processus dynamique,
e fo tio de t aits de pe so alit o
e de fa teu s de l’e i o e e t, elle est o ple e da s
ses
a is es. C’est u p o essus ui i pli ue l’i di idu da s l’a tio et ui
essite des effo ts
pou attei d e l’o je tif.
76
La description synthétique du processus de motivation permet le repérage de quelques leviers
ajeu s pou l’a o pag e e t p dagogi ue du fo ateu .
Dans notre étude, le positionnement des étudiants (Figure 2) par rapport aux deux facteurs issus de
l’a al se e o posa tes p i ipales utilit pe çue de l’e seig e e t i tuel et i t t glo al ou
engagement qui sont à notre sens les fondements de leur motivation) fait apparaître quatre formes
de la motivation :
la motivation volontaire (engagement) qui correspond aux étudiants du groupe 1 (G1) ayant un
e gage e t positif et u e pe eptio positi e de l’utilit de l’e seig e e t i tuel.
- La motivation contrainte (par manque de conviction) qui correspond aux étudiants du groupe 3
(G3) ayant des contraintes qui peuvent êt e fa iliales, te po elles, spatiales,…. ais ui
’ a e t pas de l’e plo a ilit , puis ue ot e tude fait appa aît e ue la oti atio pe çue
est i d pe da te de l’e ploi.
- La motivation nulle (absence de motivation) qui correspond aux étudiants du groupe 4 (G4) qui
sont désintéressés vis-à- is de ette ou elle fo e d’e seig e e t.
- La motivation conditionnelle qui correspond aux étudiants du groupe 2 (G2) ayant une
pe eptio positi e de l’e-enseignement mais un engagement incertain expliqué par une
fo atio i o pl te e i fo ati ue, l’a se e de o e s te h i ues et la ulga isatio
i suffisa te de l’i fo atio elati e à l’e seig e e t i tuel.
Noto s l’e iste e d’u e elatio sig ifi ati e khi deu = .
, sig ifi atio = .
e t e la
moti atio pe çue d fi ie plus haut et le st le d’app e tissage p f
des tudia ts ue ous
définissons par la motivation déclarée.
-
Scores discriminants de la motivation
U i di e de la oti atio est p opos à pa ti d’u e a al se fa to ielle discriminante, où la variable
à expliquer est la motivation perçue, ayant donc quatre modalités et les variables explicatives les plus
significatives qui sont : l’utilit pe çue, l’e gage e t, l’i te a tio , la aît ise de la te h ologie
informatique, l’a essi ilit à u o di ateu , et la dispo i ilit d’u o di ateu . Les sultats de
l’a al se dis i i a te fo t appa aît e t ois od les ou fo tio s dis i i a tes sta da dis es.
Nous retiendrons les deux premières qui sont les plus significatives (voir tableau 2), l’e eu
elle
d’affe tatio o te ue pa alidatio
ois e est gale à %.
Fonction
Variance
expliquée
% de la
variance
% cumulé
Corrélation
canonique
1
2,582
58,8
58,8
,849
2
1,782
40,6
99,4
,800
3
,025
,6
100,0
,155
Tableau 2 : Variances expliquées par les fonctions discriminantes.
F1 = 0.728 utilité +0.752 engagement + 0.177 accessibilité +0.012 maîtrise de la technologie
informatique -0.101 interaction.
F2 = -0.698 utilité +0.667 engagement + 0.156 accessibilité - 0.148 maîtrise de la technologie
informatique +0.222 interaction.
77
La Figure 3 met en exergue le double indice obtenu par croisement des scores discriminants (valeurs
des deux fonctions F1 et F2) pour chaque individu.
Fonctions discriminantes canoniques
motivation
8
1
2
6
3
4
Fonction 2
4
Barycentres
3
2
4
0
1
2
-2
-4
-6
-6
-4
-2
0
Fonction 1
2
4
Figure 3 : Scores discriminants de la motivation des étudiants.
Les quatre formes de la motivation sont délimitées dans la Figure 3 par la première bissectrice F1 =F2
et la deuxième bissectrice F1 = -F2.
La motivation volontaire (1) : F1< F2 et F1 > -F2.
La motivation conditionnelle (2) : F1<F2 et F1 < -F2.
La motivation contrainte (3) : F1 >F2 et F1 > -F2.
La motivation nulle (4): F1 > F2 et F1 < -F2.
La ise au poi t d’u si ple i di e de la oti atio
essite a le eg oupe e t des lasses et
et des classes 2 et 4, de façon à avoir seulement deux groupes : les étudiants motivés et les étudiants
o
oti s, e ui i pli ue pa o s ue t u e pe te d’i fo atio su le deg de oti atio ,
78
exprimé par les étudiants. Une autre alternative consisterait à utiliser le modèle logistique
multinomial emboîté (Dellagi 2007).
8.3 Crédit scoring.
Da s le ad e d’u e tude au sei de la Ba ue de Tu isie, la te h i ue du
dit s o i g a t
appliquée afin de résoudre le problème de recouvrement des crédits à la consommation.
Un échantillon de 150 clients de la banque à été utilisé et dix variables ont été observées. La
a ia le à e pli ue ta t di hoto i ue Y= s’il s’agit d’u o lie t et Y= s’il s’agit d’u
au ais
lie t ui p se te u is ue de e ou e e t. Les sultats de l’a al se discriminante sont les
suivants :
Tests of Equality of Group Means
Variables
Wilks' Lambda
ancienneté
F
df1
df2
Sig.
1,000
,003
1
146
,955
,985
2,171
1
146
,143
enfants
1,000
,002
1
146
,969
montant
,974
3,933
1
146
,049
durée
1,000
,071
1
146
,791
crédits
,970
4,590
1
146
,034
impayé
,847
26,413
1
146
,000
encours
,991
3,339
1
146
,049
salaire
,975
3,741
1
146
,050
remboursement
,985
2,220
1
146
,138
âge
Summary of Canonical Discriminant Functions
Eigenvalues
Canonical
Function
1
Eigenvalue
,316
% of Variance
a
Cumulative %
100,0
Correlation
100,0
,590
a. First 1 canonical discriminant functions were used in the analysis.
Un seul modèle discriminant est construit puisqu’il correspond à deux groupes de clients.
Wilks' Lambda
Test of
Function(s)
1
Wilks' Lambda Chi-square
,597
38,748
df
Sig.
10
,000
79
Le modèle construit est significatif mais peu efficace (corrélation canonique peu élevée :0.59 ,
Lambda de Wilks relativement élevée :0.316).
Standardized Canonical
Classification Results
Discriminant Function
Predicted Group
Coefficients
Membership
Function
profil
1
ancienneté
âge
Original
Count
,527
-,360
enfants
,233
montant
-,560
durée
,168
crédits
-,500
impayé
,766
encours
-,156
salaire
-,247
%
Cross-validated Count
%
1,00
2,00
Total
1,00
108
6
114
2,00
23
12
35
1,00
94,7
5,3
100,0
2,00
65,7
34,3
100,0
1,00
106
8
114
2,00
23
12
35
1,00
93,0
7,0
100,0
2,00
65,7
34,3
100,0
L’e eu elle du modèle est évaluée à (23+6)/149, soit 20.8% qui est relativement assez élevée. Ceci
est du o
e ous l’a o s sig al plus haut au a ue d’effi a it ou de o ustesse du od le. Les
a ia les e pli ati es du od le e so t pas toutes sig ifi ati es, l’i t odu tio de a ia les
qualitati es pou ait a lio e l’effi a it du od le et pa o s ue t i i ise l’e eu
elle
d’affe tatio d’u lie t da s la au aise catégorie.
80
Téléchargement