TECHNIQUES D’ANALYSES MULTIDIMENSIONNELLES DES DONNEES Elaboré par : Hatem Dellagi Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 1 I INTRODUCTION II ANALYSE EN COMPOSANTES PRINCIPALES III ANALYSE FACTORIELLE DES CORRESPONDANCES IV LES METHODES DE CLASSIFICATION. V L’ANALYSE FACTORIELLE DISCRIMINANTE. I INTRODUCTION Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 2 Les chapitres précédents ont exposé les phases qui conduisent aux traitements les plus usuels sur une variable (analyse uni variée : tri à plat, étude de la distribution, tendance centrale et dispersion), ou sur deux variables (analyse bi variée : t i ois , esu e d’asso iatio e t e deu a ia les . Nous constatons la limite de ces méthodes due aux caractères combinatoires des analyses possibles dès que le nombre de variables est assez important. Il est donc essai e d’a oi e ou s à l’a al se multi variée t aite e t si ulta d’u e se le de a ia les o e complément indispensable à toute étude en général et en marketing plus particulièrement. Les méthodes multi variées peuvent être classées selon trois groupes principaux : - Les méthodes descriptives (analyse factorielle, typologie, analyse des correspondances, analyse multidimensionnelle des similarités). Les méthodes explicatives (régression, analyse de la variance, analyse discriminante, analyse conjointe). Les méthodes avancées (analyse canonique, modèles probabilistes : logit et probit, modèles loglinéaires, modèles de causalité : analyse des structures de covariances, la régression PLS). Depuis que la gestion de la relation client est devenu la locomotive des études de marché, les te h i ues d’a al se se so t la gies ; conséquences du fait que les machines de stockages et de t aite e ts de l’i fo atio o t o seulement atteint un très haut niveau technologique mais ont connu une large diffusion les mettant à la portée de très nombreuses organisations (Data Mining). C’est la aiso pou la uelle les te h i ues d’analyses sont appelées à un très grand développement. II Analyse en composantes principales L’a al se e o posa tes est l’u e des thodes d’a al se fa to ielle des do es multidimensionnelles la plus ou a te. L’a al se e o posa tes p i ipales ACP s’ad esse au données numériques quantitatives, elle a pour objectifs : - - Analyser les liaisons entre les variables ou critères étudiés et les synthétiser par un nombre restreint de nouvelles variables appelées composantes ou facteurs, ou encore indicateurs synthétiques qui ne sont autres que des combinaisons linéaires des variables initiales. Résumer les unités statistiques en formant des groupes homogènes. O he he à ett e e ide e les p op i t s fo da e tales des do numériques et graphiques. es à l’aide des pa a t es 1. Données initiales Ces do es so t o stitu es d’o se atio s de plusieu s g a deu s, ot es X1, X2,… Xp sur un e se le d’u it s statisti ues u ot s i= ,…,n. Il est commode de présenter ces données sous fo e d’u ta leau X dont les colonnes sont les variables Xj. X1 ……. Xj …… Xp Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 3 X = Le terme générale xij du ta leau X o espo d à l’o se atio de la a ia le Xj pa l’i dividu i et le vecteur xi = (xi1,…., ij,… ip ) est celui des observations des variables X1 , ….Xp par ce dernier . Si les variables sont hétérogènes, elles seront centrées et réduites et on a le nouveau tableau Y de terme générale : ij = (xij - où Sj est l’ a t t pe de Xj )/ Sj 2. Présentation de la méthode. 2.1. Formulation du problème. Le problème consiste à réduire les p variables initiales étudiées en un nombre restreint de nouvelles variables appelées composantes ou facteurs Fk . Ces facteurs devront répondre aux deux critères suivants : - La linéarité : - L’i d pe da e : 2.2. Notio d’a e fa to iel Δ1 A1 • B A G B1 L’i fo atio appo t e pa le poi t A est égale à la distance qui le sépare du centre G de [AB]. L’i fo atio appo t e pa le poi t A au facteur est égale à (GA1)2, de même celle apportée par le point B est égale à (GB1)2, do l’i fo atio d te ue pa Δ1 est égale à : I Δ1) = GA12 + GB12 Plus généralement, soit N le nuage des points xi i= ,….n, ayant pour centre de gravité G qui est le point moyen = = ( 1 , 2 ,……, p ), muni de la métrique euclidienne. La dispersion ou l’information ou encore l’inertie du nuage de points autour de leur centre est définie par : 2 i, G) = Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] ij - j )2 Page 4 = j )2 = où Sj 2 est la variance de la variable Xj . Soit Δ un axer factoriel xi • G Δ i L’i e tie du uage de poi ts N due à l’a e Δ est donnée par : I (N, Δ) = , G) + I (N, Δ) I (N, G) = , G) est l’inertie ou la variance expliquée par l’axe Δ, elle est aussi La quantité appelée valeur propre de la matrice de variance covariance et notée λ et on a : I (N, G) = j = variance totale du nuage de points 2.3. Matrice de variances covariances La matrice de variances covariance C a pour terme général : C jj' 1 n (x ij X j )(x ij' X j' ) n i 1 Il représente la covariance entre les variables Xj et Xj’ . Si les variables sont centrées et réduites on obtient alors la matrice des corrélations de terme général : Rjj’ = 1 n ( x ij X j ) ( x ij' X j' ) S n i ^1 S j' j La trace de la matrice des corrélations V est égale au nombre p de variables étudiées et on a : p trace (V)= j1 j I( N, G ) p où λj est la aleu p op e d’o d e j de la at i e V 2.4. D fi itio de l’ACP. L’a al se e o posa tes p i ipales est u e te h i ue ui s’ad esse au tableau de données ua titati es et ui est la plus utilis e, ’est la ase de toutes les thodes d’a al ses factorielles. Elle a pour but : -Analyser les liens existants entre les variables observées. Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 5 -Former des groupes homogènes des unités statistiques étudiées. Ceci en construisant m nouvelles variables C1 , …., ,Cm m ≤p appelées composantes principales, qui sont centrées et non corrélées entre elle et qui résument l’information détenu par p variables initiales observées par les n unités statistiques ou individus. La composante principale C1 est une combinaison linéaire des Xj j=1,..,p . On a alors : C1 = a 11X1 ...... a 1p X p . La valeur de C1 pour l’individu i est : C1i a 11 x 1i ..... a 1p x ip et d’une manière générale la kieme composante principale s’écrit : Ck = a 1k X1 .... a kp X p 2.5. Détermination des composantes principales. 2.5.1. Da s l’espa e des i dividus. La détermination du premier axe factoriel D1 de vecteur directeur a1 de coordonnées ( a 11 ,..., a 1p ) qui correspond au premier vecteur propre de la matrice 1 X' X . L’a e Dk et de vecteur directeur ak keme n vecteur propre de la même matrice associé à la keme plus grande valeur propre, avec ak orthogonal à ar pour r=1,..,k-1. 2.5.2. Da s l’espa e des va ia les. R p La composante principale Ck est obtenue en maximisant alors le keme vecteur propre de la matrice j1 2 (C k , X j ) . La composante Ck est 1 XX' associé à la keme plus grande valeur propre. Cette n composante vérifie la condition : R(Ck ,Cj )=0 pour j=1,..,k-1. 2.5.2 ; Equivalence des deux analyses. Dans l'espace des individus et à la keme étape, ak est le e teu p op e d’o d e k de la at i e 1 X' X associé à la keme plus grande valeur propre λk . Da s l’espa e des a ia les Ck est le vecteur n 1 propre de la matrice XX' associé à la même valeur propre λk. . ) n En effet on a : 1 X' X ak = λk ak , en multiplions des deux cotés par la matrice X on obtient : n 1 1 XX' (Xak )= λk (Xak) d’où : XX' Ck = λk Ck. n n Remarques : a. Les matrices 1 1 XX' et X' X ont les mêmes valeurs propres λk , k=1,..,p mais de dimension n n respectives (n,n) et (p,p) différentes , donc les n-p dernières valeurs propres sont nulles. Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 6 R (C k , X j ) p b. p C 'k X j X 'j C k j1 nC 'k C k 2 j1 1 C 'k (XX ' C k ) k n C 'k C k 2.5.3. Corrélation entre la composante Ck et la variable initiale Xj. Le vecteur constitué par les corrélations des p variables initiales Xj avec la composante principale Ck est égal au vecteur ak d’o d e k ultipli pa λk1/2 En effet : La corrélation entre la composante Ck et la variable Xj est donnée par : ' 1 X jC k R(Ck ,Xj )= n k ,le vecteur des corrélations j =1,..p est donné par : [R (Ck , X1 , ….,R Ck , Xp )] = a 1 X' C k 1 X' Xa k = k k = k a k n k n k ak 2.6. Pa a t es d’aide à l’i te p tatio . L’i te p tatio des a es fa to iels ou des o posa tes p i ipales issus de l’a al se est as e su les paramètres suivants : 2.6.1 Indice de Kaiser Olkin Mayer (KMO) et test de Bartlett. L’i di e KMO L’i di ateu KMO de Kaise Olki Ma e est u e esu e de l’i po ta e des oeffi ie ts de o latio o se es pa appo t à l’i po ta e des o latio s pa tielles des ariables initiales Xj j= ,…p. Si la so e des a s des o latio s pa tielles e t e toutes les pai es de a ia les est nettement inférieure à la so e des a s des o latio s, l’i di e KMO est p o he de et o peut di e ue la te h i ue de L’ACP utilisée est adéquate ou validée. Un KMO inférieur à 0.5 montre que L’ACP ’est pas o seill e. Le test de sphéricité de Bartlett Ce test pe et de ifie l’h poth se selo la uelle la at i e de o latio s des a ia les Xj est égale à la matrice identité. Autrement dit toutes les corrélations entre les variables Xj et Xj’ pour j≠j’ sont nulles ce qui entraîne une absence totale de relations. Le rejet de cette hypothèse permet de alide la te h i ue de L’ACP utilis e. Ce test est as su la statistique de khi deux. Une valeur calculée de khi deux supérieur à la valeur critique ou encore une signification inférieur au risque fi d’a a e a outit à la alidit de la thode. 2.6.2. Matrice anti-image de corrélations. La matrice anti-image de corrélation permet de mesurer les corrélations partielles des variables i itiales deu à deu sous l’i flue e des aut es a ia les. L’i di ateu MSA Measu e of sa pli g adequacy) est donné sur la diagonale de la matrice anti-image. Les variables Xj ayant une faible aleu MSA peu e t t e li i es e ui fa o ise l’aug e tatio de l’i di e KMO. 2.6.3. Choix des composantes principales. Le choix des composantes principales ou des axes factoriels selon leurs importances da s l’a al se peut être réalisé selon les trois approches suivantes : -Approche de Kaiser Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 7 Le critère de Kaiser pour le choix des axes factorielles stipule que les axes qui peuvent retenus pour l’i te p tatio des sultats so t eu ui o t u e a ia e expliqués ou valeur propre supérieur à 1. Cepe da t e it e e tie t pas o pte de la pa t d’i fo atio ete ue pa ha ue o posa te choisie. -Approche graphique L’histog a e des aleu s p op es permet de repérer à quel niveau on remarque une dénivellation ou encore un coude ou une chute des valeurs propres. Ce i eau s’il est lai e e t e a u correspond au nombre de composantes retenues. -Approche empirique On note par : k = λk –λk+1 les différences d’o d e , ui so t st i te e t positi es entre deux valeurs propres consécutives. Βk =k - k°1 les diff e es d’o d e . Si les Βk changent de signe au niveau l on retiendra l+1 facteurs utiles pou l’i te p tatio des sultats de l’a al se. Il est aussi fort utile de regarder les pourcentages cumulés des variances expliquées. Généralement on cherche à retenir des axes factoriels qui expliquent un minimum de 50% de la variance totale ou de l’i fo atio o te ue da s le ta leau de données. .6. . Pa t de l’i fo atio e pli u e pa u a e. La variance totale est égale à la somme des p valeurs propres. La part (exprimée en pourcentage) de l’i fo atio d te ue pa l’a e Dj de variance expliquée λj est égal à : j j j p . 2.6.5. Corrélations entre les variables initiales et la composante Ck . Si les variables initiales sont centrées et réduites, le coefficient de corrélation R(Xj , Ck ) est un i di ateu pou esu e l’importance du rôle joué par la variable Xj da s l’i te p tatio de la composante Ck . Il est donc possible en identifiant les coefficients de corrélations les plus élevés de trouver les variables initiales qui contribuent le plus à la formation de la composante ou du facteur Ck . 2.6.6. Rotation des axes Factorielles. Si l’i te p tatio des fa teu s ’est lai e e t faite, le recours à la rotation des axes factoriels est possible, ceci permet de mieux les interpréter les résultats. On distingue différents types de rotation : - La rotation Varimax : elle a pour but de réduire le nombre de variables initiales qui contribuent à l’i te p tatio de l’a e tout e aug e ta t leu s o latio s a e e de ie . L’o thogo alit des axes factoriels est gardée dans ce cas. - La rotation Oblimin : elle a lmême objectif que la rotation Varimax mais les axes factorielles sont suppos s o li ues da s e as. Ce ui sou e t les as e p ati ue as de l’ tude su le le to at d’u journal de la place) bien que les facteurs en théorie sont orthogonaux par construction . - La rotation Equamax : Elle a pou ut de i i ise les fa teu s da s l’i te p tatio des sultats et de supprimer les variables initiales à cheval sur deux axes factoriels. - La rotation Promax ; Est une combinaison des rotations Equamax et Varimax. 2.7. Etude de cas. Application avec SPSS. Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 8 2.7.1. Etude su l’a hat i pulsif. Da s le ad e du ou s d’a al se de do es u e e u te a t faite pa les tudia ts aup s d’u échantillon de 900 clients des magasins carrefour, géant, monoprix, magasin général et champion. Le ut de ette tude est d’ide tifie les fa teu s d te i a ts de l’a hat i pulsif da s u e g a de su fa e, à sa oi l’at osph e du agasi , la flâ e ie, l’hu eu du lie t, l’a ia e du point de vente, le design et la sensibilité aux stimuli. Les résultats de cette enquête sont les suivants : a. Analyse Uni variée Dans le hapit e p de t ous a o s fait l’ tude de la dist i utio des p oduits a het s impulsivement, nous avons utilis pou ela le test de khi deu . Le test d’u ifo it de Kol ogo o Smirnov est aussi applicable et donne les résultats suivants : One-Sample Kolmogorov-Smirnov Test prod11 N 500 Uniform Parameters a,,b Most Extreme Differences Minimum 1,00 Maximum 5,00 Absolute ,446 Positive ,446 Negative -,166 Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) 9,973 ,000 La signification asymptotique est nulle donc inférieur à tout risque d’erreur. L’hypothèse d’uniformité des produits achetés d’une manière impulsive est par conséquent rejetée. b. Analyse bivariée. Nous a o s tudi da s la hapit e p relations suivantes : de t et da s le ad e de l’ tude su l’a hat i pulsif les - croisement du magasin avec le produit acheté impulsivement et nous avons enregistré l’e iste e d’u e elatio sig ifi ati e. - Croisement de la fréquence de visite avec le magasin et nous avons confirmé la dépendance significative de la fréquence de visites du magasin. Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 9 - Croisement de la fréquence de visites avec à la fois le magasin et la catégorie so iop ofessio elle. Nous a o s e a u ue ette de i e a ia le ’a pas d’effet sig ifi atif sur la fréquence de visites. D’aut es croisements peuvent être établis à partir du logiciel SPSS et de la même manière technique en choisissant les outils statistiques convenables par exemple : - La f ue e de isites ois e a e l’âge du lie t test Anova). - La pe eptio de l’a hat i pulsif ois e avec la nationalité du client (test Anova). - Croisement de la perception des prix du premier et du second produit achetés impulsivement ( test de corrélations des rangs de Spearman) ,les deux variables étant ordinales. O o t e à pa ti d’u test de khi deu ue le deu i e p oduit a het d’u e a i e i pulsi e dépend significativement du premier produit. Les consommateurs ont tendance à acheter un deuxième produit impulsivement dans la même gamme que le premier produit. produit11 * produit22 Crosstabulation Count produit22 alimentation produit11 textile cosmétique hygiène autre Total 111 12 48 19 29 219 textile 15 10 19 3 13 60 cosmétique 36 4 56 11 23 130 hygiène 22 2 12 11 9 56 autre 24 13 22 9 58 126 208 41 157 53 132 591 alimentation Total * * 591 clients parmi les 900 ont fait un achat impulsif répété. Chi-Square Tests Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases df Asymp. Sig. (2-sided) a 16 ,000 103,825 16 ,000 44,240 1 ,000 113,952 591 Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 10 Chi-Square Tests Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases df Asymp. Sig. (2-sided) a 16 ,000 103,825 16 ,000 44,240 1 ,000 113,952 591 a. 2 cells (8,0%) have expected count less than 5. The minimum expected count is 3,88. c. Analyse en composantes principales Cette te h i ue est appli u e au ite s Q , Q ,…,Q e p i a t espe ti e e t oi uestio ai e e a e e les fa teu s th o i ues de l’a hat i pulsif à sa oi : l’at osph e , la flâ e ie,l’humeur du lie t, l’a ia e da s le agasi , le desig , et la se si ilit au sti uli. Elle tente de vérifier et alide les fa teu s e pli atifs de l’a hat i pulsif da s le ad e tu isie . Le positio e e t des consommateurs par rapport aux différents facteurs validés permet de les réduire en groupes homogènes. Les sultats de L’ACP à pa ti du logi iel SPSS d o pos es e a al se u i a i e afi de oi uels sont les critères, dans ce cas les questions qui sont les mieux représentées, les mieux perçues. L’a al se de la at i e de o latio s pe et de ep e les fo tes o latio s ui peu e t ous aider à mieux interpréter les facteurs ou à supprimer des variables pour raison de colinéarité ou de mauvaise qualité de représentation. Tout ceci après avoir affiné les échelles de mesures en étudiant leurs fiabilités (voir chapitre 2) p pa e le te ai pou u e o e i te p tatio des fa teu s issus d’u e ACP do t les sultats so t les suivants : Dans la rubrique « analyse » on sélectionne « dimension reduction » et « factor » ou analyse factoriell Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 11 Les variables initiales arrêtés après analyse de la fiabilité des échelles de mesure sont sélectionnées comme le montre le tableau ci-dessus. Les rubriques suivantes sont ensuite utilisées : l’a al se des ipti e u i a i e et i a i e , la thode d’e t a tio des a es fa to ielles, la sau ega de des coordonnées des individus sur les différents axes (scores), le remplacement des données manquantes par la moyenne de la variable correspondante peuvent être établis dans « option ». Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 12 D’autres méthodes d’e t a tio des a es fa to ielles peu e t t e utilis es dont des explications peuvent être données en cliquant sur « help ». Le critère de Kaiser est utilisé dans ce cas pour le choix des composantes. Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 13 Résultats de L’ACP La « communalities » ou la qualité de représentation donne le pourcentage de variance expliquée par chaque variable initiale après extraction ou factorisation. On remarque que dans la question Q9 portant sur la sensibilité aux stimuli, seul l’ite . et l’ite . ui so t elati e e t ie représentés. Les items q1.4, q2.3 ont étés supprimés pour améliorer la fiabilité des échelles de mesure (voir chapitre 2). Les items q8.1,..,q8.4 qui correspondent au facteur ambiance ont été aussi li i es a e fa teu ’a pas t alid . Les o so ateu s tu isie s o fo de t a ia e et atmosphère dans le magasin. KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Bartlett's Test of Sphericity Approx. Chi-Square ,780 4538,697 df 190 Sig. ,000 L’i di e KMO et le tes de Ba tlett o t e t la o e ad uatio de ette te h i ue au do recueillies (KMO porche de 1, khi deux (Chi-Square) élevé et signification nulle). Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] e Page 14 Initial Eigenvalues Rotation Sums of Squared Loadings Component 1 3,492 17,461 17,461 2,511 12,553 12,553 2 2,447 12,235 29,697 2,302 11,509 24,062 3 2,007 10,035 39,732 2,147 10,733 34,795 4 1,586 7,931 47,663 1,998 9,991 44,787 5 1,192 5,960 53,623 1,767 8,837 53,623 Ci o posa tes p i ipales o t ete ues d’ap s le it e de Kaise ui stipule ue seules les composantes ayant une valeur propre « Eingenvalues » dépassant 1 qui sont retenus ce qui correspond exactement avec le nombre de facteurs recherchés et que l’o o fi e a pa la suite. L’histog a e des aleu s p op es e montre pas une dénivellation très claire à partir de la cinquième valeur. Le critère de Kaiser est finalement retenu. Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 15 Component Matrix a Rotated Component Matrix Component 1 2 3 a Component 4 5 1 2 q5.2 ,614 q7.3 ,808 q8.8 ,596 q7.2 ,807 q5.1 ,593 q7.1 ,778 q5.3 ,586 q7.4 ,730 q8.7 ,572 q8.8 ,810 q8.6 ,557 q8.9 ,767 q8.9 ,541 q8.6 ,740 ,611 3 4 5 q7.3 -,630 q8.7 q7.1 -,625 q9.4 ,726 q7.2 -,560 q9.5 ,648 q7.4 -,532 q9.6 ,573 q9.5 q9.1 ,558 q9.3 q9.3 ,554 q9.1 q9.2 q9.4 q5.2 ,795 q9.6 q5.1 ,759 q9.2 q5.3 ,719 q6.4 -,580 q6.4 ,754 q6.2 -,577 q6.1 ,753 q6.1 -,544 q6.2 ,749 Les deux tableaux précédents donnent les corrélations des composantes retenues avec les variables initiales avant et après rotation Varimax. Le rôle de la rotation varimax est clair dans ce cas, la s pa atio des diff e ts fa teu s e pli atifs de l’a hat i pulsif est o te ue pa o s ue t et la validation est dont établie. L’hu eu du lie t est l e p e ie fa teu ui e pli ue , % de l’i fo ation totale, suivi du design ui e pli ue . %. Ces deu p e ie s fa teu s e pli ue t e i o % de l’i fo atio . La otatio a pe is aussi de do e plus d’i po ta e au t ois de ie s fa teu s (augmentation des variances expliquées). Le positionnement des consommateurs par rapport aux deux premiers facteurs humeur et design (à partir des coordonnées sauvegardées dans le fichier de données et la représentation tridimensionnelle des variables initiales par rapport aux composantes (corrélations) permettent d’a oi u e t pologie de la populatio tudi e et les a a t isti ues de ha ue g oupe. Cette tape sera développé plus loin mais on donne ici un aperçue graphique. Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 16 17 2.7.2. Etude su la pe eptio de l’e seig e e t vi tuel. Cette tude te te d’a al se les pe eptio s et les atte tes des tudia ts d’u pa s à o o ie émergente vis-à- is de ette fo e d’e seig e e t alte ati e au thodes t aditio elles. Les résultats de ce travail font apparaître plusieurs dimensions dans la perception des étudiants. L’i te a tio appa aît o e ta t la di e sio la ieu o sid e pa les tudia ts. L’utilit de e t pe d’e seig e e t ie t e se o d lieu. D’aut e pa t, la aît ise de la te h ologie i fo ati ue représente un souci majeur pour les étudiants. La flexibilité est le concept le moins bien perçu, la gestio du te ps ’est pas ie o sid e pa les tudia ts. Co te te et o je tif de l’ tude. Le a h de l’i fo atio a désormais une dimension mondiale à telle enseigne que de nombreuses questions relatives aux communications électroniques sont devenues des préoccupations communes à de nombreux pays. Afin de promouvoir activement les atouts de la so i t de l’i fo atio aup s de tous les ho es, les o je tifs sui a ts doi e t t e pou sui is : - réduire la «fracture numérique» entre les pays riches et les pays pauvres en soutenant le d eloppe e t de la so i t de l’i fo atio au sei des pa s e d eloppe e t. e ou age la oissa e o o i ue et la p o otio des te h ologies de l’i fo ation et de la communication par le biais de la coopération internationale. reconnaître et relever les principaux défis grâce à une coopération dans la recherche en matière de TIC. créer un environnement favorable à la coopération internationale dans le domaine de la recherche et permettre le transfert de connaissances, de technologies et des compétences. L’ olutio spe ta ulai e du at iel et des logi iels i fo ati ues ai si ue l’i t g atio des technologies dans notre vie quotidienne contribuent de façon continue et importante à la croissance de la fo atio à dista e. L’i estisse e t à lo g te e da s les essou es hu ai es est t op souvent négligé. Une mise à jour permanente des compétences et des connaissances est nécessaire dans de nombreux domai es et pa ti uli e e t da s l’e seig e e t à dista e. Elle pe et de s’adapte au utatio s apides de la so i t ode e et de o att e le hô age ui de eu e u e p o upatio o u e à l’Eu ope et à la gio dite a e e. Pour les pays du sud et de l’est de la M dite a e, le p o essus d’i t g atio euroméditerranéenne est à la fois un défi et un levier pour améliorer la compétitivité de leurs économies. Pa o s ue t, la fo atio et l’i estisse e t da s le apital hu ai joue t u ôle primordial. Mais o e t ga a ti le su s et la p e it de ette fo e d’e seig e e t sa s p e d e e o sid atio les esoi s, ai si ue les pe eptio s des app e a ts de l’e-enseignement ? L’o je tif de ette tude pa e u te est d’ tudie l’i t t po t à ette fo e d’e seig e e t pa les étudiants en Tunisie, pays à économie émergente et premier pays africain en termes de o p titi it et d’ou e tu e o o i ue lasse e t fo u o dial de Da os . M thodologie de l’e u te Cette enquête se ase su les a a t isti ues p i ipales de ette ou elle fo e d’e seig e e t ui ie d aie t i flue e le hoi de l’ tudia t e e s l’i t t u’il po te à l’e seig e e t i tuel. Ces a a t isti ues o t t d fi ies da s les t ois tudes d’A augh (2000a, 2000b, 2000c), qui a 18 identifié quatre concepts essentiels de l'e-enseignement : la te h ologie, l’i te a tio , la flexibilité et l’e gage e t. a. La technologie A augh a, , e o aît le ôle de la te h ologie da s l’e seig ement virtuel. Il s’appuie su le od le TAM Te h olog A epta e Model is e pla e pa Da is, Bagozzi & Wa sho e , et ui et e ide e deu di e sio s p i ipales de la e o aissa e d’u e nouvelle technologie (cours administrés via Internet). La première dimension est la perception de so utilit pa l’utilisateu ui doit do a lio e ses pe fo a es. La deu i e di e sio est la aît ise de la te h ologie i fo ati ue. Ce od le stipule ue les o a es u’u e ou elle technologie est utile et d’utilisatio fa ile i flue e t positi e e t l’attitude des utilisateu s. . L’i te a tio Arbaugh (2000a) d o pose le o ept de l’i te a tio e uat e di e sio s ui so t les elatio s : étudiants - professeurs, étudiant - étudiant, étudiant - contenu du cours et étudiant - interface du cours. Ethier et Payet (2001) retiennent les deux premières dimensions qui leur apparaissent esse tielles da s leu o eptio de l’i t t po t à l’e seig e e t i tuel. Ces deu di e sio s centrales, selon nous, pou la p e tio de l’a a do se o t ep ises da s ot e tude. E effet la dimension humaine de type « face à face » qui dépasse les moyens techniques relationnels (courrier le t o i ue, id o o f e e, ….. est i o tou a le. c. La flexibilité A augh a d fi dimensions spatiales d’i fo atio . Ce o te ps et d’espa e de it la fle i ilit pou l’app e a t e fo tio de l’i po ta e u’il a o de au et temporelles. Cette flexibilité est permise par les nouvelles technologies ept est u i di ateu de d eloppement économique, en effet la notion de ie t esse tielle pou les app e a ts ua d ils o upe t u e ploi. d. L’e gage e t Ethie et Pa et d fi isse t l’e gage e t o e ta t u e esti atio de l’effo t ue l’ tudia t est p êt à investir dans cette activité. Est-il p t et d id à s’auto g e ? Son degré d’e gage e t peut t e alu pa l’i po ta e des elatio s e t ete ues a e les outils technologiques ( Arbaugh 2000). Cette tude su l’i t t po t à l’e seig e e t i tuel s’est d oul e au sei de la fa ult des sciences économiques et de gestion de Tunis qui compte environ 11000 étudiants dont 2591 inscrits e aît ise et e aste , te eau p opi e à ette ou elle fo e d’e seig e e t. Cette e u te a été effectuée aup s d’u ha tillo fi al de tudia ts i s its e aît ise et e aste . Ils ep se te t e i o % de l’effe tif total des tudia ts o e s pa l’ tude et so t se s s a oi assez de e ul pou app ie utile e t l’e seig e e t i tuel. La thode d’ ha tillo age retenue est celle de la « boule de neige » do o p o a iliste. L’ tude ise à a al se les p ofils des tudia ts, leu s pe eptio s des diff e ts o epts de l’e seig e e t à dista e et à e he he les liens possibles ent e le p ofil et la pe eptio des tudia ts. Ce t a ail doit ous pe ett e d’u e pa t de o p e d e les atte tes des tudia ts et d’aut e pa t de esu e leu oti atio et leu deg d’e gage e t is-à-vis de cette nouvelle méthode de formation permanente. 19 Le uestio ai e i spi concepts suivants : de l’ tude d’Ethie et Pa et a t la o e te a t o pte des P ofils des tudia ts âge, se e, e ploi, utilisatio d’I te et, f ue tatio de la i lioth ue, p f e es du st le d’e seig e e t, accès et disponibilité de la technologie informatique). - La pe eptio de l’e seig e e t i tuel ep se t e (voir questionnaire en annexe) par les dimensions suivantes : a. l’utilit pe çue (questions ; v9,..., v11) b. l’utilisatio et la aît ise de la te h ologie informatique ( ,…, v14). c. La flexibilité ou la gestion du temps (v15, …,v20). d. L’i te a tio e t e tudia ts et e t e e seig a ts étudiants (v2 ,…, . e. La motivation et l’e gage e t ,…, . La mesure de la perception des étudiants est basée sur une échelle psychométrique de Likert à cinq deg s. La fia ilit de l’ helle de esu e est ifi e à l’aide de l’alpha de C o a h ui est supérieur à 0.79 pour chacune des cinq dimensions de la perception ce qui montre une bonne homogénéité des items. - R sultats de l’e u te Analyse des profils des étudiants Da s l’a al se des p ofils des tudia ts, des tests statisti ues test d’i d pe da e de khi deu , tests de comparaison des moyennes) ont montré que les variables ayant des relations significatives avec les di e sio s de la pe eptio de l’e-enseignement sont les suivantes : - le statut des étudiants (travaille à plein temps, travaille à temps partiel, ne travaille pas). - la maîtrise de la technologie informatique. - le st le d’app e tissage. Nous allons étudier dans une première étape les relations entre les différentes variables du profil des étudiants. Dans une seconde étape, une analyse en composantes principales (ACP) nous a permis de o fi e les i di e sio s de la pe eptio de l’e seig e ent virtuel et de mettre en évidence leur importance rlatieve. a. Relatio e t e le st le d’app e tissage et l’e ploi. emploi 150 oui Effectifs non 100 50 0 1 2 Style d'apprentissage Figure 1 : pa titio des tudia ts selo l’e ploi et le st le d’app e tissage : enseignement virtuel, 2 : enseignement classique) Nous o stato s u’e i o la oiti des tudia ts ui souhaite t opte pou u e seig e e t virtuel (voir Figure 1) comme complément et non comme substitut de formation, ne travaille pas. Ce sultat i atte du peut s’e pli ue pa l’i suffisa e de l’i frastructure universitaire tunisienne et 20 l’i suffisa e de l’e ad e e t telles ue pe çues pa les tudia ts. La fo e a tuelle de l’e seig e e t sup ieu a pou o jet de po d e au i ui tudes des tudia ts, de les oti e et de les responsabiliser efficacement. Par ailleurs une partie des étudiants qui occupent un emploi désire suivre un enseignement classique malgré tous les inconvénients que cela représente. Ceci p o ie t aise la le e t d’u e o aissa e de l’e seig e e t i tuel do d’u e méfiance à so ga d. U e a pag e de se si ilisatio s’a e essai e afi de d stifie ette ou elle fo e d’e seig e e t. b. Relatio e t e le st le d’app e tissage et la aît ise de la te h ologie i fo ati ue. Maîtrise de la technologie informatique Total Tableau 1 : croisement entre le style d’app e tissage et la aît ise de la Pas du te h ologie i fo ati ue etoutte es d’effe Un peutif Presque parfaitement style 1(classique) 2(E.V) Total Figure 2 : C oise e t de la 2 27 47 32 108 5 75 77 35 192 7 102 124 67 300 aît ise de la te h ologie ave le st le d’app e tissage. Il existe une relation significative entre la maîtrise de la technologie informatique et le style d’app e tissage. E effet, les tudia ts ui hoisisse t le st le d’e seig e e t i tuel d la e t aît ise o e a le e t l’outil i fo ati ue % . I e se e t les tudia ts ui hoisisse t le st le lassi ue, d la e t e pas aît ise l’outil i fo ati ue % . L’a lio atio de la formation en informatique représente une condition nécessaire pour motiver les étudiants et minimiser le taux d’a a do ui ep se te le p i ipal o sta le au su s de ette thode d’e seig e e t. c. Analyse en composantes principales. L’a al se e o posa tes p i ipales a te appli u e au a ia les ,…, ep se ta t les différents facteurs explicatifs (voir questionnaire en annexe). Elle a permis de confirmer les cinq di e sio s de la pe eptio de l’E.V ui e pli ue t % de la a ia e totale et de mettre en e e gue l’i te a tio et l’utilit pe çue ai si ue la aît ise de l’outil i fo ati ue. E effet, l’i te a tio est le o ept le plus i po ta t au eu des tudia ts % de la a ia e totale expliquée). Cet échange entre enseignants et étudiants et entre les étudiants eux-mêmes est o sid o e p i o dial pa es de ie s. C’est u aspe t t s i po ta t du o po te e t des tudia ts ui peut s’e pli ue pa la sp ifi it de la ultu e tu isie e ui a o de u e g a de importance à l’aspe t elatio el. Co e t ga a ti le su s et la p e it de l’e-enseignement sans compléter la dimension pédagogique par le facteur relationnel, le contact direct entre enseignant ou tuteur et apprenant ? Les tudia ts so t o s ie ts de l’utilit (14.2% de la variance totale expliquée) de cette fo e d’e seig e e t ais ils i siste t fo te e t su le a ue de o e s et de fo atio su le pla te h ologi ue. Il e peut a oi d’utilit sa s u e aît ise o e a le de l’outil i fo ati ue (6.7%). La uat i e di e sio est l’e gage e t . % .La i ui e et de i e di e sio de la pe eptio de l’e-e seig e e t est la fle i ilit . % , les tudia ts se le t glige l’i po ta e 21 de la gestion du temps. Ceci est vraisemblablement dû à une conjoncture économique difficile où les jeunes sont inquiets pour leur avenir. Indice KMO et test de Bartlett Mesure de précision de l'échantillonnage de Kaiser-Meyer-Olkin. Matrice des composantes après rotation Composante ,860 1 Test de sphéricité de Bartlett Khi-deux approximé 3342,227 v23 ,917 ddl 231 v24 ,873 Signification de Bartlett ,000 v22 ,861 v21 ,568 2 3 4 5 v25 O ote la o e ad uatio de l’ACP aux données recueillies dans cette étude. Le KMO est très proche de 1 et le test de sphéricité est très significatif. L’appli atio de la otatio a i a a permis de distinguer clairement les cinq facteurs explicatifs de la pe eptio de l’e seig e e t i tuel à savoir : l’utilit pe çue, l’i te a tio entre étudiant et entre étudiant et enseignant, la flexibilité, la maîtrise de la technologie informatique et enfin l’e gage e t. Un filtrage des corrélations a permit de faire apparaître un tableau des composantes aussi clairement lisible et interprétable. v10 ,754 v11 ,689 v9 ,619 v26 ,609 v15 ,608 v14 ,827 v13 ,816 v12 ,755 v29 ,794 v28 ,762 v30 ,732 v27 v17 ,722 v18 ,721 v19 ,679 v16 ,513 v20 ,512 22 La elatio e t e les o posa tes t ou es p de e t et la uestio atu e de l’e ploi plein, 2 : temps partiel, 3 : ne travaille pas) est donnée par le tableau suivant : : temps ANOVA Somme des carrés ddl Moyenne des carrés Composante 2 Inter-groupes 11,617 2 5,809 Utilité perçue Intra-groupes 287,383 297 ,968 Total 299,000 299 Composante 1 Inter-groupes 2,194 2 1,097 Interaction Intra-groupes 296,806 297 ,999 Total 299,000 299 Composante 3 Inter-groupes 1,875 2 ,938 Maîtrise de la Intra-groupes 297,125 297 1,000 technologie Total 299,000 299 Composante 4 Inter-groupes 7,804 2 3,902 291,196 297 ,980 299,000 299 Intra-groupes L’Engagement Total Composante 5 Inter-groupes 2,134 2 1,067 La flexibilité Intra-groupes 296,866 297 1,000 Total 299,000 299 F Signification 6,003 ,003 1,098 ,335 ,937 ,393 3,980 ,020 1,068 ,345 On note l’effet sig ifi atif de la atu e de l’e ploi seule e t su l’utilit pe çue et l’e gage e t da s l’e seig e e t i tuel. Les sig ifi atio s so t espe ti e e t 0.03 et 0.02. En effet les tudia ts e e ça t u e ploi se te t la essit d’u e fo atio o pl e tai e, et ceux qui ’o t pas d’e ploi so t p t à toute fo atio leu pe etta t d’e t ou e u . Ce ui este to a t, ’est ue la fle i ilit ’est toujou s pas ie o sid rée. 23 Positio e e t des app e a ts pa appo t à l’utilit pe çue de l’E.V et de l’i te a tio 3,00 2,00 1,00 1,00 1,00 3,00 3,00 3,00 3,00 3,00 3,00 1,00 3,00 3,00 3,00 3,00 3,00 1,00 1,00 1,00 1,00 3,00 3,00 1,00 1,00 1,00 1,00 1,00 1,00 3,00 3,00 3,00 1,00 1,00 3,00 1,00 1,00 1,001,00 3,003,00 3,00 1,001,00 1,00 1,00 1,00 3,00 3,00 1,00 1,00 3,00 1,00 3,00 3,00 1,00 1,00 1,00 1,00 3,00 1,00 1,00 1,00 3,00 1,00 3,00 3,00 3,003,00 1,00 1,00 1,00 1,00 3,00 3,00 1,00 1,00 1,00 3,00 1,00 1,00 1,00 3,00 3,00 3,00 1,00 3,00 1,00 2,00 2,002,00 2,00 4,00 4,00 2,00 2,00 4,00 2,00 4,00 4,00 4,00 2,00 2,00 4,00 4,00 4,00 4,00 4,00 2,00 4,00 2,00 2,00 2,00 4,00 4,00 2,00 4,00 4,00 2,00 2,00 4,00 2,00 4,00 4,00 2,00 4,00 2,00 4,00 4,00 4,00 2,00 4,00 4,00 4,00 2,00 2,00 4,00 2,00 4,00 4,00 2,00 4,00 4,00 2,00 4,00 4,00 2,00 2,00 2,00 4,00 4,00 4,00 2,00 4,00 2,00 4,00 2,00 4,00 4,00 4,00 2,00 2,002,00 2,00 2,00 4,00 2,00 2,00 4,00 4,00 2,00 2,00 Utilité perçue de l'enseignement virtuel 1,00 1,00 1,00 0,00 -1,00 3,00 2,00 -2,00 1,00 1,00 1,00 4,00 2,00 2,00 4,00 2,00 -2,00 -1,00 0,00 1,00 2,00 Intéraction Le positionnement des étudiants par rapport aux deux premiers facteurs les plus importants à leurs yeux fait apparaître quatre groupes clairement positionnés dans cette carte factorielle. -Legroupe1 (code 1) : composé par les étudiants aya t u e o e pe eptio de l’utilit de ette fo e d’e seig e e t pa o t e l’i te a tio e se le pas p io itai e pou eu . - Le groupe 2 (code 2) : est caractérisé par les, étudiants désintéressés par cette forme de l’e seig e e t. - Le groupe 3 (code 3) : est caractérisé par les étudiants tout à fait opposés aux précédents, il s’agit des tudia ts d si eu de o pl te leu fo atio et ui atta he t eau oup d’i po ta e à l’i te a tio tudia t e seig a t. - Groupe 4 (code 4) : Il s’agit des tudia ts do t l’utilit de l’E.V ’est pas e o e lai e ta t do les o e s te h i ues ui so t e g al a ua ts et u’ils e aît ise t pas e plus puis u’ils o pte t eau oup su le o ta t di e t do l’e seig e e t lassi ue. 2.7.3. Etude sur le le to at d’u jou al. La di e tio d’u jou al souhaite t a sfo e à la fois le o te u et la fo e de so p oduit afi de mieux répondre aux attentes de ses lecteurs et augmenter son lectorat. Un questionnaire a donc été élaboré par des consultants en marketing et inséré dans le journal. etou s o t t e egist s, o t fait l’o jet d’u ti age al atoi e ; correctement remplis, seuls 808 questionnaires ont été conservés. uestio ai es ’ ta t pas 24 L’o je tif, à t a e s ette tude elle, est de ala e les te h i ues d’a al se de do es les plus utilisées en marketing et de traiter le questionnaire afin de ressortir les conclusions en termes a keti g. O se li ite a da s e ui suit à l’a ti it le to ielle et au fi e o so ateurs. Analyse bivariée Relatio e t e le ode d’a hat et l’attitude le to ielle Le croisement de ces deux variables qualitatives fait appel au test de khi deux. Le tableau suivant montre que les lecteurs recevant leur journal par la poste penchent plutôt pour une lecture différée. En effet l’effe tif th o i ue o espo da t atte du est gal à . ais elui e egist aut . De e sous l’h poth se d’i d pe da e o ote ue les le teu s a a t u a o e e t postal et ui de aie t avoir une lecture immédiate compte 25.6 mais au fait ils ne sont que 14. Pour conclure, nous pouvons dire que les lecteurs manquent d’assiduité. Il esso t aussi ue l’a hat olo tai e du jou al i pli ue u e le tu e i diate. En effet les lecteurs qui achètent délibérément leurs journaux dans un kiosque ou chez un vendeur ambulant sont plus nombreux en réalité (effectif) que ce qui est attendu (effectif théorique). Tableau croisé mode d'achat * attitude lectorielle attitude lectorielle Total lecture différée feuilleté lecture immédiate Effectif 23 68 14 105 Effectif théorique 16,1 63,3 25,6 105,0 Effectif 58 243 99 400 Effectif théorique 61,2 241,1 97,7 400,0 Effectif 14 73 37 124 Effectif théorique 19,0 74,7 30,3 124,0 Effectif 16 53 27 96 Effectif théorique 14,7 57,9 23,4 96,0 Effectif 111 437 177 725 Effectif théorique 111,0 437,0 177,0 725,0 abonnement postal portage mode d'achat dans la rue, vendeur ambulant kiosque Total 25 Tests de 2 Valeur 2 de Pearson Rapport de vraisemblance Association linéaire Nombres d’observations df Signification 12,728(a) 6 ,048 13,437 6 ,037 5,634 1 ,018 0 cellules (0%) a un effectif théorique inférieur à 5. 725 Il e iste do u e elatio sig ifi ati e e t e le ode d’a hat et l’attitude le to ielle. Ce i est o fi par une signification gale à , % et i f ieu e au is ue fi d’a a e = % do o ejette l’h poth se d’i d pe da e de es deu a a t es ualitatifs. Relation entre la variable âge et la variable fréquence de non-lecture L’âge est u e a ia le ua titati e, puis ue l’e u te a t faite d’u e a i e a o e. Le fait de donner exactement son âge ne présente aucun inconvénient pour les enquêtés. La fréquence de non lecture (vous arrive t-il d’a hete le jou al et de ne pas le lire ?) doit obéir à une échelle ualitati e e uat e odalit ja ais,…, f ue e t. Ce croisement doit être basé sur le test ANOVA. Il s’agit do de o pa e les o e es des âges des lecteurs pour chaque modalité de fréquence de non lecture. Il ressort du tableau suivant que les le teu s les plus âg s à ui il ’a i e ja ais d’a hete u jou al sa s le li e o pl te e t. Pa o t e il a i e t de te ps e te ps ou e o e f ue e t au plus jeu es d’a hete le jou al et de ne pas le li e, lo s u’ils ’atte de t pas ou e so t pas à la e he he d’u e ou elle. Tableau de bord Fréquence de non-lecture Moyenne Ecart-type Minimum Maximum jamais 53,8556 15,55348 17,00 84,00 rarement 51,1519 14,66787 16,00 85,00 de temps en temps 47,8224 12,40725 19,00 82,00 fréquemment 49,1000 14,37515 19,00 82,00 Total 51,9271 14,94015 16,00 85,00 26 ANOVA âge Somme des carrés df Moyenne des carrés Intergroupes 3549,861 3 1183,287 Intragroupes 161624,20 737 219,300 Total 165174,06 740 La signification est égale à 0.1% do o o fi l’âge du le teu et la f ue e de o le tu e. F Signification 5,396 ,001 e l’e iste e d’u e elatio sig ifi ati e e t e Une analyse en composantes principales appliquée aux questions ayant trait au bénéfice consommateur pe ett a d’e d fi i les facteurs explicatifs. Analyse en composantes principales. Statistiques descriptives La lecture du journal pour vous est : Indice KMO et test de Bartlett Moyenne Ecart-type L1 un très grand plaisir 3,6299 ,95441 L2 une vraie détente 3,6032 ,91969 L3 un moment agréable 3,6566 ,95414 L4 un divertissement 3,3025 1,04325 L5 de découvrir l'actualité autrement 4,0623 ,84104 L6 de comprendre le monde 3,9520 ,81835 L7 d’avoir du recul sur l'information 3,5890 1,00980 L8 d’avoir des repères solides 3,6584 1,00835 L9 de réfléchir sur l'actualité 4,0694 ,79020 Mesure de precision de l’échantillon de Kaiser-Meyer-Olkin Test de sphéricité de Bartlett ,869 2 approché df Sig. 2189,825 36 ,000 27 Qualité de représentation Initial Extraction L1 un très grand plaisir 1,000 ,659 L2 une vraie détente 1,000 ,789 L3 un moment agréable 1,000 ,729 L4 un divertissement 1,000 ,596 L5 découvrir l'actualité autrement 1,000 ,581 L6 comprendre le monde 1,000 ,660 L7 avoir du recul sur l'information 1,000 ,602 L8 avoir des repères solides 1,000 ,636 L9 Réfléchir sur l'actualité 1,000 ,588 Extraction Method: Principal Component Analysis. Nous oto s l’ad uatio de ette te h i ue à l’a al se des a ia les ui o e e t le bénéfice tiré dans la lecture du journal. Les variables les mieux représentés (moyenne la plus élevée et écart type le plus bas) sont celles qui représentent l’esp it d’a al se et de e oupe e t de l’i fo atio et de la découverte (L9, L5). Ces variables sont toutes relativement bien représentées après extraction des axes. Deux facteurs ou composantes du bénéfice consommateur sont retenus. Variance totale expliquée Component Valeurs propres initiales Total % of Variance Cumulative % 1 4,290 47,662 47,662 2 1,551 17,231 64,894 3 ,660 7,334 72,227 4 ,552 6,129 78,356 5 ,487 5,411 83,767 6 ,472 5,244 89,011 7 ,364 4,041 93,052 8 ,340 3,780 96,831 9 ,285 3,169 100,000 28 Matrice des composantes après rotation varimax Matrice des composantes (a) Composantes 1 Composantes Lire le journal pour vous est : 2 1 2 un très grand plaisir ,723 ,354 L1 comprendre le monde ,798 ,151 un moment agréable ,721 ,448 L2 avoir des repères solides ,760 ,243 avoir des repères solides ,719 -,319 L3 réfléchir sur l'actualité ,759 ,109 une vraie détente ,700 ,518 comprendre le monde ,692 -,391 L4 avoir du recul sur l'information ,750 ,200 avoir du recul sur l'information ,688 -,359 L5 découvrir l'actualité autrement ,727 ,230 découvrir l'actualité autrement ,680 -,305 L6 une vraie détente ,173 ,871 L7 un moment agréable ,253 ,815 réfléchir sur l'actualité ,645 -,410 L8 un divertissement ,089 ,767 un divertissement ,553 ,500 L9 un très grand plaisir ,305 ,752 Méthode d'extraction : Analyse en composantes principales. La rotation a i a a eu u effet t s positif su l’i te p tatio des deu fa teu s u fi e consommateur. En effet la matrice des corrélations sans rotation des axes factoriels ne permet pas d’i te p te le se s de ha ue o posa te les o latio s so t uivalentes) Le tableau des corrélations après rotation sépare clairement les deux facteurs du bénéfice consommateur à savoir : -Composante 1 : caractérisée a o d à l’i fo atio . o latio s les plus le es pa L ,.., L ui ep se te l’i t t - Composante 2 : caractérisée par les critères L6,.., L9 qui représentent le plaisir éprouvé dans la lecture du journal. Théoriquement les deux facteurs du bénéfice consommateur sont indépendants, néanmoins on e a ue suite à l’i te p tatio des deu o posantes qu’u lie t oit e iste e alit e t e le plaisir de lire et l’i t t à l’i fo atio . U e otatio o li i se ait tout à fait possi le da s e as. Nous pouvons donc conclure en affirmant que deux facteurs expliquent le bénéfice consommateur dans la lecture du journal à savoir : le plaisi de li e et l’i t t pou l’i fo atio . Le positio e e t des le teu s pa appo t à es deu fa teu s pe et d’appo te la t pologie en quatre groupes correspondant aux quatre cadrans du plan 1-2: suivant : 29 Plan 1-2 3 2 Axe 2 1 0 -1 -2 -3 -4 -4 -3 -2 -1 0 1 2 3 Axe 1 Nous nous limitons dans cette partie à l’aspe t g aphi ue de es g oupes, l’i te p tatio se a faite plus loin. 2.7.4. Etude sur la gestion financière des communes. Présentation des données L’ tude de la gestio fi a cière des communes tunisiennes consiste à partir des ratios fi a ie s et de di e s i di ateu s de taille et d’activités à ett e au poi t u outil d’aide à la d isio . Ce i pe ett a au d ideu s de atio alise l’aide pu li à la fois financière mais aussi et surtout technique. La s th tisatio de l’i fo atio ui doit p de l’app o he d isio elle passe par l’appli atio d’u e ACP puis ue les a ia les tudi es so t toutes ua titati es. La population considérée comporte 187 communes et 43 variables (22 ratios financiers, 12 i di ateu s de taille et i di ateu s d’a ti it s . Les communes des grandes villes ont été li i es pou des aiso s d’ho og it . . 30 Les indicateurs de taille de la commune reflètent la superficie, la population et les commodités : 31 Les i di ateu s d’a ti it s efl te t le deg d’a ti it et de d eloppe e t de la o u e: 32 Analyse en composantes principales. L’a al se e o posa tes p i ipales appli u es au a ia les p de tes pe et de s th tise l’i fo ation représentée par plus de 43 variables en mettant en place un nombre restreint d’i di ateu s synthétiques. Le positionnement des différentes communes par rapport à ces facteurs aboutira à la formation des groupes de communs les plus homogènes possibles. A a t d’appli ue l’ACP u e li i atio des a ia les fo te e t o l’a al se : l es pe ett a d’affi e Les ratios financiers R1, R6, R11, R18, R21 et les indicateurs : Uind,Uart,Ukio,Usani,Asso,Vhsf,micd,bipp,dipp,Vcsf, Iffg,Balg sont donc élimi s da s l’a al se. Les fortes corrélations les éléments de la diagonale de la matrice anti-image ainsi que le pourcentage de la variance expliquée de chaque variable après extraction des axes factoriels (communalities) sont les raisons de cette élimination KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Bartlett's Test of Sphericity Approx. Chi-Square ,676 2618,684 df 153 Sig. ,000 Nous remarquons la bonne adéquation de la technique d’analyse en composantes principales à ce tableau de données suite à cet affinement de l’information recueillie. 33 Communalities Initial Initial Eigenvalues Extraction Component Total % of Variance Cumulative % r4 1,000 ,551 1 4,791 26,618 26,618 r7 1,000 ,701 2 3,931 21,840 48,458 r10 1,000 ,431 3 2,617 14,539 62,997 r13 1,000 ,855 4 1,560 8,666 71,663 r15 1,000 ,332 5 1,090 6,055 77,719 r16 1,000 ,769 6 ,869 4,830 82,549 r17 1,000 ,538 7 ,522 2,901 85,450 r5 1,000 ,859 8 ,493 2,740 88,191 r22 1,000 ,881 9 ,461 2,563 90,754 r23 1,000 ,773 10 ,372 2,066 92,820 r24 1,000 ,823 11 ,342 1,899 94,719 super 1,000 ,106 12 ,276 1,532 96,251 popu 1,000 ,863 13 ,233 1,297 97,548 logm 1,000 ,672 14 ,196 1,087 98,635 ucom 1,000 ,133 15 ,108 ,599 99,234 unet 1,000 ,544 16 ,080 ,446 99,679 scol 1,000 ,811 17 ,042 ,233 99,912 etot 1,000 ,697 18 ,016 ,088 100,000 Extraction Method: Principal Component Analysis. Trois indicateurs synthétiques sont retenus après consultation de la matrice des composantes, ils expliquent 6 3 % de l’i fo atio . La thode des diff e es d’o d e et d’o d e pe et de ete i Deu a es fa to iels , le troisième axe est retenue car il exprime un indicateur synthétique très important qui jouera un rôle décisif dans la typologie des o u es. C’est l’e dette e t ui o e e la ajo it des communes. La otatio a i a des a es fa to iels a pe et variables initiales. is d’aug e te les o latio s e t e les o posa tes 34 Component Matrix a Rotated Component Matrix Component 1 2 a Component 3 1 2 r5 ,888 r13 ,924 r13 ,888 r5 ,920 r16 -,814 r16 -,848 r7 ,761 r7 ,805 r22 ,675 r22 ,669 r17 ,660 r17 r10 3 r10 popu ,840 popu ,914 scol ,811 scol ,895 logm ,752 etot ,835 etot ,734 logm ,812 unet unet ,737 ucom ucom r23 ,738 super r4 ,682 r23 ,862 r24 r24 ,771 r15 r4 ,739 super r15 - La composante 1: est caractérisée par les ratios de dépenses et de recettes. Elle représente le budget. - La composante 2 : est caractérisée par les indicateurs de développement qui représente les commodités. - La composante 3 : est caractérisée par les ratios r23, r24, r4 qui expriment l’e dette e t des communes. Nous e a uo s l’i po ta e de ette te h i ue ui ous a pe is de s th tise l’i fo atio . La description des communes par 43 variables dont certaines sont fortement corrélées à été restreinte à trois indicateurs synthétiques à savoir : Le udget, les o odit s et l’endettement. Le positionnement des différentes communes par rapport à ces indicateurs nous donnera une approche graphique de la typologie que nous confirmerons par la suite. 35 Nous e a uo s l’i po ta e o e ous l’a o s sig al aupa a a t de l’i di ateur de l’e dette e t ui pe et de s pa e e t e les g oupes et des o u es. L’i te p tatio et les caractéristiques des groupes formés à ce stade graphiquement seront données plus loin. 36 III Analyse factorielle des correspondances. 1. Analyse factorielle des correspondances simples. 1.1. Introduction. L’a al se fa to ielle des correspondances simples (AFC) est u e te h i ue d’a al se de do es multidimensionnelles. C’est u e thode des ipti e ui g alise le test d’i d pe da e de Khideux de Pearson. L’AFC s’ad esse esse tielle e t au ta leau de o ti ge e ui oise les odalit s de deu a ia les ualitati es. Elle s’ te d au de do es ua titati es ho og es et positi es de telle faço ue la so e d’u e lig e ou u e olo e ait u se s. Exemples : - Da s l’ tude su le le to at, le oise e t du ode d’a hat et de l’attitude le to ielle do t la elatio est sig ifi ati e oi hapit e a a outit à u ta leau de o ti ge e. L’appli atio de l’AFC à e ta leau ap s a oi o fi l’e iste e d’u e elatio sig ifi ati e e t e les deu a ia les ualitati es pe et d’ tudie les o espo da es e t e les odalit s, aut e e t dit les associations et les oppositions des différentes modalités des deux variables. - Positionnement des différentes marques de téléphones portables par rapport aux différents critères étudiés. Le croisement des différentes marques avec les différents critères étudiés donne lieu à un tableau de notes, donc un tableau de données homogènes et positives. Chaque case de ce tableau est égale à la moyenne des notes attribuées par la population étudiée concernant une marque de mobile et un critère précis. - Evolution des ventes des hebdomadaires. On étudié dans ce cas les ventes des hebdomadaires pe da t u e p iode do e. L’appli atio de l’AFC pe et de o pa e les pa ts de a h s des diff e tes e ues e t e deu a es et de o pa e aussi l’ olutio des pa ts de marchés de deux revues. 1.2. Présentation de la méthode. La transformation du tableau de données (Cij ) en un tableau de probabilités permet de comparer les lignes et les colonnes. Soit : ● f ij C C ij i , la p opo tio de l’effe tif total C=∑∑Cij correspondant à la modalité i de la ij j variable Q1 ou à la ieme ligne du tableau et à la modalité j de la variable Q2 ou à la colonne j. ● fi. = f ij , f . j f ij , f ji p n f ij j1 i 1 f i. , f ij f ij f.j . ● fI =(f1. ,f2. ,…fn.) la distribution marginale en colonne qui correspond aux poids des lignes. ● fJ = (f.1 ,f.2 ,…f.p ) la distribution marginale en ligne ou celle des poids des colonnes. 37 ● f Ji (f1i , f 2i ,...f pi ) la distribution conditionnelle en ligne ou profil ligne. ● f Ij (f1j , f 2j ,...f nj ) la distribution conditionnelle en colonne ou profil colonne. La distribution utilisée pour comparer deux profils lignes ( p ) est la distance de khi deux définie par : d 2 (i, i' ) p j1 p 1 i 1 f ij f i ' j (f j f ji ' ) 2 ( ) 2 . f.j f i '. j1 f . j f i. Dans l’espace n des profils colonnes on a : d 2 ( j, j' ) n i 1 1 j (f i f i j ' ) 2 . f i. L’AFC d’un tableau de contingence comprend plusieurs étapes : - Réaliser une ACP du tableau des profils lignes munis des poids fi. . - Réaliser une ACP du tableau des profils colonnes munis des poids f.J . - Etudier les liens entre les deux analyses. - Construire des graphiques qui ont l’avantage de représenter simultanément les lignes et les colonnes mettant en évidence les proximités entre les profils lignes, les proximités entre les profils colonnes et la nature de la liaison entre les lignes et les colonnes. 1.3. Le nuage des profils lignes. 1.3.1. Inertie totale du nuage. La variance totale ou l’information contenue dans le tableau des profils lignes ou encore l’inertie s’exprime par : I(N(I)) = f i.d 2 ( iJ , f J ) f i. n n p i 1 i 1 j1 p (f f f ) 2 n khideux 1 f ij ij i. . j ( f . j ) 2 f i. f . j C f . j f i. i 1 j1 Le point moyen GJ ou le centre de gravité du nuage N(I) s’écrit : f f n GJ = i 1 i i. J (f .1,. ,....f .p ) f J 38 1.3.2. Construction du premier axe principal. f d Soit Δ1 le premier axe principal de vecteur directeur u1 obtenu à partir de la minimisation de la variance par rapport à Δ1 : I( N, 1 ) i. 2 * * (f Ji , f Ji ) 2 avec f Ji la projection orthogonale de f Ji sur Δ1 . u1 est le premier vecteur propre de la matrice de variance covariance : V=X’DX -GJGJ’ associé à la plus grande valeur propre λ1 . La matrice D est une matrice diagonale dont les éléments de la diagonale sont les poids fi. des lignes. On montre que GJ est le vecteur propre trivial associé à la valeur propre nulle. 1.3.3. Construction de la première composante principale. La première composante F1 est une nouvelle variable définie pour chaque individu * ou ligne i par : F1(i) = <fJi – fJ , u1 > est la coordonnée de la projection f Ji sur Δ1 ayant pour origine fJ du nuage N(I). 1 i (f j f . j )u 1 ( j) avec j1 f . j p F1(i) = f n i 1 F (i) 0 (F1 est centrée). i. 1 La variance de F1 ui ’est aut e ue la a ia e e pli u e par Δ1 est égale à λ1 : λ1 f n i 1 F (i) . La part de l’information détenue par la première composante est 2 i. 1 1 . /C égale à 2 1.4. Le nuage des profils colonnes. Le point moyen du nuage des profils colonnes GI est donné par : f p GI = j1 f (f1. ,....f n. ) f I j .j I D’une manière similaire que le paragraphe précédent on obtient ( mutadis mutandis) les résultats suivants : I(N(J)) = khi deux /C = ∑λj . T1 ( j) n i 1 1 j (f i f i. ) v1 (i) , v1 est le premier vecteur propre associé à la valeur propre f i. λ1 de la matrice de variances covariances V1 = XD1X’-GIGI’, avec D1 une matrice diagonale dont les éléments de la diagonale sont les poids f.j des colonnes . 39 1.5. Lien entre les deux analyses. u1, …ur les vecteurs propres de la matrice des variances covariances du nuage des profils lignes associés aux valeurs propres λ1 ,…λr . v1 , …vr ceux du nuage des profils colonnes associés aux mêmes valeurs propres. r= min(p-1,n-1). En effet la dimension de V est (p,p) et admet p-1 valeurs propres non triviales. La dimension de V1 est (n,n) et admet n-1 valeurs propres dont n-p dernières valeurs propres sont nulles. F1 , …Fr les composantes principales du nuage des profils lignes N(I). T1, ….Tr les composantes principales du nuage des profils colonnes N(J). Avec : Fh (i) = h v h (i) et Th(j) = f i. h u h ( j) . f.j On a alors les relations de transition : Fh(i) = 1 h f T ( j) p j1 i j h et Th(j) = 1 h f n i 1 j i Fh (i) . L’analyse d’un des nuages des profils se déduit facilement de l’autre nuage. Il convient alors d’analyser le tableau de données correspondant à la matrice de variances covariances ayant la taille la plus petite. 1.6. Paramètres d’aide à l’interprétation des résultats. Les paramètres d’aide à l’interprétation fournis par les différents logiciels statistiques en général et SPSS en particulier se limitent à : a. La contribution d’un profil ligne à la variance expliquée par l’axe Δh . Le rôle joué par un profil ligne i, i=1,..n dans l’interprétation d’un axe est caractérisé son poids, sa coordonnée sur cet axe et enfin la variance expliquée par celui-ci, exprimée par sa contribution soit : CTR (i) f i. Fh2 (i) . h De même on définit la contribution d’un profil colonne j par rapport au même axe, soit : G 2h ( j) . CTR ( j) f . j h 40 Un profil ligne ou colonne est jugé important dans l’interprétation d’un axe si sa contribution exprimée en pourcentage dépasse la contribution moyenne ou si elle est supérieure au poids fi. (f.j) b. La qualité de représentation du profil ligne i sur l’axe Δh . La qualité du profil ligne est mesurée par le cosinus de l’angle que le vecteur profil f Ji fait avec l’axe Δh et donnée par : QLTh(i) = Fh2 (i) . d 2 (f Ji , f J ) De la même façon , on définie la qualité de représentation du profil colonne fIj , soit : G 2h ( j) QLTh(j) = 2 j . d (f I , f I ) Le profil est jugée bien représenté sur l’axe factoriel si QLT est proche de 1 puisque c’est exactement le carré du cosinus. 1.7 Applications et utilisation de SPSS. Dans la fonction « Analyse » choisir la rubrique « Correspondence Analysis ». On sélectionne après la variable deuxième produit acheté impulsivement pour la colonne et le magasin pour la variable ligne. 41 L’optio « statistics » pe et de s le tio e et d’affi he le ta leau de o espo da e, les tableaux de p ofils lig es et olo es ai si ue les pa a t es d’aide à l’i te p tatio pou ha ue variable. L’optio « plots » permet de donner une représentation graphique des profils lignes et des profils colonnes simultanément. 42 1.7.1 L’Achat impulsif. O a justifi p de e t et da s le ad e de l’e u te su l’a hat i pulsif, l’e iste e de elatio s sig ifi ati es e t e le lieu d’a hat et le p e ie p oduit a het d’u e pa t et le deu i e p oduit d’aut e pa t., a het s tous les deu d’u e a i e i pulsi e Sig ifi atio = . L’appli atio d’u e AFC au ta leau des effe tifs sui a t pe ett a de t ou e les o espo da es entre les points de ventes et le deuxième produit acheté d »une manière impulsive. Croisement entre le deuxième produit acheté (prod22) & lieu d’a hat Correspondence Table magasin prod22 Monoprix alimentation SMG Champion Carrefour Géant Active Margin 30 21 17 14 16 98 2 1 1 5 7 16 16 12 7 12 28 75 hygiène 7 4 10 5 4 30 autre 7 8 1 22 19 57 62 46 36 58 74 276 textile cosmétique Active Margin Summary Dimension Singular Value Inertia Chi Square Sig. Proportion of Inertia Accounted for Confidence Singular Value Cumulative Standard Deviation Correlation 2 1 ,375 ,141 ,760 ,760 ,052 2 ,163 ,026 ,143 ,902 ,060 3 ,133 ,018 ,095 ,998 4 ,021 ,000 ,002 1,000 1,000 1,000 Total ,185 51,132 ,000(a) ,175 a 16 degrees of freedom Le o e de odalit s est le e pou les deu a ia les do L’AFC peut s'appliquer sur le tableau des profils lignes ou colonnes. Quatre axes factoriels peuvent être construits (nombre de 43 modalités -1). Les deux premiers axes expliquent 90.2% de la variance totale du tableau égale à 0.185. Le premier explique 76% (0.141/0.185) et le deuxième 14.3% (0.26/0.185). Overview Row Points(a) Score in Dimension Contribution Of Point to Inertia of Dimension prod22 Mass 1 2 Inerti a 1 Of Dimension to Inertia of Point 2 1 2 Total alimentation ,355 -,526 ,119 ,043 ,262 ,031 ,867 ,019 ,886 textile ,058 ,814 -,162 ,017 ,102 ,009 ,824 ,014 ,838 cosmétique ,272 ,198 ,475 ,018 ,028 ,378 ,227 ,568 ,794 hygiène ,109 -,837 -,777 ,043 ,203 ,404 ,657 ,246 ,903 autre ,207 ,857 -,375 ,064 ,404 ,179 ,886 ,073 ,959 ,185 1,000 1,000 Active Total 1,000 a Symmetrical normalization Overview Column Points(a) magasin Mass Score in Dimension 1 Inertia Contribution Of Point to Inertia of Dimension 2 1 Of Dimension to Inertia of Point 2 1 2 Total Monoprix ,225 -,467 ,276 ,023 ,131 ,105 ,807 ,122 ,928 SMG ,167 -,253 ,258 ,010 ,028 ,068 ,389 ,175 ,564 Champion ,130 -1,056 -,506 ,064 ,388 ,206 ,847 ,084 ,931 Carrefour ,210 ,631 -,592 ,045 ,223 ,453 ,696 ,265 ,961 Géant ,268 ,567 ,319 ,043 ,230 ,168 ,759 ,104 ,863 ,185 1,000 1,000 Active Total 1,000 a Symmetrical normalization 44 Axe 1 : L’a e est a a t is pa les p oduits ali e tai es, d’h gi e et aut e p oduits le t o i ue, matériel auto, bureautique,..) et les hypermarchés Carrefour Géant et Champion. Carrefour et Géant s’asso ie t au p oduit aut e et s’oppose t à Cha pio ui s’asso ie au p oduits ali e tai e et d’h gi e.. Axe 2 : L’a e est a a t is pa l’opposition des points de ventes Carrefour et Champion au produit cosmétique qui se situe entre les magasins Géant, Monoprix et SMG. magasin prod22 0,6 cosmétique Dimension 2 0,4 Géant Monoprix 0,2 SMG alimentation 0,0 textile -0,2 -0,4 Champion autre -0,6 Carrefour hygiène -0,8 -1,0 -0,5 0,0 0,5 Dimension 1 En o lusio ous pou o s affi e ue o e a t la atu e de l’a hat i pulsif p t et sa relation avec le point de vente, les produits de première nécessité sont liées aux magasins Monoprix, SMG et Cha pio . Les p oduits du se o d o d e ou d’utilit oi d e so t li s au h pe a h s, do la taille du agasi i flue e l’a hat et la atu e du deu i e p oduit a het i pulsi ement. 1.7.2 Accès et utilisation d’Internet. Da s l’e u te <<I te et : accès et utilisation au Québec>> réalisée en septembre 1997(voir le site http://www.risq.qc.ca/enquête , o s’i t esse entre autre à la relation entre les deux variables suivantes : -A ie -No et da s l’utilisatio d’I te et e d’heu es de o e io pa ois odalit s . odalit s . 45 Le ta leau des effe tifs o te u à pa ti des do variables est : es de l’e u te ui oise les odalit s des deux Nombres d’heures de connexion Ancienneté -3mois 3à6mois 6à12mois 1 à 2ans 2 à3ans +3ans Total -2h 71 79 160 208 65 23 603 2 à5h 197 204 542 798 359 148 2248 5 à10h 251 234 491 762 427 227 2394 10 à20h 172 164 421 565 399 227 1948 +20h 79 98 239 397 272 241 1326 Total 770 776 1853 2730 1522 868 8519 Le nombre de liges est inférieur aux nombres de colonnes donc une analyse factorielle des correspondances est appliquée au tableau des profils colonnes. Soit le tableau des variances expliquées par les axes issus du nuage des profils colonnes : Axes Valeur propre Pourcentage expliqué Pourcentage cumulé 1 0.0258 86.82 86.82 2 0.0022 7.24 94.06 3 0.0013 4.28 98.34 4 0.0005 1.66 100 5 0.00 0.00 100 La dernière valeur propre est nulle elle correspond à la valeur triviale. Les deux premiers axes fa to iels e pli ue t . % de l’i fo atio totale. Nous ous li ite o s do à l’i te p tatio de la première carte factorielle. Soit les tableaux des contributions et des qualités de représentations relatives aux deux premiers axes. 46 Profils lignes : Heures connexion Poids relatifs en (%) Ctr1 (i) Ctr2 (i) Qlt1 (i) Qlt2 (i) -2h 7.08 0.26 0.01 0.91 0.00 2-5h 26.39 0.17 0.44 0.81 0.17 5-10h 28.10 0.01 0.33 0.15 0.66 10-20h 22.87 .0.05 0.09 0.64 0.09 +20h 15.57 0.51 0.12 0.96 0.02 Profils colmonnes : Ancienneté Poids relatifs en (%) Ctr1 (i) Ctr2 (i) Qlt1 (i) Qlt2 (i) -3mois 9.04 0.07 0.52 0.61 0.38 3-6mois 9.11 0.05 0.10 0.71 0.13 6-12mois 21.75 0.08 0.07 0.82 0.06 1-2ans 32.05 0.05 0.26 0.62 0.28 2-3ans 17.87 0.12 0.06 0.8 0.03 +3ans 10.19 0.63 0.00 0.98 0.00 Axe 1 : Le premier axe factoriel est expliqué essentiellement par les modalités +3ans qui contribue à da s la fo atio de et a e te la odalit + heu es d’utilisatio he do adai e d’I te et. une moindre mesure et par opposition on trouve la modalité - heu s d’utilisatio . Do et a caractérisé par les internautes professionnels ou les a os d’I te et ui so t ie ep se t l’a e QLT= . . 63% Da s e est s su Axe 2 : Le deuxième axe factoriel est expliqué essentiellement par la modalité -3mois d’a ie caractérise les novices. et ui 47 En examinant les trajectoires des deux variables dans le plan factoriel ci-dessous nous remarquons la divergence entre dernières modalités des deux variables. Au début on enregistre une affluence sur I te et ui s’att ue a e le te ps pou se li ite e fi au a os et au p ofessio els. -3mois facteur2(7.24%) 0,1 5_10h 0,06 3_6mois 2_3ans +3ans -2h 10_20h 0,02 6_12mois -0,02 20+h 1_2ans -0,06 -0,45 -0,30 -0,15 0,00 2_5h 0,15 0,30 Facteur1(86.62%) 1.7.3 Le Lectorat. L’a al se fa to ielle des o espo da es e ige des a ia les ualitati es sig ifi ati es d pe da tes test d’i d pe da e de 2 . P de e t, o a justifi l’e iste e d’u lie sig ifi atif e t e le mode d’a hat te l’attitude le to ielle (sig=0.048<5%). Proportion d'inertie Valeur singulière de confiance Corrélation Dimension Valeur singulière Inertie Khi-deux Sig. Expliqué Cumulé Ecart-type 1 ,127 ,016 ,924 ,924 ,034 2 ,036 ,001 ,076 1,000 ,037 1,000 1,000 Total ,018 12,728 ,048(a) 2 -,028 a 6 degrés de liberté L’analyse factorielle est effectuée sur le tableau des profils colonnes puisque le nombre de modalités de l’attitude lectorielle est égal à trois donc deux axes factoriels expliquent toute 48 l’information. Le premier axe détient à lui seul 92.4%(0.16/0.18) de l’information ou de la variance totale égale à 0.018 Caractéristiques des points colonnes attitude lectorielle Score dans la dimension Masse 1 Inertie Contribution De point à inertie de dimension 2 1 2 De dimension à inertie de point 1 2 lecture différée ,153 -,538 ,344 ,006 ,348 ,499 ,895 ,105 feuilleté ,603 -,092 -,147 ,001 ,040 ,357 ,579 ,421 lecture immédiate ,244 ,565 ,147 ,010 ,612 ,144 ,981 ,019 ,018 1,000 1,000 Total actif 1,000 Caractéristiques des points lignes mode d'achat Masse Score dans la dimension 1 Inertie Contribution De point à inertie de dimension 2 1 2 De dimension à inertie de point 1 2 abonnement postal ,145 -,802 -,004 ,012 ,732 ,000 1,000 ,000 portage ,552 ,046 -,082 ,000 ,009 ,102 ,520 ,480 dans la rue, vendeur ambulant ,171 ,421 -,105 ,004 ,237 ,052 ,983 ,017 kiosque ,132 ,144 ,482 ,001 ,022 ,846 ,237 ,763 ,018 1,000 1,000 Total actif 1,000 a Normalisation principale symétrique La consultation des deux tableaux précédents et en se basant sur les contributions et les coordonnées des points linges et des points colonnes par rapport aux deux axes factoriels nous permet de donner une interprétation de ces derniers. Les modalités ayant les contributions a u es e g as et ui so t sup ieu es à la o t i utio o e e so t elles a a t ise l’a e. Les oo do es se e t à p ise l’asso iatio ou l’oppositio des odalit s. 49 Axe 1 : Les odalit s a o e e t postal et le tu e diff e ui s’asso ie t e s'opposa t au lecture immédiate et achat dans la rue ou vendeur ambulant. odalit s Axe 2 : La modalité Kiosque est celle qui contribue le plus à la fo atio de et a e et dans une moindre mesure on trouve la lecture différée et feulletée. 0,5 . % et d’aut e pa t kiosque Dimension 2 0,4 lecture différée 0,3 0,2 lecture immédiate 0,1 0,0 abonnement postal -0,1 dans la rue, vendeur portage -0,2 -0,9 -0,6 -0,3 0,0 0,3 0,6 Dimension 1 Pour conclure nous pouvons dire en se référant au plan factoriel ci-dessus que la liberté ou la d isio d’a hat d’u jou al favorise une lecture immédiate. Par contre le portage donne une le tu e feuillet e et l’a o e e t postal u e le tu e diff e. 2. Analyse factorielle des correspondances multiples L’a al se fa to ielle des o espo da es ultiples (AFCM) pe et d’a al se un tableau de variables nominales observées par une population de n individus. Ce tableau binaire est appelé tableau disjonctif complet. p m Soient X1 ,….Xm m variables qualitatives , chaque variable Xj po ssède pj modalités avec p= j1 j le nombre total de modalités qui correspond au nombre de colonnes du tableau X étudié. Soit xijl le terme général de ce tableau : 50 xijl = si l’i di idu i opte pou la odalit l de la a ia le Xj et 0 sinon. Le tableau X est tel que la so e de ha ue lig e est gale à et la so e d’u e olo e jl ou l est la modalité de la variable Xj est égale à njl ui est le le o e d’i di idu ui o t hoisi la odalit l de la variable Xj . n jl n est la fréquence de la modalité l de la variable Xj . O d fi it ais e t de la e faço ue da s le d’u e AFC si ple les p ofils lig es et les p ofils colonnes et on montre (Saporta 1990)que la variance totale du nuage des points lignes ou des points colonnes est égale à : I( N(I), f J ) p 1 m L’i te p tatio des a es fa to iels se fait de la e faço u’u e AFC si ple et elle est as e su les mêmes paramètres (poids, coordonnées, contributions et qualité de représentation). Application : Etudes de cas Etude du comportement de l’i vestisseu tu isie à la BVMT ( [email protected]). Lo s de l’i t odu tio e ou se pa off e publique de vente (OPV), une étude a été élaborée par enquête auprès des investisseurs sur leurs comportements après l’eupho ie u’a connu la bourse tunisienne à la fin des années 90 et les augmentations anormales de certaines valeurs. Les résultats de cette étude sont su le site du Conseil du Marché tunisien dans la rubrique « Etude » . 51 IV. La classification. Le but des méthodes de classification est de construire une partition ou une suite de partitions emboîtées d’u e se le d’o jets do t o o aît les dista es deu à deu . Les lasses fo es doivent être les plus homogènes possibles. Les méthodes de partitionnement sont : - La classification hiérarchique ascendante (CAH). - Les méthodes du type « nuées dynamiques ». - Les cartes de Kohenen (Approche neuronale). 1. La classification CAH. La classification hiérarchique est autre manière de résumer les données elle consiste à construire une typologie ou partition des individus en classes homogènes. Soit la t pologie d’u e populatio E de taille e k lasse d’effe tifs 1 , …., k . Notons par G1 , …, Gk cette typologie du nuage de points N(x1 ,… n ) et g ,….,gk les centres de ces cklasses. L’i e tie du uage N ou la a ia e totale se d o pose ai si : nd k I(N,g) = i 1 ni (g i , g ) k 2 i 1 ni I(G i , g i ) = variance inter classe + variance intra classes. n L’i e tie i te lasses pe et de esu e la a i e do t les lasses s’ loig ent les unes des autres, notée I(G1, …,Gk et ep se te l’i e tie e pli u e pa la t pologie. L’i e tie i t a classe qui est la moyenne des variances des classes, mesure leur homogénéité. Co st u tio d’u e t pologie selo le it e de Wa d. On agrège les individus qui fo t le oi s a ie l’i e tie i te lasses. E d’aut es te es, o he he à o te i à ha ue pas u i i u lo al de l’i e tie i t a lasse ou u a i u de l’i e tie i ter classes. Lo s u’o e pla e deu lasses Gi et Gj de la typologie G1,….Gk par la réunion Gi UGj il y a u e di i utio de l’i e tie i te lasses ot e pa D Gi ,Gj ) et égale à : D(G i , G j ) Sachant que g ij nj ni n j 2 nin j ni 2 d ( g i , g ) d 2 (g j , g ) d (g ij g) d 2 (g i , g j ). n n n n (n i n j ) n i g i n jg j ni n j . Ce critère est utilisé pour mesurer la distance entre deux classe Gi et Gj et s’appelle le it e d’ag gatio de WARD. 52 Algorithme Itératif de la CAH. La CAH est desti e à u e populatio de taille li it e < ta t do le o e d’op atio s effe tu pa l’algo ith e ie u& la p e i e tape ui o siste à o pa e les distances deux à deux entre tous les individus. Etape 1 : elle consiste à partir de la population entière comme seule et unique classe. Chaque individu constitue un singleton. On compare les distances deux à deux de ces classes et on regroupe les deux classes Gi et Gj correspondant à la distance minimale et dont les profils se ressemble le plus . L’i e tie totale à ette tape est do gale à l’i e tie i te lasses. Etape 2 : Deux individus sont donc agrégé et constitue une classe notée Gij de centre gij . Cette étape consiste à comparer les distances qui séparent le centre gij aux n- i di idus esta ts, l’i di idu le plus proche y sera agrégé. . . Etape finale : Il ’ a u’u e seule lasse ui eg oupe toute la populatio . L’i e tie i te lasse est donc nulle, la somme des pe tes d’i e tie i te lasse des diff e tes tapes de l’algo ith e est do gale à l’i e tie totale. Les diff e tes tapes de l’algo ith e o stitue t u e hi a hie as e da te et u de d og a e est ainsi mis en place. A ha ue tape o al ule u i di e o te u e di isa t la pe te d’i e tie i te lasse pa l’i e tie totale. O etie t la t pologie correspondant à une augmentation brutale de l’i di e ou à la valeur maximale de 1 nk où T est la variance intra classe et k le nombre d T k 1 classes. 2. Méthode des k-means. Cette méthode développée par Edwin Diday consiste à partir d’u e populatio de choisir arbitrairement k points selon la représentation graphique du nuage de points. i di idus de Ces k points définissent k voisinages V1 ,…Vk . Soient c1 ,… k les centres respectifs de ces voisinages qui diffèrent forcément avec les k points choisis arbitrairement. Une procédure itérative basée sur la minimisation de la variance intra classes ou sur la minimisation des différences entre les coordonnées des centres des classes obtenus à chaque étape itérative pe et d’a outi à u e typologie optimale. Algorithme de k-meanss Etape 1 : k points sont choisis arbitrairement qui correspondent à k voisinages ou groupes V11 ,…Vk1 de centres respectifs c11 ,… k1 . 53 Etape 2 : à ces centres c11 ,… nouveaux centres c12 ,…. k2 . 1 k correspondent k nouveaux voisinages V12 , …Vk2 qui donnent k . . Etape finale : La pa titio fi ale d’o d e p ui est opti ale vérifié la nullité des différences des oo do es des e t es des lasses o te ues à l’ tape p et à l’ tape p de te p-1. La méthode des k-meanss p se te l’i o ie t de l’absence d’u i it de la t pologie ete ue. E effet le choix arbitraire des centres initiaux des classes a une influence sur la typologie retenue. La méthode des nuées dynamiques est une extension de la méthode précédente. Cette méthode consiste à considérer un noyau des points les plus centraux ou un axe factoriel ou encore un plan factoriel La méthode des nuées dynamiques exige un nombre de classe que l’o doit fi e d’a a e contrairement à la méthode da la classification ascendante hiérarchique qui propose une typologie selon le critère de Ward par exemple. 3. Application. Utilisation de SPSS. 3.1 Gestion financière des communes. Dans la rubrique « Analyse » on accède à la fonction « Classify » et on choisit la méthode des kmeans. 54 On sélectionne les trois facteurs arrêtés dans l’analyse en composante principale afin de déterminer la typologie idéale. Nous pouvons effectuer l’analyse typologique sur les variables initiales au lieu des composantes qu’il faut choisir minutieusement. Comme nous l’avons signalé auparavant, un nombre de classe est demandé au départ ( dans ce cas c’est 4) ainsi qu’un nombre d’itérations de l’algorithme qu’il faut prendre assez grand. On cliquant sur « save » , ceci nous permet de sauvegarder l’appartenance de chaque commune à la classe à la quelle elle est affectée sous forme d’une variable codée de 1 à 4. L’option « statistics » permet de fournir les coordonnées des centres initiaux des classes ainsi que les coordonnées finales. 55 a Iteration History Initial Cluster Centers Change in Cluster Centers Cluster 1 2 3 Iteration 4 1 2 3 4 Budget -,16992 3,36705 -,65463 -1,30973 1 1,748 2,296 2,022 2,003 Commodités 4,10655 1,02667 -,51751 -1,10516 2 ,206 ,160 ,164 ,049 Endettement -,61970 ,44987 3,72735 -2,06845 3 ,000 ,057 ,100 ,035 4 ,000 ,035 ,036 ,023 5 ,000 ,000 ,000 ,000 a. Convergence achieved due to no or small change in cluster centers. The maximum absolute coordinate change for any center is ,000. The current iteration is 5. The minimum distance between initial centers is 4,810. Cinq itérations ont permis à l’algorithme de converger selon le critère mentionné auparavant et au bas du tableau des itérations. Distances between Final Cluster Centers Final Cluster Centers Cluster Cluster 1 2 3 4 1 1 2 2,753 Budget -,11650 1,26725 -,45117 -,42797 2 2,753 Commodités 2,21214 -,14783 -,19467 -,34965 3 2,989 2,238 Endettement -,24270 ,06419 1,49737 -,54922 4 2,599 1,814 3 4 2,989 2,599 2,238 1,814 2,053 2,053 ANOVA Cluster Mean Square Error df Mean Square df F Sig. Budget 31,384 3 ,502 183 62,532 ,000 Commodités 37,001 3 ,410 183 90,284 ,000 Endettement 34,813 3 ,446 183 78,108 ,000 The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the differences among cases in different clusters. The observed significance levels are not corrected for this and thus cannot be interpreted as tests of the hypothesis that the cluster means are equal. 56 Une analyse de la variance en option dont la variable explicative ou facteur est l’appartenance de la commune à la classe et la variable à expliquer est la composante ou l’indicateur synthétique. Les trois ANOVA sont significatives (sig=0). C'est-à-dire les trois indicateurs séparent significativement les communes en quatre classes. Les commodités séparent le mieux les quatre classes (Fisher le plus élevé : 90.284). Les caractéristiques des classes seront précisées dans le chapitre suivant. Number of Cases in each Cluster Cluster Valid 1 20,000 2 44,000 3 34,000 4 89,000 187,000 Missing . T pologie des lie ts d’u e Ba ue. Une banque a élaboré une étude visant à mieux connaître la situation et le comportement de sa clientèle. Elle souhaite notamment définir des types homogènes de clients afin de pouvoir entreprendre des politiques différenciées pour chacun d’eux et aussi mettre en place un outil d’aide à la décision pour l’octroi des crédits. La banque a utilisé pour cela les données figurant dans les fichiers de gestion. Elle a constitué un échantillon de cinquante titulaires d’un compte courant appartenant à des ménages distincts. Onze variables quantitatives exprimant le comportement bancaire et deux autres informations relatives à leur situation sociodémographique ont été arrêtées. 13 VARIABLES ACTIVES _____________________________________________________________ V1 : solde moyen V2 : montant moyen des chèques tirés V3 : nombre de mois avec découvert V4 : montant cumulé des découverts V5 : nombre de produits de la banque utilisés V6 : nombre d’emprunts divers effectués V7 : montant total des emprunts effectués V8 : variation des dépôts (en %) V9 : montant total des dépôts V10: montant total des retraits V11: variation des retraits (en %) V12: taille du ménage du client V13: âge du client _______________________________________________________________ 57 L’ACP appli u e au t eize a ia les a permis de mettre en place deux indicateurs synthétiques (voir tableau des corrélations) à savoir le comportement (client actif ou passif) et la situation financière. -------------------------------------------------------------------------VARIABLES | CORRELATIONS VARIABLE-FACTEUR --------------------------------------------------------------------------VARIABLES ACTIVES | 1 2 3 4 5 --------------------------------------------------------------------------V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 | | | | | | | | | | | | | -.69 -.54 .74 .61 -.45 -.11 -.15 -.77 -.78 -.13 .37 -.49 -.54 .35 -.04 .18 .01 -.77 -.55 -.92 .30 .44 -.87 -.34 .01 -.24 -.36 -.17 -.46 -.62 -.24 .01 -.21 -.32 -.28 -.18 .10 .28 .27 -.01 .44 .27 .14 -.04 .52 -.09 -.22 -.15 -.19 -.31 .50 -.01 .14 .46 -.04 .10 -.01 -.37 .04 -.10 -.04 -.06 .68 .32 -.12 Une typologie en trois classes est obtenue selon le critère de Ward. On constate dans la description suivante des classes formées la variation utale de l’i di e ui est passé de 1.2 à 2.54797. La oupu e de l’a e se fait au i eau de la lasse e ui do e la d o positio e t ois lasses 95, 96,97. CLASSIFICATION HIERARCHIQUE : DESCRIPTION DES NOEUDS HISTOGRAMME DES INDICES DE NIVEAU NUM. AINE BENJ EFF. POIDS INDICE 51 7 3 2 2.00 .00534 * . . . 85 48 81 5 5.00 .13267 **** 86 69 80 6 6.00 .17360 ***** 87 10 86 7 7.00 .19986 ****** 88 49 44 2 2.00 .19998 ****** 89 11 82 9 9.00 .23276 ******* 90 84 88 11 11.00 .25713 ******* 91 89 76 14 14.00 .28332 ******** 92 85 57 7 7.00 .29194 ******** 93 77 75 8 8.00 .41804 ************ 94 92 93 15 15.00 .59377 **************** 95 90 83 13 13.00 .64597 ****************** 96 91 46 15 15.00 .79515 ********************** 97 94 87 22 22.00 1.20079 ****************************** --------------------------------------------------------------------------98 96 97 37 37.00 2.54797 ******************************** 99 95 98 50 50.00 2.98148 ******************************** 58 IV. l’A al se fa to ielle dis i i a te. 1. Introduction. Le but des thodes dis i i a tes est de p di e u e a ia le ualitati e à k at go ies à l’aide de p variables explicatives généralement numériques. Soient P une population partitionnée en q g oupes à l’aide d’u e a ia le ualitati e Y, ha ue u it statisti ue est d ite pa p a ia les quantitatives X1, X2, ..., Xp. L’AFD pe et de alise les deu o je tifs sui a ts : - Le premier est de distinguer parmi les variables quantitatives celles qui séparent le mieux les groupes, de les comparer et de mettre en place des combinaisons linéaires de ses variables qui pe ette t la dis i i atio des g oupes. C’est l’aspe t des iptif de l’AFD. - Le second est d’affe te d’aut es u it s statisti ues au diff e ts g oupes selo o se atio s des diff e tes a ia les ua titati es. C’est l’aspe t d isio el de l’AFD. leu s L’a al se fa to ielle dis i i a te, o t ai e e t à l’A al se e o posa tes p i ipales et l’a al se factorielle des correspondances qui permettent la description des données, aboutit à une prise de décision selon une démarche statistique. Les do ai es d’appli atio de L’AFD so t o eu et se o fo de t a e eu de la e o aissa e des fo es. O utilise l’AFD o e outil d’aide à la d isio , pa e e ple e fi a e pou la détection de défaillance des entreprises [Bardos 97], ou pour évaluer le risque de crédit bancaire. En marketing elle permet par exemple, la prévision de la décision d’a hat d’u p oduit oi III . E milieu industriel cette technique peut être utilisée dans le domaine du contrôle de la qualité. Elle pe et aussi d’esti e les po ses a ua tes. 2. Présentation de la méthode. 2.1 Exemple A partir des valeurs prises par u i di idu pou a ia les ua titati es, il s’agit de d te laquelle des n classes de la variable qualitative il appartient. i e à Supposons que p =2 c'est-à-di e u’il a deu a ia les e pli ati es X1, X2 seulement et que q=2 c'està-dire que la variable qualitative ne possède que 2 classes. Ces données sont représentées sur le graphique suivant, les axes étant constitués par les variables quantitatives, les individus du premier groupe sont représentés par la lettre A, ceux du second groupe par la lettre B. X2 B3 B4 B1 B5 B6 A1 A2 A7 B2 A3 A4 X1 A5 a D 59 L’a e D dis i i e les deu g oupes. Il est do possi le d’affe te u ou el l e t a à l’u des deu g oupes e sa ha t sa oo do e su l’a e D. L’a e D est u e o i aiso li ai e des variables X1 et X2 appelé composante discriminante. Le p o l e de l’a al se dis i i a te est juste e t la o st u tio d’u e ou plusieu s combinaisons de variables permettant de discriminer les groupes, ces combinaisons linéaires sont appelées variables discriminantes. 2.2 Décomposition de la variance On note pour toute la population étudiée : n : la taille de la population p : le nombre de variables explicatives étudiées. q : le nombre de groupes ou encore le nombre de modalités de la variable à expliquer. mj :la moyenne de la variable Xj Vj :la variance de la variable Xj et pou ha ue g oupe k d’effe tif k k = ,… : mjk : la moyenne de la variable Xj dans le groupe k. vjk : la variance de variable Xj dans le groupe k. O a pou tout j = ,….p 1 q Vj n k (m m j ) n k v kj = Bj n k 1 1 k q 1 n k j Variance inter groupes ou between 2 + Wj Variance intra groupes ou within On défini de même la covariance entre les deux variables Xj et Xl : v( j , l ) q nk k 1 q k k [ ( )( _ ) ] (m j m j )(m kj ml ) x m x m ij j il l n n k 1 Gk k 1 Soit la matrice des covariances totales : V=B+W B : la matrice des covariances inter groupes. W : la matrice des covariances intra groupes. 60 En posant : x 11 m1 ...................................x 1p m p . .x i1 m1 ..........x ij m j .............x ip m p 1 R . n . . x m1 ...................................x np m p n1 it : V = R’R La matrice de varia e o a ia e totale s’ Et en posant : n1 (m 11 m 1 ) n nk S (m 1k m 1 ) n nq (m 1q m 1 ) n La nk k (m j m j ) n at i e de o a ia es i te g oupes s’ n1 (m 1p m p ) n nk k (m p m p ) n nq q (m p m p ) n it : B = S’ S. 3. Composantes discriminantes. Co e ous l’a o s sig al p de e t, l’id e est de o st uire des composantes discriminantes Z qui sont des combinaisons linéaires des variables explicatives X1,…..Xp .Soit la o posa te d’o d e l Z l = X =j Xj qui sépare le mieux les q classes associées aux modalités de la variable à expliquer Y . Cette combinaison linéaire de composantes j j=1,.., p devra être : de variance intra groupes minimum ce qui correspond à une homogénéité maximum des classes. - de variance inter groupes maximum ce qui signifie une séparation maximum des centres des classes. Pour cela on cherche la combinaison minimisant le rapport : - T ' W = variance intra de /variance inter de ' B ' (V B) ' V ' 1. ' B B 61 Ce qui revient à maximiser le rapport R () = ' B , donc à maximiser ’B sous la contrainte ’V=1. ' V R est une fonction homogène en, R() =R(c ), où c est constante quelconque. Soit à maximiser le Lagrangien : L = ’B -(’V-1). D’où : B = V ce qui implique (V-1B) = avec ’B =. Soit le premier vecteur propre de la matrice V-1B associée à la plus grande valeur propre 1 de V-1B. Ap s a oi t ou ette p e i e o i aiso li ai e u’o ote a 1 on pourra chercher une combinaison linéaire 2 non corrélée à 1 de variance 1 et de variance inter classes maximum. On it e le p o essus e he ha t à l’ tape t la o i aiso t non corrélée à 1,…... t-1 de variance 1 et de variance inter classes maximum, obtenus en calculant les vecteurs propres de V-1B associés aux valeurs propres 1, …t de V-1B, t est au plus égal à q-1 car le rang de la matrice de covariances inter groupes B est au plus égal à q-1. Avec : 1 >2 …> …>t et 0j j= ,…t. en effet : ' B ' (V W) 1 (’W0) = ' ' V V 1,…... t sont appelées combinaisons linéaires discriminantes. 4. Lie ave L’ACP Soit une combinaison linéaire discriminante. On pose U = V et on désigne par l’a e engendré par le vecteur U de norme 1 par la métrique V-1 et on a : (BV-1) U =B = V = U B étant la matrice associée aux centres gl l= ,… des classes Gl l= ,… , diago alise la at i e BV-1 ou V-1B revient à faire une analyse en composantes principales du nuage {gl l= ,… } affe t s des poids wl = {pj j Gl }= (nl /n généralement). 62 5. C it e d’affe tatio ou tape d isionnelle. Il s’agit de fai e le lasse e t d’u e o se atio ou i di idu da s l’u des g oupes à pa ti de la o aissa e des aleu s des a ia les e pli ati es. L’i di idu à lasse est suppos e t pa rapport au centre de gravité global des individus. L’affe tatio de se fait selo l’app o he g o t i ue : x est affecté au groupe pour lequel la distance entre x et le centre de gravité du groupe est la plus faible. D2(x,gk) = (x – gk)’ V-1 (x – gk) appelée distance de Mahalanobis ce qui revient à minimiser la quantité gk’ V-1 (gk – 2x). Remarque : Insuffisance du critère géométrique. groupe1 x groupe2 L’i di idu se ait affe t au g oupe selo le it e g o t i ue ie u’il soit g aphi ue e t plus proche du groupe 1. Ceci est dû à la différence des variances des deux groupes. 6. Aut es it es d’affe tatio . La métrique V-1 de l’AFD e t aî e de o euses e eu s de lasse e t puis ue l’ galit des matrices de variances covariances est rarement vérifiée en pratique. Elle ne tient pas compte en out e de la fo e des lasses, ais elle a l’a a tage de fa ilite les al uls. Pou e die à ette i suffisa e, l’id e est d’a o de da s le al ul des dista es au diff e ts g oupes des poids d’auta t plus forts que le groupe est fortement dispersé. Cela revient à munir ha ue g oupe d’u e t i ue d fi ie pa u e fo e uad ati ue d fi ie positi e. Soit la dista e d’u i di idu x au centre de la classe Gk définie par : Dk2(x,gk) = (x – gk)’ Qk (x – gk) avec : 63 Qk = [det Wk ]1/pWk-1 minimisant la moyenne des carrés des distances entre individus dans le groupe Gk , où Wk est la matrice des covariances intra classes pour le groupe Gk. 7. App o he a esie e d’affe tatio . Soient p1, p2,….pq les proportions des q groupes dans la population étudiée. La distribution de p o a ilit d’u i di idu do t le e teu d’o se atio = 1,…, p), est donnée pour chaque groupe j par la densité fj . O a d’ap s la fo ule de Ba es : P (G j / x ) p jf j (x) p f (x) q j1 la probabilité pour que x Gj . j j La gle a esie e o siste à affe te l’i di idu au g oupe ui a la p o a ilit à poste io i maximale, c'est-à-dire maximiser le terme pjfj . Il est do essai e d’esti e fj(x). 7.1 Estimation paramétrique. On suppose que le vecteur x N p ( j , j ) pour chaque groupe Gj . La loi normale multidimensionnelle est donnée par : f j (x) (2) p/2 1 1 exp[ ( x j )' j 1 ( x j )] 1/ 2 2 det( j ) donc maximiser pjfj(x) revient à minimiser le terme : (x j )' j 1 (x j ) 2 ln(p j ) ln(det j ) 7.1.1 Hétéroscédasticité. Dans le cas général, les matrices de covariances j so t diff e tes. Le it e d’affe tatio est alo s quadratique en x. Les probabilités pj so t suppos es o ues ais il est essai e d’esti e les moyennes j ainsi que les matrices de covariances j en maximisant la vraisemblance compte tenu de l’h poth se de o alit . Ce i o duit à esti e la o e e j* par gj le centre de la classe Gj et j par la matrice de covariances empiriques : S*j 1 (x i g j )(x i g j )' n j 1 iG j 7.1.2 Homoscédasticité. On suppose dans ce cas que les lois dans chaque groupe partagent la même structure de covariances j =. Le terme à maximiser devient : 64 ln( p j ) 1 ' 1 j j 'j 1 x 2 qui est linéaire en x . Les moyennes sont estimées comme précédemment, tandis que la matrice est estimée par la matrice de covariances intra classes empiriques : 1 q S (x i g j )(x i g j )' n q j1 iG j * Le it e s’ it alo s : 1 Max[ x ' 1 j 'j 1 j ln( p j )] 2 7.2 Estimation non paramétrique. O pa le d’esti atio fo tio elle lo s ue le o e de pa a t es à esti e est i fi i. O au a donc à estimer une fonction, par exemple la régression y=f(x) ou encore une densité de probabilité. Da s e as, au lieu de suppose u’o a affai e à u e de sit de t pe o u o ale do t o estime les paramètres, on cherche une estimation f de la densité f. Pour tout x de , f(x) est donc estimée par f (x). Cette app o he t s souple a l’a a tage de e pas essite d’h poth ses pa ti uli es su la loi, e e a he elle ’est appli a le u’a e des ha tillo s de g a de taille d’auta t plus ue le o e de dimension est grand. L’id e la plus atu elle o siste à esti e la de sit e u poi t e o pta t le o e d’o se atio s situ es da s u oisi age de su , on peut choisir un voisinage de la forme]x - hn/2 , x + hn/2[ où hn est u el st i te e t positif, e ui o duit à l’esti ateu : f n (x) Fn ( x h n / 2) Fn ( x h n / 2) hn Fn désigne la fonction de répartition empirique associée à un échantillon de taille n. Cette expression peut e o e s’ i e : 1 f n (x) nh n K( n i 1 x Xi ) hn où X1,…,Xn so t les a ia les al atoi es de l’ ha tillo . K est une fonction appelée <<noyau de convolution >> ou plus simplement <<noyau>> (kernels). Exemples : a. 1[-1/2 , 1/2] est un noyau de Parzen Rozenblatt positif cf[Bosq & Lecoutre 87]. 65 b. 1 2 e x 2 /2 est un noyau de Parzen Rozenblatt positif défini sur . Le hoi du o au se le t e gl pa u it e d’opti isatio oi Bos .E alit o peut être amené à envisage d’aut es o au pou des aiso s de lissage ou de fa ilit de al ul. La fo e du o au ’est pas t s d te i a te su la ualit de l’esti atio o t ai e e t à la aleu de h. Le choix de h est crucial pour la précision locale ou globale de fn . Si K est la densité de la loi normale réduite on a : s h n 1.059 1n/ 5 ; où sn est l’ a t t pe e pi i ue. n La méthode du noyau est utilisée pour calculer une estimation non paramétrique de chaque densité fl(x) qui sont alors des fonctions définies dans p. Le noyau K*doit donc être multidimensionnel : f l (x) 1 nlh p K iG l * ( x xi ). h Un noyau multidimensionnel peut être défini à partir de la densité usuelle de lois : multi normale Np(0,p) ou uniforme sur la sphère unité ou encore par produit de noyaux unidimensionnels : K(x ) p K*(x) = j1 j 8. Application : 66 8.1 Développement des communes tunisiennes à travers leurs gestions financières. La situation financière des communes tunisiennes demeure dans une large mesure tributaire de la qualité de gestion des ressources disponibles. Le développement des capacités locales, la ode isatio de la gestio fi a i e pa le e ou s au te h i ues d’ aluatio , d’a al se et de prospective sont des mesures de nature à permettre aux communes de rationaliser leurs choix budgétaire. Il s’agit à pa ti d’u ha tillo de o u es d fi ies pa atios fi a ie s et des i di ateu s de taille et d’a ti it de ett e e pla e u outil d’aide à la d isio afi d’opti ise l’aide fi a i e ou te h i ue des pou oi s pu li s. Cet outil est o te u e appli ua t l’a al se fa to ielle dis i i a te ui passe essai e e t pa u e ACP ui s th tise l’i fo atio e su a t les variables étudiées par les trois indicateurs synthétiques : - Budget - Commodités - Endettement Le positio e e t des o u es pa appo t à es t ois fa teu s et l’appli atio de la thode des nuées dynamiques, nous permettent de faire une typologie des communes en trois classes : - - - - Communes aisées (classe 1) : ce sont les communes à niveau de développement local app ia le et au essou es fi a i es le es. Il s’agit pou es o u es de ode ise leu s outils de gestio i te e, d’a lio e les se i es e dus au ito e s et s’o upe des aspects secondaires tels ue les p o l es d’e i o e e t, d’e ellisse e t et d’espa es verts. Communes en développement (classe 2) : ce sont les communes à niveau de développement local appréciable mais aux ressources financières insuffisantes. Ces communes dynamiques ne man ue t pas d’i itiati es ais ’o t pas les o e s de leu s a itio s. Il s’agit d’a lio e la pla ifi atio da s es o u es pou atio alise leu s d pe ses et éventuellement améliorer leurs ressources budgétaires. Co u es a ua t d’i itiati es lasse 3) : Ce sont des communes à faible niveau de développent local tout en enregistrant des ressources globalement moyennes et un faible endettement. Ces communes manquent de dynamisme dans la mesure où leur aisance fi a i e elati e ’est pas e ploit e à o es ie t. Pou es o u es il s’agit su tout d’u problème de gestion, une aide technique améliorerait la situation. Communes en difficulté (classe 4) : ce sont des communes à niveau de développement et de ressources faibles et un endettement élevé. Ce so t des o u es u’il faut impérativement aider tant au niveau financier (en augmentant leur quotte part du fond o u pou pe ett e u d eloppe e t sp ifi ue u’au i eau te h i ue. 67 La variable qualitative à expliquer est donc codée de 1 à , elle d sig e l’appa te a e ou l’affe tatio d’u e o u e à l’u e des lasses fo e. Cette affe tatio o stitue u e p ise de d isio pou les pou oi s pu li s afi de atio alise l’aide u’elle soit fi a i e ou te h i ue. L’a al se fa to ielle dis i i a te appli u e au si p e ie s fa teu s issus de l’ACP ous do résultats suivants : e les L’optio « statistics » permet de donner les différents paramètres de chaque variable ou facteur explicatif. 68 Tests d'égalité des moyennes des groupes Lambda de Wilks F ddl1 ddl2 Signification REGR factor score 1 for analysis 2 ,345 115,898 3 183 ,000 REGR factor score 2 for analysis 2 ,416 85,782 3 183 ,000 REGR factor score 3 for analysis 2 ,479 66,236 3 183 ,000 REGR factor score 4 for analysis 2 ,993 ,442 3 183 ,723 REGR factor score 5 for analysis 2 ,997 ,171 3 183 ,916 REGR factor score 6 for analysis 2 ,979 1,280 3 183 ,283 Nous constatons que seuls les trois indicateurs synthétiques à savoir le budget, les commodités et l’e dette e t ui so t sig ifi atifs da s la dis i i atio des lasses. Pour étudier le pouvoir discriminant des variables explicatives qui sont dans ce cas les facteurs o te us à pa ti d’u e ACP, le ta leau p de t ous p se te les pa a t es sui a ts : - - Le Fischer : F somme.des.carres. int er classes /( k 1) , les variables les plus somme.descarrés. int ra classes /( n k ) discriminantes correspondent aux valeurs de F les plus élevées. Le niveau de signification = p(F(q-1,n-q)F) nous permet de préciser quelles sont les variables significativement discriminantes. Le Lambda de Wilks :w =1-2 , plus ce paramètre est faible plus le pouvoir discriminant de la variable est fort. Le lambda de wilks peut être globale et concerne les fonctions discriminantes : (1 2m ) q 1 m 1 Ce paramètre nous permet d’étudier le pouvoir discriminant dans le cas d’une d’un modèle unique qui correspond à deux groupes . - Le rapport de corrélation :0 2 ( X j , Y ) var iance. int er classes 1 ; plus le rapport var iance.totale est proche de 1 plus le pouvoir discriminant la variable Xj est important. L’interprétation du pouvoir discriminant des fonctions ou des composantes discriminantes est basée sur les paramètres suivants : - Egalité des matrices de variances / covariances des q groupes : Test de Box. 69 H0 : les matrices de variances / covariances des q groupes sont égales, les groupes sont donc homogènes. H1 : Il existe au moins deux groupes pour lesquels les matrices de variances/ covariances ne sont pas égales, les groupes sont hétérogènes. Ce tes est basé sur le calcul da la statistique F pour fixé. La règle de décision consiste à rejeter H0 si la signification p(F) < . - Qualité des fonctions discriminantes ou capacité à différencier entre les groupes : λi /λi est le % de la variance expliquée par la ieme composante discriminante. λi / Vi est la corrélation canonique. Indicateur statistique pour mesurer la relation de la variable à expliquer et les variables explicatives : ΛG =det(W)/ det(V), mesure la relation au niveau global (tous les facteurs). - Si le nombre de classes k est égal à 2 ou3, le lambda suit une distribution en F (Rao.1973), ce qui permet de mesurer la signification : Dans la cas de deux classe on a F(d1 , d2 ) avec d1 =p et d2 = n-p-1. Dans le cas de 3 classes d1 =2q et d2 = 2n-2p-4(ou n-3 si p=1). Dans les autres cas il est nécessaire de passer par une approximation donc par une fonction de ΛG. Soit le V de Bartlett qui suit une distribution de khi-deux à p(q-1) ddl V = -[ n-1 + ½(p+q)]log(ΛG ) q étant le nombre de groupes Ce test p se te l’a a tage de pou oi séparément. - ifie la elatio au i eau glo al puis pou Significatio statisti ue des a es dis i i a ts afi décrire les différences entre les groupes. de dui e l’espa e ha ue a e essai e pou Co t ai e e t à l’AFD à deu g oupes ou u seul test est e uis, da s l’AFD à g oupes plusieu s tests seront faits. Ces tests seront effectués en cascade, afin de déterminer le nombre de dimension selon lesquelles les groupes se différencient significativement. Le p e ie test po te su l’h poth se ulle d’ galit des e t oïdes, e ga da t toutes les fo tio s discriminantes. Les tests suivants portant sur la même hypothèse nulle en éliminant successivement la fonction F1 , F2 ,.., Fq-1 axes construits. Si p(khi-deux)< l’a e du i eau de la as ade se a ga d sinon supprimé. 70 Valeurs propres Résultats du test M de Box 50,675 Fonction F Approximativement Valeur propre % de la variance % cumulé Corrélation canonique 2,695 ddl1 18 ddl2 20347,890 Signification ,000 1 2,043(a) 45,6 45,6 ,819 2 1,456(a) 32,5 78,1 ,770 3 ,984(a) 21,9 100,0 ,704 . On rejette donc l’hypothèse d’égalité des matrices de covariances des quatre groupes constitués car la signification est nulle donc inférieur à n’importe quel risque fixé d’avance. T ois od les ou fo tio s dis i i a tes so t o st uites puis u’il e iste uat e g oupes de communes. Les trois modèles ont un pouvoir discriminants des groupes significatifs et détiennent respectivement 45.4, 32.5, 21.9% de la variance totale. Lambda de Wilks Test de la ou des fonctions Lambda de Wilks Khi-deux ddl Signification de 1 à 3 ,067 492,107 9 ,000 de 2 à 3 ,205 289,016 4 ,000 3 ,504 125,015 1 ,000 Les trois modèles (de 1 à 3) sont utiles dans cette analyse, ils correspondent à la valeur la plus basse du Lambda de Willks (0.067). Coefficients des fonctions discriminantes canoniques standardisées Fonction 1 2 3 REGR factor score 1 for analysis 2 ,947 -,286 ,183 REGR factor score 2 for analysis 2 ,248 ,918 ,323 REGR factor score 3 for analysis 2 -,377 -,304 ,885 71 Résultats du classement(b,c) Classe d'affectation (nuées dynamiques) Original Effectif % Validécroisé(a) Effectif % Classe(s) d'affectation prévue(s) 1 2 3 4 Total 1 32 0 1 0 33 2 0 17 1 0 18 3 0 0 51 5 56 4 0 0 0 80 80 1 97,0 ,0 3,0 ,0 100,0 2 ,0 94,4 5,6 ,0 100,0 3 ,0 ,0 91,1 8,9 100,0 4 ,0 ,0 ,0 100,0 100,0 1 32 0 1 0 33 2 1 16 1 0 18 3 0 0 51 5 56 4 0 0 0 80 80 1 97,0 ,0 3,0 ,0 100,0 2 5,6 88,9 5,6 ,0 100,0 3 ,0 ,0 91,1 8,9 100,0 4 ,0 ,0 ,0 100,0 100,0 b 96,3% des observations originales classées correctement. c 95,7% des observations validées-croisées classées correctement. 72 Le pou e tage o se des o u es affe t es o e te e t da s la lasse d’o igi e est de 3. L’e eu de lasse e t o se e est de l’o dre de 3.7% qui correspond au pourcentage des o u es do t le g oupe p u e o espo d pas au g oupe o igi al. L’e eu elle o te ue pa la thode de la alidatio ois e est de l’o d e de . %. 8. La pe eptio de l’e seig e e t vi tuel. Cette étude ahie de t a au di ig s te te d’a al se les pe eptio s et les atte tes des tudia ts tunisiens vis-à- is de ette fo e d’e seig e e t alte ati e au thodes t aditio elles. Les résultats de ce travail font apparaître plusieurs dimensions dans la perception des étudiants. L’i te a tio appa aît o e ta t la di e sio la ieu o sid e pa les tudia ts. L’utilit de e t pe d’e seig e e t ie t e se o d lieu. D’aut e pa t, la aît ise de la te h ologie i fo ati ue représente un souci majeur pour les étudiants. La flexibilité est le concept le moins bien perçu, la gestio du te ps ’est pas ie o sid e pa les tudia ts. U e t pologie de la oti atio is-à-vis du e-Learning est proposée dans ce travail, de plus un indicateur de mesure de la motivation a été élaboré. Da s l’a al se des p ofils des tudia ts, des tests statisti ues test d’i d pe da e de khi deu , tests de comparaison des moyennes) ont montré que les variables ayant des relations significatives avec les dimensions de la pe eptio de l’e-enseignement sont les suivantes : - le statut des étudiants (travaille à plein temps, travaille à temps partiel, ne travaille pas). - la maîtrise de la technologie informatique. - le st le d’app e tissage. Nous allons étudier dans une première étape les relations entre les différentes variables du profil des étudiants. Dans une seconde étape, une analyse en composantes principales (ACP) nous a permis de o fi e les i di e sio s de la pe eptio de l’e seig e e t i tuel et de ett e e idence leur importance relative. Relatio e t e le st le d’app e tissage et l’e ploi. emploi 150 oui Effectifs non 100 50 0 1 2 Style d'apprentissage Figure 1 : pa titio des tudia ts selo l’e ploi et le st le d’app e tissage virtuel, 2 : enseignement classique) : enseignement 73 Nous o stato s u’e i on la moitié des étudiants qui souhaitent opter pour un enseignement virtuel (voir Figure 1) comme complément et non comme substitut de formation, ne travaille pas. Ce sultat i atte du peut s’e pli ue pa l’i suffisa e de l’i f ast u tu e u i e sitai e tunisienne et l’i suffisa e de l’e ad e e t telles ue pe çues pa les tudia ts. La fo e a tuelle de l’e seig e e t sup ieu a pou o jet de po d e au i ui tudes des tudia ts, de les oti e et de les responsabiliser efficacement. Par ailleurs une partie des étudiants qui occupent un emploi désire suivre un enseignement classique malgré tous les inconvénients que cela représente. Ceci p o ie t aise la le e t d’u e o aissa e de l’e seig e e t i tuel do d’u e fia e à son égard. Une a pag e de se si ilisatio s’a e essai e afi de d stifie ette ou elle fo e d’e seig e e t. Relatio e t e le st le d’app e tissage et la Maîtrise de la technologie informatique style 1 2 Total aît ise de la te h ologie i fo ati ue. Total Pas du tout Un peu Presque 2 27 47 32 108 5 75 77 35 192 7 102 124 67 300 parfaite ment Tableau 1 : oise e t e t e le st le d’app e tissage et la te es d’effe tif aît ise de la te h ologie i fo ati ue e Il existe une relation significative entre la maîtrise de la technologie informatique et le style d’app e tissage. E effet, les tudia ts ui hoisisse t le st le d’e seig e e t i tuel d la e t aît ise o e a le e t l’outil i fo atique (73%). Inversement les étudiants qui choisissent le st le lassi ue, d la e t e pas aît ise l’outil i fo ati ue % . L’a lio atio de la fo atio en informatique représente une condition nécessaire pour motiver les étudiants et minimiser le taux d’a a do ui ep se te le p i ipal o sta le au su s de ette thode d’e seig e e t. Analyse en composantes principales. L’a al se e o posa tes p i ipales a pe is de o fi e les i di e sio s de la pe eptio de l’E.V ui e pli ue t % de la a ia e totale et de ett e e e e gue l’i te a tio et l’utilit pe çue ai si ue la aît ise de l’outil i fo ati ue. E effet, l’i te a tio est le o ept le plus important aux yeux des étudiants (32% de la variance totale expliquée). Cet échange entre enseignants et étudiants et entre les étudiants eux-mêmes est considéré comme primordial par ces 74 de ie s. C’est u aspe t t s i po ta t du o po te e t des tudia ts ui peut s’e pli ue pa la spécificité de la culture tunisienne ui a o de u e g a de i po ta e à l’aspe t elatio el. Co e t ga a ti le su s et la p e it de l’e-enseignement sans compléter la dimension pédagogique par le facteur relationnel, le contact direct entre enseignant ou tuteur et apprenant ? Les étudia ts so t o s ie ts de l’utilit . % de la a ia e totale e pli u e de ette fo e d’e seig e e t ais ils i siste t fo te e t su le a ue de o e s et de fo atio su le pla te h ologi ue. Il e peut a oi d’utilit sa s u e aît ise o e a le de l’outil i fo ati ue . % . La uat i e di e sio est l’e gage e t . % .La i ui e et de i e di e sio de la pe eptio de l’e-e seig e e t est la fle i ilit . % , les tudia ts se le t glige l’i po ta e de la gestion du temps. Ceci est vraisemblablement dû à une conjoncture économique difficile où les jeunes sont inquiets pour leur avenir. Des tests statistiques de comparaison des moyennes ont montré des relations significatives α< . e t e d’u e pa t le p ofil des tudia ts ep se t pa l’e ploi, l’utilisatio et la aît ise de la te h ologie i fo ati ue, l’a s et la dispo i ilit de l’outil i fo ati ue et d’aut e pa t l’utilit perçue et l’e gage e t da s ette oie d’a e i . Ceci contredit le résultat annoncé par Ethier et Pa et ui a a e t ue les di e sio s du p ofil de l’ tudia t a adie tudia t à te ps partiel, âgé de moins de 35 ans et occupant un emploi à temps plein) ne contribuent pas à expliquer so i t t glo al pou l’e seig e e t. Les deu auteu s ajoute t ue les pe eptio s de l’ tudia t canadien vis-à-vis des quatre concepts : interaction, flexibilité, utilité et utilisation de la technologie i fo ati ue e pli ue t d’u e a i e sig ifi ati e R2 =0.76) son intérêt global pour l’e seig e e t i tuel. Cette elatio sig ifi ati e ’est pas ifi e da s ot e tude R2 =0.27). Ceci peut s’e pli ue pa les diff e es de pe eptio e t e les tudia ts a adie s et les tudia ts tunisiens puisque les méthodologies suivies sont semblables. Les diff e tes fo es de l’i t t à l’e-enseignement. L’i t t est g ale e t d fi i o e u e atte tio fa o a le à uel u’u ou à uel ue hose. D’ap s Ethie et Pa et , ette atte tio fa o a le se di ise e uat e i eau d’i t t ui so t l’intérêt nul, théorique, pratique et exclusif. L’i t t e lusif ’a pas t e p i pa les tudia ts da s ot e tude ui a fait appa aît e u e autre forme : l’i t t if. Ce i est dû o e ous l’a o s e tio p de e t à la fia e des étudiants tu isie s à s’e gage totale e t da s l’a e tu e i tuelle. A pa ti du positio e e t des tudia ts pa appo t à l’utilit pe çue et à l’e gage e t fa teu s issus de l’a al se e o posa tes p i ipales ous et ou o s les uat e fo es de l’i t t à l’e-enseignement : L’i t t vif : ep se t pa les tudia ts ui t oig e t d’u e utilit pe çue et d’u e gage e t le s sa s a a do e o pl te e t l’e seig e e t lassi ue (groupe 1 dans la figure 2). - L’i t t théorique : représenté par les étudia ts a a t pe çu u e g a de utilit pou l’ee seig e e t ais ui h site t ou ui o t peu de s’e gage pa o aissa e ou pa manque de moyens (groupe 2 dans la figure 2). Ces deux cas de figure représentent pour les décideurs des clients potentiels u’il faut o u i e répondant à leurs préoccupations. - 75 L’i t t nul : ep se t pa les tudia ts ui ’ p ou e t au u i t t pou ette fo e d’e seig e e t g oupe da s la figu e . L’i t t pratique : ep se t pa les tudia ts ui so t p ts à s’e gage da s l’a e tu e i tuelle de l’e seig e e t ou l’a e tu e de l’e seig e e t i tuel sa s e oi l’utilit peutt e pa e u’ils ’o t pas le hoi , pa e e ple : les étudiants pour lesquels un cours présentiel est impossible à suivre (groupe 3 dans la figure 2). - Re a uo s l’ho og it des tudia ts a a t u e pe eptio positi e de l’utilit a e ho izo tal positif o t ai e e t à eu ui o t u e pe eptio gati e de l’utilit ui so t ettement plus dispersés (voir figure 2). 4 Intérêt global ou engagement 3 G1 2 G3 1 0 -1 -2 G4 G2 -3 -4 -2 0 Utilité perçue Figure 2 : Positio 2 4 de l'e-enseignement e e t des tudia ts pa appo t à l’utilit pe çue et à l’e gage e t. Mise e pla e d’u i di e de esu e de la otivatio pou l’e-enseignement. La de a de de espo sa ilisatio , d’i pli atio et d’i estisse e t des ito e s e g al et des tudia ts e pa ti ulie da s la fo atio et da s le t a ail de ie t i lu ta le, u l’i po ta e des e jeu o o i ues, so iau , et p dagogi ues ui l’a o pag e t. Ce i e d essai e l’ aluation de la oti atio des adultes à s’e gage da s la fo atio et da s l’a tio . C’est à la ha ilitatio de la notion de motivation, reconstruite à partir des comportements cognitifs des apprenants que nous devons concentrer tous nos efforts afin de maximiser les chances de réussite de cette méthode d’e seig e e t. Pour Claude Levy-Leboyer(1999), la motivation ne se limite pas à de simples recettes, elle se gère, se construit en permanence à partir de multiples stratégies. La motivation est un processus dynamique, e fo tio de t aits de pe so alit o e de fa teu s de l’e i o e e t, elle est o ple e da s ses a is es. C’est u p o essus ui i pli ue l’i di idu da s l’a tio et ui essite des effo ts pou attei d e l’o je tif. 76 La description synthétique du processus de motivation permet le repérage de quelques leviers ajeu s pou l’a o pag e e t p dagogi ue du fo ateu . Dans notre étude, le positionnement des étudiants (Figure 2) par rapport aux deux facteurs issus de l’a al se e o posa tes p i ipales utilit pe çue de l’e seig e e t i tuel et i t t glo al ou engagement qui sont à notre sens les fondements de leur motivation) fait apparaître quatre formes de la motivation : la motivation volontaire (engagement) qui correspond aux étudiants du groupe 1 (G1) ayant un e gage e t positif et u e pe eptio positi e de l’utilit de l’e seig e e t i tuel. - La motivation contrainte (par manque de conviction) qui correspond aux étudiants du groupe 3 (G3) ayant des contraintes qui peuvent êt e fa iliales, te po elles, spatiales,…. ais ui ’ a e t pas de l’e plo a ilit , puis ue ot e tude fait appa aît e ue la oti atio pe çue est i d pe da te de l’e ploi. - La motivation nulle (absence de motivation) qui correspond aux étudiants du groupe 4 (G4) qui sont désintéressés vis-à- is de ette ou elle fo e d’e seig e e t. - La motivation conditionnelle qui correspond aux étudiants du groupe 2 (G2) ayant une pe eptio positi e de l’e-enseignement mais un engagement incertain expliqué par une fo atio i o pl te e i fo ati ue, l’a se e de o e s te h i ues et la ulga isatio i suffisa te de l’i fo atio elati e à l’e seig e e t i tuel. Noto s l’e iste e d’u e elatio sig ifi ati e khi deu = . , sig ifi atio = . e t e la moti atio pe çue d fi ie plus haut et le st le d’app e tissage p f des tudia ts ue ous définissons par la motivation déclarée. - Scores discriminants de la motivation U i di e de la oti atio est p opos à pa ti d’u e a al se fa to ielle discriminante, où la variable à expliquer est la motivation perçue, ayant donc quatre modalités et les variables explicatives les plus significatives qui sont : l’utilit pe çue, l’e gage e t, l’i te a tio , la aît ise de la te h ologie informatique, l’a essi ilit à u o di ateu , et la dispo i ilit d’u o di ateu . Les sultats de l’a al se dis i i a te fo t appa aît e t ois od les ou fo tio s dis i i a tes sta da dis es. Nous retiendrons les deux premières qui sont les plus significatives (voir tableau 2), l’e eu elle d’affe tatio o te ue pa alidatio ois e est gale à %. Fonction Variance expliquée % de la variance % cumulé Corrélation canonique 1 2,582 58,8 58,8 ,849 2 1,782 40,6 99,4 ,800 3 ,025 ,6 100,0 ,155 Tableau 2 : Variances expliquées par les fonctions discriminantes. F1 = 0.728 utilité +0.752 engagement + 0.177 accessibilité +0.012 maîtrise de la technologie informatique -0.101 interaction. F2 = -0.698 utilité +0.667 engagement + 0.156 accessibilité - 0.148 maîtrise de la technologie informatique +0.222 interaction. 77 La Figure 3 met en exergue le double indice obtenu par croisement des scores discriminants (valeurs des deux fonctions F1 et F2) pour chaque individu. Fonctions discriminantes canoniques motivation 8 1 2 6 3 4 Fonction 2 4 Barycentres 3 2 4 0 1 2 -2 -4 -6 -6 -4 -2 0 Fonction 1 2 4 Figure 3 : Scores discriminants de la motivation des étudiants. Les quatre formes de la motivation sont délimitées dans la Figure 3 par la première bissectrice F1 =F2 et la deuxième bissectrice F1 = -F2. La motivation volontaire (1) : F1< F2 et F1 > -F2. La motivation conditionnelle (2) : F1<F2 et F1 < -F2. La motivation contrainte (3) : F1 >F2 et F1 > -F2. La motivation nulle (4): F1 > F2 et F1 < -F2. La ise au poi t d’u si ple i di e de la oti atio essite a le eg oupe e t des lasses et et des classes 2 et 4, de façon à avoir seulement deux groupes : les étudiants motivés et les étudiants o oti s, e ui i pli ue pa o s ue t u e pe te d’i fo atio su le deg de oti atio , 78 exprimé par les étudiants. Une autre alternative consisterait à utiliser le modèle logistique multinomial emboîté (Dellagi 2007). 8.3 Crédit scoring. Da s le ad e d’u e tude au sei de la Ba ue de Tu isie, la te h i ue du dit s o i g a t appliquée afin de résoudre le problème de recouvrement des crédits à la consommation. Un échantillon de 150 clients de la banque à été utilisé et dix variables ont été observées. La a ia le à e pli ue ta t di hoto i ue Y= s’il s’agit d’u o lie t et Y= s’il s’agit d’u au ais lie t ui p se te u is ue de e ou e e t. Les sultats de l’a al se discriminante sont les suivants : Tests of Equality of Group Means Variables Wilks' Lambda ancienneté F df1 df2 Sig. 1,000 ,003 1 146 ,955 ,985 2,171 1 146 ,143 enfants 1,000 ,002 1 146 ,969 montant ,974 3,933 1 146 ,049 durée 1,000 ,071 1 146 ,791 crédits ,970 4,590 1 146 ,034 impayé ,847 26,413 1 146 ,000 encours ,991 3,339 1 146 ,049 salaire ,975 3,741 1 146 ,050 remboursement ,985 2,220 1 146 ,138 âge Summary of Canonical Discriminant Functions Eigenvalues Canonical Function 1 Eigenvalue ,316 % of Variance a Cumulative % 100,0 Correlation 100,0 ,590 a. First 1 canonical discriminant functions were used in the analysis. Un seul modèle discriminant est construit puisqu’il correspond à deux groupes de clients. Wilks' Lambda Test of Function(s) 1 Wilks' Lambda Chi-square ,597 38,748 df Sig. 10 ,000 79 Le modèle construit est significatif mais peu efficace (corrélation canonique peu élevée :0.59 , Lambda de Wilks relativement élevée :0.316). Standardized Canonical Classification Results Discriminant Function Predicted Group Coefficients Membership Function profil 1 ancienneté âge Original Count ,527 -,360 enfants ,233 montant -,560 durée ,168 crédits -,500 impayé ,766 encours -,156 salaire -,247 % Cross-validated Count % 1,00 2,00 Total 1,00 108 6 114 2,00 23 12 35 1,00 94,7 5,3 100,0 2,00 65,7 34,3 100,0 1,00 106 8 114 2,00 23 12 35 1,00 93,0 7,0 100,0 2,00 65,7 34,3 100,0 L’e eu elle du modèle est évaluée à (23+6)/149, soit 20.8% qui est relativement assez élevée. Ceci est du o e ous l’a o s sig al plus haut au a ue d’effi a it ou de o ustesse du od le. Les a ia les e pli ati es du od le e so t pas toutes sig ifi ati es, l’i t odu tio de a ia les qualitati es pou ait a lio e l’effi a it du od le et pa o s ue t i i ise l’e eu elle d’affe tatio d’u lie t da s la au aise catégorie. 80