TECHNIQUES DANALYSES MULTIDIMENSIONNELLE

Telechargé par zoologiefpk
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 1
TECHNIQUES D’ANALYSES MULTIDIMENSIONNELLES DES DONNEES
Elaboré par : Hatem Dellagi
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 2
I INTRODUCTION
II ANALYSE EN COMPOSANTES PRINCIPALES
III ANALYSE FACTORIELLE DES CORRESPONDANCES
IV LES METHODES DE CLASSIFICATION.
V L’ANALYSE FACTORIELLE DISCRIMINANTE.
I INTRODUCTION
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 3
Les chapitres précédents ont exposé les phases qui conduisent aux traitements les plus usuels sur
une variable (analyse uni variée : tri à plat, étude de la distribution, tendance centrale et dispersion),
ou sur deux variables (analyse bi variée : ti ois, esue d’assoiatio ete deu aiales. Nous
constatons la limite de ces méthodes due aux caractères combinatoires des analyses possibles dès
que le nombre de variables est assez important. Il est donc essaie d’aoi eous à l’aalse
multi variée taiteet siulta d’u esele de aiales oe complément indispensable à
toute étude en général et en marketing plus particulièrement. Les méthodes multi variées peuvent
être classées selon trois groupes principaux :
- Les méthodes descriptives (analyse factorielle, typologie, analyse des correspondances, analyse
multidimensionnelle des similarités).
- Les méthodes explicatives (régression, analyse de la variance, analyse discriminante, analyse
conjointe).
- Les méthodes avancées (analyse canonique, modèles probabilistes : logit et probit, modèles log-
linéaires, modèles de causalité : analyse des structures de covariances, la régression PLS).
Depuis que la gestion de la relation client est devenu la locomotive des études de marché, les
tehiues d’aalse se sot lagies ; conséquences du fait que les machines de stockages et de
taiteets de l’ifoatio ot o seulement atteint un très haut niveau technologique mais ont
connu une large diffusion les mettant à la portée de très nombreuses organisations (Data Mining).
C’est la aiso pou lauelle les tehiues d’analyses sont appelées à un très grand développement.
II Analyse en composantes principales
L’aalse e oposates est l’ue des thodes d’aalse fatoielle des does
multidimensionnelles la plus ouate. L’aalse e oposates piipales ACP s’adesse au
données numériques quantitatives, elle a pour objectifs :
- Analyser les liaisons entre les variables ou critères étudiés et les synthétiser par un nombre
restreint de nouvelles variables appelées composantes ou facteurs, ou encore indicateurs
synthétiques qui ne sont autres que des combinaisons linéaires des variables initiales.
- Résumer les unités statistiques en formant des groupes homogènes.
O hehe à ette e idee les popits fodaetales des does à l’aide des paates
numériques et graphiques.
1. Données initiales
Ces does sot ostitues d’oseatios de plusieus gadeus, otes X1, X2,… Xp sur un
esele d’uits statistiues uots i=,,n. Il est commode de présenter ces données sous
foe d’u taleau X dont les colonnes sont les variables Xj.
X1 ……. Xj …… Xp
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 4
X =
Le terme générale xij du taleau X oespod à l’oseatio de la aiale Xj pa l’idividu i et le
vecteur xi = (xi1,….,ij,…ip ) est celui des observations des variables X1 , ….Xp par ce dernier . Si les
variables sont hétérogènes, elles seront centrées et réduites et on a le nouveau tableau Y de terme
générale :
ij = (xij - )/ Sj Sj est l’at tpe de Xj
2. Présentation de la méthode.
2.1. Formulation du problème.
Le problème consiste à réduire les p variables initiales étudiées en un nombre restreint de nouvelles
variables appelées composantes ou facteurs Fk . Ces facteurs devront répondre aux deux critères
suivants :
- La linéarité :
- L’idpedae :
2.2. Notio d’ae fatoiel
A1 Δ1
B A
G
B1
L’ifoatio appote pa le poit A est égale à la distance qui le sépare du centre G de [AB].
L’ifoatio appote pa le poit A au facteur est égale à (GA1)2, de même celle apportée par le
point B est égale à (GB1)2, do l’ifoatio dteue pa Δ1 est égale à :
I Δ1) = GA1
2 + GB1
2
Plus généralement, soit N le nuage des points xi i=,….n, ayant pour centre de gravité G qui
est le point moyen = = ( 1 , 2 ,……, p ), muni de la métrique euclidienne.
La dispersion ou l’information ou encore l’inertie du nuage de points autour de leur
centre est définie par :
2 i, G) = ij - j )2
Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 5
= j )2 =
où Sj 2 est la variance de la variable Xj .
Soit Δ un axer factoriel
xi
G
Δ
i
L’ietie du uage de poits N due à l’ae Δ est donnée par :
I (N, Δ) =
I (N, G) = , G) + I (N, Δ)
La quantité , G) est l’inertie ou la variance expliquée par l’axe Δ, elle est aussi
appelée valeur propre de la matrice de variance covariance et notée λ et on a :
I (N, G) = j = variance totale du nuage de points
2.3. Matrice de variances covariances
La matrice de variances covariance C a pour terme général :
)Xx)(Xx(
n
1
C'j
'ij
j
n
1i ij'jj
Il représente la covariance entre les variables Xj et Xj’ . Si les variables sont centrées et réduites on
obtient alors la matrice des corrélations de terme général :
Rjj’ =
'j
'j
'ij
n
1^i j
j
ij
S
)Xx(
S
)Xx(
n
1
La trace de la matrice des corrélations V est égale au nombre p de variables étudiées et on a :
trace (V)=
p)G,N(I
p
1j j
λj est la aleu pope d’ode j de la atie V
2.4. Dfiitio de l’ACP.
L’aalse e oposates piipales est ue tehiue ui s’adesse au tableau de données
uatitaties et ui est la plus utilise, ’est la ase de toutes les thodes d’aalses factorielles.
Elle a pour but :
-Analyser les liens existants entre les variables observées.
1 / 80 100%

TECHNIQUES DANALYSES MULTIDIMENSIONNELLE

Telechargé par zoologiefpk
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !