Techniques d'Analyses Multidimensionnelles des Données

Telechargé par zoologiefpk

Téléchargement

Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 1

TECHNIQUES D’ANALYSES MULTIDIMENSIONNELLES DES DONNEES

Elaboré par : Hatem Dellagi

Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 2

I INTRODUCTION

II ANALYSE EN COMPOSANTES PRINCIPALES

III ANALYSE FACTORIELLE DES CORRESPONDANCES

IV LES METHODES DE CLASSIFICATION.

V L’ANALYSE FACTORIELLE DISCRIMINANTE.

I INTRODUCTION

Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 3

Les chapitres précédents ont exposé les phases qui conduisent aux traitements les plus usuels sur

une variable (analyse uni variée : tri à plat, étude de la distribution, tendance centrale et dispersion),

ou sur deux variables (analyse bi variée : ti ois, esue d’assoiatio ete deu aiales. Nous

constatons la limite de ces méthodes due aux caractères combinatoires des analyses possibles dès

que le nombre de variables est assez important. Il est donc essaie d’aoi eous à l’aalse

multi variée taiteet siulta d’u esele de aiales oe complément indispensable à

toute étude en général et en marketing plus particulièrement. Les méthodes multi variées peuvent

être classées selon trois groupes principaux :

- Les méthodes descriptives (analyse factorielle, typologie, analyse des correspondances, analyse

multidimensionnelle des similarités).

- Les méthodes explicatives (régression, analyse de la variance, analyse discriminante, analyse

conjointe).

- Les méthodes avancées (analyse canonique, modèles probabilistes : logit et probit, modèles log-

linéaires, modèles de causalité : analyse des structures de covariances, la régression PLS).

Depuis que la gestion de la relation client est devenu la locomotive des études de marché, les

tehiues d’aalse se sot lagies ; conséquences du fait que les machines de stockages et de

taiteets de l’ifoatio ot o seulement atteint un très haut niveau technologique mais ont

connu une large diffusion les mettant à la portée de très nombreuses organisations (Data Mining).

C’est la aiso pou lauelle les tehiues d’analyses sont appelées à un très grand développement.

II Analyse en composantes principales

L’aalse e oposates est l’ue des thodes d’aalse fatoielle des does

multidimensionnelles la plus ouate. L’aalse e oposates piipales ACP s’adesse au

données numériques quantitatives, elle a pour objectifs :

- Analyser les liaisons entre les variables ou critères étudiés et les synthétiser par un nombre

restreint de nouvelles variables appelées composantes ou facteurs, ou encore indicateurs

synthétiques qui ne sont autres que des combinaisons linéaires des variables initiales.

- Résumer les unités statistiques en formant des groupes homogènes.

O hehe à ette e idee les popits fodaetales des does à l’aide des paates

numériques et graphiques.

1. Données initiales

Ces does sot ostitues d’oseatios de plusieus gadeus, otes X1, X2,… Xp sur un

esele d’uits statistiues uots i=,…,n. Il est commode de présenter ces données sous

foe d’u taleau X dont les colonnes sont les variables Xj.

X1 ……. Xj …… Xp

Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 4

X =

Le terme générale xij du taleau X oespod à l’oseatio de la aiale Xj pa l’idividu i et le

vecteur xi = (xi1,….,ij,…ip ) est celui des observations des variables X1 , ….Xp par ce dernier . Si les

variables sont hétérogènes, elles seront centrées et réduites et on a le nouveau tableau Y de terme

générale :

ij = (xij - )/ Sj où Sj est l’at tpe de Xj

2. Présentation de la méthode.

2.1. Formulation du problème.

Le problème consiste à réduire les p variables initiales étudiées en un nombre restreint de nouvelles

variables appelées composantes ou facteurs Fk . Ces facteurs devront répondre aux deux critères

suivants :

- La linéarité :

- L’idpedae :

2.2. Notio d’ae fatoiel

A1 Δ1

B • A

L’ifoatio appote pa le poit A est égale à la distance qui le sépare du centre G de [AB].

L’ifoatio appote pa le poit A au facteur est égale à (GA1)2, de même celle apportée par le

point B est égale à (GB1)2, do l’ifoatio dteue pa Δ1 est égale à :

I Δ1) = GA1

2 + GB1

Plus généralement, soit N le nuage des points xi i=,….n, ayant pour centre de gravité G qui

est le point moyen = = ( 1 , 2 ,……, p ), muni de la métrique euclidienne.

La dispersion ou l’information ou encore l’inertie du nuage de points autour de leur

centre est définie par :

2 i, G) = ij - j )2

Dellagi Hatem. FSEGT. 2009-2010[Tapez un texte] Page 5

= j )2 =

où Sj 2 est la variance de la variable Xj .

Soit Δ un axer factoriel

• G

L’ietie du uage de poits N due à l’ae Δ est donnée par :

I (N, Δ) =

I (N, G) = , G) + I (N, Δ)

La quantité , G) est l’inertie ou la variance expliquée par l’axe Δ, elle est aussi

appelée valeur propre de la matrice de variance covariance et notée λ et on a :

I (N, G) = j = variance totale du nuage de points

2.3. Matrice de variances covariances

La matrice de variances covariance C a pour terme général :

)Xx)(Xx(

C'j

'ij

1i ij'jj  



Il représente la covariance entre les variables Xj et Xj’ . Si les variables sont centrées et réduites on

obtient alors la matrice des corrélations de terme général :

Rjj’ =

'ij

1^i j

)Xx(

1



La trace de la matrice des corrélations V est égale au nombre p de variables étudiées et on a :

trace (V)=

p)G,N(I

1j j





où λj est la aleu pope d’ode j de la atie V

2.4. Dfiitio de l’ACP.

L’aalse e oposates piipales est ue tehiue ui s’adesse au tableau de données

uatitaties et ui est la plus utilise, ’est la ase de toutes les thodes d’aalses factorielles.

Elle a pour but :

-Analyser les liens existants entre les variables observées.

1 / 80 100%

Documents connexes

L`impact d`une publicité presse

Epictète IIIème partie

Immortel Taoïste vs. Moine Zen: Illumination Spirituelle

Le Grand Prix de la Course de la Vie - Sathya Sai Baba

AD4SCREEN lance BACKINAPP La 1 Solution de

Ecoles de musique, Conservatoires

huppe

de 7 milliards de personnes, ce n`est pas facile. Avec le

UNIFR – département de mathématiques 22 Mars 2017

troisième CC, avec correction rapide

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Techniques d'Analyses Multidimensionnelles des Données

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Techniques d'Analyses Multidimensionnelles des Données

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib