Projection, Discrimination et Classification Analyse discriminante de

Projection, Discrimination et Classification
Massih-Réza Amini
Techniques d’Analyse de Données et Théorie de l’Information
Master M2 IAD – Parcours Recherche
http://www-connex.lip6.fr/~amini Laboratoire d’Informatique de Paris 6 2
Plan
Analyse Factorielle Discriminante de Fisher (AFD)
Régression linéaire au sens des moindre carrées
Analyse Discriminante Linéaire (ADL)
Lien entre AFD, ADL et RMC
Synthèse sur AFD, ADL, RMC et RL
Avantages et Inconvénients de ADL
Régression Logistique
Exemple d’application: la tâche de Recherche d’Information
Recherche avec un codage binaire,
Vers une meilleure représentation,
L’information de classe avec l’AF améliore encore la représentation
Laboratoire d’Informatique de Paris 6 3
Analyse discriminante de Fisher
Pb de dimensionnalité : beaucoup de méthodes / techniques (en classif.)
sont inappropriées ou inapplicables en grande dimension
On projette sur un sous-espace
Perte possible d’informations
Trouver la projection optimale à ce sens
w1
x2
w2
x2
Laboratoire d’Informatique de Paris 6 4
Critère d’optimisation :
Solution vérifie :
Solution
Analyse Discriminante de Fisher (2)
Laboratoire d’Informatique de Paris 6 5
Interprétation géométrique
La solution de la régression vérifie
La réponse du modèle, est la projection orthogonale de Ysur
l’espace des données.
(
)
(
)
0==Y
ˆ
YXB
ˆ
XYX tt
B
ˆ
x1
x2
Y
Y
ˆ
Y
ˆ
()
YXXXXB
ˆ
XY
ˆ
tt 1
==
Matrice de projection, vérifie la propriété d’idempotence
Laboratoire d’Informatique de Paris 6 6
Analyse Discriminante Linéaire
But : Discrimination
ADL dans le cas de populations normales avec une matrice de
covariance commune pour les différentes groupes
Règle de décision dans le cas bi-classe
x2
x1
p(c).p(x/c)
Laboratoire d’Informatique de Paris 6 7
Estimation des paramètres du modèle linéaire
On suppose que chaque exemple xiappartient à une et une seule
classe.
Critère d’optimisation : logarithme de la vraisemblance complète des
données (ou la vraisemblance classifiante)
Dans le cas normal les paramètres du modèle qui maximise ce critère
sont
Laboratoire d’Informatique de Paris 6 8
Lien entre AF, ADL et RMC
β
1
β
2
x1
x2
β
2
x
t.
β
2
+
β
O
= 0
x
t
.
β
2
+
γ
O
= 0
x1
β
2
Analyse Factorielle Discriminante
Projection
x1
x2
Analyse Linéaire Discriminante
Discrimination
Régression Linéaire au Moindre Carrées
x2
y
x1
Classification
Laboratoire d’Informatique de Paris 6 9
Lien entre AF, ADL et RMC
AFD RMC
Si n1et n2sont les cardinaux des 2 classes et que les désirées
sont codées par (-1)kn/nkpour, k{1,2}
Les paramètres βqui minimise EMC satisfont l’équation
ADL RMC
On remplace le problème d’inégalités dans le cas ADL
Par un problème d’égalités dans le cas RMC
()
12
1
12
21 )(. mmSmmnS
n
nn
SWBW =
+
ββ
Laboratoire d’Informatique de Paris 6 10
AF
β
μ2
μ1
AF, LDA et LSR sur un exemple jouet
RMC
RMC
ADL
ADL
AF, ADL et RMC
Laboratoire d’Informatique de Paris 6 11
Régression Logistique
On modélise le logarithme du rapport des densités conditionnelles de
classes par des fonctions linéaires. Pour le cas bi-classes :
Propriétés
Les probabilités a posteriori ont une forme simple (logistique)
Une grande variété de familles de distributions vérifient
l’hypothèse de départ.
Critère d’optimisation : vraisemblance classifiante
Laboratoire d’Informatique de Paris 6 12
Régression Logistique (2)
Critère d’optimisation équivalente (cas bi-classe)
Les dérivées partielles d’ordre 1 et 2 de Lcen fonction de Βsont :
Solution par approximation numérique et pas de solution exacte
Laboratoire d’Informatique de Paris 6 13
ADL
RMC
ADL, RMC et RL sur l’exemple jouet
ADL, RMC et RL ADL
RMC
RL
Laboratoire d’Informatique de Paris 6 14
RMC et RL : Deux régresseurs linéaires différentes
Régression Logistique
y
x1
x2
Régression Linéaire au Moindre Carrées
x2
y
x1
x
t
.
β
2
+
γ
O
= 0
x1
x
t
.
β
+
β
0
= 0
Laboratoire d’Informatique de Paris 6 15
RL ou ADL ?
Les densités gaussiennes avec une même matrice de covariance, vérifient l’hypothèse
des modèles logistiques.
Les probabilités a posteriori de classes dans les deux cas (RL et ADL) ont la même
forme logistique, mais les coefficients pour ces deux modèles sont estimés de façon
différents.
La régression logistique ne fait pas d’hypothèse sur la densité marginale des points X et trouve
les coefficients de p(C/ X) en maximisant la forme équivalent de la vraisemblance classifiante,
Lc,
Avec l’ADL, les paramètres du modèle sont estimées en maximisant la forme complète de la
vraisemblance classifiante. Ici, la densité marginale p(X) joue un rôle dans l’estimation de ces
paramètres.
Laboratoire d’Informatique de Paris 6 16
Analyse Discriminante Multiple
dàc-1 dimension avec cle nombre de classes
Généralisation de Fisher
wdevient une matrice W[ dx (c-1) ]
Différent de plusieurs AFD : optimisation globale
Laboratoire d’Informatique de Paris 6 17
Analyse Discriminante Multiple (2)
pàc-1 dimension avec cle nombre de classes
Généralisation de Fisher
wdevient une matrice W[px (c-1)]
Pour une population centrée
La matrice de dispersion inter-classe
variance des moyennes
La matrice de dispersion intra-classe
moyenne des variances
Laboratoire d’Informatique de Paris 6 18
Analyse Discriminante Multiple (3)
Critère : Chercher Wqui rend stationnaire est finie,
sous la contrainte
Laboratoire d’Informatique de Paris 6 19
Exemple d’application: Recherche de l’Information
Dictionnaire
+
+
: une
description de q
: une
description de di
Collection de documents
matching
Ce livre traite dans
une large mesure
des Hobbits et le
lecteur découvrira
dans ses pages
une bonne part de
leur caractères.
.
.
.
xl
histoire
traiter
caractère
mesure
lecteur
découvrir
.
.
.
Dictionnaire
di
xi
di
q
i,
i.e. .
Documents triés dans
l’ordre décroissant de
leur score
Laboratoire d’Informatique de Paris 6 20
18 documents codés sur un dictionnaire de 32 termes. Les documents sont
classés suivant trois catégories : Business Recession (classe A),
Tectonics (classe B) et Mental disorder (classe C).
Exemple Jouet
Classe A
Classe BClasse C
1 / 8 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !