Analyse discriminante

Téléchargement

Analyse et codage des

signaux

Mohamed CHETOUANI

[email protected]

Plan

• Composantes d’un système de reconnaissance des formes

• Méthodes statistiques pour la réduction de dimension

• Sélection de caractéristiques

• Techniques d’apprentissage

Plan

Composantes d’un système

Réduction d e dimension

Sélection de caractéristiques

Apprentissage

Système de reconnaissance des

formes

Définition générale:

A partir de mesures d’une forme inconnue, il s’agit de:

• Trouver une représentation pertinente de la forme

• Classer en catégorie

Plan

Composantes d’un

système

Réduction d e dimension

Sélection de caractéristiques

Apprentissage

Système de reconnaissance des

formes

• Capteur

• Pré-traitements

• Extraction de paramètres

• Algorithme de classification

• Mais également des données (étiquetées ou non)

Plan

Composantes d’un

système

Réduction d e dimension

Sélection de caractéristiques

Apprentissage

Terminologie

Caractéristiques, codes: ensemble de variables déterminé à partir de

propriétés de l’objet.

« Choisir » des caractéristiques discriminantes et indépendantes est

un point clé de tout problème de reconnaissance des formes.

Vecteur de caractéristique: Association de plusieurs caractéristiques.

Vecteur de dimension d représentant l’objet.

Plan

Composantes d’un

système

Réduction d e dimension

Sélection de caractéristiques

Apprentissage

Terminologie

Espace des caractéristiques: espace de dimension d

formé par l’ensemble des caractéristiques.

Espace 3D

Distribution des données dans

l’espace des caractéristiques

Plan

Composantes d’un

système

Réduction d e dimension

Sélection de caractéristiques

Apprentissage

Terminologie

Classe: Catégorie à laquelle appartient l’objet.

Forme: Ensemble des caractéristiques de l’objet traité.

Dans certains cas, on associe au vecteur caractéristique

la classe de l’objet.

Exemple: une des instances d’un même objet

⇒ Objet: lettre A

Variabilité entre

scripteurs

Exemple de l’objet « A »

Plan

Composantes d’un

système

Réduction d e dimension

Sélection de caractéristiques

Apprentissage

Terminologie

Frontière de décision:

Hyper-plan, fonction de dimension d permettant la séparation des

formes en différentes classes.

Plan

Composantes d’un

système

Réduction d e dimension

Sélection de caractéristiques

Apprentissage

Terminologie

Données/Base d’apprentissage: données utilisées pour

la conception du système de reconnaissance.

Ces données sont a priori étiquetées.

Données/Base de test: données utilisées pour

l’estimation des performances du système de

reconnaissance.

⇒ Utilisation industrielle: lecteur de chèques, code

postaux, biométrie …

Plan

Composantes d’un

système

Réduction d e dimension

Sélection de caractéristiques

Apprentissage

Problème de dimension des

vecteurs caractéristiques

Explosion du nombre et de la dimension des données…

Plan

Composantes d’un système

Réduction de dimension

Sélection de caractéristiques

Apprentissage

Problème de dimension des

vecteurs caractéristiques

Aspects pratiques:

Relation dimension des vecteurs caractéristiques /

performances du classifieur

Plan

Composantes d’un système

Réduction de dimension

Sélection de caractéristiques

Apprentissage

Rechercher une solution optimale

Problème de dimension des

vecteurs caractéristiques

Approches pour la réduction de dimension:

• extraction de caractéristiques: créer un sous-

ensemble de nouvelles caractéristiques par

combinaison des caractéristiques existantes

• sélection de caractéristiques: choisir un sous-

ensemble de caractéristiques pertinent

Plan

Composantes d’un système

Réduction de dimension

Sélection de caractéristiques

Apprentissage

Problème de dimension des

vecteurs caractéristiques

Formalisation du problème de la réduction de

dimension:

La réduction de dimension consiste à transformer le

vecteur le x (dimension N) en un vecteur y (dimension

M) avec M<N: y=f(x)

La fonction f réalise la réduction de dimension.

La réduction de dimension ne doit pas diminuer les

performances en classification.

Plan

Composantes d’un système

Réduction de dimension

Sélection de caractéristiques

Apprentissage

Problème de dimension des

vecteurs caractéristiques

Réduction de dimension par projection du vecteur

caractéristique:

y=f(x)=Wx

Projection (combinaison) linéaire ou non-linéaire,

séparation des classes (discriminantes).

Plan

Composantes d’un système

Réduction de dimension

Sélection de caractéristiques

Apprentissage

Stratégies de réduction de

dimension

Plan

Composantes d’un système

Réduction de dimension

Sélection de caractéristiques

Apprentissage

•La projection de données nécessite la minimisation d’un critère.

•Deux types de critères:

•Représentation du signal: Représenter

les données dans un espace de plus

petite dimension.

Analyse en Composantes

Principales

•Classification:

Projection dans un espace (de plus

petite dimension) qui maximise la

séparabilité des classes.

Analyse Discriminante

Données

Plan

Composantes d’un système

Réduction de dimension

Sélection de caractéristiques

Apprentissage

Ensemble d’apprentissage : S exemples étiquetés formés de N

descripteurs (variables)

X = {x(1), x(2)…, x(S)} avec x(j) = (x1, x2, … , xN)

X : réalisation d’un échantillon de taille S d’un vecteur aléatoire de

dimension N

Statistiques associées à X

- moyenne :

- matrice de covariance :

x =1

(j)

! ! ""

(j)(j) T

))((

Analyse en Composantes

Principales

Plan

Composantes d’un système

Réduction de dimension

Sélection de caractéristiques

Apprentissage

Analyse de la variabilité des données à travers la

matrice de variance-covariance

Excepté si l’une des variables peut s’exprimer comme une fonction

d’autres variables, N variables sont nécessaires pour rendre

compte de toute la variabilité

Objectif de l’ACP : décrire à l’aide de M < N variables

un maximum de cette variabilité

 compression des données décrites par M nouvelles variables

 visualisation des données en 2D ou 3D (si M = 2 ou 3)

 interprétation des données : liaisons inter-variables

Analyse en Composantes

Principales

Plan

Composantes d’un système

Réduction de dimension

Sélection de caractéristiques

Apprentissage

Composantes : b1, b2 … bM

bk : nouvelle variable = combinaison linéaire des variables

bk = u1k x1 + u2k x2 + … + uMk xM

 Coefficients uik à déterminer pour que les bk soient :

- 2 à 2 décorrélés

- de variance maximale

- d’importance décroissante

Analyse en Composantes

Principales

Plan

Composantes d’un système

Réduction de dimension

Sélection de caractéristiques

Apprentissage

•Données image = un vecteur, 1 composante / pixel

•Données codées = un vecteur, 1 composante /

descripteur

N = 4200 pixels

= x 2 R4200

vecteur « texture »

Analyse en Composantes

Principales

Plan

Composantes d’un système

Réduction de dimension

Sélection de caractéristiques

Apprentissage

 Trouver le sous-espace de dimension M approchant

au mieux les données

1 / 21 100%

Documents connexes

Fiche d`exercices #2 Quelques méthodes génératives

"Analyse de publicités" Une fiche d`activités autour de la publicité et

Exercices d`algèbre linéaire

doc question 5 _ Matrices.doc

Hémocromatose doc

PDF Formation - Cegos E

Licence d`Économie - 1re année Mathématiques appliquées S2 TD

TD Formalisme de la matrice densité 1 Généralités 2 Système à

Plan du cours de Marketing Stratgique

MASTERE DE RECHERCHE « MACROÉCONOMIE ET

Repères et forces

TD Compression Exercice 1 Appliquer l`algorithme

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d'utilisation

Analyse discriminante

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Analyse discriminante

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib