Méthodes d`apprentissage automatique pour la bioinformatique

Téléchargement

M´ethodes d’apprentissage automatique pour la

bioinformatique - BIOL-F-524

TP 5: Analyse discriminante lin´eraire

19 D´ecembre 2008

1 Introduction

L’analyse discriminante lin´eaire (Linear discriminant analysis - LDA)

une une mani`ere de calculer un hyperplan s´eparateur permettant de classiﬁer

des donn´ees. Les donn´ees utilis´ees pour ce TP se trouvent `a l’adresse :

http://www.ulb.ac.be/di/map/yleborgn/BIOLF524/TP5/script.tgz

L’archive contient le ﬁchier R ’lda.R’ dans lequel se trouvent les fonctions qui

seront utilis´ees dans le TP, ainsi qu’une version du jeu de donn´ees microar-

ray Golub modiﬁ´e de mani`ere `a ce que les classes y soient ´equitablement

repr´esent´ees. Une fois dans R, chargez ’lda.R’

source("lda.R")

et le jeu de donn´ees ’Golub50.Rdata’ :

load("Golub50.Rdata")

Le jeu de donn´ees Golub50 contient :

– Une matrice Xde 50 observations pour 7129 variables, repr´esentant les

expressions d’un ensemble de 7129 g`enes pour 50 patients diﬀ´erents.

– Une sortie Y, associant un type de leuc´emie pour chacun des 50 pa-

tients (25 de chaque type, classe 0 ou 1).

2 Analyse discriminante lin´eaire

La fonction ’lda.example()’ illustre l’analyse discriminante lin´eaire sur

un jeu de donn´ees g´en´er´e artiﬁcellement, et ayant 2 classes possibles. La

ligne noire continue represente la s´eparation optimale (calcul´ee en ayant

connaissance des param`etres ayant permi de g´en´erer les donn´ees), et la ligne

bleue repr´esente la s´eparation obtenue en estimant `a partir du jeu de donn´ees

les param`etres de la gaussienne multiva´eri´ee correspondant `a chacune des

classes.

−10 −5 0 5 10

3 Application `a Golub

R´eduisez d’abord la dimensionalit´e du dataset Golub `a 2 dimensions, en

ne retenant que les deux premi`eres composantes principales. Celles-ci sont

obtenues en calculant les deux premiers vecteurs propres de la matrice de

covariance des entr´ees, voir fonction ’getPC’.

X.2<-getPC(X)

Appliquez ensuite l’analyse discriminante lin´eaire :

lda(X.2,Y)

Enﬁn, calculez l’erreur empirique et l’erreur en 10-fold CV de ce mod`ele.

1 / 2 100%

Documents connexes

Projet 2 : Classification supervisée : Analyse discriminante Table

"Analyse de publicités" Une fiche d`activités autour de la publicité et

Fiche d`exercices #2 Quelques méthodes génératives

Pluridisciplinaire on line

Analyse fonctionnelle et topologie

Devoir surveillé octobre 2014

TP2 : analyse discriminante linéaire et quadratique

pdf

Transformations linéaires

Applications linéaires

Analyse Discriminante et Prévision Ozone : LDA, QDA, KNN

Hémocromatose doc

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Méthodes d`apprentissage automatique pour la bioinformatique

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Méthodes d`apprentissage automatique pour la bioinformatique

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib