Classification automatique

Classication automatique

Damien Nouvel

Damien Nouvel (Inalco) Classication 1 / 24

Principes d’apprentissage (automatique)

Plan

1. Principes d’apprentissage (automatique)

2. Méthodes non-itératives

3. Méthodes itératives

Damien Nouvel (Inalco) Classication 2 / 24

Principes d’apprentissage (automatique)

Généralités sur l’apprentissage

§Qu’est-ce que l’apprentissage

•Pour l’humain, acquisition

•De connaissances (cognition, par ex. une langue)

•D’un savoir-faire (tâche, par ex. marcher)

•Pour l’intelligence articielle

•Prendre une décision intellligente

•Construire un modèle automatiquement

ñDicile à déterminer ex-nihilo

ñImportance de dénir les données et l’objectif

§Notion d’erreur

•Permet de guider l’apprentissage

•Objectif : avoir le moins d’erreurs possible

•Lien avec la fonction d’évaluation

Damien Nouvel (Inalco) Classication 3 / 24

Principes d’apprentissage (automatique)

Automatiser la conception de systèmes

§Eort sur le coût de conception (ingénierie) des logiciels

ñDegré d’intervention de l’humain dans la conception

§Schématiquement

•Conception manuelle (symbolique, à base de règles) :

Données Modèle Application

•Conception automatique (statistique, guidé par les données) :

Données Modèle Application

Damien Nouvel (Inalco) Classication 4 / 24

Principes d’apprentissage (automatique)

Exploitation des données

§Formalisation des données

•Ensemble de données en entrée X=tx1,x2,x3. . . xnu

•Généralement non-ordonné

•Chaque exemple est une structure (vecteur)

•Caractéristiques /features xi1. . . xin

ñForme matricielle : matrices (lignes xi˚/ colonnes x˚j)

•Ensemble de données en sortie Y=ty1,y2,y3. . . ynu

•Résultat attendu associé à chaque xicorrespond un yi

•Généralement une seule valeur (booléenne, entière ou réelle)

•Lorsque c’est une classe, un entier par classe

ñForme matricielle : vecteur (une colonne)

§Tenir compte des données en entrée X

•Telles quelles : apprentissage par cœur, KNN

•Extraction de statistiques : TF.IDF, Bayes

•Itération sur les données : neurones, logit, SVM, CRF

§Tenir compte des données en sortie Y: degré de supervision

Damien Nouvel (Inalco) Classication 5 / 24

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

Classification automatique

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Classification automatique

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib