Lecture Notes for E Alpaydın 2004 Introduction to Machine Learning © The MIT Press (V1.1)
7)
Estimation semi-paramétrique:
Mélange de densités
où Gi est un composant (aussi appelé groupe/grappe)
1. P ( Gi ): pourcentage du mélange (apriori),
2. p ( x | Gi): densité du composant
3. k: nombre de composants fixé initialement
( ) ( ) ( )
∑
=
=
k
i
ii Ppp
1
|GGxx
Lecture Notes for E Alpaydın 2004 Introduction to Machine Learning © The MIT Press (V1.1)
8)
Estimation semi-paramétrique:
Mélange de densités
Exemple:
! Mélange gaussien où p(x|Gi) ~ N ( i , ∑i )
! paramètres = {P ( Gi ), i , ∑i }ki=1 estimées à partir
d’échantillons X={xt}t
! Contrairement à la classification, les échantillons X=
{xt}t ne sont pas étiquetés
Lecture Notes for E ALPAYDIN 2004 Introduction to Machine Learning © The MIT Press (V1.1)
9)
Classes .vs. Grappes
! Supervisé: X = { xt ,rt }t
! Classes Ci i=1,...,K
où p ( x | Ci) ~ N ( i , ∑i )
! = {P (Ci ), i , ∑i }Ki=1
! Non-supervisé : X = { xt }t
! Grappe Gi i=1,...,k
où p ( x | Gi) ~ N ( i , ∑i )
! = {P ( Gi ), i , ∑i }ki=1
Étiquettes, r ti ?
( ) ( ) ( )
∑
=
=
k
i
ii Ppp
1
|GGxx
( ) ( ) ( )
∑
=
=
K
i
ii Ppp
1
|CCxx
( )
( )( )
∑
∑
∑
∑∑
−−
=
==
t
t
i
T
i
t
ti
tt
i
i
t
t
i
t
tt
i
i
t
t
i
i
r
r
r
r
N
r
CP
ˆ
mxmx
x
m
S
Lecture Notes for E ALPAYDIN 2004 Introduction to Machine Learning © The MIT Press (V1.1)
10)
Groupage des k-moyennes
! Exemple: Soit une image couleurs de N pixels que
l’on veut coder. Supposons que chacun des pixels a
trois composantes de couleurs {R, G, B} et que
chacune des composantes de couleurs est codée
avec 8 bits de résolution.
! Combien de bits seront nécessaires pour coder
l’image entière?
Lecture Notes for E ALPAYDIN 2004 Introduction to Machine Learning © The MIT Press (V1.1)
11)
Tiré)de)Pa0ern)Recognition)and)Machine)Learning)de)Christopher)M.)Bishop;
Images originales: 240x180 pixels
Combien de bits il faut pour coder chacune de ces images?
Lecture Notes for E ALPAYDIN 2004 Introduction to Machine Learning © The MIT Press (V1.1)
12)
Compression de l’image
! Comment faire pour réduire le nombre de bits nécessaires
pour coder les images sans réduire le nombre de pixels?
! En réduisant la palette de couleurs {R, G, B}
" 24 bits: 16 millions de couleurs possibles
" 8 bits: 256 couleurs possibles
! On parlera alors de quantification ou de vecteur de
quantification de la palette de couleurs
! Comment quantifier?
" Quantification uniforme?
" Quantification non-uniforme? groupage des k-moyennes
" Quelle est la meilleure quantification?