!!"#$"%&'
%'
()*+,-./'01'2.//,344,/214'5'67''5''!#%&'
Extraction*de*connaissance*
Data*mining*–*KDD*–*etc.*
8.9,:10';<,=,=.<>'?32.@,4'A<+,/0''
B.@C*129'8,+413@@1'5'73)D8,+413@@1'E/3FGH'
I./*,2*J':.9,:10GK<,=,=.<L</3FD,:<G2.:'
()*+,-./'01'2.//,344,/214'5'67''5''!#%&'
Intervenants*et*thèmes*
Intervenants
Nicolas Durand, Mohamed Quafafou
Thèmes du cours
Cours (CM)
!Données et Challenges
!Méthodes et algorithmes
!Evaluation et implémentation (Weka)
Travaux dirigés (TD)
!Etudes d’algorithmes et de méthodes
Travaux pratiques (TP)
!Utilisation de différents algorithmes sur diverses données
!Implémentations – voir Exercices
!
()*+,-./'01'2.//,344,/214'5'67''5''!#%&'
Objectifs*
Appréhender le contexte et les enjeux
Se familiariser avec les concepts de base
les différentes étapes processus de data mining
Pré-traitement des données
Des données à la connaissance
Post-traitement de la connaissance
Les méthodes et algorithmes qui transforme les données en
connaissances
Les méthodes d’évaluation
Etudier quelques cas en utilisant Weka
()*+,-./'01'2.//,344,/214'5'67''5''!#%&'
Organisation*
Evaluation
Note de contrôle continue – durant les TP (25%)
Note final Examen (75%)
Ressources
Voir pages personnelles des intervenants
Voir les références précisés dans les supports de Cours/TD/TP
Contacts
Réception sur RdV
Mohamed Quafafou, Bureau 128 (devant salle 127)
!!"#$"%&'
!'
()*+,-./'01'2.//,344,/214'5'67''5''!#%&'
Plan*
M/*+.0<2-./'
A.//N14'
8N*9.014'1*'7@O.+3*9:14'
7PP+1/-44,O1'4<P1+F34N'
7PP+1/-44,O1'/./'4<P1+F34N'
8N*9.014'0QNF,@<,-./'
M:P@N:1/*,-./'
7PP@32,-./'
()*+,-./'01'2.//,344,/214'5'67''5''!#%&'
Pourquoi*Data*Mining*?*
R,'0.//N14'14*'@1'/.<F1,<'PN*+.@1'5'./'0.3*'
,PP+1/0+1'S'@Q,/,@C41+T'U,PP.+*'I.::3443./'
(<+.PN1//1G'
V(7V(7UIWUIW'
XUY7?MZ(>'V(7UIW>'[MVE7RMZ(>'VE887UMZ(>'BU(AMI\>'E?A(UV\7?A'
I91+291+>'X+O,/341+>'I.:P+1/0+1>'UN4<:1+>'1*2G''
()*+,-./'01'2.//,344,/214'5'67''5''!#%&'
8103,'1*'3/=.+:,-./'
M/=.+:,-./'*1)*<1@@1'5']<)'UVV'
^.<+/,<)'\[''
Pourquoi*Data*Mining*?*
\+,/4=.+:1+>'U12.//,_*+1>'1*2G''
9`PJ""F.),@1,0G@,a4G1),@1,0G2.:"'
()*+,-./'01'2.//,344,/214'5'67''5''!#%&'
I.::1+21'1/'@3O/1'1*'1D:,+b1-/O'
B.<+K<.3':1`+1'</'P+.0<3*'S'2.*N'0Q</',<*+1'0,/4'</'+,C./'c'
I.:P.+*1:1/*'014'2@31/*4'c'
Pourquoi*Data*Mining*?*
\+,21+>'70,P*1+>'V-:<@1+>'B+N03+1>'7/-23P1+>'1*2G''
!!"#$"%&'
d'
()*+,-./'01'2.//,344,/214'5'67''5''!#%&'
B<a@323*N'23a@N1''
A34P.43-=4'e)14'0,/4'</1'F3@@1'.<'</'21/*+1'2.::1+23,@1T'
A34P.43-=4':.a3@14'
VC4*f:14'01'+12.::,/0,-./'gh1a>'8.a3@1>'\[>'1*2GH'
Pourquoi*Data*Mining*?*
I.@@12*1+>'B+N03+1>'V<+F13@@1+'7/-23P1+>'1*2G''
()*+,-./'01'2.//,344,/214'5'67''5''!#%&'
7/,@C41'01'*+,i12*.3+14'
72K<343-./'01'0.//N14'gI,4'014'\,)34H'
A.//N14'8.a3@14'
7/3:,<)>'1*2G'
Pourquoi*Data*Mining*?*
Y1.D2.0,O1>'/1`.C,O1>'83/3/O>'1*2G''
()*+,-./'01'2.//,344,/214'5'67''5''!#%&'
B,+*,O1'1*'03j<43./'
814':<43K<14>':14'P9.*.4>':14',:34>':14'k'T'
814'P@,C@34*4>'21'K<1'iQ,3:1>'1*2G'
Pourquoi*Data*Mining*?*
B,+*,O1+>'03j<41+>'P1+4.//,@341+'+12.::,/0,-./4>'1*2G''
()*+,-./'01'2.//,344,/214'5'67''5''!#%&'
7F34'1*'41/-:1/*4'
^Q,29f*1>'iQ<-@341'1*'i1'0.//1':./',F34T'
814'2.::1/*,3+14'1*'42.+14>'
Pourquoi*Data*Mining*?*
7/,@C41+>',F34'[email protected],@>'41/-:1/*'ON/N+,@>'1*2G'
!!"#$"%&'
6'
()*+,-./'01'2.//,344,/214'5'67''5''!#%&'
^1'*l11*4'T'
^Q,29f*1>'iQ<-@341'1*'i1'0.//1':./',F34T'
814'2.::1/*,3+14'1*'42.+14>'
Pourquoi*Data*Mining*?*
B,+*,O1+>'4<+F13@@1+>'V<3F+1>'I,+*.O+,P931+>'1*2G'
()*+,-./'01'2.//,344,/214'5'67''5''!#%&'
Big*Data*
()*+,-./'01'2.//,344,/214'5'67''5''!#%&'
Multilingues*
R3:3*14'0Q</':.*4'c'
R14':.*4'/1'4./*'P,4'*.<i.<+4'4NP,+N4'P,+'014'14P,214'T'
()1:P@1'1/'[31*/,:31/'
Mt_lut_gia_cm_c_vi_,nh_hình_hin_nay.'
M@'C','%#'4C@@,a@14>41@./'@,'=,m./',F12'@,K<1@@1'F.<4'@14'03F341n'F.<4'
.a-1/0+,3'014'43O/3e2,-./4'03jN+1/*14'T'
!
()*+,-./'01'2.//,344,/214'5'67''5''!#%&'
Formats*de*données*
A3F1+43*N'014'=.+:,*4'01'0.//N14'
U1@,-.//1@@1'
\1) *1'
(/41:a@1'
VNK<1/21'
Y+,P91'
WCP1+O+,P91'
M:,O1'
[30N.'
(*2G'
!!"#$"%&'
$'
()*+,-./'01'2.//,344,/214'5'67''5''!#%&'
Processus*
VN@12-./'
B+ND*+,3*1:1/*4'
\+,/4=.+:,-./'A,*,':3/3/O'
(F,@<,-./'
M/*1+P+N*,-./'
[34<,@34,-./'
o,41'01'0.//N14'"'
A,*,'l,+19.<41''
()*+,-./'01'2.//,344,/214'5'67''5''!#%&'
Domaines*concernés*
7O1/*4''
3/*1@@3O1/*4'
XR7B'
7PP+1/-44,O1'
V*,-4-K<14'
[34<,@34,-./'
VC4*f:14'
1)P1+*4'
UN41,<)'01'
/1<+./14'
A,*,'l,+19.<41'
o,41'01'0.//N14'
W3O9'P1+=.+:,/21'
2.:P<-/O'
''''B+.a,a3@3*N4'
XP-:34,-./'
()*+,-./'01'2.//,344,/214'5'67''5''!#%&'
Principales*tâches*
I@,443e2,-./''
(4-:,-./'
U1O+.<P1:1/*'p2@<4*1+3/Oq'
7/,@C41'01'0NP1/0,/214'
VNK<1/214'
[34<,@34,-./'
UN4<:N'p4<::,+3n,-./q'
AN*12-./'01'0NF3,-./'
Que$dois-je$faire$
de$mes$données?'
()*+,-./'01'2.//,344,/214'5'67''5''!#%&'
De*quoi*s’agit*t-il*?*
C’est un
processus interac4f, itéra4f et "non-trivial", d'identification de
connaissances qui sont valides, nouvelles, potentiellement utiles et
compréhensibles.
Ce processus cyclique
comporte les phases de sélec4on de données, de pré-traitements,
de transforma4ons, de data$mining, d'interpréta4on et
d'évalua4on de la connaissance extraite.
1 / 7 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !