UNIVERSITEMONTPELLIERII
Fouillededonnées:
Règlesséquentielles
Encadrantes:
Mme.LAURENTAnne
Mme.TEISSEIREMaguelonne
Etudiants
Mr.ALLIAMohamedRachid
Mlle.BOUADITassadit
Mr.ElMOUTAOUKILSami
Mr.KEIRAMamadou
2
Tabledesmatières
Remerciements.......................................................................................................................................4
1Introduction:.....................................................................................................................................5
2Gestionduprojet:.............................................................................................................................6
Conceptsthéoriques...............................................................................................................................7
3Conceptsgénéraux.............................................................................................................................8
1.1.Définitions..................................................................................................................................8
3.1.1Itemetitemset:..............................................................................................................8
3.1.2Transaction:....................................................................................................................8
3.1.3Supportminimal:............................................................................................................8
3.2Recherchederèglesd’association:...........................................................................................8
3.2.1Sélectionetpréparationdesdonnées:..........................................................................9
3.2.2Découvertedesitemsetsfréquents:..............................................................................9
3.2.3Générationdesrèglesd’association:...........................................................................10
3.2.4Visualisationetinterprétationdesrèglesd’associations:............................................10
3.3Recherchederèglesséquentielles:.........................................................................................10
3.3.1Séquence:.....................................................................................................................10
3.3.2Fréquenced’uneséquence:.........................................................................................10
3.3.3Séquencesfréquentesmaximalesoumotifsséquentiels:..........................................11
3.3.4Extractiondesmotifsséquentiels.................................................................................11
3.3.5Propriétésdesséquencesfréquentes...........................................................................12
3.3.6Supportd’uneséquence:.............................................................................................12
3.3.7Confianced’unerègle:..................................................................................................12
Algorithmesexistants............................................................................................................................13
4Algorithmesexistants.......................................................................................................................14
4.1L’algorithmeAprioriAll:............................................................................................................14
4.2L’algorithmeApriori:................................................................................................................14
4.2.1L’étapedejointure:......................................................................................................14
4.2.2L’étaped’élagage:.........................................................................................................15
4.2.3Exempledel’algorithmeApriori:..................................................................................15
4.2.4Discussionetlimitesdel’algorithmeApriori:...............................................................17
4.3L’algorithmeSPADE:................................................................................................................17
4.3.1LimitedeSPADE............................................................................................................18
3.4L’algorithmeGSP:....................................................................................................................18
3.4.1Étapesdel’algorithmeGSP:.........................................................................................18
3.4.2Limitesdel’algorithmeGSP...........................................................................................19
3
3.5L’algorithmePSP:.....................................................................................................................20
3.5.1LimitesdePSP................................................................................................................20
VPSPEnAction......................................................................................................................................21
4FonctionnementdeVPSP:...............................................................................................................22
4.1TransformationdelabasededonnéesfaçonSPADE:.............................................................22
4.2VPSP:.........................................................................................................................................24
4.2.1Structurededonnéesutilisée:.....................................................................................24
4.2.2AlgorithmeVPSP:..........................................................................................................26
4.2.3OptimisationsapportéesparVPSP:..............................................................................32
ExtractiondesRèglesSéquentiellesetCalculdelaConfiance.............................................................34
5Miseenœuvre:...............................................................................................................................35
5.1Rappel.......................................................................................................................................35
5.1.1Confianced’unerègleséquentielle...............................................................................35
5.1.2ExtractiondesRèglesséquentiellesd’uneséquence:..................................................35
5.2Lesdifférentesapprochesducalcul.........................................................................................36
5.2.1Calculenparallèle.........................................................................................................36
5.2.2CalculenPosttraitement..............................................................................................37
5.3Application:..............................................................................................................................38
5.3.1Outilsetenvironnementdedéveloppement:...............................................................39
5.4MéthodesrajoutéesàVPSP.....................................................................................................39
5.4.1Générationdesrèglesséquentiellesdemêmelongueurpouruneséquence:............39
5.4.2Calculdelaconfiance:..................................................................................................40
5.4.3Optimisation:................................................................................................................41
5.5SchémaUML.............................................................................................................................42
5.6Résultatsobtenus:...................................................................................................................42
6Conclusion........................................................................................................................................43
6.1Bilan..........................................................................................................................................43
6.2Perspectives..............................................................................................................................43
7Tabledesfigures:............................................................................................................................44
8Tableaux...........................................................................................................................................44
9Bibliographie....................................................................................................................................44
4
Remerciements
CeTERaétéréaliséencollaborationavecl’équipefouillededonnéesduLaboratoireInformatique
RobotiqueetMicroélectroniquedeMontpellier(LIRMM).
NoustenonsavanttoutàexprimernosvifsremerciementsàLisaDIJORIOpourtoutel’aidequ’ellea
apportéeàlacompréhensiondenotresujet,sadisponibilité,toutessesexplicationséclairées,ainsi
quesoninvestissementetenthousiasmeconcernantnostravaux.Elleasu,toutaulongdeceprojet,
nousmotiverafinquel’onfournisselesmeilleursrésultatspossibles.
NousremercionsMadameAnneLAURENTetMadameMaguelonneTEISSEIRE,nosdeux
encadrantes,pourleurimplicationplusquedévouéeaubondéroulementdeceprojet.
Ellesnousontapportéleurrigueur,leurparticipationàlarédactionetàlacorrectiondecerapport.
Leurespritcritiqueainsiqueleursconseilsaviséssurlaprésentationdenostravauxnousontététrès
utilesetnousontpermisdecontenirnotreenthousiasmeafindenepasnouséloignerdusujet.
5
1 Introduction:
DanslecadredenotreMasterInformatiqueUnifiéeProfessionneletRecherchepremièreannée,
nousavonschoisiausecondsemestreleTERintitulé:«Fouillededonnées:Règlesséquentielles»,
dontlebutétaitd’arriveràextrairetouteslesrèglesséquentiellesàpartird’unensemblede
séquencesfréquentesnéréesparl’algorithmed’extractiondemotifsséquentielsVPSP(Aurélien
Serra,2006),développéparl’équipeTATOOauseinduLIRMM.
Durantcesdernièresannées,lesquantitésdedonnéescollectées,dansdiversdomaines
d’application,deviennentdeplusenplusimportantes.
Cesquantitésontsuscitélebesoind’analyseetd’interprétationafind’enextrairedesconnaissances
utiles.Danscettesituation,lafouillededonnéesseproposededonnerlesoutilsetlestechniques
nécessairespourl’extractiondecesconnaissances.
Deuxclassesdemotifssesontalorsavéréestrèsutilesetsimultanémentutiliséesdanslapratique,à
savoir:
Lesitemsetsfréquents
Lesmotifsséquentielsfréquents
L’extractiondesmotifsséquentielspermetladétectionetl’analysedescomportementsfréquentsde
différentsacteurslorsdemultiplesévènements,exemple:
60%desgensquiachètentunetélévisionachètentunmagnétoscopeplustard
Parcontre,lanotiondecausalitén’apparaîtpasdanslesmotifsséquentiels.
D’oùl’intérêtetlebutdutravailquinousaétéassignéetquiestd’étendrecesméthodesau
contextedesrèglesséquentielleslarelationdecausalitéestaccompagnéeparunerelation
temporelle.
Notretravailconsistedansunpremiertempsàétudieretàcomprendrelefonctionnementde
l’algorithmed’extractiondemotifsséquentielsVPSP,dansundeuxièmetemps,àintroduirelanotion
deconfianceetl’implémenterdansVPSPtoutengénérantlesrèglesséquentiellesquiendécoulent.
Parexemple:Onextrairalesrèglesdutype«Lesinternautesayantétéintéressésparcetarticleont
plustardétéintéresséspartelautre»etgrâceauconceptdeconfianceonpourraavoirl’information
suivante:
60%desgensquiachètentunmagnétoscopeontachetéauparavantunetélévision;
70%desgensquiachètentunecartemémoireontachetéauparavantuntéléphone
portable.
Danslapremièrepartiedecerapport,nousaborderonslesconceptsgénérauxafindemieux
appréhenderlesujet;
Dansladeuxièmepartie,nousferonslepointsurlesdifférentsalgorithmesd’extractiondemotifs
séquentielsexistants;
Danslatroisièmepartie,nousexpliqueronsledéroulementdel’algorithmeVPSP;
Dansladernièrepartie,nousdétailleronsl’implémentationdelasolutionproposée;
Etpourfinir,nousconcluronstoutenproposantdesperspectives.
1 / 44 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !