Prétraitement des données

Téléchargement

Prétraitementdesdonnées

Piét it ldé?

•

ourquo

pr

ét

er

es

onn

es

•Nettoyagedesdonnées

•

Intégration et transformation

Intégration



transformation

•Réductiondesdonnées

•Discrétisationet

énérationdehiérarchiesde

concepts

Pourquoiprétraiterlesdonnées?

é é

•Donn

esr

ellessouvent



incomplètes :valeurs manquantes données



incomplètes



valeurs



manquantes

,

données



simplifiées

bruitées:erreursetexceptions

ihét d



nco

hé

ren

es:nommage,co

age

•Résultatsdelafouilledépendentdelaqualitédes

données

Principalesétapesdansleprétraitementdesdonnées 3

•Nettoyage

•Intégration

Data cleaning

Data integration

•Transformation

•Réduction

Data transformation

Data reduction attributes attributes

A1 A2 A3 ... A126

2, 32, 100, 59, 48 0.02, 0.32, 1.00, 0.59, 0.48

A1 A3 ... A115

•Discrétisation

A1 A2 A3 ... A126

...

tra

nsactions

transaction

A1 A3 ...

...

T1456

A115

...

T2000

tra

Donnéesmanquantes

•Donn

esnondisponibles



certains attributs n

’

ont pas de valeur



certains



attributs



nont



pas



valeur

•Causes:

mauvaisfonctionnementdel’équipement

incohérencesavecd’autresdonnéesetdonc

supprimées

nonsaisiescarnonoumalcomprises

considéréespeuimportantesaumomentdela

•

Ces données doivent être inférées

Ces



données



doivent



être



inférées

Commentremplirlestrous?

I l tl

•

gnorer

e

peuefficacequandlepourcentagedevaleursmanquantesestélevé

Clé ll ldé

•

omp

lé

termanue

ement

es

onn

Laborieuxouinfaisable

•Utiliseruneconstanteglobale

ex:« inconnue »,unenouvellecatégorie?

•Utiliserlamoyennedel’attribut

•Utiliserlamo

ennedel’attribut

ourlamêmeclasse

y p

mieux

•

Utiliser la valeur la plus probable

Utiliser



valeur



plus



probable

formuleBayésienneouarbrededécision

1 / 27 100%

Documents connexes

agence Intervalles

RTF

Exercices sur l'attribut du sujet - Grammaire Française

Le sujet et l`attribut du sujet

La fonction attribut du sujet

Les adjectifs épithètes et attributs

L`attribut du sujet

Nom:

Attribut du sujet.

la présence de caractères communs et l`évolution

Problème - Nombre de surjections 1

Caractérisation et Classification

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d'utilisation

Prétraitement des données

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Prétraitement des données

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib