Page 1 sur 2
UNIVERSITE DE CARTHAGE
INSTITUT DES HAUTES ETUDES COMMERCIALES
Année Universitaire 2020/2021
Examen Session Principale
Niveau : 2ème Licence BI
Responsables Module : Rim Faiez /
Jihène Tounsi
Matière : AFD
Durée : 2h
Partie 1 : Questions de réflexion
1.1 Donnez une définition du terme « Datamining »
1.2 Expliquez brièvement les différentes étapes d’un projet datamining.
1.3 Quelle est la différence entre les méthodes supervisées et non supervisées ?
1.4 Lors de l’application d’un algorithme de datamining, nous sommes amenés à diviser l’échantillon
en 3 Datasets. Quels sont les datasets nécessaires à ce travail et à quoi servent-ils ?
Partie 2 : Traitement des données qualitatives
2.1 Comment peut-on catégoriser les données qualitatives ?
2.2 Quelles sont les différentes techniques pour transformer les données catégoriques en données
numériques ? Mettre l’accent sur le critère de choix entre ces différentes techniques.
2.3 Supposons que nous avons la variable catégorique Température pouvant prendre les valeurs :
chaud, froid, caniculaire. Proposez un encodage adéquat (code python + un schéma illustratif)
Partie 3 : Etude de cas
Dans cette partie nous allons travailler avec un échantillon nommé « data_health.csv ». Cet
ensemble de données contient des informations sur une séance d'entraînement typique : la durée
de la session en minutes, le pouls moyen durant la séance, le pouls maximal, la dépense calorique
durant la séance, le nombre d’heure de travail avant la session d’entraînement et le nombre
d’heure de sommeil durant la nuit précédant la session d’entraînement.
3.1 Donnez le code nécessaire pour importer le jeu de données dans python et afficher les 13
premières lignes
3.2 La figure suivante montre un affichage de ce jeu de données
Page 2 sur 2
Proposez une analyse courte de ce jeu de données et mettre l’accent sur les problèmes rencontrés.
3.3 Un analyste a réalisé un nettoyage de ce jeu de données (voir figure ci dessous). Quelle technique
de nettoyage a-t-il utilisé ? Donnez le code pour réaliser cette tâche en python.
3.4 Maintenant nous voulons visualiser un graphique « plot » mettant l’accent sur la concommation
calorique selon l’effort fourni moyen. Votre graphique devra être libellé (noms des axes) et porter un
titre de votre choix. Proposez le code nécessaire sans oublier d’importer la bibliothèque à utiliser.
Bon Travail
1 / 2 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !