Examen de Fouille de données
Master 1 Informatique – 1ere session
Tout document autorisé - Durée 2 heures
Exercice 1 Modélisation décisionnelle d’un Entrepôt de données : Système Hospitalier (6
points)
Un hôpital cherche à étudier ses patients en fonction de différents critères : leur âge, la durée
de leur hospitalisation, le nombre de services visités durant l’hospitalisation, les résultats de
l’enquête de satisfaction à la fin de l’hospitalisation (une note sur : 1/ la prise en charge
médicale, 2/ sur l’aspect hôtelier), le mode d’entrée dans l’hôpital (urgence, orienté par le
médecin traitant, opération prévue), la provenance (domicile, autre établissement, ..), le motif
d’hospitalisation (dialyse, obstétrique, opération, hôpital de jour …), l’adresse du patient, la
date de début d’hospitalisation, …
Q1 : Proposer un schéma en étoile pour cet entrepôt de données. Vous identifierez les
dimensions, les mesures et justifierez vos choix.
Q2 : On cherche à dimensionner cet entrepôt, les données dont l’hôpital dispose sont les
suivantes :
• Médecine : 50115 hospitalisations complètes; 38645 hospitalisations de jour sur
l’année
• Chirurgie : 29259 hospitalisations complètes; 9942 hospitalisations de jour sur
l’année
• Obstétrique : 6655 hospitalisations complètes; 4058 hospitalisations de jour sur
l’année
• Durée de stockage : 10 ans
• Nombre de médecins : 1000
• Nombre moyen de service visités : 2
Donnez la dimension de l’entrepôt.
Exercice 2 Datamining (4 points)
On cherche à établir l’existence de groupes parmi les patients. Afin de mettre en œuvre une méthode
pour l’analyse de données, l’hôpital vous contacte avec un sous-ensemble de données :
d’hospitalisation
charge
Hôtelier
services
Question 2.1 Concevez une distance entre deux patients. Une case vide représente un questionnaire
non rempli.