v
RÉSUMÉ
Dans un contexte où la puissance de calcul des ordinateurs est en constante augmentation, et
où de plus en plus de données sont recueillies par les organisations, ces dernières
s’intéressent de manière grandissante à l’exploration de leurs bases de données (Data
Mining), dans le but d’améliorer leurs processus.
Par processus, nous entendons tout ensemble d’activités transformant un élément d’entrée
en un élément de sortie.
Si la grande majorité des processus sont monitorés, et que des observations surviennent
durant leur déroulement pour assurer leur contrôle, ces observations sont néanmoins
rarement utilisées pour prédire l’état final. Ce travail s’intéresse ainsi à la prédiction de l’état
de sortie des processus à partir des observations survenues durant leur déroulement.
Nous nous intéressons en particulier à la formation des étudiants au baccalauréat de l’École
Polytechnique de Montréal. Nous considérons cette formation comme un processus, dans le
sens où il s’agit d’un enchaînement d’étapes, sur 12 sessions (4 ans), transformant les
étudiants entrants en des ingénieurs prêts à entrer sur le marché de l’emploi.
Les données disponibles sont, pour chaque étudiant, les notes moyennes obtenues à chacune
des 12 sessions du baccalauréat, les crédits pris à chaque session, et le département de
l’étudiant en question.
L’idée est de tenter de prédire la moyenne cumulative des six dernières sessions obtenue par
chaque étudiant, à partir de ses moyennes obtenues à chacune des six premières sessions, du
nombre de crédits pris durant chaque session, et du département de l’étudiant.
Ce travail s’intéresse ainsi à tester si les informations disponibles et mesurables sont
suffisantes pour fournir une prédiction informative, en dépit d’informations non disponibles,
telles que des variables reflétant la psychologie, la vie personnelle ou associative de
l’étudiant. En particulier, nous nous intéressons à savoir s’il existe des formes (patterns) dans
l’évolution des notes moyennes des étudiants au cours de leur baccalauréat.