
v 
 
RÉSUMÉ 
Dans un contexte où la puissance de calcul des ordinateurs est en constante augmentation, et 
où  de  plus  en  plus  de  données  sont  recueillies  par  les  organisations,  ces  dernières 
s’intéressent de  manière  grandissante  à  l’exploration de  leurs  bases  de  données  (Data 
Mining), dans le but d’améliorer leurs processus.  
Par processus, nous entendons tout ensemble d’activités transformant un élément d’entrée 
en un élément de sortie. 
 
Si la grande majorité des processus sont monitorés,  et  que  des  observations surviennent 
durant  leur  déroulement  pour  assurer  leur  contrôle,  ces  observations  sont  néanmoins 
rarement utilisées pour prédire l’état final. Ce travail s’intéresse ainsi à la prédiction de l’état 
de sortie des processus à partir des observations survenues durant leur déroulement.  
Nous nous intéressons en particulier à la formation des étudiants au baccalauréat de l’École 
Polytechnique de Montréal. Nous considérons cette formation comme un processus, dans le 
sens  où  il s’agit d’un  enchaînement  d’étapes,  sur  12  sessions  (4  ans),  transformant  les 
étudiants entrants en des ingénieurs prêts à entrer sur le marché de l’emploi.  
Les données disponibles sont, pour chaque étudiant, les notes moyennes obtenues à chacune 
des  12  sessions  du  baccalauréat,  les  crédits  pris  à  chaque  session,  et le  département  de 
l’étudiant en question.  
 
L’idée est de tenter de prédire la moyenne cumulative des six dernières sessions obtenue par 
chaque étudiant, à partir de ses moyennes obtenues à chacune des six premières sessions, du 
nombre de crédits pris durant chaque session, et du département de l’étudiant. 
 
Ce  travail  s’intéresse  ainsi  à  tester  si  les  informations  disponibles  et  mesurables  sont 
suffisantes pour fournir une prédiction informative, en dépit d’informations non disponibles, 
telles  que  des  variables  reflétant  la  psychologie, la  vie  personnelle  ou  associative  de 
l’étudiant. En particulier, nous nous intéressons à savoir s’il existe des formes (patterns) dans 
l’évolution des notes moyennes des étudiants au cours de leur baccalauréat.