1 L’Exploration de Données Educatives Victoria PERES-LABOURDETTE LEMBE, Chargée de mission innovation et prospective pédagogiques CAFOC AUVERGNE CAFOC AUVERGNE - 2014 2 Nous allons définir l’Exploration de Données Educatives et préciser ses liens avec la formation d’adultes en six questions : Qu’est-ce que l’Exploration de Données Educatives ? Quel est l’historique de cette discipline ? Quels en sont les enjeux ? Quels sont ses publics et ses périmètres d’application? Quelles sont les méthodes utilisées ? Quel est l’intérêt de l’Exploration de Données Educatives pour un formateur d’adultes ? L’exploration, ou la fouille, de données (dite Data Mining en anglais) est une discipline ayant pour objet : l’extraction de connaissances informationnelles à partir de grandes quantités de données la détermination de modèles basés sur la mise en relation des données. Cette exploration s’effectue par des méthodes automatiques ou semi-automatiques. L’Exploration de Données Educatives (dite Educational Data Mining en anglais) est une discipline scientifique émergente. Elle fait se rencontrer plusieurs disciplines, en particulier : le data mining (l’exploration de données) le machine learning (l’apprentissage automatique) la statistique les mathématiques l’informatique les Sciences de l’Apprendre (en anglais Learning Sciences). L’Exploration de Données Educatives est une discipline qui repose sur les techniques de la fouille de données appliquées aux données éducatives. L’Exploration de Données Educatives identifie analyse développe des méthodes et des processus pour analyser les données issues de l'éducation. Les données analysées par l’Exploration de Données Educatives sont constituées des traces numériques laissées par les apprenants et leurs enseignants lors de : leurs interactions dans des environnements d’apprentissage connectés de toutes natures (en particulier les plateformes de formation en ligne (dits LMS) leurs consultations de ressources didactiques. CAFOC AUVERGNE - 2014 3 Le point de départ de l’Exploration de Données Educatives est constitué par l’analyse des logs issus des interactions étudiants - ordinateur (un log est un fichier d’enregistrement informatique de l’historique des événements sur un dispositif numérique). La mise à disposition de données éducatives étant de plus en plus fréquente et accessible a abouti à la tenue de divers ateliers thématiques entre 2000 et 2007, dans le cadre de plusieurs conférences scientifiques internationales. En 2008, un groupe de chercheurs spécialisé dans l’Exploration de Données Educatives a mis sur pied la première conférence scientifique internationale exclusivement consacrée à cette nouvelle discipline. En 2009 est apparu le “Journal of Educational Data Mining”, une revue scientifique en ligne gratuite et en libre accès, qui fait état des dernières recherches menées en Exploration de Données Educatives. En 2011, a été constitué l’International Educational Data Mining Society. Quels sont les enjeux de l’Exploration de Données Educatives ? La création en institution éducative de bases de données dédiées aux informations sur les étudiants, et l’usage croissant des logiciels éducatifs amènent à la constitution de dépôt de données éducatives de plus en plus importants. Le développement du e-Learning, concomitant à celui d’Internet accroît davantage encore le volume de données susceptible d’être exploré. Ces données viennent s’additionner aux données également récoltées dans les salles de formation. Quels sont les publics et les périmètres d’application de l’Exploration de Données Educatives ? LE PUBLIC L’EXPLORATION DE DONNEES EDUCATIVES Apprenants Accompagne la personnalisation de la formation en ligne, en développant en particulier le tutorat automatique Enseignants / Formateurs / Tuteurs Met à disposition des outils d’analyse de l’apprentissage et du comportement des étudiants Ingénieurs et chercheurs en sciences de l’apprendre Aide à évaluer les dispositifs et à exploiter des outils d’extraction des données Organisations Permet d’améliorer les processus de décision Administrateurs (de direction ou techniques) Aide à déterminer la meilleure façon d’organiser et d’utiliser des ressources et des espaces connectés Tableau réalisé d'après l'article "Educational Data Mining: A Review of the State of the Art" de Romero Cristobal et Sebastian Ventura, publié dans Systems, Man, and Cybernetics, Part C: Applications and Reviews, IEEE Transactions, Volume:40 , Issue: 6. CAFOC AUVERGNE - 2014 4 Les méthodes utilisées par l’Exploration de Données Educatives : Voici quelques-unes des principales méthodes utilisées par l’Exploration de Données Educatives : La prédiction : l'objectif est de développer un modèle qui peut déduire d’un seul aspect des données certaines combinaisons d'autres aspects des données. Le clustering : l'objectif est de regrouper les données pour mieux les classifier. L’extraction de relation : l’objectif est d’identifier des relations entre des entités sémantiques. La découverte de modèles : l’objectif est d’utiliser un modèle déjà créé et de l'utiliser pour faire de nouvelles découvertes dans la science de l'apprentissage. La distillation de données pour le jugement humain : l’objectif est de favoriser l’identification de données et leur classification. La datavisualisation y est particulièrement utile. L’Exploration de Données Educatives a pour finalité une meilleure compréhension des apprenants et de leurs conditions d’apprentissage. Elle peut permettre : de détecter et d’anticiper le désengagement des apprenants de guider l’effort d'apprentissage des apprenants d’évaluer les apprenants dans les tâches d'apprentissage L’Exploration de Données Educatives peut également permettre : de développer ou d’affiner les modèles d'apprenants de prévoir les performances et le comportement des apprenants de mesurer les effets des interventions individuelles de développer une meilleure compréhension des représentations que les apprenants ont d’une discipline. CAFOC AUVERGNE - 2014