Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux Plan • Objectifs • Débouchés • Formation • UVs spécifiques • UVs connexes • Enseignants et partenaires Structure générale des études à l’UTC Règlement des études : -Minimum 22 UVs réussies -Dont 14 dans les catégories CF/CP -NPML, communication -Culture générale -Validation stage et projet 3 2 1 Specialisation 2nd Internship 1st Internship Fondamental& Specialisation Fondamental Training Structure du département GI Pierre Morizet Les séjours à l’étranger Double-diplômes : Cranfield (UK) Saragosse (Esp) Turin (It)* Photographie d’une promotion • Flux moyen : 150 diplômés par an • Profil moyen d’un diplômé du GI • – 25 UV environ. – 2 semestres en entreprise • Dont 18 CF/CP • Plus de 3 mentionnées Quelques chiffres – – Près de 40% ont passé au moins 6 mois dans un pays étranger Plus de 20% sortiront avec 2 diplômes (DEA, Masters étrangers) Objectifs Constat • Les entreprises et administrations sont confrontées à des données surabondantes Besoin • Extraire des informations permettant de faciliter les prises de décision. Réponse • Former des ingénieurs “mineurs” de données – information = minerai – ingénieur = mineur Débouchés • Deux orientations – Informatique décisionnelle – Gestion d’entrepôts de données • Secteurs d’activités très variés : – Entreprises utilisatrices : des multinationales à l’administration en prililégiant les banques et les assurances ; – Sociétés de Services et d’Ingénierie Informatiques (SSII) – Editeurs de logiciels (SAS, SPPS...). Débouchés • Domaines d’applications – Analyse de risque: assurance – Analyse financière: tendance boursière – Décisionnel : stratégie industrielle et commerciale – Marketing: prospection de clients, CRM – Médecine: recherche de structures génétiques, – Prédiction : pic de pollution – Gestion de stock – ... Formation • Objectif double : – structurer et constituer de vastes entrepôts de données à partir de systèmes parfois hétérogènes – « fouiller » ces données pour • répondre à des questions précises, • tester des hypothèses, • réaliser des prédictions ou découvrir des relations cachées. Formation UV’s spécifiques • NF26 : Data Warehouse et décisionnel NF26 • Principes de développement et d'exploitation des outils informatiques pour • la conception et l'exploitation d'entrepôts de données SY09 • la prise de décision Concepts de base des modèles multidimensionnels; SY19 Alimentation; Interrogation, requêtage, OLAP (On-Line Analytical Processing). AP Outils décisionnels (régression, CRM, tableaux de bord, …) Sources de données Temps Réel Applications Métiers, ERP Batch BO Enterprise Data Cleansing Data profiling Bases BO Data Integrator Moteur ETL Data Validation Data Warehouse Data Auditing Fichiers, Web, XML, COBOL Analyse d’Impacts Metadonnées Pilotage Reporting Interrogation Analyses Origine des données Formation UV’s spécifiques NF26 • SY09: Analyse de données pour le Data Mining • Visualisation des données SY09 SY19 AP • Exploration statistique • Classification automatique • Regression Formation UV’s spécifiques • SY19 : Méthodes de décision statistiques NF26 SY09 SY19 AP • Théorie de la décision • Reconnaissance des formes • Réseaux de neurones à couches • Arbres de décision Formation UV’s spécifiques • Atelier projet (en cours d’élaboration) NF26 SY09 SY19 AP • En partenariat avec des industriels, • Des problèmes concrets • Réalisé par groupe de deux étudiants • Suivi par un enseignant de l’équipe pédagogique de la filière. Formations UVs Connexes • Prérecquis du profil commun de branche • SY02: Méthodes statistisques pour l’ingénieur • NF16: Algorithmique et structures de données • NF17: Bases de données • UV’s liées: • GE40: Management de projets • LO17: Recherche d’information: indexation et multimédia • LO18: Projet multimédia • SR03: Programmation des applications internet • LO20: Génie logiciel • RO04: Optimisation discrète et continue • RO05: Processus stochastiques • RO06: Simulation et technique d’optimisation • SY23: Vision et image Enseignants et partenaires • Partenaires industriels • EDF, • Micropole-Univers, • Exalead • KXEN • SAS • CEA • .. • Equipe pédagogique • Stéphane Crozat (UTC), • Thierry Denœux (UTC), • Gérard Govaert (UTC), • Pierre Morizet (UTC), • Samuel Samson (Micropole-Univers) Promotions FD • Depuis l’automne 2004 20 étudiants/an en moyenne • Domaines couverts en stages et projets – Informatique financière, workflow, reporting, – traitement d’images, analyse de procédé, – business intelligence, datawarehouse, décisonnel – analyse multivariée, modèles prédictifs, règles d’association • Entreprises ayant accueilli des projets de fin d’études FD – Bios-groupe Keyrus, Business & Decision, Cadexan, Cap Gemini, CERF, CEA, CSC Infogerance, Dassault Systems, Ernst & Young, France Télécom, GDF, General Electric, GE Healthcare System, Glaxowellcome, IBM, INRIA, Legrand S.A, Logia-CMG-Unilog, Mereo, Mircropole Univers, Parexel international, PSA, Siemens, Société Générale, Solystic, Umanis Nord, Universités, … Merci de votre attention…