Filière Data Mining (Fouille de données)

publicité
Filière Data Mining
(Fouille de données)
Pierre Morizet-Mahoudeaux
Plan
• Objectifs
• Débouchés
• Formation
• UVs spécifiques
• UVs connexes
• Enseignants et partenaires
Structure générale des études à l’UTC
Règlement des études :
-Minimum 22 UVs réussies
-Dont 14 dans les
catégories CF/CP
-NPML, communication
-Culture générale
-Validation stage et projet
3
2
1
Specialisation
2nd Internship
1st Internship
Fondamental&
Specialisation
Fondamental Training
Structure du département GI
Pierre Morizet
Les séjours à l’étranger
Double-diplômes :
Cranfield (UK)
Saragosse (Esp)
Turin (It)*
Photographie d’une promotion
• Flux moyen : 150 diplômés par an
• Profil moyen d’un diplômé du GI
•
–
25 UV environ.
–
2 semestres en entreprise
• Dont 18 CF/CP
• Plus de 3 mentionnées
Quelques chiffres
–
–
Près de 40% ont passé au moins 6 mois dans un pays étranger
Plus de 20% sortiront avec 2 diplômes (DEA, Masters étrangers)
Objectifs
Constat
• Les entreprises et administrations sont confrontées à des
données surabondantes
Besoin
• Extraire des informations permettant de faciliter les prises
de décision.
Réponse
• Former des ingénieurs “mineurs” de données
–
information = minerai
–
ingénieur = mineur
Débouchés
• Deux orientations
– Informatique décisionnelle
– Gestion d’entrepôts de données
• Secteurs d’activités très variés :
– Entreprises utilisatrices : des multinationales à l’administration
en prililégiant les banques et les assurances ;
– Sociétés de Services et d’Ingénierie Informatiques (SSII)
– Editeurs de logiciels (SAS, SPPS...).
Débouchés
• Domaines d’applications
– Analyse de risque: assurance
– Analyse financière: tendance boursière
– Décisionnel : stratégie industrielle et commerciale
– Marketing: prospection de clients, CRM
– Médecine: recherche de structures génétiques,
– Prédiction : pic de pollution
– Gestion de stock
– ...
Formation
• Objectif double :
– structurer et constituer de vastes entrepôts de données à
partir de systèmes parfois hétérogènes
– « fouiller » ces données pour
• répondre à des questions précises,
• tester des hypothèses,
• réaliser des prédictions ou découvrir des relations cachées.
Formation
UV’s spécifiques
• NF26 : Data Warehouse et décisionnel
NF26
• Principes de développement et d'exploitation des outils
informatiques pour
• la conception et l'exploitation d'entrepôts de données
SY09
• la prise de décision
Concepts de base des modèles multidimensionnels;
SY19
Alimentation;
Interrogation, requêtage, OLAP (On-Line Analytical Processing).
AP
Outils décisionnels (régression, CRM, tableaux de bord, …)
Sources de données
Temps
Réel
Applications
Métiers,
ERP
Batch
BO Enterprise
Data
Cleansing
Data profiling
Bases
BO Data Integrator
Moteur
ETL
Data
Validation
Data Warehouse
Data
Auditing
Fichiers, Web,
XML, COBOL
Analyse
d’Impacts
Metadonnées
Pilotage
Reporting
Interrogation
Analyses
Origine des
données
Formation
UV’s spécifiques
NF26
• SY09: Analyse de données pour le Data Mining
• Visualisation des données
SY09
SY19
AP
• Exploration statistique
• Classification automatique
• Regression
Formation
UV’s spécifiques
• SY19 : Méthodes de décision statistiques
NF26
SY09
SY19
AP
• Théorie de la décision
• Reconnaissance des formes
• Réseaux de neurones à couches
• Arbres de décision
Formation
UV’s spécifiques
• Atelier projet (en cours d’élaboration)
NF26
SY09
SY19
AP
• En partenariat avec des industriels,
• Des problèmes concrets
•
Réalisé par groupe de deux étudiants
•
Suivi par un enseignant de l’équipe pédagogique de la filière.
Formations
UVs Connexes
• Prérecquis du profil commun de branche
• SY02: Méthodes statistisques pour l’ingénieur
• NF16: Algorithmique et structures de données
• NF17: Bases de données
• UV’s liées:
• GE40: Management de projets
• LO17: Recherche d’information: indexation et multimédia
• LO18: Projet multimédia
• SR03: Programmation des applications internet
• LO20: Génie logiciel
• RO04: Optimisation discrète et continue
• RO05: Processus stochastiques
• RO06: Simulation et technique d’optimisation
• SY23: Vision et image
Enseignants et partenaires
• Partenaires industriels
• EDF,
• Micropole-Univers,
• Exalead
• KXEN
• SAS
• CEA
• ..
• Equipe pédagogique
• Stéphane Crozat (UTC),
• Thierry Denœux (UTC),
• Gérard Govaert (UTC),
• Pierre Morizet (UTC),
• Samuel Samson (Micropole-Univers)
Promotions FD
• Depuis l’automne 2004 20 étudiants/an en moyenne
• Domaines couverts en stages et projets
– Informatique financière, workflow, reporting,
– traitement d’images, analyse de procédé,
– business intelligence, datawarehouse, décisonnel
– analyse multivariée, modèles prédictifs, règles d’association
• Entreprises ayant accueilli des projets de fin d’études FD
– Bios-groupe Keyrus, Business & Decision, Cadexan, Cap
Gemini, CERF, CEA, CSC Infogerance, Dassault Systems,
Ernst & Young, France Télécom, GDF, General Electric, GE
Healthcare System, Glaxowellcome, IBM, INRIA, Legrand
S.A, Logia-CMG-Unilog, Mereo, Mircropole Univers, Parexel
international, PSA, Siemens, Société Générale, Solystic,
Umanis Nord, Universités, …
Merci de votre attention…
Téléchargement