DATA ANALYTICS Unlocking Knowledge and Value from Data Team Parietal: scikit-learn Gaël Varoquaux Olivier Grisel PARIS 12 novembre 2014 Scikit-learn : apprentissage statistique Apprentissage statistique : • Apprendre sur des données existantes • Pour prédire sur des données nouvelles Scikit-learn : apprentissage statistique Des applications : • Société / sondages Nate Silver : Prédiction du scrutin présidentiel US 2012 Scikit-learn : apprentissage statistique Des applications : • Marketting, e-commerce Recommandation de produits Anne ★★ Bernard ★★★★ ★★★ ★★★ ★★★ ★★ Charles Denis ★ ★ ★★★★ ★ ★★★ ★ ★★ ★★★★ Scikit-learn : apprentissage statistique Des applications : • Santé : diagnostic, dépistage Coeur de métier de l'équipe Parietal Scikit-learn : apprentissage statistique Des applications très variées: Anne ★★ Bernard ★★★★ ★★★ ★★★ ★★★ ★★ Charles Denis ★ ★ ★★★★ ★ ★★★ ★ ★★ ★★★★ ● Un contexte d'analyse statistique similaire ● Un outil logiciel : scikit-learn Scikit-learn : une bibliothèque de base Scikit-learn est un « moteur » Scikit-learn : une bibliothèque de base Scikit-learn est un « moteur » Il faut l'adapter aux cas d'utilisations Scikit-learn : une bibliothèque de base Programmation en Python : ● Écriture d'applications ● Utilisation interactive Scikit-learn : une bibliothèque de base Python : ● Langage haut niveau (comme Matlab, R, SAS) ● Utilisé dans l'industrie (web, administration système)