Scikit-learn

publicité
DATA ANALYTICS
Unlocking Knowledge and Value from Data
Team Parietal:
scikit-learn
Gaël Varoquaux
Olivier Grisel
PARIS 12 novembre 2014
Scikit-learn : apprentissage statistique
Apprentissage statistique :
• Apprendre sur des données existantes
• Pour prédire sur des données nouvelles
Scikit-learn : apprentissage statistique
Des applications :
• Société / sondages
Nate Silver :
Prédiction du scrutin
présidentiel US 2012
Scikit-learn : apprentissage statistique
Des applications :
• Marketting, e-commerce
Recommandation
de produits
Anne
★★
Bernard
★★★★
★★★
★★★
★★★
★★
Charles
Denis
★
★
★★★★
★
★★★
★
★★
★★★★
Scikit-learn : apprentissage statistique
Des applications :
• Santé : diagnostic, dépistage
Coeur de métier
de l'équipe Parietal
Scikit-learn : apprentissage statistique
Des applications très variées:
Anne
★★
Bernard
★★★★
★★★
★★★
★★★
★★
Charles
Denis
★
★
★★★★
★
★★★
★
★★
★★★★
●
Un contexte d'analyse statistique similaire
●
Un outil logiciel : scikit-learn
Scikit-learn : une bibliothèque de base
Scikit-learn est un « moteur »
Scikit-learn : une bibliothèque de base
Scikit-learn est un « moteur »
Il faut l'adapter aux
cas d'utilisations
Scikit-learn : une bibliothèque de base
Programmation en Python :
●
Écriture d'applications
●
Utilisation interactive
Scikit-learn : une bibliothèque de base
Python :
●
Langage haut niveau (comme Matlab, R, SAS)
●
Utilisé dans l'industrie (web, administration système)
Téléchargement