presentation splunk user group doopera

publicité
User Group Splunk – France
Présentation Prelert AD pour Splunk
Frédéric Michel – Doopera
@fred_ml
27 juin 2014
Doopera
Créé en 2013, Doopera est un cabinet de conseil en technologie et gestion de l’information.
➡ Notre mission :
➡ accompagner et proposer les meilleures solutions analytiques fondées sur l'intégration
de toutes les données dans l'entreprise dans une plate-forme globale.
➡ résoudre la complexité liée à l'adoption de technologies Big Data pour une analyse
prédictive
Un savoir faire pragmatique
 Un accompagnement des entreprises sur la mise en œuvre d'une
stratégie relative au Big Data
 Une intégration des solutions analytiques de grande échelle
apportant des bénéfices tangibles au business
Terminologie
 Machine-Learning
 domaine de l’informatique qui met au point des
algorithmes permettant de déterminer pour de
nouvelles données des caractéristiques à partir de la
connaissance de données d’apprentissage.
 Analyse prédictive
 L'analytique prédictive aide à lier données et action
efficace en tirant des conclusions fiables (probabilité)
sur les conditions actuelles et les événements futurs.
 Détection d’anomalies
 Ce qui est différent/bizarre dans les données
Une analogie pour commencer…
 Comment prédire le nombre de lettres
postales que je recevrais demain ?
Une approche pratique …
 Compter le nombre de lettres reçues
 1 journée ?
 1 semaine ?
 1 mois ?
 La précision de la prédiction augmente en
fonction du volume de données analysées
 Utiliser ces informations pour créer …
Fonction de répartition
Et pour l’IT …
• # de courriers = # d’évènements d’un type
particulier
• Nombre d’erreurs d’un type particulier
• Nombre d’intrusions
• Ou un KPI
• Temps de réponse
• Taux d’utilisation d’une application
• Nombre d’incidents résolus
Quelque soit le type de données, un modèle (fonction de répartition)
unique est nécessaire
Prelert – Machine learning
• Utilise des modèles
probalistes pour détecter des
anomalies dans les données
• La précision est fonction du
modèle statistique (fonction
de répartition) des données
• Prelert utilise les techniques
de machine learning pour
créer des modèles statistique
Types d’anomalies détectées
Domaine d’application
 Réactif - Diagnostique
 Traitement de données historiques pour détection
d’anomalies, de « bizarrerie »
 Réduire l’ensemble des données en petits datasets
suspects
 Proactif – Temps réel / Monitoring
 Analyse des données à « la volée » : prévu, non
prévu ?
 Générer des alertes en temps réels
Prelert Anomaly Detective
• Etend les commandes standards Splunk de
recherche
• prelertautodetect : détecte à la volée des anomalies
sur une recherche.
• Prelertcompare : présente ce qui a changé entre 2
recherche. Baseline vs période de temps suspecte
• Prelertcategorize : algorithme de catégorisation
d’événements non structurés
• Ajoute des fonctions statistiques
• Min, max, count, rare, …
Demo
3 mois dans la vie d’un centre de service IT ….
Questions
Téléchargement