User Group Splunk – France Présentation Prelert AD pour Splunk Frédéric Michel – Doopera @fred_ml 27 juin 2014 Doopera Créé en 2013, Doopera est un cabinet de conseil en technologie et gestion de l’information. ➡ Notre mission : ➡ accompagner et proposer les meilleures solutions analytiques fondées sur l'intégration de toutes les données dans l'entreprise dans une plate-forme globale. ➡ résoudre la complexité liée à l'adoption de technologies Big Data pour une analyse prédictive Un savoir faire pragmatique Un accompagnement des entreprises sur la mise en œuvre d'une stratégie relative au Big Data Une intégration des solutions analytiques de grande échelle apportant des bénéfices tangibles au business Terminologie Machine-Learning domaine de l’informatique qui met au point des algorithmes permettant de déterminer pour de nouvelles données des caractéristiques à partir de la connaissance de données d’apprentissage. Analyse prédictive L'analytique prédictive aide à lier données et action efficace en tirant des conclusions fiables (probabilité) sur les conditions actuelles et les événements futurs. Détection d’anomalies Ce qui est différent/bizarre dans les données Une analogie pour commencer… Comment prédire le nombre de lettres postales que je recevrais demain ? Une approche pratique … Compter le nombre de lettres reçues 1 journée ? 1 semaine ? 1 mois ? La précision de la prédiction augmente en fonction du volume de données analysées Utiliser ces informations pour créer … Fonction de répartition Et pour l’IT … • # de courriers = # d’évènements d’un type particulier • Nombre d’erreurs d’un type particulier • Nombre d’intrusions • Ou un KPI • Temps de réponse • Taux d’utilisation d’une application • Nombre d’incidents résolus Quelque soit le type de données, un modèle (fonction de répartition) unique est nécessaire Prelert – Machine learning • Utilise des modèles probalistes pour détecter des anomalies dans les données • La précision est fonction du modèle statistique (fonction de répartition) des données • Prelert utilise les techniques de machine learning pour créer des modèles statistique Types d’anomalies détectées Domaine d’application Réactif - Diagnostique Traitement de données historiques pour détection d’anomalies, de « bizarrerie » Réduire l’ensemble des données en petits datasets suspects Proactif – Temps réel / Monitoring Analyse des données à « la volée » : prévu, non prévu ? Générer des alertes en temps réels Prelert Anomaly Detective • Etend les commandes standards Splunk de recherche • prelertautodetect : détecte à la volée des anomalies sur une recherche. • Prelertcompare : présente ce qui a changé entre 2 recherche. Baseline vs période de temps suspecte • Prelertcategorize : algorithme de catégorisation d’événements non structurés • Ajoute des fonctions statistiques • Min, max, count, rare, … Demo 3 mois dans la vie d’un centre de service IT …. Questions