IBM-SPSS Présentation de SolutionStat Juin 2014 Ordre du jour • Qui sommes-nous? – Présentation de SolutionStat – Rôle de SolutionStat en tant que partenaire d’affaires avec IBM pour les solutions d’analytique prédictive. – Survol de la famille de produits IBM-SPSS. • Quoi de neuf avec la version 22? – Formatage d’un tableau basé sur des expressions conditionnelles – Modification automatique de la sortie – Amélioration de la productivité avec Python • Connaissez-vous toutes les possibilités offertes par IBM-SPSS? – – – – • Système de gestion de sortie : OMS Module « SPSS Custom Tables » Logiciel « SPSS Text Analytics for Survey » Combinaison des logiciels R et SPSS Questions et discussion www.SolutionStat.ca 2 Qui sommes-nous? Notre offre SolutionStat Inc. offre des services de consultation en statistique et en analytique prédictive et des services de formation portant sur l’utilisation de logiciels et divers aspects de l’analyse statistique. Notre mission • Exploiter l’extraordinaire potentiel des données. • Optimiser l’utilisation des outils d’analyse statistique • Faciliter l’établissement de stratégies analytiques, la prise de décision et l’atteinte d’objectifs de développement des affaires. www.SolutionStat.ca 3 Nos experts Notre équipe est composée de consultants qui possèdent : • Une formation universitaire en statistique et méthodes quantitatives. • Plusieurs années d'expérience dans le domaine du forage de données (« Data mining ») et de l'intelligence d'affaires. • Une capacité à bien comprendre les besoins des clients, à formuler ces besoins en un langage quantitatif et à communiquer efficacement les résultats des analyses. Nos valeurs • • • • www.SolutionStat.ca Flexibilité Travail d’équipe Partage de connaissances Stabilité 4 Nos services Consultation statistique Un aperçu de nos services • Modèles prédictifs / analyses prédictives • Segmentation • Analyse de données de sondage • Analyse de marché • Géomarketing • Analyse du panier d’épicerie • Gestion et création de sondages en ligne Nos clients • Vente au détail • Banques • Télécommunications • Organismes • Gouvernement Formations en statistique Cours et formules • Utilisation du logiciel SPSS • Application de méthodes statistiques • Formations en laboratoire (publiques) • Formations en entreprise www.SolutionStat.ca Clientèle visée • Entreprises privées • Organismes gouvernementaux • Universités • Centres de recherche 5 Nos solutions • Grâce à des partenariats stratégiques, SolutionStat fournit des solutions multifonctionnelles pour vos besoins en analytique des affaires : – Revendeur autorisé des produits IBM SPSS – Collaboration avec NewIntelligence pour le volet Intelligence d’affaires (Cognos) – Revendeur autorisé des produits de données de Environics Analytics www.SolutionStat.ca 6 IBM-SPSS Partenaire d’IBM, SolutionStat est revendeur des produits d’analytique prédictive IBM SPSS. Nous offrons également des services de consultation et de formation aux entreprises qui désirent exploiter le plein potentiel de cette gamme de logiciels. IBM SPSSMD Statistics Utiliser la puissance de l'analyse statistique évoluée pour comprendre les données, détecter les tendances et produire des prévisions précises. IBM SPSS Modeler Un puissant ensemble d'utilitaires d'exploration de données permettant de créer des modèles prédictifs rapidement et intuitivement sans programmation. www.SolutionStat.ca 7 IBM SPSS Statistics Planification IBM SPSS Complex Samples IBM SPSS Conjoint Gestion et préparation des données IBM SPSS Data Preparation IBM SPSS Missing Values 2 1 Analyse de données 3 4 Production de rapports IBM SPSS Statistics Base IBM SPSS Advanced Statistics IBM SPSS Regression IBM SPSS Categories IBM SPSS Decision Trees IBM SPSS Forecasting IBM SPSS Bootstrapping IBM SPSS Direct Marketing IBM SPSS Exact Tests IBM SPSS Neural Networks IBM SPSS Custom Tables www.SolutionStat.ca 8 Nouveautés de la version 22 Quoi de neuf avec la version 22? • Formatage d’un tableau basé sur des expressions conditionnelles • Modification automatique de la sortie • Amélioration de la productivité avec Python www.SolutionStat.ca 9 Nouveautés de la version 22 Quoi de neuf avec la version 22? • Formatage d’un tableau basé sur des expressions conditionnelles • Modification automatique de la sortie • Amélioration de la productivité avec Python www.SolutionStat.ca 10 Formatage conditionnel • Dans IBM SPSS Statistics 22, de nouvelles fonctions permettent de modifier le formatage de zones sélectionnées ou de cellules de vos tableaux basé sur des expressions conditionnelles. • Permet de mettre en évidence des lignes, des colonnes ou des cellules spécifiques pour montrer leur importance. www.SolutionStat.ca 11 Formatage conditionnel Exemple 1 : Formatage appliqué à toutes les cellules du tableau. Il vous est possible de… • Modifier le format d’affichage des valeurs. • Remplacer la valeur présentée dans une cellule. www.SolutionStat.ca Modifier le nombre de décimales affichées Remplacer les valeurs de 100% par des blancs 12 Formatage conditionnel Exemple 2 : Formatage conditionnel utilisé pour mettre en évidence des cellules. Plusieurs choix de formats sont disponibles pour mettre en évidence une cellule : • Mettre la valeur en gras, en italique ou la souligner. • Mettre la valeur en couleur. • Surligner la valeur. Mettre en évidence les pourcentages supérieurs à 25%. Le formatage n’est appliqué qu’aux cellules respectant une condition. www.SolutionStat.ca 13 Formatage conditionnel Exemple 2 : Formatage conditionnel utilisé pour mettre en évidence des cellules. Plusieurs choix de format sont disponibles pour mettre en évidence une cellule : • Mettre la valeur en gras, en italique ou la souligner. • Mettre la valeur en couleur. • Surligner la valeur. Les pourcentages entre 15% et 25% s’affichent en jaune et les pourcentages supérieurs à 25% s’affichent en rouge. Surligner les pourcentages supérieurs à 25%. Le formatage n’est appliqué qu’aux cellules respectant une condition. www.SolutionStat.ca 14 Formatage conditionnel Exemple 3 : Formatage conditionnel utilisé pour mettre en évidence une ligne ou une colonne entière. Si au moins une cellule de la ligne rencontre la condition, toute la ligne est mise en évidence. Si au moins une cellule de la colonne rencontre la condition, toute la colonne est mise en évidence. www.SolutionStat.ca 15 Formatage conditionnel • La mise en forme conditionnelle s’avère aussi intéressante pour mettre en évidence les tests statistiques qui sont significatifs. www.SolutionStat.ca 16 Formatage conditionnel • La commande de mise en forme conditionnelle est disponible : – Dans la boîte de dialogue d’une commande d’analyse statistique en cliquant sur le bouton « Style »; – Dans la fenêtre des résultats (Output), par le menu Utilities > Style Output www.SolutionStat.ca 17 Nouveautés de la version 22 Quoi de neuf avec la version 22? • Formatage d’un tableau basé sur des expressions conditionnelles • Modification automatique de la sortie • Amélioration de la productivité avec Python www.SolutionStat.ca 18 Éliminer les tâches redondantes • Grâce à la nouvelle commande Output Modify, on peut : Supprimer des objets Modifier les titres Effectuer une transposition de lignes et de colonnes www.SolutionStat.ca 19 Nouveautés de la version 22 Quoi de neuf avec la version 22? • Formatage d’un tableau basé sur des expressions conditionnelles • Modification automatique de la sortie • Amélioration de la productivité avec Python www.SolutionStat.ca 20 Amélioration de la productivité Nouvelle boîte de dialogue de bienvenue Fichiers Fichiers récents Nouveautés Modules and Programmation Tutorats Bénéfices Gagner du temps Utiliser plus rapidement les nouveautés Accéder rapidement aux tutorats www.SolutionStat.ca 21 Amélioration de la productivité avec Python Plusieurs améliorations à la programmation avec Python: • Python est maintenant installé par défaut Cela inclut le plug-in de Python 2.7 pour tous les systèmes d'exploitation et les extensions Il est maintenant plus facile d’utiliser les extensions www.SolutionStat.ca 22 Amélioration de la productivité avec Python Plusieurs améliorations à la programmation avec Python: Rechercher et télécharger des extensions • Les utilisateurs peuvent facilement rechercher et télécharger des extensions provenant de la communauté SPSS • Consulter également les mises à jour de versions installées et les actualiser au besoin www.SolutionStat.ca 23 Amélioration de la productivité avec Python Exemple de création d’un graphique de type nuage de points dans une régression linéaire. Utilisation de l’extension: STATS REGRESS PLOT www.SolutionStat.ca 24 Fonctionnalités Connaissez-vous toutes les possibilités offertes par IBM-SPSS? • • • • Système de gestion des sorties : OMS Module « SPSS Custom Tables » Logiciel « SPSS Text Analytics for Survey » Logiciels R et SPSS www.SolutionStat.ca 25 Fonctionnalités Connaissez-vous toutes les possibilités offertes par IBM-SPSS? • • • • Système de gestion des sorties : OMS Module « SPSS Custom Tables » Logiciel « SPSS Text Analytics for Survey » Logiciels R et SPSS www.SolutionStat.ca 26 Amélioration de la productivité avec l’OMS Le système de gestion des résultats (OMS - Output Management System) accessible via le menu Utilities, permet d’exporter automatiquement le contenu de vos tableaux de résultats. • OMS vous permet, entre autres, d’enregistrer la sortie de vos tableaux, puis d’utiliser cette sortie pour d’autres analyses. Exporter rapidement des résultats d’analyses statistiques tels que les coefficients, les valeurs de tests statistiques, etc. Utile dans le processus de bootstrap www.SolutionStat.ca 27 Amélioration de la productivité avec l’OMS Le panneau de configuration du système de gestion des résultats, OMS Control Panel, vous permet de démarrer et d’arrêter vos requêtes qui acheminent les résultats vers différentes destinations. Chaque requête OMS reste active jusqu’à ce qu’elle soit interrompue (sur demande) ou jusqu’à la fin de la session. Plusieurs requêtes OMS sont indépendantes les unes des autres. www.SolutionStat.ca 28 Amélioration de la productivité avec l’OMS Exemple de création d’une requête OMS: Choisissez les éléments à exporter. www.SolutionStat.ca Spécifiez une destination pour les résultats 29 Fonctionnalités Connaissez-vous toutes les possibilités offertes par IBM-SPSS? • • • • Système de gestion des sorties : OMS Module « SPSS Custom Tables » Logiciel « SPSS Text Analytics for Survey » Logiciels R et SPSS www.SolutionStat.ca 30 Tableaux personnalisés IBM SPSS Custom Tables • IBM SPSS Custom Tables est un outil convivial pour résumer les données provenant d'IBM SPSS Statistics par la création de tableaux personnalisés faciles à lire et à interpréter. • Utile à la création de rapports comme par exemple : • Analyse de données de sondages; • Études de marché. www.SolutionStat.ca 31 Tableaux personnalisés Plus flexible que les outils classiques Commande FREQUENCIES pour obtenir des tableaux de fréquences. Module de tableaux personnalisés SPSS Custom Tables Sélectionner que les statistiques d’intérêt. www.SolutionStat.ca 32 Tableaux personnalisés Présentation de totaux et sous-totaux Présenter la répartition des répondants pour les niveaux de satisfaction générale Présenter le total Présenter des soustotaux. Le sous-total 1 est la somme des 3 premières catégories et le sous-total 2 la somme des 2 dernières catégories. Cacher les catégories incluses dans le calcul des sous-totaux. Présenter uniquement les sous-totaux et le total www.SolutionStat.ca 33 Tableaux personnalisés Sélectionner les statistiques sommaires • Les statistiques descriptives pour les variables qualitatives incluent des effectifs et une grande variété de calculs de pourcentage. • Les statistiques descriptives pour les variables d’échelle (continues) incluent : – Moyenne – Médiane – Percentiles Remarque : Les statistiques – Somme descriptives disponibles – Écart-type dépendent du niveau de mesure – Étendue (Range) de leur variable source. – Valeurs minimale et maximale – Pourcentage de somme, etc. www.SolutionStat.ca 34 Tableaux personnalisés Utiliser différentes structures de construction pour vos tableaux Empilement Emboîtement www.SolutionStat.ca … 35 Tableaux personnalisés Avantages du produit SPSS Tables : • Flexibilité : l’utilisateur choisit l’emplacement des variables, les statistiques produites et le format des données dans les cellules du tableau. • L’utilisateur obtient directement des tableaux prêts à être insérés dans une présentation. On évite des étapes manuelles à l’aide d’Excel pour réorganiser nos tableaux SPSS. • Les tableaux produits peuvent mettre en évidence des tendances, des changements ou des différences importantes. www.solutionstat.ca Débuter avec SPSS 36 Tableaux personnalisés L’interface de génération des tableaux Panneau de canevas www.SolutionStat.ca • Permet de visualiser le tableau tout au long de sa création. • Les variables se glissent simplement dans le panneau de canevas dans les dimensions lignes et colonnes. • Les options du tableau se définissent facilement. • Il est possible de gérer l’apparence du tableau, par exemple, le format d’affichage des statistiques, d’ajouter un titre et du texte sous le tableau. 37 Tableaux personnalisés Optimiser des tâches récurrentes www.SolutionStat.ca • Il est possible de conserver la syntaxe dans le but de reproduire rapidement les mêmes tableaux. • Par exemple, si les tableaux doivent être reproduits tous les mois à partir des nouveaux répondants à votre sondage. 38 Fonctionnalités Connaissez-vous toutes les possibilités offertes par IBM-SPSS? • • • • Système de gestion des sorties : OMS Module « SPSS Custom Tables » Logiciel « SPSS Text Analytics for Survey » Logiciels R et SPSS www.SolutionStat.ca 39 Text Analytics for Survey • Prenons l’exemple d’un hôtel qui veut collecter l’opinion de ses clients. Deux questions ouvertes sont posées aux clients : – Quels sont les points forts de votre séjour à l’hôtel? – Quels sont les points faibles de votre séjour à l’hôtel? Identifiant Points Forts Excellentes prestations générales . J'ai particulièrement apprecié 1 les salons où l'on pouvait travailler ou se reposer en toute tranquillité qualité du service, accueil très chaleureux, discrétion du 2 personnel 3 propreté des lieux, accueil chaleureux, buffet extraordinaire 4 PROXIMITE 5 l'accueil 6 vue sur mer 7 climatisation agreable, belle vue 8 Chambre agréable, restaurant raffiné et service très agréable 9 les chambres bien équipées 10 la piscine 11 femmes de chambre ravissantes. service ok sans + 12 Une grande qualité d'accueil 13 très bon restaurant, service de chambre de qualité 14 belle chambre, service agréable 15 Super piscine, accueil top et chambre très bien entretenue 16 La nourriture, la piscine. 17 La baie vitrée sur les gratte-ciel de Mahattan • Points Faibles Le petit déjeuner n'était pas à la hauteur du tarif pratiqué (Les viennoiseries semblaient dater et manquaient de fraicheur). Le ménage était succinct et rapidement fait. chambres exigues. pas de service de blanchisserie trop de bruit. pas de chambre fumeur ACCEUIL les chambres bruyant bruit Prix excessif l'accueil l'accueil piscine trop petite. buffets assez moyens. Abscence de mini bar l'eau de la piscine était froide, pas de garde d'enfant clim ne fonctionnait pas la cuisine très très médicocre La chambre donné sur une cour crasseuse Rien de spécial Un travail manuel pour analyser tous ces commentaires peut être long et ardu. www.SolutionStat.ca 40 Text Analytics for Survey IBM SPSS Text Analytics for Survey est une application qui permet : • De transformer les textes non structurés de sondages en données quantitatives (catégories). • D’exporter les catégories produites dans le logiciel IBM SPSS Statistics pour les intégrer aux analyses statistiques. • De réutiliser les catégories produites sur des études identiques ou similaires afin d’obtenir des résultats comparables. IBM SPSS Text Analytics for Survey utilise des technologies linguistiques avancées. • Plusieurs langues dont le français. • Possibilité de traduire des réponses écrites en différentes langues vers l’anglais. Pratique si les répondants étaient francophones et anglophones. www.SolutionStat.ca 41 Text Analytics for Survey Pour « décoder » le texte et faire des regroupements, cette application utilisera : • Modèle de ressource • Package d’analyse de texte (TAP - Text Analysis Package) : modèles de catégorisation de réponses texte. – Contient les catégories et les ressources linguistiques nécessaires au codage automatique. – Il est possible de créer et modifier des packages d’analyse de texte. www.SolutionStat.ca 42 Text Analytics for Survey Étape 1 : Extraction de données • • Panneau Résultats d’extraction • • Concepts : regroupements de termes clés. Types : regroupements de concepts (ensemble de termes similaires) Patrons : combinaisons de termes et de types. L’extraction est un processus itératif selon lequel les résultats sont extraits, examinés et modifiés. Résultats d’extraction = concepts + types + patrons Base pour la construction des catégories www.SolutionStat.ca 43 Text Analytics for Survey Étape 2 : Catégorisation des données • Création de catégories : • Automatiquement • Manuellement • Structure hiérarchique • Raffinement des catégories Panneau Catégories • Pour débuter la création des catégories : • Utiliser un package d’analyse de texte (TAP); • Importer un fichier de catégories prédéfinies; • Créer manuellement ses propres catégories. www.SolutionStat.ca 44 Text Analytics for Survey Étape 3 : Exportation des résultats • Une fois que l’assignation des enregistrements aux catégories est satisfaisante, il est possible d’exporter les résultats. • Notamment, on peut créer une base de données SPSS (.sav) qui contiendra le numéro de l’enregistrement et les catégories créées. • Permet d’utiliser les catégories dans les analyses statistiques. www.SolutionStat.ca 45 Text Analytics for Survey • • Dans notre exemple, 16 personnes ont émis un commentaire positif sur l’accueil. En croisant avec l’âge, on constate que 56.3% des répondants qui ont émis un commentaire positif sur l’accueil avaient de 30 à 40 ans. www.SolutionStat.ca 46 Fonctionnalités Connaissez-vous toutes les possibilités offertes par IBM-SPSS? • • • • Système de gestion des sorties : OMS Module « SPSS Custom Tables » Logiciel « SPSS Text Analytics for Survey » Logiciels R et SPSS www.SolutionStat.ca 47 Amélioration de la productivité avec le logiciel R R et SPSS Statistics: Une combinaison gagnante! Qu’est-ce que R? R est un langage de programmation « open source » et un logiciel d’analyses statistiques. Le langage R est très populaire auprès des experts en analyse de données (« Data Mining »). Source: Rexer Analytics 2013 Grâce à R, les utilisateurs de SPSS Statistics ont désormais accès à : Une riche collection de méthodologies d’analyses statistiques très spécialisées Un large éventail de graphiques permettant une meilleure compréhension de vos données. www.SolutionStat.ca 48 Amélioration de la productivité avec le logiciel R Les limites de R: Déploiement : Difficile à intégrer dans un environnement opérationnel Interface: Difficile à utiliser pour des non-programmeurs Courbe d’apprentissage: Longue pour des nonprogrammeurs. Performance: R peut consommer toute la mémoire vive. Avec l’intégration de R dans SPSS, on peut contourner ces limites! Déploiement => Famille complète de produits intégrés, IBM SPSS Statistics, Modeler, Cognos, etc. Interface => Interface graphique (GUI) Courbe d’apprentissage => Plus facile avec SPSS Performance => Serveur pour SPSS Statistics ou Modeler www.SolutionStat.ca 49 Amélioration de la productivité avec le logiciel R La programmation R peut être utilisée pour créer des boîtes de dialogue personnalisées, rendant ainsi la vie plus facile à des nonprogrammeurs qui peuvent ainsi profiter d’algorithmes complexes pour leurs analyses. www.SolutionStat.ca 50 Protection des fichiers par mot de passe Vous pouvez protéger les informations confidentielles inclues dans un fichier de données (.sav), un fichier de résultats (.spv) ou un fichier de syntaxe (.sps) en le chiffrant à l’aide d’un mot de passe. Cette option de chiffrement d’un fichier est disponible à partir des boîtes de dialogue. Les mots de passe ne peuvent pas être récupérés s’ils sont perdus. Note: les fichiers chiffrés ne peuvent être ouverts dans les versions antérieures à la version 21. www.SolutionStat.ca 51 Remerciements • Nous voulons remercier nos partenaires pour leur participation dans l’organisation de ce séminaire. Questions? www.SolutionStat.ca 52 Nous joindre SolutionStat Consultation et formation en statistique inc. 10905, boul. Henri-Bourassa Est Montréal (Québec) H1C 1H1 Courriel: [email protected] • Jean-François Allaire, associé Téléphone: (514) 648-8461, poste 625 Courriel : [email protected] • Julie Meloche Téléphone: (514) 648-8461, poste 629 Courriel : [email protected] www.SolutionStat.ca 53