IBM-SPSS - Solution Stat

publicité
IBM-SPSS
Présentation de SolutionStat
Juin 2014
Ordre du jour
•
Qui sommes-nous?
– Présentation de SolutionStat
– Rôle de SolutionStat en tant que partenaire d’affaires avec IBM pour les
solutions d’analytique prédictive.
– Survol de la famille de produits IBM-SPSS.
•
Quoi de neuf avec la version 22?
– Formatage d’un tableau basé sur des expressions conditionnelles
– Modification automatique de la sortie
– Amélioration de la productivité avec Python
•
Connaissez-vous toutes les possibilités offertes par IBM-SPSS?
–
–
–
–
•
Système de gestion de sortie : OMS
Module « SPSS Custom Tables »
Logiciel « SPSS Text Analytics for Survey »
Combinaison des logiciels R et SPSS
Questions et discussion
www.SolutionStat.ca
2
Qui sommes-nous?
Notre offre
SolutionStat Inc. offre des services de consultation en statistique et
en analytique prédictive et des services de formation portant sur
l’utilisation de logiciels et divers aspects de l’analyse statistique.
Notre mission
• Exploiter l’extraordinaire potentiel des données.
• Optimiser l’utilisation des outils d’analyse statistique
• Faciliter l’établissement de stratégies analytiques, la prise de
décision et l’atteinte d’objectifs de développement des affaires.
www.SolutionStat.ca
3
Nos experts
Notre équipe est composée de consultants qui possèdent :
• Une formation universitaire en statistique et méthodes quantitatives.
• Plusieurs années d'expérience dans le domaine du forage de
données (« Data mining ») et de l'intelligence d'affaires.
• Une capacité à bien comprendre les besoins des clients, à formuler
ces besoins en un langage quantitatif et à communiquer
efficacement les résultats des analyses.
Nos valeurs
•
•
•
•
www.SolutionStat.ca
Flexibilité
Travail d’équipe
Partage de connaissances
Stabilité
4
Nos services
Consultation statistique
Un aperçu de nos services
• Modèles prédictifs / analyses prédictives
• Segmentation
• Analyse de données de sondage
• Analyse de marché
• Géomarketing
• Analyse du panier d’épicerie
• Gestion et création de sondages en ligne
Nos clients
• Vente au détail
• Banques
• Télécommunications
• Organismes
• Gouvernement
Formations en statistique
Cours et formules
• Utilisation du logiciel SPSS
• Application de méthodes statistiques
• Formations en laboratoire (publiques)
• Formations en entreprise
www.SolutionStat.ca
Clientèle visée
• Entreprises privées
• Organismes gouvernementaux
• Universités
• Centres de recherche
5
Nos solutions
•
Grâce à des partenariats stratégiques, SolutionStat fournit des
solutions multifonctionnelles pour vos besoins en analytique des
affaires :
– Revendeur autorisé des produits IBM SPSS
– Collaboration avec NewIntelligence pour le volet Intelligence d’affaires
(Cognos)
– Revendeur autorisé des produits de données de Environics Analytics
www.SolutionStat.ca
6
IBM-SPSS
Partenaire d’IBM, SolutionStat est revendeur des
produits d’analytique prédictive IBM SPSS. Nous
offrons également des services de consultation et de
formation aux entreprises qui désirent exploiter le plein
potentiel de cette gamme de logiciels.
IBM SPSSMD Statistics
Utiliser la puissance de l'analyse statistique évoluée
pour comprendre les données, détecter les tendances
et produire des prévisions précises.
IBM SPSS Modeler
Un puissant ensemble d'utilitaires d'exploration de
données permettant de créer des modèles prédictifs
rapidement et intuitivement sans programmation.
www.SolutionStat.ca
7
IBM SPSS Statistics
Planification
IBM SPSS Complex Samples
IBM SPSS Conjoint
Gestion et préparation
des données
IBM SPSS Data Preparation
IBM SPSS Missing Values
2
1
Analyse de données
3
4
Production de rapports
IBM SPSS Statistics Base
IBM SPSS Advanced Statistics
IBM SPSS Regression
IBM SPSS Categories
IBM SPSS Decision Trees
IBM SPSS Forecasting
IBM SPSS Bootstrapping
IBM SPSS Direct Marketing
IBM SPSS Exact Tests
IBM SPSS Neural Networks
IBM SPSS Custom Tables
www.SolutionStat.ca
8
Nouveautés de la version 22
Quoi de neuf avec la version 22?
•
Formatage d’un tableau basé sur des expressions conditionnelles
•
Modification automatique de la sortie
•
Amélioration de la productivité avec Python
www.SolutionStat.ca
9
Nouveautés de la version 22
Quoi de neuf avec la version 22?
•
Formatage d’un tableau basé sur des expressions conditionnelles
•
Modification automatique de la sortie
•
Amélioration de la productivité avec Python
www.SolutionStat.ca
10
Formatage conditionnel
•
Dans IBM SPSS Statistics 22, de nouvelles fonctions permettent de
modifier le formatage de zones sélectionnées ou de cellules de vos
tableaux basé sur des expressions conditionnelles.
•
Permet de mettre en
évidence des lignes, des
colonnes ou des cellules
spécifiques pour montrer leur
importance.
www.SolutionStat.ca
11
Formatage conditionnel
Exemple 1 : Formatage appliqué à toutes les cellules du tableau.
Il vous est possible de…
•
Modifier le format
d’affichage des valeurs.
•
Remplacer la valeur
présentée dans une
cellule.
www.SolutionStat.ca
Modifier le
nombre de
décimales
affichées
Remplacer les valeurs
de 100% par des blancs
12
Formatage conditionnel
Exemple 2 : Formatage conditionnel utilisé pour mettre en évidence
des cellules.
Plusieurs choix de formats
sont disponibles pour
mettre en évidence une
cellule :
• Mettre la valeur en
gras, en italique ou la
souligner.
• Mettre la valeur en
couleur.
• Surligner la valeur.
Mettre en évidence
les pourcentages
supérieurs à 25%.
Le formatage n’est
appliqué qu’aux cellules
respectant une condition.
www.SolutionStat.ca
13
Formatage conditionnel
Exemple 2 : Formatage conditionnel utilisé pour mettre en évidence
des cellules.
Plusieurs choix de format
sont disponibles pour
mettre en évidence une
cellule :
• Mettre la valeur en
gras, en italique ou la
souligner.
• Mettre la valeur en
couleur.
• Surligner la valeur.
Les pourcentages entre 15% et
25% s’affichent en jaune et les
pourcentages supérieurs à 25%
s’affichent en rouge.
Surligner les
pourcentages
supérieurs à 25%.
Le formatage n’est
appliqué qu’aux cellules
respectant une condition.
www.SolutionStat.ca
14
Formatage conditionnel
Exemple 3 : Formatage conditionnel utilisé pour mettre en évidence
une ligne ou une colonne entière.
Si au moins une cellule de
la ligne rencontre la
condition, toute la ligne est
mise en évidence.
Si au moins une cellule de
la colonne rencontre la
condition, toute la colonne
est mise en évidence.
www.SolutionStat.ca
15
Formatage conditionnel
•
La mise en forme conditionnelle s’avère aussi intéressante pour
mettre en évidence les tests statistiques qui sont significatifs.
www.SolutionStat.ca
16
Formatage conditionnel
•
La commande de mise en forme conditionnelle est disponible :
– Dans la boîte de dialogue d’une commande d’analyse statistique en cliquant
sur le bouton « Style »;
– Dans la fenêtre des résultats (Output), par le menu Utilities > Style Output
www.SolutionStat.ca
17
Nouveautés de la version 22
Quoi de neuf avec la version 22?
•
Formatage d’un tableau basé sur des expressions conditionnelles
•
Modification automatique de la sortie
•
Amélioration de la productivité avec Python
www.SolutionStat.ca
18
Éliminer les tâches
redondantes
•
Grâce à la nouvelle
commande Output Modify, on
peut :
 Supprimer des objets
 Modifier les titres
 Effectuer une transposition
de lignes et de colonnes
www.SolutionStat.ca
19
Nouveautés de la version 22
Quoi de neuf avec la version 22?
•
Formatage d’un tableau basé sur des expressions conditionnelles
•
Modification automatique de la sortie
•
Amélioration de la productivité avec Python
www.SolutionStat.ca
20
Amélioration de la
productivité
Nouvelle boîte de
dialogue de bienvenue
 Fichiers
 Fichiers récents
 Nouveautés
 Modules and
Programmation
 Tutorats
Bénéfices
 Gagner du temps
 Utiliser plus
rapidement les
nouveautés
 Accéder rapidement
aux tutorats
www.SolutionStat.ca
21
Amélioration de la
productivité avec Python
Plusieurs améliorations à la
programmation avec
Python:
• Python est maintenant
installé par défaut
 Cela inclut le plug-in
de Python 2.7 pour
tous les systèmes
d'exploitation et les
extensions
 Il est maintenant plus
facile d’utiliser les
extensions
www.SolutionStat.ca
22
Amélioration de la
productivité avec Python
Plusieurs améliorations à la programmation avec Python:
Rechercher et télécharger des extensions
• Les utilisateurs peuvent facilement rechercher et télécharger des
extensions provenant de la communauté SPSS
• Consulter également les mises à jour de versions installées et les
actualiser au besoin
www.SolutionStat.ca
23
Amélioration de la
productivité avec Python
Exemple de création d’un
graphique de type nuage de
points dans une régression
linéaire. Utilisation de
l’extension:
STATS REGRESS PLOT
www.SolutionStat.ca
24
Fonctionnalités
Connaissez-vous toutes les possibilités offertes par
IBM-SPSS?
•
•
•
•
Système de gestion des sorties : OMS
Module « SPSS Custom Tables »
Logiciel « SPSS Text Analytics for Survey »
Logiciels R et SPSS
www.SolutionStat.ca
25
Fonctionnalités
Connaissez-vous toutes les possibilités offertes par
IBM-SPSS?
•
•
•
•
Système de gestion des sorties : OMS
Module « SPSS Custom Tables »
Logiciel « SPSS Text Analytics for Survey »
Logiciels R et SPSS
www.SolutionStat.ca
26
Amélioration de la
productivité avec l’OMS
Le système de gestion des résultats (OMS - Output
Management System) accessible via le menu
Utilities, permet d’exporter automatiquement le
contenu de vos tableaux de résultats.
• OMS vous permet, entre autres,
d’enregistrer la sortie de vos tableaux, puis
d’utiliser cette sortie pour d’autres analyses.
 Exporter rapidement des résultats
d’analyses statistiques tels que les
coefficients, les valeurs de tests
statistiques, etc.
 Utile dans le processus de bootstrap
www.SolutionStat.ca
27
Amélioration de la
productivité avec l’OMS
Le panneau de configuration du système de gestion des résultats, OMS
Control Panel, vous permet de démarrer et d’arrêter vos requêtes qui
acheminent les résultats vers différentes destinations.
 Chaque requête OMS reste active
jusqu’à ce qu’elle soit interrompue
(sur demande) ou jusqu’à la fin de
la session.
 Plusieurs requêtes OMS sont
indépendantes les unes des autres.
www.SolutionStat.ca
28
Amélioration de la
productivité avec l’OMS
Exemple de création d’une requête OMS:
Choisissez les
éléments à
exporter.
www.SolutionStat.ca
Spécifiez
une
destination
pour les
résultats
29
Fonctionnalités
Connaissez-vous toutes les possibilités offertes par
IBM-SPSS?
•
•
•
•
Système de gestion des sorties : OMS
Module « SPSS Custom Tables »
Logiciel « SPSS Text Analytics for Survey »
Logiciels R et SPSS
www.SolutionStat.ca
30
Tableaux personnalisés
IBM SPSS Custom Tables
•
IBM SPSS Custom Tables est un outil convivial pour résumer les données
provenant d'IBM SPSS Statistics par la création de tableaux personnalisés
faciles à lire et à interpréter.
•
Utile à la création de rapports
comme par exemple :
• Analyse de données de
sondages;
• Études de marché.
www.SolutionStat.ca
31
Tableaux personnalisés
Plus flexible que les outils classiques
Commande
FREQUENCIES pour
obtenir des tableaux de
fréquences.
Module de tableaux
personnalisés SPSS
Custom Tables
Sélectionner que
les statistiques
d’intérêt.
www.SolutionStat.ca
32
Tableaux personnalisés
Présentation de totaux et sous-totaux
Présenter la répartition des
répondants pour les niveaux de
satisfaction générale
Présenter le total
Présenter des soustotaux. Le sous-total 1
est la somme des 3
premières catégories
et le sous-total 2 la
somme des 2
dernières catégories.
Cacher les catégories incluses
dans le calcul des sous-totaux.
Présenter uniquement les
sous-totaux et le total
www.SolutionStat.ca
33
Tableaux personnalisés
Sélectionner les statistiques sommaires
• Les statistiques descriptives pour les variables qualitatives incluent des effectifs et une
grande variété de calculs de pourcentage.
• Les statistiques descriptives pour les variables d’échelle (continues) incluent :
– Moyenne
– Médiane
– Percentiles
Remarque : Les statistiques
– Somme
descriptives disponibles
– Écart-type
dépendent du niveau de mesure
– Étendue (Range)
de leur variable source.
– Valeurs minimale et maximale
– Pourcentage de somme, etc.
www.SolutionStat.ca
34
Tableaux personnalisés
Utiliser différentes structures de construction pour vos tableaux
Empilement
Emboîtement
www.SolutionStat.ca
…
35
Tableaux personnalisés
Avantages du produit SPSS Tables :
•
Flexibilité : l’utilisateur choisit l’emplacement des variables, les statistiques
produites et le format des données dans les cellules du tableau.
•
L’utilisateur obtient directement des tableaux prêts à être insérés dans
une présentation. On évite des étapes manuelles à l’aide d’Excel pour
réorganiser nos tableaux SPSS.
•
Les tableaux produits peuvent mettre en évidence des tendances, des
changements ou des différences importantes.
www.solutionstat.ca
Débuter avec SPSS
36
Tableaux personnalisés
L’interface de génération des tableaux
Panneau de
canevas
www.SolutionStat.ca
•
Permet de visualiser le tableau tout
au long de sa création.
•
Les variables se glissent simplement
dans le panneau de canevas dans
les dimensions lignes et colonnes.
•
Les options du tableau se définissent
facilement.
•
Il est possible de gérer l’apparence
du tableau, par exemple, le format
d’affichage des statistiques, d’ajouter
un titre et du texte sous le tableau.
37
Tableaux personnalisés
Optimiser des tâches récurrentes
www.SolutionStat.ca
•
Il est possible de conserver la
syntaxe dans le but de reproduire
rapidement les mêmes tableaux.
•
Par exemple, si les tableaux doivent
être reproduits tous les mois à partir
des nouveaux répondants à votre
sondage.
38
Fonctionnalités
Connaissez-vous toutes les possibilités offertes par
IBM-SPSS?
•
•
•
•
Système de gestion des sorties : OMS
Module « SPSS Custom Tables »
Logiciel « SPSS Text Analytics for Survey »
Logiciels R et SPSS
www.SolutionStat.ca
39
Text Analytics for Survey
•
Prenons l’exemple d’un hôtel qui veut collecter l’opinion de ses clients.
Deux questions ouvertes sont posées aux clients :
– Quels sont les points forts de votre séjour à l’hôtel?
– Quels sont les points faibles de votre séjour à l’hôtel?
Identifiant Points Forts
Excellentes prestations générales . J'ai particulièrement apprecié
1
les salons où l'on pouvait travailler ou se reposer en toute
tranquillité
qualité du service, accueil très chaleureux, discrétion du
2
personnel
3
propreté des lieux, accueil chaleureux, buffet extraordinaire
4
PROXIMITE
5
l'accueil
6
vue sur mer
7
climatisation agreable, belle vue
8
Chambre agréable, restaurant raffiné et service très agréable
9
les chambres bien équipées
10
la piscine
11
femmes de chambre ravissantes. service ok sans +
12
Une grande qualité d'accueil
13
très bon restaurant, service de chambre de qualité
14
belle chambre, service agréable
15
Super piscine, accueil top et chambre très bien entretenue
16
La nourriture, la piscine.
17
La baie vitrée sur les gratte-ciel de Mahattan
•
Points Faibles
Le petit déjeuner n'était pas à la hauteur du tarif pratiqué (Les
viennoiseries semblaient dater et manquaient de fraicheur). Le
ménage était succinct et rapidement fait.
chambres exigues. pas de service de blanchisserie
trop de bruit. pas de chambre fumeur
ACCEUIL
les chambres
bruyant
bruit
Prix excessif
l'accueil
l'accueil
piscine trop petite. buffets assez moyens.
Abscence de mini bar
l'eau de la piscine était froide, pas de garde d'enfant
clim ne fonctionnait pas
la cuisine très très médicocre
La chambre donné sur une cour crasseuse
Rien de spécial
Un travail manuel pour analyser tous ces commentaires peut être long et
ardu.
www.SolutionStat.ca
40
Text Analytics for Survey
IBM SPSS Text Analytics for Survey est une application qui permet :
• De transformer les textes non structurés de sondages en données
quantitatives (catégories).
• D’exporter les catégories produites dans le logiciel IBM SPSS Statistics
pour les intégrer aux analyses statistiques.
• De réutiliser les catégories produites sur des études identiques ou similaires
afin d’obtenir des résultats comparables.
IBM SPSS Text Analytics for Survey utilise des
technologies linguistiques avancées.
• Plusieurs langues dont le français.
• Possibilité de traduire des réponses écrites en différentes
langues vers l’anglais. Pratique si les répondants étaient
francophones et anglophones.
www.SolutionStat.ca
41
Text Analytics for Survey
Pour « décoder » le texte et faire des regroupements, cette application utilisera :
• Modèle de ressource
• Package d’analyse de texte (TAP - Text Analysis Package) : modèles de
catégorisation de réponses texte.
– Contient les catégories et les ressources linguistiques nécessaires au codage
automatique.
– Il est possible de créer et modifier des packages d’analyse de texte.
www.SolutionStat.ca
42
Text Analytics for Survey
Étape 1 : Extraction de données
•
•
Panneau
Résultats
d’extraction
•
•
Concepts : regroupements de termes
clés.
Types : regroupements de concepts
(ensemble de termes similaires)
Patrons : combinaisons de termes et
de types.
L’extraction est un processus itératif
selon lequel les résultats sont
extraits, examinés et modifiés.
Résultats d’extraction = concepts + types + patrons
Base pour la construction des catégories
www.SolutionStat.ca
43
Text Analytics for Survey
Étape 2 : Catégorisation des données
•
Création de catégories :
• Automatiquement
• Manuellement
•
Structure hiérarchique
•
Raffinement des catégories
Panneau
Catégories
•
Pour débuter la création des catégories :
• Utiliser un package d’analyse de texte (TAP);
• Importer un fichier de catégories prédéfinies;
• Créer manuellement ses propres catégories.
www.SolutionStat.ca
44
Text Analytics for Survey
Étape 3 : Exportation des résultats
•
Une fois que l’assignation des
enregistrements aux catégories est
satisfaisante, il est possible d’exporter
les résultats.
•
Notamment, on peut créer une base
de données SPSS (.sav) qui
contiendra le numéro de
l’enregistrement et les catégories
créées.
•
Permet d’utiliser les catégories dans
les analyses statistiques.
www.SolutionStat.ca
45
Text Analytics for Survey
•
•
Dans notre exemple, 16 personnes ont émis un commentaire positif sur
l’accueil.
En croisant avec l’âge, on constate que 56.3% des répondants qui ont émis
un commentaire positif sur l’accueil avaient de 30 à 40 ans.
www.SolutionStat.ca
46
Fonctionnalités
Connaissez-vous toutes les possibilités offertes par
IBM-SPSS?
•
•
•
•
Système de gestion des sorties : OMS
Module « SPSS Custom Tables »
Logiciel « SPSS Text Analytics for Survey »
Logiciels R et SPSS
www.SolutionStat.ca
47
Amélioration de la
productivité avec le logiciel R
R et SPSS Statistics: Une combinaison gagnante!
Qu’est-ce que R?
R est un langage de programmation « open source »
et un logiciel d’analyses statistiques. Le langage R
est très populaire auprès des experts en
analyse de données (« Data Mining »).
Source: Rexer Analytics 2013
Grâce à R, les utilisateurs de SPSS Statistics ont
désormais accès à :
 Une riche collection de méthodologies d’analyses
statistiques très spécialisées
 Un large éventail de graphiques
permettant une meilleure compréhension de vos données.
www.SolutionStat.ca
48
Amélioration de la
productivité avec le logiciel R
Les limites de R:
 Déploiement : Difficile à intégrer dans un environnement
opérationnel
 Interface: Difficile à utiliser pour des non-programmeurs
 Courbe d’apprentissage: Longue pour des nonprogrammeurs.
 Performance: R peut consommer toute la mémoire vive.
Avec l’intégration de R dans SPSS, on peut
contourner ces limites!
 Déploiement => Famille complète de produits intégrés, IBM
SPSS Statistics, Modeler, Cognos, etc.
 Interface => Interface graphique (GUI)
 Courbe d’apprentissage => Plus facile avec SPSS
 Performance => Serveur pour SPSS Statistics ou Modeler
www.SolutionStat.ca
49
Amélioration de la
productivité avec le logiciel R
La programmation R peut être utilisée pour créer des boîtes de
dialogue personnalisées, rendant ainsi la vie plus facile à des nonprogrammeurs qui peuvent ainsi profiter d’algorithmes complexes
pour leurs analyses.
www.SolutionStat.ca
50
Protection des fichiers par mot de
passe
Vous pouvez protéger les informations confidentielles inclues dans un fichier de
données (.sav), un fichier de résultats (.spv) ou un fichier de syntaxe (.sps) en le
chiffrant à l’aide d’un mot de passe. Cette option de chiffrement d’un fichier est
disponible à partir des boîtes de dialogue.
 Les mots de passe ne peuvent
pas être récupérés s’ils sont
perdus.
Note: les fichiers chiffrés ne peuvent être
ouverts dans les versions antérieures à la
version 21.
www.SolutionStat.ca
51
Remerciements
•
Nous voulons remercier nos partenaires pour leur participation dans
l’organisation de ce séminaire.
Questions?
www.SolutionStat.ca
52
Nous joindre
SolutionStat Consultation et formation en statistique inc.
10905, boul. Henri-Bourassa Est
Montréal (Québec)
H1C 1H1
Courriel: [email protected]
•
Jean-François Allaire, associé
Téléphone: (514) 648-8461, poste 625
Courriel : [email protected]
•
Julie Meloche
Téléphone: (514) 648-8461, poste 629
Courriel : [email protected]
www.SolutionStat.ca
53
Téléchargement