Analysez vos données
catégorielles
PASW® Categories 18 – Spécifications
Libérez la totalité du potentiel de vos données à travers
l’analyse prédictive, l’apprentissage statistique, le mapping
perceptuel, le dimensionnement des préférences et les
techniques de réduction des dimensions, y compris
le dimensionnement optimal de vos variables. PASW
Categories* vous fournit tous les outils dont vous avez
besoin pour obtenir des informations claires sur les
données numériques et catégorielles complexes ainsi
que les données à nombre de dimensions élevé.
Par exemple, utilisez PASW Categories pour comprendre
quelles sont les caractéristiques que les consommateurs
associent le plus à votre produit ou à votre marque, ou pour
déterminer la perception que les clients ont de vos produits
par rapport aux autres produits que vous ou vos concurrents
proposez.
Avec PASW Categories, vous pouvez appliquer une régres-
sion lorsque la variable prédite et les variables de résultat
sont numériques, ordinales ou nominales et interpréter
* PASW Categories et PASW Statistics Base, anciennement nommés
SPSS Categories et SPSS Statistics Base, font partie de la gamme
Predictive Analytics Software de SPSS Inc.
visuellement les données pour observer le lien entre les
lignes et les colonnes dans de grands tableaux de scores,
d’effectifs, d’évaluations, de classements ou de similarités.
Ceci vous permet de :
n Comprendre et travailler avec les données ordinales
et nominales à l’aide de procédures similaires aux
analyses de régression conventionnelle, de composantes
principales et de corrélation canonique.
n Traiter les résidus anormaux dans les données
numériques ou les relations non linéaires entre les
variables de valeurs prédites et la variable de résultat.
Utiliser les options de régression de crête, le lasso,
Elastic Net, la sélection des variables et la sélection des
modèles pour les données numériques et catégorielles.
n Utiliser des diagrammes doubles et triples pour
représenter la relation entre les objets (observations),
les catégories et les (ensembles de) variables dans les
analyses de corrélation
n Représenter les similarités entre un ou deux ensembles
d’objets comme les distances dans les cartes
perceptuelles
Chaque module de la famille PASW Statistics peut
désormais être installé et exécuté séparément ou en
association avec d’autres modules. PASW® Statistics
Base* n’est plus nécessaire, car des fonctionnalités telles
que l’accès et la gestion des données et la création de
graphiques ont été ajoutées à tous les modules. Ceci vous
donne une flexibilité accrue dans la manière d’installer et
d’utiliser ce logiciel polyvalent. PASW Statistics Base existe
toujours et reste à la base de nombreux déploiements,
puisqu’il contient des procédures et tests statistiques
fondamentaux pour beaucoup d’analyses.
Transformez vos variables qualitatives en
variables quantitatives
Les procédures avancées disponibles dans PASW Categories
vous permettent d’effectuer des opérations statistiques
supplémentaires sur les données catégorielles.
Utilisez les procédures de dimensionnement optimal de
PASW Categories. Ceci ouvre un nouvel ensemble de fonc-
tions statistiques en vous permettant d’effectuer des analy-
ses de variables de niveaux de mesure mixtes, de combi-
naisons de variables nominales, ordinales et numériques,
par exemple.
La capacité de PASW Categories d’effectuer des régressions
multiples avec un dimensionnement optimal vous permet
d’appliquer la régression lorsque vous avez des mélanges
de valeurs prédites numériques, ordinales et nominales
et des variables de résultat. La dernière version de PASW
Categories comprend des procédures de pointe pour
la sélection et la régularisation des modèles. Vous
pouvez effectuer des analyses de correspondance et de
correspondance multiple pour évaluer numériquement
les relations entre deux variables nominales ou plus dans
vos données. Vous pouvez également utiliser l’analyse des
correspondances pour analyser tout tableau ayant
des entrées non négatives.
De plus, avec la procédure d’analyse des composantes prin-
cipales, vous pouvez réduire vos données aux composantes
importantes. Les diagrammes doubles et triples d’objets,
de catégories et de variables montrent les relations. Ces
options sont également disponibles pour les données
numériques. Le dimensionnement optimal vous donne
une matrice de corrélation basée sur les quantifications
de vos variables ordinales et nominales. Vous pouvez
également diviser vos variables en ensembles puis analyser
les relations entre les ensembles avec l’analyse de
corrélations canoniques non linéaires.
Affichez graphiquement les relations sous-jacentes
Quels que soient les types de catégories que vous
étudiez, segments de marché, diagnostics médicaux,
sous-cultures, partis politiques ou espèces biologiques,
les procédures de dimensionnement optimal vous libèrent
des restrictions associées aux tableaux à double entrée,
plaçant les relations dans vos variables dans un cadre de
référence plus grand. Vous pouvez voir une carte des vos
données et pas seulement un rapport statistique.
Les techniques de réduction des dimensions de PASW
Categories vous permettent d’aller au-delà des tableaux
volumineux. Au lieu de cela, vous pouvez clarifier
les relations dans vos données à l’aide de cartes
perceptuelles et de diagrammes doubles.
nLes cartes perceptuelles sont des graphiques
récapitulatifs haute résolution qui affichent graphique-
ment les variables similaires ou les catégories proches les
unes des autres. Elles vous fournissent des informations
uniques sur les relations entre plus de deux variables
catégorielles.
nLes diagrammes doubles et triples vous permettent
d’examiner les relations entre les observations, les
variables et les catégories. Par exemple, vous pouvez
définir les relations entre les produits, les clients et
les caractéristiques démographiques.
En utilisant la dimensionnement des préférences, vous
pouvez également visualiser les relations entre les objets.
L’algorithme de dépliage innovant sur lequel cette
procédure est basée vous permet d’effectuer des analyses
non métriques pour les données ordinales et d’obtenir
des résultats pertinents. Le dimensionnement des proximi-
tés vous permet d’analyser les similarités entre les objets
et d’inclure les caractéristiques des objets dans la même
analyse.
Comment utiliser PASW Categories ?
La régression catégorielle (CATREG) prédit les valeurs d’une
variable de résultat nominale, ordinale ou numérique à
partir d’une combinaison de variables de valeurs prédites
catégorielles (non) ordonnées et numériques. Vous pouvez
utiliser la régression avec le dimensionnement optimal
pour décrire, par exemple, comment la satisfaction
professionnelle peut être prédite à partir de la catégorie
professionnelle, la région géographique et le nombre de
trajets professionnels.
Les techniques de dimensionnement optimal quantifient
les variables de manière à maximiser le R multiple. Le
dimensionnement optimal peut être appliqué aux variables
numériques quand les résidus sont anormaux ou quand
les variables de valeurs prédites ne sont pas associées de
manière linéaire à la variable de résultat. Trois nouvelles
méthodes de régularisation : régression de crête, le lasso
et Elastic Net améliorent la précision de la prédiction
en stabilisant les estimations des paramètres. La sélection
automatique des variables permet d’analyser des
ensembles de données importants contenant plus de
variables que d’objets. En utilisant le niveau d’échelle
numérique, vous pouvez aussi effectuer des régularisations
dans la régression avec le lasso ou Elastic Net pour vos
données numériques.
Vous pouvez également utiliser CATREG pour appliquer
des modèles additifs généralisés (GAM) à vos données
numériques et catégorielles.
(compacte, moyenne, décapotable, utilitaire, sport, etc.) et
CATPCA utilise ces classifications pour grouper les points
des voitures. En attribuant un poids important à la variable
de classification, les voitures se regroupent étroitement
autour du point de leur classe. PASW Categories affiche
les relations complexes entre les objets, les groupes et les
variables dans une carte à dimensions réduites facilitant la
compréhension de leurs relations.
L’analyse de corrélations canoniques non linéaires
(OVERALS) utilise le dimensionnement optimal pour généra-
liser la procédure d’analyse des corrélations canoniques afin
de s’adapter à des variables de niveaux de mesure mixtes.
Ce type d’analyse vous permet de comparer plusieurs
ensembles de variables entre eux dans le même diagramme
après avoir supprimé la corrélation dans les ensembles.
Par exemple, vous pouvez analyser les caractéristiques
des produits. Les juges représentent les variables dans les
ensembles alors que les produits sont les observations.
OVERALS établit les évaluations des juges après la sup-
pression des corrélations et combine les différentes car-
actéristiques pour afficher les relations entre les produits.
Chaque juge peut également avoir utilisé un ensemble de
critères séparé pour juger les produits. Dans ce cas, chaque
juge forme un ensemble et OVERALS établit la moyenne des
critères après avoir supprimé les corrélations, puis combine
les scores des différents juges.
L’analyse des correspondances (CORRESPONDENCE) vous
permet d’analyser les tableaux à double entrée contenant
des mesures de correspondance entre les lignes et les
colonnes ainsi que d’afficher les lignes et les colonnes
comme des points sur une carte. Un type de tableau de
correspondance très commun est un tableau à double
entrée dans lequel les cellules contiennent des effectifs
joints pour deux variables nominales. PASW Categories
affiche les relations entre les catégories de ces variables
nominales dans une présentation visuelle.
L’analyse des correspondances multiples (MULTIPLE
CORRESPONDENCE) diffère de l’analyse des correspon-
dances dans le fait qu’elle vous permet d’utiliser plus de
deux variables dans votre analyse. Avec cette procédure,
toutes les variables sont analysées au niveau nominal
(catégories non ordonnées).
Par exemple, vous pouvez utiliser l’analyse de correspon-
dances multiples pour explorer les relations entre l’émission
de télévision préférée, la tranche d’âge et le sexe.
L’analyse des composantes principales catégorielles
(CATPCA) utilise le dimensionnement optimal pour
généraliser la procédure d’analyse des composantes
principales afin de s’adapter à des variables de niveaux
de mesure mixtes. Elle est semblable à l’analyse des
correspondances multiples, excepté le fait que vous
pouvez spécifier un niveau d’analyse variable par variable.
Par exemple, vous pouvez afficher les relations entre
différentes marques de voitures et les caractéristiques
telles que le prix, le poids, la consommation, etc. Vous
pouvez également décrire les voitures d’après leur classe
La procédure OVERALS peut également être utilisée pour
généraliser la régression multiple lorsque vous avez des
variables de résultats multiples à prédire conjointement à
partir d’un ensemble de variables de valeurs prédites.
Le positionnement multidimensionnel (PROXSCAL) effectue
un positionnement multidimensionnel d’une ou plusieurs
matrices contenant des similarités ou des dissemblances
(proximités). Vous pouvez également calculer les distances
entre les observations dans les données multivariées
comme entrée dans PROXSCAL. PROXSCAL affiche les
proximités comme des distances dans une carte afin que
vous ayez une compréhension spaciale de la relation entre
les objets. Dans le cas des matrices de proximité multiples,
PROXSCAL analyse les points communs et représente les
différences entre eux.
Par exemple, vous pouvez utilisez PROXSCAL pour afficher
les similarités entre les différentes saveurs des boissons
préférées par les consommateurs dans diverses tranches
d’âge. Vous constaterez peut-être que les jeunes soulignent
les différences entre les saveurs traditionnelles et nouvelles
alors que les adultes mettent l’accent sur les boissons allé-
gées par rapport aux boissons non allégées.
Le dimensionnement des préférences (PREFSCAL)
examine visuellement les relations entre deux ensembles
d’objets, par exemple les consommateurs et les produits.
Le classement des préférences effectue un dépliage
multidimensionnel afin de trouver une carte représentant
les relations entre ces deux ensembles d’objets en tant
que distances entre deux ensembles de points.
Par exemple, si un groupe de conducteurs a évalué 26
modèles de voitures en dix attributs sur une échelle de
six points, vous pouvez trouver une carte avec des classes
affichant les modèles similaires et les personnes qui
préfèrent ces modèles. Cette carte est un compromis basé
sur les dix attributs différents et un graphique des dix
attributs différents montre comment ils influencent
de façon différentielle les dimensions de la carte.
PASW Categories peut être installé en tant que logiciel client
seulement mais, pour des performances optimales, une ver-
sion serveur est également disponible.
Une plus grande valeur ajoutée grâce à la collaboration
Pour partager et réutiliser efficacement des actifs, les
protéger en respectant les règles de conformité internes et
externes et publier les résultats de manière à ce qu’un plus
grand nombre d’utilisateurs puissent les consulter et les
utiliser, envisagez d’enrichir votre logiciel PASW Statistics
avec PASW® Collaboration and Deployment Services
(anciennement SPSS Predictive Enterprise Services). Vous
pouvez obtenir plus d’informations sur ces précieuses fonc-
tionnalités en téléchargeant la brochure « Collaboration »
sur www.spss.com/fr/software/deployment/cds.
1 / 8 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !