n Corrélations des variables transformées et
racines caractéristiques de la matrice de
corrélation pour chaque dimension
n Corrélations des variables originales et des
racines caractéristiques de la matrice de
corrélation
n Notes des objets
n Contributions des objets : Masse,
inertie, contribution des objets à l’inertie
des dimensions et contribution des
dimensions à l’inertie des objets
n Graphez les résultats, en créant les
éléments suivants :
n Graphiques de catégorie : points de
catégorie, transformation (quantifications
de catégorie optimale contre indicateurs
de catégorie), valeurs résiduelles pour les
variables sélectionnées et graphique joint
de points de catégorie pour une sélection
de variables
n Notes des objets
n Mesures de discrimination
n Biplots d’objet et centroïdes de variables
sélectionnées
– Ajoutez des variables transformées et des
notes d’objet au fichier de données de travail
– Ecrivez des données discrétisées, des
données transformées et des notes d’objet
vers un fichier de données externes
CATPCA
n Analyse des composantes principales via le
dimensionnement optimal
– Spécifiez le niveau de dimensionnement
optimal auquel vous souhaitez analyser
chaque variable. Choisissez entre : spline
ordinal (monotone), spline nominal (non
monotone), ordinal, nominal, nominal
multiple ou numérique.
– Spécifiez les poids des variables
– Discrétisez les variables continues ou
convertissez les variables de chaîne
en valeurs d’entiers numériques en
multipliant, classant ou regroupant les
valeurs en un nombre présélectionné
de catégories selon une distribution
optionnelle (normale ou uniforme), ou
en regroupant les valeurs d’un intervalle
présélectionné en catégories. Les options
de classement et de regroupement
peuvent également être utilisées pour
recoder les données catégoriques.
– Spécifiez comment vous souhaitez
gérer les données manquantes. Excluez
uniquement les cellules de la matrice
de données sans valeur valide, imputez
les données manquantes avec le
mode variable ou avec une catégorie
supplémentaire, ou utilisez l’exclusion au
niveau des listes.
– Imprimez les résultats, dont :
n Résumé de modèle
n Statistiques et historique d’itérations
n Statistiques descriptives (fréquences,
valeurs manquantes et mode)
nVariance prise en compte par variable et
par dimension
n Chargements de composants
n Quantifications de catégorie et coor
données de catégorie (vecteur et/ou
coordonnées centroïdes) pour chaque
dimension
n Corrélations des variables transfor
mées et racines caractéristiques de la
matrice de corrélation
n Corrélations des variables origina
les et racines caractéristiques de la
matrice de corrélation
n Notes d’objet (composant)
– Graphez les résultats en créant :
n Graphiques de catégorie : points
de catégorie, transformations
(quantifications de catégorie
optimale contre indicateurs de
catégorie, valeurs résiduelles
pour les variables sélectionnées
et graphique joint des points
de catégorie pour une sélection
de variables
n Graphique des notes d’objet (composant)
n Graphique des chargements de composant
PROXSCAL
n Analyse de positionnement ltidimensionnel
– Lisez une ou plusieurs matrices carrées de
proximité, symétrique ou asymétrique
– Lisez les poids, configurations initiales,
coordonnées fixées et variables
indépendantes
– Traitez les proximités en tant qu’ordinales
(non métriques) ou numériques (métriques)
; les transformations ordinales peuvent
traiter les observations associées en tant
que valeurs discrètes ou continues
– Spécifiez le dimensionnement
multidimensionnel avec trois modèles de
différence ainsi que le modèle d’identité
– Spécifiez les coordonnées fixes ou les
variables indépendantes pour limiter
la configuration. Additionnellement,
spécifiez les transformations (numériques,
nominales, ordinales et splines) pour les
variables indépendantes.
PREFSCAL
n Examinez visuellement les relations entre
deux objets afin de trouver une échelle
quantitative commune
– Lisez une ou plusieurs matrices
rectangulaires de proximité
– Lisez les poids, configurations initiales, et
coordonnées fixées
– Transformez optionnellement les proximités
avec les fonctions linéaire, ordinale,
ordinale lissée ou spline
– Spécifiez le dépliage multidimensionnel
avec identité, modèle euclidien pondéré ou
modèles euclidiens généralisés
– Spécifiez des coordonnées de ligne et de
colonne fixes pour limiter la configuration
Configuration système
n Logiciel : PASW Statistics Base* 17.0
n Les autres pré-requis système varient en
fonction du système d'exploitation
Fonctionnalités susceptibles de modifications en fonction
de la version finale mise en vente.
Ce symbole indique une nouvelle fonction
– Ajoutez des variables transformées, des
valeurs prédites et des valeurs résiduelles
au fichier de données de travail
– Imprimez les résultats, dont :
n Multiple R, R2, et graphiques R2 ajustés
n Coefficients de régression standardisés,
erreurs standard, corrélation d’ordre
zéro, corrélation de partie, corrélation
partielle, mesure de l’importance
relative de Pratt pour les prédicteurs
transformés, tolérance avant et après
transformation, et statistiques F
n Tableau de statistiques descriptives
incluant les fréquences marginales, le
type de transformation, le nombre de
valeurs manquantes et le mode
n Historique d’itérations
n Tableaux pour les paramètres
d’ajustement et de modèle : Tableau
ANOVA avec degrés de liberté en
fonction du niveau de dimensionnement
optimal ; tableau résumé de modèle
avec R2 ajusté pour dimensionnement
optimal, valeurs t et niveaux de
signification ; un tableau séparé avec
ordre zéro, corrélation de partie et
corrélation partielle ; et l’importance et la
tolérance avant et après transformation.
n Corrélations des prédicteurs transformés
et des racines caractéristiques de la
matrice de corrélation
n Corrélations des prédicteurs originaux et
racines caractéristiques de la matrice de
corrélation
n Quantifications de catégories
– Ecrivez des données discrétisées et
transformées dans un fichier de données
externe
n Trois nouvelles méthodes de régularisation :
Ridge Regression, Lasso et Elastic Net
– Améliorez la précision de prédiction en
stabilisant les estimations de paramètres
– Analysez les données à fort volume
(davantage de variables que d’objets)
– Obtenez la sélection automatique de
variable à partir du jeu de prédicteurs
– Ecrivez des modèles et des coefficients
régularisés vers un nouvel ensemble de
données pour utilisation ultérieure.
n Deux nouvelles méthodes pour l’évaluation
de la précision prédictive et de la sélection
de modèle : .632(+) bootstrap, et Validation
croisée (CV)
– Trouvez le modèle optimal pour la
prédiction avec les options .632(+)
bootstrap et CV
– Obtenez les estimations non paramétriques
des erreurs standard des coefficients avec
le bootstrap
n Démarrages multiples systématiques
– Découvrez la solution optimale globale
lorsque des transformations monotones
sont présentes
– Ecrivez les signes des coefficients de
régression vers un nouvel ensemble de
données pour réutilisation
CORRESPONDANCE
n Analyse des correspondances
– Entrez les données en tant que fichier
de cas ou directement en tant qu’entrée de
tableau
– Spécifiez le nombre de dimensions de
la solution
– Choisissez entre deux mesures de
distances : Distances Khi-carré pour
l’analyse des correspondances ou distances
euclidiennes pour les types d’analyse biplot
– Choisissez entre cinq types de
standardisation : suppression des
moyennes de ligne, suppression des
moyennes de colonne, suppression
des moyennes de ligne et de colonne,
égalisation des totaux de ligne, ou
égalisation des totaux de colonne
– Cinq types de normalisation : symétrique,
principale, principale ligne, principale
colonne et personnalisée
– Imprimez les résultats, dont :
n Tableau des correspondances
n Tableau résumé : valeurs singulières,
inertie, proportion d’inertie, prise en
compte par les dimensions, proportions
cumulatives d’inertie prises en compte
par les dimensions, statistiques de
confiance pour le nombre maximum de
dimensions, profils de ligne et profils de
colonne
n Présentation des points de ligne et
de colonne : Masse, notes, inertie,
contribution des points à l’inertie
des dimensions et contributions des
dimensions à l’inertie des points
n Statistiques de confiance de ligne et
de colonne : déviations standard et
corrélations pour les points de ligne et
de colonne actifs
CORRESPONDANCES MULTIPLES
n Analyse des correspondances multiples
(remplace l’analyse HOMALS, incluse dans les
versions antérieures à SPSS Categories 13.0)
– Spécifiez le poids des variables
– Discrétisez les variables continues ou
convertissez les variables de chaîne en
valeurs d’entiers numériques en multipliant,
classant ou regroupant les valeurs en un
nombre présélectionné de catégories selon
une distribution optimale (normale ou
uniforme), ou en regroupant les valeurs d’un
intervalle présélectionné en catégories. Les
options de classement et de regroupement
peuvent également être utilisées pour
recoder les données catégoriques.
– Spécifiez comment vous souhaitez
gérer les données manquantes. Excluez
uniquement les cellules de la matrice
de données sans valeur valide, imputez
les données manquantes avec le
mode variable ou avec une catégorie
supplémentaire, ou utilisez l’exclusion au
niveau des listes.
– Spécifiez les objets et variables devant
être traités comme supplémentaires
(la sortie complète est incluse pour les
catégories qui se produisent uniquement
pour les objets supplémentaires)
– Spécifiez le nombre de dimensions dans la
solution
– Spécifiez un fichier contenant les
coordonnées d’une configuration et
les variables d’ajustement dans cette
configuration fixée
– Choisissez entre cinq options de
normalisation : variable principale (optimise
les associations entre les variables), objet
principal (optimise les distances entre
les objets), symétrique (optimise les
relations entre les objets et les variables),
indépendant, ou personnalisée (valeurs
spécifiées par l’utilisateur autorisant tout ce
qui est situé entre la normalisation principale
de variable et la normalisation principale
d’objet)
– Contrôlez le nombre d’itérations
– Spécifiez le critère de convergence
– Imprimez les résultats, dont :
n Résumé de modèle
n Statistiques et historique d’itérations
n Statistiques descriptives (fréquences,
valeurs manquantes et mode)
n Mesures de discrimination par variable et
dimension
n Quantifications de catégorie (coordonnées
centroïdes), masses, inertie des
catégories, contribution des catégories à
l’inertie des dimensions et contribution
des dimensions à l’inertie des catégories
To learn more, please visit www.spss.com.
For SPSS office locations and telephone numbers,
go to www.spss.com/worldwide.
SPSS is a registered trademark and the other SPSS Inc. products
named are trademarks of SPSS Inc. All other names are trademarks
of their respective owners. © 2009 SPSS Inc. All rights reserved.
SCT1702SPC-0209-FR
Prédire les résultats et révéler les
relations dans les données catégoriques
PASW® Categories 17.0 – Spécifications
Libérez tout le potentiel de vos données via l’analyse
prédictive, l’apprentissage statistique, le mapping
perceptuel, le dimensionnement des préférences et
les techniques de réduction de dimensions, dont le
dimensionnement optimal de vos variables. PASW
Categories* dispose de tous les outils nécessaires pour
une visibilité parfaite sur vos données catégoriques et
numériques complexes et sur les données de grandes
dimensions.
Vous pouvez par exemple utiliser PASW Categories pour
déterminer quelle caractéristique les consommateurs
associent le plus étroitement à votre produit ou à votre
marque ou pour déterminer la perception qu’a le client
de vos produits par comparaison avec d’autres produits
proposés par vous-mêmes ou par vos concurrents.
Avec PASW Categories, vous pouvez utiliser la régression
lorsque les prédicteurs et les variables de sortie sont
numériques, ordinaux ou nominaux et interpréter
visuellement les données pour voir comment les lignes
et les colonnes s’associent dans les grands tableaux de
notes, de décomptes, d’estimations, de classements ou de
similarités. Vous disposez ainsi de la capacité à :
n Travailler avec les données ordinales et nominales et les
comprendre en utilisant des procédures similaires à la
régression conventionnelle, les composants principaux et
les analyses de corrélation canonique.
n Travailler avec des valeurs résiduelles non normales dans
les données numériques ou des relations non linéaires
entre les variables de prédicteur et la variable de sortie.
Utilisez les options Ridge Regression, Lasso, Elastic
Net, la sélection de variable et la sélection de modèle
pour les données numériques comme pour les données
catégoriques.
n Utiliser des biplots et des triplots (diagrammes à double
ou triple projection) pour représenter la relation entre les
objets (cas), les catégories et les (jeux de) variables dans
les analyses de corrélation.
n Représenter les similarités entre un ou deux jeux d’objets
sous la forme de distances sur les cartes perceptuelles.
Transformez vos variables qualitatives en variables
quantitatives
Les procédures avancées disponibles sous PASW Categories
permettent d’exécuter des opérations statistiques
additionnelles sur les données catégoriques.
Utilisez les procédures de dimensionnement optimal
(optimal scaling) de PASW Categories pour assigner
des unités de mesure et des points zéro à vos données
catégoriques. Cette approche vous ouvre un tout nouvel
ensemble de fonctions statistiques et vous permet
d’exécuter des analyses sur les variables de niveaux de
mesures mixtes–par exemple, sur des combinaisons de
variables nominales, ordinales et numériques.
* PASW Categories et PASW Statistics Base, précédemment
SPSS Categories
™
et SPSS Statistics Base, font partie du
portefeuille de logiciels d’analyse prédictive de SPSS Inc.