Questionnaire - Psychologie Statistique

publicité
Psychologie,
Première année,
Questionnaire.
Description des résultats
Remarques
On commence par décrire la situation
statistique.
Les variables sont au nombre de 63. Chaque
variable peut être étudiée séparément des
autres ;
Ou bien, les variables peuvent être étudiées
par deux ;
Ou bien par groupes plus importants.
Remarques
L’étude des variables une par une est une
étape indispensable, mais non suffisante en
général, de la description des résultats.
De même, les méthodes permettant
d’étudier le lien entre deux variables ne
répondent pas à toutes les questions
possibles, et des méthodes plus générales
devront être utilisées par la suite.
Remarques
Du fait du grand nombre de variables, nous
ne les détaillerons pas toutes, donnant
seulement quelques exemples
particulièrement parlants.
Plan
1.
2.
3.
4.
Situation statistique
Une variable à la fois
Deux variables à la fois
Limites et compléments
1. La situation statistique
Poser les bases pour un traitement
approprié
Sujets
On a relevé pour chaque étudiant volontaire
(individu) de la promotion (échantillon) un
certain nombre de grandeurs afin de
déterminer le profil, l’attitude face à la
psychologie, etc. de l’ensemble des
étudiants en psychologie (population).
L’échantillon est de taille 232 (n=232).
Variables
Certaines des 63 variables sont dichotomiques
(mots à entourer, sexe), ou nominales
(exemple de fruit, d’animal, groupe).
D’autres sont quantitatives (notes).
Tableau descriptif (SPSS)
Tableaux statistiques (SPSS)
2. Une variable à la fois
Présentation, représentation, calcul de
paramètres.
Exemple 1
Description de la population
Variables inutiles ?
Une étape préliminaire est la description de
la population.
On utilise pour cela des variables (âge, sexe,
niveau d’étude) qui n’ont pas d’intérêt
direct dans l’étude, mais qui permettent de
se faire une idée de la population.
Groupes
L’une des variables importantes est ici le
« groupe » (hasard, typique, premier).
Pour que les comparaisons entre les groupes
soient pertinentes, il est évidemment
nécessaire que les groupes soient similaires
du point de vue des variables sexe, âge,
étude.
Nous allons donc construire des tableaux
donnant les différences entre les groupes.
Survol
Pour décrire une variable, on peut :
1. Présenter les fréquences ou effectifs dans
des tableaux (construire le tableau
statistique)
2. Représenter les données (en général
distribution de la variable) par un
graphique
3. Calculer des indices ou paramètres
(position, dispersion, forme…)
Tableau de contingence
Remarques
Il est évidemment délicat, voire impossible,
de construire un tableau de contingence si
l’une des variables a trop de modalités (âge
par exemple)
On pourrait cependant le faire pour croiser
les variables « groupe » et « étude », mais le
tableau serait peu lisible.
Graphiques
M
F
Graphiques
200
Occurrences
100
0
1
ETUDE
2
3
4
5
8
Graphiques
75
Les bâtons montrent des effectifs
Effectif
50
25
0
2 0,00
3 0,00
age
4 0,00
5 0,00
Paramètres
Pour la variable dichotomique « sexe », les
pourcentages contiennent toute
l’information nécessaire, on calculera
seulement : 87.5% de filles.
Paramètres
La variable « étude », comme la variable
« âge », est numérique, si bien que l’on
calculera, selon le procédé le plus courant,
la moyenne et l’écart type.
On trouve ainsi pour l’âge : 20.99  3.96
Et pour « étude » : 1.51  0.96
Remarques
En réalité, les calculs que nous venons de
faire devraient être effectués pour chaque
groupe, séparément, puisque nous voulons
ensuite pouvoir comparer ces groupes.
Cependant, nous nous contenterons pour le
moment de ces mesures globales.
Exemple 2
Les notes au bac
Remarques
Il s’agit de variables quantitatives. Nous les
traiterons comme telles.
Le nombre de modalités (21) pousse à éviter
les tableaux statistiques, un peu lourds.
Représentation graphique
Les aires montrent effectifs
40
Effectif
30
20
10
0
5
10
francais
15
Représentation graphique
16
14
12
10
8
6
Pour-cent
4
2
0
3
5
PHILO
7
9
11
13
15
17
Remarques
On pourrait aussi représenter les
distributions sur le même graphique, ce qui
permettrait de les comparer plus aisément.
Cela ne permettrait pas, pourtant, de lire le
lien entre les variables.
Paramètres
Exemple 3
Attitude face à la psychologie
Tableaux
On pourrait construire les tableaux
statistiques, mais il restent moins lisibles
qu’un graphique.
Les variables sont pseudo-numériques, mais
nous les traiterons comme si elles étaient
véritablement quantitatives.
Faut-il être altruiste ?
50
Moyenne : 4.1
Écart type : 0.9
40
Asymétrie : -0.9
30
Pour-cent
20
10
0
1
ALTRUIST
2
3
4
5
Faut-il rester détaché ?
DÉTACHÉ
Moyenne : 4.1
120
Écart type : 0.9
100
Asymétrie : -0.9
80
60
Fréquence
40
20
0
1
DÉTACHÉ
2
3
4
5
La psychanalyse est une science ?
SCIENCE2
Moyenne : 3.0
100
Écart type : 1.0
80
Asymétrie : -0.7
60
Fréquence
40
20
0
1
SCIENCE2
2
3
4
5
Prestige de la psycho ?
PRESTIGE
Moyenne : 3.4
140
120
Écart type : 0.9
100
Asymétrie : -0.5
80
60
Fréquence
40
20
0
1
PRESTIGE
2
3
4
5
Un don pour la psychologie ?
DON
Moyenne : 2.2
100
Écart type : 1.5
80
Asymétrie : 0.5
60
Fréquence
40
20
0
1
DON
2
3
4
5
La psychologie une philosophie ?
PSYPHIL
Moyenne : 3.3
100
Écart type : 1.2
80
Asymétrie : -0.5
60
Fréquence
40
20
0
1
PSYPHIL
2
3
4
5
Exemple 4
Prototypes
Présentation
Les trois groupes ont donné des exemples
de fruit, animal, etc…
Les variables sont nominales, si bien qu’il
est difficile de calculer des paramètres.
Les modalités sont nombreuses, si bien que
les tableaux statistiques sont peu lisibles.
Enfin, ce qui nous intéresse ici est la
distribution CONDITIONNELLE de la
variable considérée (par groupe).
Remarques
Cette partie de l’expérience a été traitée plus
sérieusement.
En particulier, on a supprimé dans chaque
groupes des individus qui empêchaient les
groupes d’être similaires.
Cela est possible car les individus
« supprimés » sont choisis indépendamment
des réponses aux questions catégorielles.
Arbres
70
Les modalités peu
fréquentes ont été
supprimées pour
une meilleure
lisibilité.
60
50
40
30
GROUPE
20
hasard Pour-cent
10
0
bouleau
first Pour-cent
typique Pour-cent
chêne
pommier
sapin
saule
Arbres
70
Les modalités peu
fréquentes ont été
supprimées pour
une meilleure
lisibilité.
60
50
40
ARBRE
30
bouleau
chêne
20
pommier
10
0
hasard Pour-cent
sapin
saule
first Pour-cent
typique Pour-cent
2. Deux variables
numériques
Liens entre deux variables
numériques
Survol
Il arrive qu’on s’interroge (c’est très
fréquent) sur le lien éventuel entre deux
variables.
Si les variables sont numériques, ce que
nous supposerons ici, le diagramme de
dispersion s’impose, avec le calcul du
coefficient de corrélation linéaire (r), ou le
coefficient de détermination (r²), plus facile
à interpréter.
Exemple 1
Notes au bac.
Maths et Français
20
r=0.027, r²=0.0007
Soit 0.07%.
Moins de 0.1% de la
variation de
« français » est
expliqué linéairement
par « maths ».
FRANCAIS
10
0
0
MATHS
10
20
C’est presque nul,
quoique plutôt positif.
Histoire et Philosophie
18
r=0.036,
16
Soit r²=0.0013, soit
0.13%.
14
12
10
8
PHILO
6
4
2
2
4
6
HISTOIRE
8
10
12
14
16
18
20
Exemple 2
Attitudes face à la psychologie
La psycha/psycho comme science
Nuage de points
r=0.36.
Variable dépendante : SCIENCE1
2
r²=13%
Le diagramme est
malheureusement peu
lisible à cause du grand
nombre de points
superposés.
1
0
-1
-2
1,5
2,0
2,5
SCIENCE1
3,0
3,5
4,0
4,5
5,0
5,5
Remarques
Tous les r sont positifs, mais la plupart sont
proches de 0.
Cela laisse penser qu’il y a des « manières
de coder », ou des personnalités plus ou
moins « acquiesçantes ».
Sinon, il devrait y avoir des coefficients
négatifs (notamment entre mémoire et
logique, ou philosophie et science
(r=0.009)).
3. Envoi
Limites
Ce qu’on n’a pas fait
Toute question relative à
Des interactions
Des groupes de variables
La définition globale des individus par des
faisceaux de variables
Ne peut pas se résoudre par les méthodes
utilisées plus haut, qui ne prennent pas en
compte plus de deux variables
simultanément.
Quelques exemples
Nous allons passer en revue quelques
résultats concernant plus de deux variables,
de manière plus ou moins intuitive.
Les méthodes diffèrent selon qu’on étudie
des variables numériques ou nominales.
Analyse factorielle
Les notes
Composante 2
Diagramme des variables
Diagramme de composantes
Y a-t-il des matières
scientifiques et des
matières littéraires ?
1,0
histoire
maths
,5
Le sport est-il plutôt
littéraire ou
scientifique ?
francais
0,0
lv1
philo
sport
-,5
-1,0
-1,0
-,5
Composante 1
0,0
,5
1,0
Les différentes
matières mesurentelles les même
compétences ?
Diagramme de dispersion
3
La promotion est-elle
homogène du point de
vue des résultats au
baccalauréat ?
2
1
Où se situe les individus
par rapport aux deux
facteurs déterminés plus
haut ?
0
facteur 2
-1
-2
-3
-3
-2
facteur 2
-1
0
1
2
3
4
Diagramme de dispersion
3
Y a-t-il des différences
de notes entre les
filières ?
2
FILIÈRE
1
STT
0
STI
SMS
-1
S
facteur 2
L
-2
ES
-3
BTA
-3
-2
facteur 1
-1
0
1
2
3
4
Les filières STT et STI
sont-elles similaires ?
D’où proviennent les
individus atypiques ?
Codage optimal
Attitudes face aux études de
psychologie
Variables
2
Quelles modalités
s’attirent ?
1
3
3
1
3
4
0
2
-1
Quelles modalités se
repoussent ?
5
1
5
4
4
2
2
1
-2
axe 2
DON
5
-3
-4
-3,0
MEM
LOGIQU
-2,0
axe 1
-1,0
0,0
1,0
2,0
3,0
Les étudiants hésitent-ils
entre la psychologie
comme don et la
psychologie comme
matière fastidieuse ?
Individus
3
Où se situent,
globalement, les
individus ?
2
1
Comment décrire,
globalement, l’attitude
des étudiants face à la
psychologie comme
matière ?
0
-1
-2
axe 2
-3
-4
-3
axe 1
-2
-1
0
1
2
3
Téléchargement