Psychologie, Première année, Questionnaire. Description des résultats Remarques On commence par décrire la situation statistique. Les variables sont au nombre de 63. Chaque variable peut être étudiée séparément des autres ; Ou bien, les variables peuvent être étudiées par deux ; Ou bien par groupes plus importants. Remarques L’étude des variables une par une est une étape indispensable, mais non suffisante en général, de la description des résultats. De même, les méthodes permettant d’étudier le lien entre deux variables ne répondent pas à toutes les questions possibles, et des méthodes plus générales devront être utilisées par la suite. Remarques Du fait du grand nombre de variables, nous ne les détaillerons pas toutes, donnant seulement quelques exemples particulièrement parlants. Plan 1. 2. 3. 4. Situation statistique Une variable à la fois Deux variables à la fois Limites et compléments 1. La situation statistique Poser les bases pour un traitement approprié Sujets On a relevé pour chaque étudiant volontaire (individu) de la promotion (échantillon) un certain nombre de grandeurs afin de déterminer le profil, l’attitude face à la psychologie, etc. de l’ensemble des étudiants en psychologie (population). L’échantillon est de taille 232 (n=232). Variables Certaines des 63 variables sont dichotomiques (mots à entourer, sexe), ou nominales (exemple de fruit, d’animal, groupe). D’autres sont quantitatives (notes). Tableau descriptif (SPSS) Tableaux statistiques (SPSS) 2. Une variable à la fois Présentation, représentation, calcul de paramètres. Exemple 1 Description de la population Variables inutiles ? Une étape préliminaire est la description de la population. On utilise pour cela des variables (âge, sexe, niveau d’étude) qui n’ont pas d’intérêt direct dans l’étude, mais qui permettent de se faire une idée de la population. Groupes L’une des variables importantes est ici le « groupe » (hasard, typique, premier). Pour que les comparaisons entre les groupes soient pertinentes, il est évidemment nécessaire que les groupes soient similaires du point de vue des variables sexe, âge, étude. Nous allons donc construire des tableaux donnant les différences entre les groupes. Survol Pour décrire une variable, on peut : 1. Présenter les fréquences ou effectifs dans des tableaux (construire le tableau statistique) 2. Représenter les données (en général distribution de la variable) par un graphique 3. Calculer des indices ou paramètres (position, dispersion, forme…) Tableau de contingence Remarques Il est évidemment délicat, voire impossible, de construire un tableau de contingence si l’une des variables a trop de modalités (âge par exemple) On pourrait cependant le faire pour croiser les variables « groupe » et « étude », mais le tableau serait peu lisible. Graphiques M F Graphiques 200 Occurrences 100 0 1 ETUDE 2 3 4 5 8 Graphiques 75 Les bâtons montrent des effectifs Effectif 50 25 0 2 0,00 3 0,00 age 4 0,00 5 0,00 Paramètres Pour la variable dichotomique « sexe », les pourcentages contiennent toute l’information nécessaire, on calculera seulement : 87.5% de filles. Paramètres La variable « étude », comme la variable « âge », est numérique, si bien que l’on calculera, selon le procédé le plus courant, la moyenne et l’écart type. On trouve ainsi pour l’âge : 20.99 3.96 Et pour « étude » : 1.51 0.96 Remarques En réalité, les calculs que nous venons de faire devraient être effectués pour chaque groupe, séparément, puisque nous voulons ensuite pouvoir comparer ces groupes. Cependant, nous nous contenterons pour le moment de ces mesures globales. Exemple 2 Les notes au bac Remarques Il s’agit de variables quantitatives. Nous les traiterons comme telles. Le nombre de modalités (21) pousse à éviter les tableaux statistiques, un peu lourds. Représentation graphique Les aires montrent effectifs 40 Effectif 30 20 10 0 5 10 francais 15 Représentation graphique 16 14 12 10 8 6 Pour-cent 4 2 0 3 5 PHILO 7 9 11 13 15 17 Remarques On pourrait aussi représenter les distributions sur le même graphique, ce qui permettrait de les comparer plus aisément. Cela ne permettrait pas, pourtant, de lire le lien entre les variables. Paramètres Exemple 3 Attitude face à la psychologie Tableaux On pourrait construire les tableaux statistiques, mais il restent moins lisibles qu’un graphique. Les variables sont pseudo-numériques, mais nous les traiterons comme si elles étaient véritablement quantitatives. Faut-il être altruiste ? 50 Moyenne : 4.1 Écart type : 0.9 40 Asymétrie : -0.9 30 Pour-cent 20 10 0 1 ALTRUIST 2 3 4 5 Faut-il rester détaché ? DÉTACHÉ Moyenne : 4.1 120 Écart type : 0.9 100 Asymétrie : -0.9 80 60 Fréquence 40 20 0 1 DÉTACHÉ 2 3 4 5 La psychanalyse est une science ? SCIENCE2 Moyenne : 3.0 100 Écart type : 1.0 80 Asymétrie : -0.7 60 Fréquence 40 20 0 1 SCIENCE2 2 3 4 5 Prestige de la psycho ? PRESTIGE Moyenne : 3.4 140 120 Écart type : 0.9 100 Asymétrie : -0.5 80 60 Fréquence 40 20 0 1 PRESTIGE 2 3 4 5 Un don pour la psychologie ? DON Moyenne : 2.2 100 Écart type : 1.5 80 Asymétrie : 0.5 60 Fréquence 40 20 0 1 DON 2 3 4 5 La psychologie une philosophie ? PSYPHIL Moyenne : 3.3 100 Écart type : 1.2 80 Asymétrie : -0.5 60 Fréquence 40 20 0 1 PSYPHIL 2 3 4 5 Exemple 4 Prototypes Présentation Les trois groupes ont donné des exemples de fruit, animal, etc… Les variables sont nominales, si bien qu’il est difficile de calculer des paramètres. Les modalités sont nombreuses, si bien que les tableaux statistiques sont peu lisibles. Enfin, ce qui nous intéresse ici est la distribution CONDITIONNELLE de la variable considérée (par groupe). Remarques Cette partie de l’expérience a été traitée plus sérieusement. En particulier, on a supprimé dans chaque groupes des individus qui empêchaient les groupes d’être similaires. Cela est possible car les individus « supprimés » sont choisis indépendamment des réponses aux questions catégorielles. Arbres 70 Les modalités peu fréquentes ont été supprimées pour une meilleure lisibilité. 60 50 40 30 GROUPE 20 hasard Pour-cent 10 0 bouleau first Pour-cent typique Pour-cent chêne pommier sapin saule Arbres 70 Les modalités peu fréquentes ont été supprimées pour une meilleure lisibilité. 60 50 40 ARBRE 30 bouleau chêne 20 pommier 10 0 hasard Pour-cent sapin saule first Pour-cent typique Pour-cent 2. Deux variables numériques Liens entre deux variables numériques Survol Il arrive qu’on s’interroge (c’est très fréquent) sur le lien éventuel entre deux variables. Si les variables sont numériques, ce que nous supposerons ici, le diagramme de dispersion s’impose, avec le calcul du coefficient de corrélation linéaire (r), ou le coefficient de détermination (r²), plus facile à interpréter. Exemple 1 Notes au bac. Maths et Français 20 r=0.027, r²=0.0007 Soit 0.07%. Moins de 0.1% de la variation de « français » est expliqué linéairement par « maths ». FRANCAIS 10 0 0 MATHS 10 20 C’est presque nul, quoique plutôt positif. Histoire et Philosophie 18 r=0.036, 16 Soit r²=0.0013, soit 0.13%. 14 12 10 8 PHILO 6 4 2 2 4 6 HISTOIRE 8 10 12 14 16 18 20 Exemple 2 Attitudes face à la psychologie La psycha/psycho comme science Nuage de points r=0.36. Variable dépendante : SCIENCE1 2 r²=13% Le diagramme est malheureusement peu lisible à cause du grand nombre de points superposés. 1 0 -1 -2 1,5 2,0 2,5 SCIENCE1 3,0 3,5 4,0 4,5 5,0 5,5 Remarques Tous les r sont positifs, mais la plupart sont proches de 0. Cela laisse penser qu’il y a des « manières de coder », ou des personnalités plus ou moins « acquiesçantes ». Sinon, il devrait y avoir des coefficients négatifs (notamment entre mémoire et logique, ou philosophie et science (r=0.009)). 3. Envoi Limites Ce qu’on n’a pas fait Toute question relative à Des interactions Des groupes de variables La définition globale des individus par des faisceaux de variables Ne peut pas se résoudre par les méthodes utilisées plus haut, qui ne prennent pas en compte plus de deux variables simultanément. Quelques exemples Nous allons passer en revue quelques résultats concernant plus de deux variables, de manière plus ou moins intuitive. Les méthodes diffèrent selon qu’on étudie des variables numériques ou nominales. Analyse factorielle Les notes Composante 2 Diagramme des variables Diagramme de composantes Y a-t-il des matières scientifiques et des matières littéraires ? 1,0 histoire maths ,5 Le sport est-il plutôt littéraire ou scientifique ? francais 0,0 lv1 philo sport -,5 -1,0 -1,0 -,5 Composante 1 0,0 ,5 1,0 Les différentes matières mesurentelles les même compétences ? Diagramme de dispersion 3 La promotion est-elle homogène du point de vue des résultats au baccalauréat ? 2 1 Où se situe les individus par rapport aux deux facteurs déterminés plus haut ? 0 facteur 2 -1 -2 -3 -3 -2 facteur 2 -1 0 1 2 3 4 Diagramme de dispersion 3 Y a-t-il des différences de notes entre les filières ? 2 FILIÈRE 1 STT 0 STI SMS -1 S facteur 2 L -2 ES -3 BTA -3 -2 facteur 1 -1 0 1 2 3 4 Les filières STT et STI sont-elles similaires ? D’où proviennent les individus atypiques ? Codage optimal Attitudes face aux études de psychologie Variables 2 Quelles modalités s’attirent ? 1 3 3 1 3 4 0 2 -1 Quelles modalités se repoussent ? 5 1 5 4 4 2 2 1 -2 axe 2 DON 5 -3 -4 -3,0 MEM LOGIQU -2,0 axe 1 -1,0 0,0 1,0 2,0 3,0 Les étudiants hésitent-ils entre la psychologie comme don et la psychologie comme matière fastidieuse ? Individus 3 Où se situent, globalement, les individus ? 2 1 Comment décrire, globalement, l’attitude des étudiants face à la psychologie comme matière ? 0 -1 -2 axe 2 -3 -4 -3 axe 1 -2 -1 0 1 2 3