D:\840910172.doc
1
NOTIONS ABORDEES EN STATISTIQUE
Le protocole
Le protocole de base est le tableau
Il y a les individus statistiques représentant les éléments de férence sur lesquels portent
les statistiques
Une modalité représente les éléments de l’ensemble de variation de la variable (une
variable est une colonne du tableau associée à la colonne individu)
Complément d’information : Une variable est bien une colonne de la table, elle possède
plusieurs modalités. Une variable est un ensemble de modalités exclusives les unes des autres.
Plusieurs modalités d’une variable, ça peut être par exemple dans la variable type de travail
on peut trouver les quatre modalités suivantes : temps partiel ; temps plein ; rémunération
parents ; autres.
Remarque sur les variables nominales : il n’y a pas de relations entre elles, exemple : filles
garçons ; sexe.
Remarque sur les observations : c’est ce qui caractérise un individu dans une table, dans le
protocole de base.
Le plan
S’il n’y a pas de caractéristique descriptive c’est un plan non structuré, dans le cas
contraire il est dit structuré (Il y a des caractéristiques descriptives qui concernent les
individus)
la relation d’emboîtement : deux groupes différenciés par leurs caractéristiques (exemple
l’âge) donc protocole structuré par :
les variables indépendantes (dans l’exemple l’âge)
les variables dépendantes (par exemple le temps de lecture) des variables
indépendantes
Les sujets sont emboîtés dans les groupes
exemple d’écriture schématisée : S5 < G2 > VD1 il s’agit de 5 sujets dits emboîtés dans deux
groupes avec une variable dépendante (dont modèle dit univarié). Il y aura donc 5 x 2 x 1
observations
la relation de croisement : il s’agit d’associé une variable manipulée VI (donc
indépendante) à chaque individu (par exemple chaque individu à droit à deux essais).
exemple d’écriture schématisée : S X T on dit que les sujets sont croisés avec les tâches.
S10 X T2 X VD1 : on a ici 10 sujets croisés avec deux tâches (les deux essais dans l’exemple)
avec une variable dépendante observée. Donc 10 x 2 x 1 observations
Attention : même si on a deux tâches, il s’agit d’une variable, on peut donc avoir une relation
univariée avec deux tâches ! et non une relation bivariée !!
relation de croisement
On fait une comparaison entre la variable observée dans une condition et la même variable
observée dans une autre condition
la relation d’emboîtement
On va étudié la liaison entre les deux variables observée
Attention : S X T → VD (univarié donc !) est différent, et il ne faut pas confondre, de
S V2 (bivarié donc !) Dans le premier cas on fait varier les variables dans une condition,
puis la même variable dans une autre condition. Dans le deuxième cas, on s’intéresse à la
liaison entre les deux variables.
D:\840910172.doc
2
Recoder une variable numérique
exemple : de 26 à 97 secondes on veut un intervalle de 7s (pour avoir une bonne précision) du
coup 97-26 (+1 ajout systématique) = 72 qu’on divise par 7, on obtient 11 classes
Pour obtenir la valeur centrale de la classe centrale qu’on note Uk (K indique le numéro de la
classe) :26 + 72/2 = 62
On part de cette valeur pour trouver sa classe soit 62 - 3 et 62 + 3 donnent {59 (62) 65}
Puis on déduit les autres {66 (69) 72} etc... vers les haut et idem vers le bas.
Remarque : dans les classes {0 (1) 2} ; {3 (4) 5} ; {6 (7) 8} ; la valeur 2,75 Є à la classe {3
(4) 5}
Remarque : il est préférable, mais ce n’est pas obligatoire que les intervalles soient égaux.
Pour obtenir les valeurs limites de chaque classe on additionne la val centrale de la classe
plus celle de la classe supérieure et on divise par deux. exemple : {21 (23) 25} ; {26 (28) 30} ;
{31 (33) 35} donne 23 + 28 / 2 = 25,5 pour la première, 28 + 33 / 2 = 30,5 pour la suivante
etc...
La note Z
La note Z est une transformation d’une variable numérique, elle permet d’exprimer la distance
d’une observation par rapport à la moyenne en nombre d’écarts types.
Z = (X (valeur observée) - M (valeur moyenne de la distribution)) / S (écart type de la
distribution)
exemple : notes de 0 à 20 avec une moyenne de 11 et un écart type de 3,2 on obtient pour la
note 0 = (0-11)/3,2 = -3,43 pour la note 2 (si on gradue de deux en deux) = (2-11)/3,2 = -2,81
etc... 20 = (20-11)/3,2 =2,81
Distribution
C’est dénombrer le nombre d’observations par modalité
Faire un distribution transforme un protocole en perdant des informations sur l’identité des
individus. Donc regrouper les données.
variables nominales
On regroupe des individus par appartenance à un même champ (exemple : tous les peintres,
tous les enseignants, tous les ferrailleurs etc.), on obtient Ui modalités avec pour chacune
d’elle Ni effectifs. Σ Ni donne la totalité des effectifs appelé N
exemple : Pour U1 on a N1 effectifs = 4 ; U2 → N2 = 6 ; U3 →N3 = 2 ; N= 4 + 6 + 2 = 12
On transformer l’effectif d’une modalité en fréquence : fk = nk / n
exemple pour U2 on a 6 / 12 = 0,5.
Σ fk = 1 (exemple f1 : 4/12=0,33 ; f2 : 0,5 ; f3 : 2/12= 0,17
donc le total = 0,33 + 0,5 + 0,17 = 1
On peut multiplier par 100 pour avoir des pourcentages
Remarque : écrire dans la colonne des fréquences la valeur de n pour pouvoir retrouver les
effectifs.
variables ordinales
En fait le principe est des créer un tableau dans lequel on répartit les individus par variables.
D:\840910172.doc
3
ce qui donne
On pourrait aussi présenter le tableau de cette façon :
i
rép.
1
a
2
b
3
b
4
c
5
a
6
b
7
b
8
c
9
a
n=9
Mod. uk
Effectif nk
Fréq. fk
a
3
0,33
b
4
0,44
c
2
0,22
n = 9
Σ fk = 1
Mod. uk
a
c
a Effectif nk
3
2
n = 9
b Fréq. fk
0,33
0,22
Σ fk = 1
D:\840910172.doc
4
variables numériques
C’est le même principe sauf qu’on a souvent à faire des regroupement par exemple en 7
classes avec les valeurs centrales (cf. Recoder une variable numérique)
distribution bivariée (exemple)
n° de classe
échelle de temps
1
0 à 5
2
6 à 11
3
12 à 17
4
18 à 23
5
24 à 29
6
30 à 35
rem : on peut imaginer qu’il s’agit de méthode de résolution de problème
temps (n° de cl.)
méth.
1
2
3
4
5
6
A
2
0
0
0
1
1
B
0
1
0
1
0
0
C
0
0
0
1
2
2
D
0
0
0
0
0
0
E
0
2
0
0
0
0
tot.
2
3
0
2
3
3
tot. gén. n=13
Attention les applications suivantes sont pour les
protocoles Les indices de tendance centrale
Le mode
C’est la seule procédure applicables à tout types de variable y compris nominale. Il faut
d’abord avoir réalisé la distribution !
Le mode c’est l’effectif le plus grand cela permet de comparer des distributions.
i
n° de
cl. tps
méth.
1
1
A
2
1
A
3
2
B
4
5
C
5
4
C
6
4
B
7
5
A
8
6
A
9
6
C
10
6
C
11
5
C
12
2
E
13
2
E
D:\840910172.doc
5
Attention dans l’exemple de la variable 2 qui donne un effectif de 24, c’est 2 le mode et non
l’effectif.
La médiane reprise du cours sous Excel
Elle coupe la distribution en deux parties égales.
1ère méthode
on range la distribution par ordre croissant d’effectifs, puis on compte les lignes et on prend la
moitié.
2ème méthode
modalités
a
b
c
d
e
effectifs
5
15
9
8
3
n=40
ef. cum.
5
20
29
37
40
40/2=20
modalités
a
b
c
d
e
effectifs
7
13
0
12
8
n=40
ef. cum.
7
20
20
32
40
= 20 =20
l’intervalle bc à cd est médian
modalités
a
b
c
d
e
effectifs
7
9
8
12
4
n=40
ef. cum.
7
16
24
36
40
=16 =16
40/2=20, 20 se situe dans l’intervalle c
La moitié de l’effectif se trouve dans l’échelon c est dit médian
modalités
a
b
c
d
e
effectifs
1
4
21
10
4
n=40
ef. cum.
1
5
26
36
40
1+4 =5 10+4 =14
40/2=20 L’échelon c est dit quasi médian
20 est plus proche de 26 que de 5, la coupure cd est quasi médiane
classes
0-2
3-5
6-8
9-11
12-14
15-17
18-20
val.
centrale
1
4
7
10
13
16
19
effectif
1
1
4
4
7
4
3
n=24
ef. cum.
1
2
6
10
17
21
24
24/2=12, 12 se trouve dans l’échelon 12-14 qui dit quasi médiane. 12 est plus près de 10 que
de 17. La coupure en 9-11 et 12-14 est dite quasi médiane
Comme variable numérique on peut calculer par interpolation
Lim inf. 10+13/2=11,5 ; il y a 3 valeurs par classe ; Ec inf = Effectif cumulé inf
nm = effectif de la classe médiane
1 / 9 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !