Vocabulaire et notations
Vocabulaire et notations
Modalité : valeur
Ensemble des variables observées (I)
Les individus (n)
Ensemble des modalités observables (Mx)
La variable (X)
Taille de i (X(i))
Effectif d’une modalité : c’est le nombre d’individus chez qui on a observé cette modalité
Fréquence d’une modalité : c’est la proportion des individus chez qui on a observé cette modalité
Tableau de distribution : tableau dans lequel on indique les diverses modalités observables (en réalité, il
arrive assez fréquemment qu’on n’indique que les modalités observées effectivement. Cela dépend des
objectifs de l’analyse : on indique ce dont on a ou aura besoin)
Caractéristiques de centralité ou de localisation : nombres résumés de la collection d’observations à
l’aide desquels on tente de répondre à deux questions : où se situe la distribution sur l’axe des modalités ?
Quel est le centre de cette distribution ?
- Le mode (centre de concentration de la collection des observations)
- La médiane (centre de position de la collection des observations)
- La moyenne arithmétique (centre d’équilibre de la collection des observations)
Mode (Mo) : valeur (ou modalité) sur laquelle ou autour de laquelle la concentration (densité) des
observations est la plus forte. En d’autres mots, modalité qui a le plus grand effectif ou la plus grande
fréquence. Si d’autres modalités ont un effectif très proche, il est avisé de le signaler.
Médiane (quantile d’ordre ½) (Me) : valeur (ou modalité) qui, dans un rangement ordinal des
observations, a la moitié des observations à sa gauche et l’autre moitié à sa droite. Néanmoins, il est souvent
difficile d’avoir très précisément la moitié des observations de part et d’autre… on fait pour un mieux et on
précise alors si c’est médian ou quasi médian.
Moyenne (arithmétique) (n(x)) : centre d’équilibre de la collection d’observations. C’est la valeur par
rapport à laquelle les écarts des observations se compensent tous, c’est-à-dire qu’ils s’annulent.
Caractéristiques de dispersion : tentatives de donner un indicateur numérique de la dispersion d’une
distribution. On souhaite qu’il soit nul si la dispersion est nulle, et qu’il soit d’autant plus grand que la
dispersion est grande. Il y a plusieurs manières de procéder, qui s’articulent autour de deux idées : (1) la
dispersion comme étendue de la distribution et (2) la dispersion comme éloignement moyen entre les
observations et le centre de la distribution.
Dans la première catégorie : l’étendue et l’étendue interquartile
Dans la deuxième catégorie : l’écart absolu moyen et l’écart type qui se calcule en prenant la racine carrée
de la variance.
L’étendue (ETEx) : est l’écart entre la plus grande observation et la plus petite
L’étendue interquartile (EIQx) : est l’écart entre le premier quartile et le troisième quartile
L’écart absolu moyen (EAMx) : moyenne des écarts (en grandeur absolue) entre chaque observation et la
moyenne des n observations.
L’écart type (x) : racine carrée de la variance, et la variance est la moyenne des carrés des écarts (en
grandeur absolue) entre chaque observation et la moyenne des n observations.
La valeur typique : pour un groupe constate 600 filles et 100 garçons, la valeur typique sera la fille
(souvent la valeur typique sera le mode).