Master1, UE4, EC 9A : Eléments de mathématiques chapitre 15 statistiques, gestion de données
Page 1
CHAPITRE 15 : STATISTIQUES, GESTION DE DONNEES.
La statistique descriptive est une méthode scientifique qui recueille, ordonne, analyse et interprète des
données à partir d’observations, enquêtes, expériences etc. Pour une meilleure lisibilité, ces données
sont représentées graphiquement, dans des tableaux. Elle est utilisée dans des domaines aussi variés
que la biologie, l’économie, l’agronomie etc.
I VOCABULAIRE :
L’ensemble sur lequel porte l’étude statistique s’appelle la population. Les éléments la composant
sont appelés individu ou unité statistique.
Lorsque la population est trop importante, on peut pour des raisons économiques y prélever un
échantillon représentatif, d’une plus petite taille.
A chacune des unités statistiques, peut-être associé un caractère ou une variable statistique (propriété
commune aux individus), mesurable ou pas. Les valeurs prises par la variable statistique sont appelées
modalités.
Une variable statistique est soit qualitative, soit quantitative.
Une variable qualitative est une variable qui n’est pas mesurable. Une variable est dite qualitative
ordinale quand les modalités (valeurs) qui lui sont associées peuvent être hiérarchisées (mention au
bac). Une variable est dite qualitative nominale lorsque les modalités qui lui sont associées ne
peuvent pas être hiérarchisées (yeux bleus, marrons etc.).
Un variable quantitative est une variable qui est mesurable (nombre de frères et sœurs, notes, taille etc).
Une variable est quantitative discrète si elle peut prendre des valeurs isolées (nombre de frères et
sœurs, de voitures par foyer etc.).
Une variable est quantitative continue si elle peut prendre toutes les valeurs d’un intervalle de
nombres réels ( de la forme [a ; b[ ) appelé classe (taille, salaire etc.). Pour les calculs, on utilise les
valeurs centrales des classes.
On organise les informations en tableaux faisant apparaitre le nombre (effectifs) d’individus pour
chaque caractère. L’effectif total est la somme de tous les effectifs. On obtient ainsi une distribution
des individus selon le caractère étudié. On peut alors calculer la fréquence de chaque valeur. C’est le
quotient de l’effectif de cette valeur par l’effectif total. Elle s’exprime souvent en pourcentages.
Cette liste d’informations fait l’objet de différents calculs qui permettent de caractériser la population :
elle constitue une série statistique.
Le mode de la série statistique est la valeur de la variable associée au plus grand effectif ou à la plus
grande fréquence.
II REPRESENTATIONS GRAPHIQUES (NON EXHAUSTIVES) :
Les représentations permettent de visualiser les données. Elles sont choisies en fonction du type de
variable, du traitement statistique associé, de l’usage qui en fait, d’où l’importance d’exercer son esprit
critique.
2.1 cas des variables qualitatives :
On utilise généralement des diagrammes en barres (ou tuyaux d’orgue) constitués de rectangles
contigus ou non ayant la même largeur. Les hauteurs des rectangles sont proportionnelles aux effectifs
de chaque catégorie.
On utilise aussi des diagrammes circulaires ou semi-circulaires. Les mesures des angles au centre
des secteurs sont proportionnelles aux effectifs ou aux fréquences de chaque catégorie. L’effectif total
est représenté par un disque de mesure 360 ° ou un demi-disque de mesure 180 °.