Master1, UE4, EC 9A : Eléments de mathématiques chapitre 15 statistiques, gestion de données
Page 1
CHAPITRE 15 : STATISTIQUES, GESTION DE DONNEES.
La statistique descriptive est une méthode scientifique qui recueille, ordonne, analyse et interprète des
données à partir d’observations, enquêtes, expériences etc. Pour une meilleure lisibilité, ces données
sont représentées graphiquement, dans des tableaux. Elle est utilisée dans des domaines aussi variés
que la biologie, l’économie, l’agronomie etc.
I VOCABULAIRE :
L’ensemble sur lequel porte l’étude statistique s’appelle la population. Les éléments la composant
sont appelés individu ou unité statistique.
Lorsque la population est trop importante, on peut pour des raisons économiques y prélever un
échantillon représentatif, d’une plus petite taille.
A chacune des unités statistiques, peut-être associé un caractère ou une variable statistique (propriété
commune aux individus), mesurable ou pas. Les valeurs prises par la variable statistique sont appelées
modalités.
Une variable statistique est soit qualitative, soit quantitative.
Une variable qualitative est une variable qui n’est pas mesurable. Une variable est dite qualitative
ordinale quand les modalités (valeurs) qui lui sont associées peuvent être hiérarchisées (mention au
bac). Une variable est dite qualitative nominale lorsque les modalités qui lui sont associées ne
peuvent pas être hiérarchisées (yeux bleus, marrons etc.).
Un variable quantitative est une variable qui est mesurable (nombre de frères et sœurs, notes, taille etc).
Une variable est quantitative discrète si elle peut prendre des valeurs isolées (nombre de frères et
sœurs, de voitures par foyer etc.).
Une variable est quantitative continue si elle peut prendre toutes les valeurs d’un intervalle de
nombres réels ( de la forme [a ; b[ ) appelé classe (taille, salaire etc.). Pour les calculs, on utilise les
valeurs centrales des classes.
On organise les informations en tableaux faisant apparaitre le nombre (effectifs) d’individus pour
chaque caractère. L’effectif total est la somme de tous les effectifs. On obtient ainsi une distribution
des individus selon le caractère étudié. On peut alors calculer la fréquence de chaque valeur. C’est le
quotient de l’effectif de cette valeur par l’effectif total. Elle s’exprime souvent en pourcentages.
Cette liste d’informations fait l’objet de différents calculs qui permettent de caractériser la population :
elle constitue une série statistique.
Le mode de la série statistique est la valeur de la variable associée au plus grand effectif ou à la plus
grande fréquence.
II REPRESENTATIONS GRAPHIQUES (NON EXHAUSTIVES) :
Les représentations permettent de visualiser les données. Elles sont choisies en fonction du type de
variable, du traitement statistique associé, de l’usage qui en fait, d’où l’importance d’exercer son esprit
critique.
2.1 cas des variables qualitatives :
On utilise généralement des diagrammes en barres (ou tuyaux d’orgue) constitués de rectangles
contigus ou non ayant la même largeur. Les hauteurs des rectangles sont proportionnelles aux effectifs
de chaque catégorie.
On utilise aussi des diagrammes circulaires ou semi-circulaires. Les mesures des angles au centre
des secteurs sont proportionnelles aux effectifs ou aux fréquences de chaque catégorie. L’effectif total
est représenté par un disque de mesure 360 ° ou un demi-disque de mesure 180 °.
Master1, UE4, EC 9A : Eléments de mathématiques chapitre 15 statistiques, gestion de données
Page 2
On utilise enfin les diagrammes en bande. La surface d’un rectangle est découpée en sous-surfaces
rectangulaires dont les longueurs variables (l’une étant fixée) sont proportionnelles aux effectifs de
chaque catégorie.
2.2 cas des variables quantitatives discrètes:
On utilise généralement des diagrammes en bâtons. Leur hauteur est proportionnelle aux effectifs.
Les logiciels de « tableur-grapheur » ne permettent pas souvent de les construire. Il faut alors
construire un diagramme en barres puis réduire la largeur du rectangle en choisissant un écart
maximum entre deux barres.
2.3 cas des variables quantitatives continues:
On peut utiliser les histogrammes et les courbes.
L’histogramme est constitué de rectangles contigus dont les aires sont proportionnelles aux effectifs
de chaque classe. Sur l’axe des abscisses sont reportées les bornes des classes de la série.
III PARAMETRES DE POSITION:
Pour effectuer des observations ou effectuer des études comparatives entre des séries statistiques à
variables quantitatives, on peut calculer les indicateurs de tendance que sont la moyenne et la
médiane.
Rappel : le mode d’une série statistique est la valeur de la variable associée au plus grand effectif ou à
la plus grande fréquence. Dans le cas d’une variable continue dont les classes sont de même amplitude,
la classe associée au plus grand effectif rectifié est appelée classe modale. Le mode est le centre de
cette classe. On peut donc noter qu’une population n’a pas toujours un mode ou une classe modale
unique.
3.1 moyenne arithmétique :
Définition : La moyenne arithmétique de p observations est le quotient de leur somme par l’effectif
total N.
p
p
nn
xx
x
...
...
1
1
ou bien
pi
ii
x
N
x1
1
Exercice 1 :
Siloé a eu les notes suivantes en mathématiques : 12 ; 11 ; 8 ; 7 ; 13.
a) Elle calcule sa moyenne et trouve 13,5. Sans faire de calcul comment peut-on être sûr qu’elle s’est
trompée.
b) Calculer sa moyenne.
Master1, UE4, EC 9A : Eléments de mathématiques chapitre 15 statistiques, gestion de données
Page 3
3.2 moyenne arithmétique pondérée:
Définition : C’est la moyenne des x i pondérés par les effectifs n i .
p
pp
nn
xnxn
x
...
...
1
11
ou bien
pi
iii xn
N
x1
1
.
On peut aussi la calculer en pondérant les x i par leur fréquence respective f i :
pp xfxfx ...
11
ou bien
pi
iii xfx 1
.
Si la série se présente sous forme de classes, on admet que toutes les valeurs observées se regroupent
au centre de classe. On obtient alors une moyenne pondérée approchée.
Exercice 2 :
Lucas a eu 8 notes en français au cours du 1er trimestre :
- trois notes d’interrogation surprise : 14 ; 12 et 7 qui ont 1 de coefficient ;
- deux notes de devoir rédigé à la maison : 15 et 13 de coefficient 2 ;
- trois notes de contrôle : 12 ; 9 et 11 de coefficient 3.
Quelle est sa moyenne du 1er trimestre ?
Exercice 3 :
a) Dans une station d’essence la caissière a noté la quantité en litres achetée par les 5 premiers clients
du matin : 45,7 ; 56,8 ; 35,6 ; 37,6 ; 46.
Quelle est la quantité moyenne achetée par ces clients ?
b) Après avoir noté la quantité d’essence achetée par le 6ème client, elle calcule la quantité moyenne
achetée par les six premiers clients et trouve : 43,8 L. Quelle quantité d’essence a pris le 6ème client ?
Exercice 4 : Effectifs
Notes
Un professeur des écoles a réalisé un diagramme en bâton avec les notes obtenues par ses élèves d’une
classe de CE1 à la dernière évaluation de mathématiques :
Trouver la moyenne obtenue par ses élèves. On donnera une valeur approchée à 0,1 près par excès.
Master1, UE4, EC 9A : Eléments de mathématiques chapitre 15 statistiques, gestion de données
Page 4
Exercice 5 :
Dans un examen lépreuve de français a pour coefficient 3, l’épreuve de maths coefficient 4 et
l’épreuve de langue coefficient 2.
Un étudiant a obtenu 12 en français et 8 en mathématiques. Combien doit-il avoir en langue pour
réussir l’examen, c'est-à-dire avoir au moins une moyenne de 10 ?
3.3 moyenne géométrique:
Définition : La moyenne géométrique de n valeurs positives x i est la racine ne de leur produit.
n
n
nnxxxxG 1
11 )...(...
Elle est utile pour calculer les moyennes de pourcentages.
Exercice 6 :
Le prix d’un article a subi trois hausses successives de 5%, 6 % et 8 % et deux baisses de 3 % et 4% .
Déterminer l’augmentation moyenne de l’article.
3.4 moyenne harmonique:
Définition : La moyenne harmonique de n valeurs positives x i est le nombre H dont l’inverse est la
moyenne arithmétique des inverses de ces n valeurs.
n
xxnH 1
...
111
1
ou bien
Elle est utile pour le calcul des vitesses moyennes sur une même distance
2
1
1
12
21 vvv
d
v
ddd
V
Exercice 7 :
Un cycliste a parcouru 4 étapes de 80 km chacune à la vitesse respective de 10 km/h, 20 km/h, 16km/h
et 32 km/h. Quelle est sa vitesse moyenne ?
3.5 les quantiles:
Attention, les modalités doivent être rangées dans l’ordre croissant.
La ligne des effectifs cumulés croissants peut aussi aider dans la recherche du rang des quantiles.
Définition : Les quantiles sont les valeurs du caractère x i qui partagent la série statistique en n séries
de même effectif. Selon la valeur de n, les quantiles sont appelés :
Médiane si n = 2
Quartiles (Q 1 ; Q 2 ; Q 3 ) si n = 4
Déciles D 1 ; … D 9 si n = 10
Centiles C 1 ; … C 99 si n = 100.
Master1, UE4, EC 9A : Eléments de mathématiques chapitre 15 statistiques, gestion de données
Page 5
3.5 a) la médiane:
Définition : La médiane Me est la valeur de x i qui partage la série statistique en deux séries de même
effectif. Il y a donc autant de valeurs inférieures à la médiane que de valeurs supérieures à la médiane.
Si le caractère est discret, on peut déterminer la médiane de la manière suivante :
Si l’effectif total N est impair, la médiane est la valeur du caractère x i située au rang
21N
.
Si l’effectif total N est pair, la médiane est la moyenne arithmétique des deux valeurs du caractère x i
situés au rang
2
N
et au rang
2
N
+ 1.
Remarque : si le caractère est continu, on retiendra la classe associée à l’effectif cumulé croissant,
représentant au moins 50 % de l’effectif total. La médiane appartient alors à cette classe et peut être
déterminée graphiquement.
Exercice 8 :
a) Trouver la médiane de la série : 12 ; 2 ; 27 ; 15 ; 13 ; 16 ; 7.
b) Trouver la médiane de la série : 15 ; 12,5 ; 17 ; 5 ; 25 ; 36 ; 4,5 : 12.
Exercice 9 :
Stéphanie dit à son ami : « On vient de nous rendre les notes du concours blanc, j’ai eu 11 et il y a
autant d’étudiants de mon groupe qui ont plus que moi que d’étudiants qui ont moins que moi ».
Son ami : « Alors la moyenne du groupe est de 11 ».
Voici les notes du groupe de Stéphanie : 13 ; 5 ; 6 ; 7 ; 7 ; 8,5 ; 9 ; 9,5 ; 10 ; 12 ; 10 ; 6,5 ; 10,5 ; 11 ;
11,5 ; 12 ; 12 ; 12 ; 12 ; 12,5 ; 13 ; 14 ; 15 ; 8 ; 15.
1) Stéphanie a-t-elle raison ?
2) Sans calculer la moyenne, peut-on savoir si son ami a tort ou raison ?
3) Vérifier la réponse en calculant la moyenne
3.5 b) les quartiles:
Définition : Les quartiles d’une série statistique sont les trois valeurs Q 1 , Q 2 , Q 3 du caractère qui
partagent la série statistique en quatre parties de même effectif.
25 % au moins de l’effectif total a une valeur inférieur à Q 1 (1er quartile);
75 % au moins de l’effectif total a une valeur inférieur à Q 3 (3ème quartile);
Le deuxième quartile est égal à la médiane Me.
Si l’effectif total n’est pas un multiple de 4, alors les quartiles Q 1 et Q 3 sont respectivement les termes
de rang immédiatement supérieurs à
4
N
et à
.
4
3N
Si l’effectif total est un multiple de 4, alors les quartiles Q 1 et Q 3 sont respectivement les termes de
rang
4
N
et à
.
4
3N
Les quartiles sont toujours des valeurs de la série.
1 / 9 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !