Seconde Cours : statistiques descriptives
1
I Le vocabulaire des statistiques
définition 1 :
L’ensemble sur lequel on travaille en statistique est appelé population.
Si cet ensemble est trop vaste, on en restreint l’étude à une partie appelée échantillon.
Un élément de cet ensemble est appelé individu.
définition 2 :
La particularité commune que l’on étudie est appelée caractère.
L’effectif d’une « valeur » d’un caractère est le nombre d’individus ayant cette valeur.
Les valeurs prises par le caractère sont aussi appelées les modalités.
Si celles-ci s’expriment par un nombre, il s’agit d’un caractère quantitatif. (dans ce cas, le
nombre se note en général xi)
Si les valeurs du nombre exprimé sont isolées, il s’agit d’un caractère discret.
Par contre, si ces valeurs sont prises dans tout un intervalle de , il s’agit d’un caractère
continu.
Exemples :
Le nombre de frères et sœurs d’un élève de seconde est un caractère quantitatif discret.
il peut prendre les valeurs 0, 1, 2, 3, 4 .....
La taille des élèves de seconde est un caractère quantitatif continu. il peut prendre toutes
les valeurs entre 1,50 m et 1,95 m.
Si la particularité étudiée ne s’exprime pas par un nombre, il s’agit d’un caractère qualitatif.
Exemple :
Dans une population, être marié(e) est un caractère qualitatif à deux valeurs : oui ou non.
Exemples : caractères étudiés sur un individu
Couleur des yeux : caractère qualitatif
Nombre d’enfants : caractère quantitatif discret.
Mois de naissance : caractère qualitatif
sport pratiqué : caractère qualitatif
pointure de chaussures : caractère quantitatif discret.
taille : caractère quantitatif continu
Seconde Cours : statistiques descriptives
2
Valeurs d’une variable quantitative
Pointure
38
39
40
41
42
Taille
[155 ;160[
[160 ;165[
[165 ;170[
[170 ;175[
modalités d’une variable qualitative
sport
Tennis
VTT
foot
handball
définition 3 :
Une série statistique est l’ensemble des résultats d’une étude : valeurs du caractère et
effectifs correspondants.
On représente souvent une série statistique sous forme d’un tableau.
définition 4 :
Le nombre d’individus (ni) d’une modalité est appelé effectif.
Le nombre total d’individus (N) de la population est appelé effectif total.
Le rapport fi = ni
N est appelé fréquence.
remarques :
fi est un nombre toujours compris entre 0 et 1.
Souvent, les nombres fi s’expriment par un pourcentage.
La somme des nombres fi est toujours égale à 1.
e
II Représentations graphiques
Divers graphiques permettent d’illustrer les données et de comparer deux séries
statistiques. En voici certains :
les diagrammes en bâtons ou en barres, formés de barres dont l’abscisse est la
valeur xi d’un caractère et la hauteur est proportionnelle à ni ou à fi ;
les diagrammes à secteurs (ou « camemberts ») qui sont des disques partagés en
secteurs dont l’angle au centre est proportionnel à l’effectif de chaque valeur ;
des histogrammes, lorsque les valeurs sont regroupées en classes. Lorsque les classes
sont de même amplitude, on construit des rectangles ayant pour base chacune des
classes et une hauteur proportionnelle à l’effectif :
Diagramme en bâtons Diagramme à secteurs Histogramme
Seconde Cours : statistiques descriptives
3
III Caractéristiques d’une série
a) Mesures de tendance centrale
définition 1 :
Le mode pour un caractère discret, noté Mo, est la valeur qui correspond au plus grand
effectif.
dans le cas d’un caractère continu, on parle de classe modale.
Dans le cas de classes de même amplitude, la classe modale est une classe qui correspond au
plus fort effectif.
définition 2 : la moyenne
dans le cas d’une série discrète.
la moyenne est le nombre noté x .
x = n1x1 + n2x2 + ... + npxp
N ou x = f1x1 + f2x2 + ... + fpxp.
Si les valeurs sont regroupées en classe, on calcule la moyenne en choisissant comme valeurs
du caractère les centres des classes et comme effectifs, les effectifs des classes.
définition 3 :
la médiane d’une série, dont les valeurs du caractères sont discrètes et rangées dans l’ordre
croissant, est la valeur partageant la population en deux groupes de même effectif.
b) Mesures de dispersion : étendue et quartiles
définition 4 : l'étendue
La différence des valeurs extrêmes du caractère s’appelle l’étendue.
Si on étudie des notes, c’est la différence entre la note la plus haute et la note la plus
basse.
Remarque : on ne parle d’étendue que dans le cas d’un caractère quantitatif.
Seconde Cours : statistiques descriptives
4
définition 5 : les quartiles
Un quartile correspond à chacune des 3 valeurs qui divisent les données d'une série triées
en 4 parts égales, de sorte que chaque partie représente 1/4 de l'échantillon de la
population.
le 1er quartile sépare les 25 % inférieurs des données ;
le 2e quartile est la médiane de la série ;
le 3e quartile sépare les 75 % inférieurs des données.
La différence entre le 3e quartile et le 1er quartile s'appelle écart interquartile ; c'est un
critère de dispersion de la série.
c) Exemples
1)
5
8
12
15
18
7
5
14
3
2
Le mode est la note 12 car l’effectif 14 est le plus grand.
La médiane est la note du 16eme élève car il y a 31 élèves. c’est donc 12.
La moyenne :
x =
7 5 5 8 14 12 3 15 2 18
7 5 14 3 2
     
   
= 324
31
10,45.
L’étendue est : 18 5 = 13.
2)
[1,5 ; 1,6[
[1,6 ; 1,7[
[1,7 ; 1,8[
[1,8 ; 1,9[
[1,9 ; 2[
5
16
9
4
1
La classe [1,6 ; 1,7[ est la classe modale car elle a le plus grand effectif.
Son centre, 1,65 est le mode de la série.
La moyenne :
x =
5 1,55 16 1,65 9 1,75 4 1,85 1 1,95
5 16 9 4 1
     
 
= 59,25
35
1,69
Seconde Cours : statistiques descriptives
5
3) Quels sont les pays de l’ex-Europe des 15 ayant la population la plus jeune ?
Dans le tableau ci-dessous, on a rangé ces pays dans l’ordre croissant du pourcentage P de
jeunes de moins de 15 ans dans la population pour les classer en quatre quarts, délimités
par les quartiles.
Pays
Pourcentage P des
moins de 15 ans
Part des pays dans
l'intervalle [0;P]
Italie
14,6%
1/15 soit
6,7%
Espagne
15,3%
2/15 soit
13,3%
Grèce
15,4%
3/15 soit
20,0%
Allemagne
15,8% (Q1)
4/15 soit
26,7%
Autriche
17,0%
5/15 soit
33,3%
Portugal
17,0%
6/15 soit
40,0%
Belgique
17,7%
7/15 soit
46,7%
Danemark
18,2% (Med)
8/15 soit
53,3%
Finlande
18,4%
9/15 soit
60,0%
Hollande
18,5%
10/15 soit
66,7%
Suède
18,7%
11/15 soit
73,3%
Luxembourg
18,8% (Q3)
12/15 soit
80,0%
France
19,0%
13/15 soit
86,7%
Grande-Bretagne
19,2%
14/15 soit
93,3%
Irlande
22,2%
15/15 soit
100,0%
Dans la dernière colonne on a indiqué les fréquences cumulées croissantes en pourcentage.
Le premier quartile , noté Q1, est la plus petite valeur de la variable telle que pour au
moins 25% des individus, cette variable est inférieure ou égale à Q1.
Ici Q1 = 15,8%.
Le troisième quartile , noté Q3, est la plus petite valeur de la variable telle que pour au
moins 75% des individus, cette variable est inférieure ou égale à Q3.
Ici Q3 = 18,8%.
La médiane, notée Med, est la valeur de la variable pour le ou les individus centraux (ici le
Danemark).
Ici Med = 18,2%.
Si l’on note Min et Max les valeurs extrêmes de la série, les cinq paramètres :
Min, Q1, Med, Q3 et Max permettent de partager la série en quatre groupes d’effectifs
voisins.
L'écart interquartile est égal à Q3 Q1 = 18,8 15,8 = 3%
1 / 5 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !