Premi`ere ES-L 2014/2015
Chapitre 3 : Statistiques descriptives
Cours
1 Comment r´esumer une s´erie statistique ?
1.1 Le couple m´ediane - ´ecart interquartile
efinition 1
On consid`ere une s´erie statistique ayant un nombre nde valeurs, suppos´ees rang´ees dans l’ordre croissant.
On appelle ediane de cette s´erie le nombre Med qui partage cette s´erie en deux parties de mˆeme effectif
M´ethode 1
D´etermination de la m´ediane
1. Premier cas : le nombre de valeurs est impair
Dans ce cas, la m´ediane est la valeur centrale de la s´erie. Par exemple, d´eterminer la m´ediane pour la s´erie
ci-dessous :
15 8 13 5 14 13 18 10 11
Ici, on a n=...
On classe les valeurs dans l’ordre croissant :
On a n
2=... que l’on arrondi `a l’entier sup´erieur ....
La m´ediane est donc la . . . -i`eme valeur : M ed =....
2. Deuxi`eme cas : le nombre de valeurs est pair
Dans ce cas, il y a deux valeurs centrales : la m´ediane est la demi-somme de ces deux valeurs. Par exemple,
d´eterminer la m´ediane pour la s´erie ci-dessous :
3 9 5 4 2 9 6 8
Ici, on a n=...
On classe les valeurs dans l’ordre croissant :
On a n
2=.... La m´ediane est donc la demi-somme de la . . . -i`eme valeur et de la . . . -i`eme valeur.
Med =...+...
2=....
3. Troisi`eme cas : la s´erie est donn´ee avec des effectifs
Soit par exemple la s´erie statistique suivante :
Valeur 3 7 11 13 17
Effectif 40 31 25 42 56
On commence par calculer l’effectif total : n=...
nest pair, n
2=..., donc la ediane est la demi-somme de la . . . -i`eme valeur et de la . . . -i`eme valeur.
On calcule les effectifs cumul´es croissants pour eterminer la . . . -i`eme valeur et la . . . -i`eme valeur :
Valeur 3 7 11 13 17
Effectif 40 31 25 42 56
Eff. cumul´es
On constate que la . . . -i`eme valeur est ´egale `a . . . et la . . . -i`eme valeur est ´egale `a . . . ,
donc M ed =...+...
2=....
Lyc´ee ´
Emile Duclaux Page 1/5
Premi`ere ES-L 2014/2015
4. Quatri`eme cas : la s´erie est donn´ee avec des fr´equences
Soit par exemple la s´erie statistique suivante :
Valeur 8 10 12 15 19
Fequence 23 9 33 31 4
On calcule les fr´equences cumul´ees croissantes :
Valeur 8 10 12 15 19
Fequence 23 9 33 31 4
Feq. cumul´ees
La m´ediane est la premi`ere valeur pour laquelle la fr´equence cumul´ee d´epasse 50%, donc Med =....
!
efinition 2
Le premier quartile Q1d’une s´erie statistique est la plus petite valeur de cette s´erie telle qu’au
moins 25% des valeurs lui soient inf´erieures ou ´egales.
Le deuxi`eme quartile d’une s´erie statistique est sa m´ediane M ed.
Le troisi`eme quartile Q3d’une s´erie statistique est la plus petite valeur de cette s´erie telle qu’au
moins 75% des valeurs lui soient inf´erieures ou ´egales.
Med
Q1Q3
50% des valeurs 50% des valeurs
25% des valeurs
75% des valeurs
+ +++ +
Remarque
Q1,Med et Q3partagent les valeurs de la s´erie en quatre groupes de mˆeme effectif.
M´ethode 2
D´etermination des quartiles
1. Premier cas : on dispose de la liste de toutes les valeurs
Soit par exemple la s´erie suivante :
110 115 116 121 124 131 138 140 141 144 149 152 155
Ici, on a n=...
On a n
2=... que l’on arrondi `a l’entier sup´erieur .... La m´ediane est donc la . . . -i`eme valeur : Med =....
On a n
4=... que l’on arrondi `a l’entier sup´erieur ....
Le premier quartile Q1est don ´egale `a la . . . -i`eme valeur : Q1=....
On a 3n
4=... que l’on arrondi `a l’entier sup´erieur ....
Le premier quartile Q3est don ´egale `a la . . . -i`eme valeur : Q3=....
Lyc´ee ´
Emile Duclaux Page 2/5
Premi`ere ES-L 2014/2015
2. Deuxi`eme cas : la s´erie est donn´ee avec des effectifs ou des fr´equences
Dans ce cas, on utilise les effectifs cumul´es ou les fr´equences cumul´ees.
Soit par exemple la s´erie statistique suivante :
Valeur 3 7 11 13 17
Effectif 40 31 25 42 56
Eff. cumul´es
n
4=..., donc Q1est la . . . -i`eme valeur : Q1=....
3n
4=..., donc Q3est la . . . -i`eme valeur : Q3=....
Soit par exemple la s´erie statistique suivante :
Valeur 8 10 12 15 19
Fequence 23 9 33 31 4
Feq. cumul´ees
On en d´eduit : Q1=... et Q3=....
!
efinition 3
On appelle ´ecart interquartile la diff´erence Q3Q1.
Remarque
Au moins 50% des valeurs de la s´erie sont comprises entre Q1et Q3.
`
A retenir
Le couple ediane - ´ecart interquartile est un esum´e de la s´erie statistique.
La m´ediane est une caract´eristique de position : elle permet de situer les valeurs.
L’´ecart interquartile est une caract´eristique de dispersion : plus il est grand, plus les valeurs sont
dispers´ees par rapport `a la m´ediane.
!
On r´esume souvent une s´erie statistique en construisant un diagramme en boˆıte, appel´e aussi boˆıte `a mous-
tache. Il s’agit d’un rectangle (boˆıte) dont la longueur correspond `a l’´ecart interquartile, dans lequel un segment
correspond `a la m´ediane. `
A gauche et `a droite du rectangle, des segments (moustaches) indiquent la distance entre
Q1et la plus petite valeur de la s´erie et la distance entre Q3et la plus grande valeur de la s´erie.
xmin xmax
Q1Q3
Med
Lyc´ee ´
Emile Duclaux Page 3/5
Premi`ere ES-L 2014/2015
M´ethode 3
Construction d’un diagramme en boˆıte
On commence par calculer Q1,M ed,Q3.
On choisit une ´echelle sur l’axe horizontal afin de faire apparaˆıtre les cinq nombres xmin,Q1,M ed,Q3et
xmax.
On construit le rectangle et les deux segments comme indiqu´e ci-dessus.
Soit par exemple la s´erie d´ej`a ´etudi´ee ci-dessus :
110 115 116 121 124 131 138 140 141 144 149 152 155
pour laquelle on avait trouv´e : Q1=...,Med =...,Q3=....
Choisissons une ´echelle horizontale de 2 cm pour 10 unit´es (axe gradu´e de 100 `a 160), et compl´etons le diagramme :
100 160
+ ++ + + + +
1.2 Le couple moyenne - ´ecart-type
L’´ecart-type est un nombre permettant de mesurer la dispersion des valeurs d’une s´erie statistique par rapport
`a sa moyenne (et non plus par rapport `a sa m´ediane).
efinition 4
On consid`ere une s´erie statistique comportant kvaleurs not´ees x1,x2, . . . , xnd’effectifs respectifs n1,n2,
. . . , nk. On note nl’effectif total : n=n1+n2+...+nk.
Valeur x1x2. . . xkTotal
Effectif n1n2. . . nkn
On note xla moyenne de cette s´erie.
On appelle variance de la s´erie statistique le nombre V´egal `a la moyenne des carr´es des ´ecarts
`a la moyenne de cette s´erie.
En d’autres termes :
V=1
nn1(x1x)2+n2(x2x)2+...+nk(xkx)2
On appelle ´ecart-type de la s´erie statistique le nombre σ´egal `a la racine carr´ee de la variance :
σ=V
Remarques
La lettre grecque σse lit “sigma”.
La variance est calcul´ee `a partir des carr´es des valeurs et l’´ecart-type est la racine carr´ee de la variance.
L’´ecart-type s’exprime donc dans la eme unit´e que les valeurs de la s´erie.
Lyc´ee ´
Emile Duclaux Page 4/5
Premi`ere ES-L 2014/2015
M´ethode 4
Calcul de l’´ecart-type “`a la main”
Consid´erons par exemple la s´erie statistique repr´esent´ee par le tableau suivant :
Valeur xi3 7 11 13 17
Effectif ni40 31 25 42 56
L’effectif total est : n=..., la moyenne vaut : x=....
Compl´etons le tableau ci-dessous :
(xix)2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
ni. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
La variance est ´egale `a la moyenne de ce dernier tableau : V...
D’o`u l’´ecart-type σ...
Dans la pratique, on ne calcule pas un ´ecart-type `a la main, mais on utilise une calculatrice ou un logiciel.
`
A retenir
Le couple moyenne - ´ecart-type est un esum´e de la s´erie statistique.
La moyenne est une caract´eristique de position : elle permet de situer les valeurs.
L’´ecart-type est une caract´eristique de dispersion : plus il est grand, plus les valeurs sont dispers´ees
par rapport `a la moyenne.
L’´ecart interquartile ne d´epend que des valeurs situ´ees entre Q1et Q3, alors que l’´ecart-type tient
compte de toutes les valeurs de la s´erie : il est donc plus sensible aux valeurs extrˆemes.
2 Utilisation de la machine
Voir les fiches-outil distribu´ees en classe.
Les d´efinitions des quartiles utilis´ees par les calculatrices ne sont pas les mˆemes que les d´efinitions du cours.
Il est donc possible que la calculatrice ne donne pas les mˆemes valeurs qu’une recherche “`a la main”.
3´
Etude et comparaison de s´eries statistiques
Nous allons comparer la r´epartition des taux de comage des pays de l’OCDE avec celle de l’ensemble des ´etats
du monde.
Les donn´ees utilis´ees pour les pays de l’OCDE sont issues du site de l’OCDE ; les donn´ees pour les ´etats du monde
sont issues de “The world factbook” (https ://www.cia.gov/library/publications/the-world-factbook/), publi´e par
la CIA.
Les donn´ees se trouvent dans le fichier comparaison chomage.ggb `a ouvrir dans GeoGebra.
Dans GeoGebra, electionner les colonnes B et E, puis choisir l’outil “Statistiques `a plusieurs variables” dans le
deuxi`eme bouton de commandes :
Une fenˆetre intitul´ee “Sources de donn´ees” s’ouvre. Cliquer sur le bouton et cocher “Utiliser l’entˆete comme
titre”, puis cliquer sur le bouton “Analyser”.
Une fenˆetre intitul´ee “Analyse des donn´ees” s’ouvre. Les diagrammes en boˆıte des deux s´eries sont construits avec
la mˆeme ´echelle : cela permet de comparer les deux s´eries.
Cliquer sur le bouton pour faire apparaˆıtre les r´esum´es statistiques des deux s´eries.
Indiquer pour chaque s´erie : Q1,M ed,Q3, l’´ecart interquartile, puis la moyenne et l’´ecart-type σ.
Utiliser ces donn´ees et le graphique pour comparer les deux s´eries et expliquer les diff´erences.
Vous rendrez vos r´eponses sous la forme d’un fichier ODT contenant une copie des diagrammes obtenus.
Lyc´ee ´
Emile Duclaux Page 5/5
1 / 5 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !