Telechargé par Fekhreddine Chekkal

cours statistiques master

publicité
INTRODUCTION
Vocabulaire statistique
L ’opérateur somme
VOCABULAIRE STATISTIQUE
Population statistique :
Une population statistique est l'ensemble sur lequel on effectue des observations.
Individu (ou unités statistiques) :
Les individus sont les éléments de la population statistique étudiée.
Caractère statistique ou variable statistique :
C'est ce qui est observé ou mesuré sur les individus d'une population statistique.
1
Saïd Chermak
pour infomaths.com
INTRODUCTION
Vocabulaire statistique
L ’opérateur somme
VARIABLES QUANTITATIVES
Variable quantitative :
Une variable statistique est quantitative si ses valeurs sont des nombres exprimant
une quantité, sur lesquels les opérations arithmétiques (somme, etc...) ont un sens.
Variable quantitative discrète: Variable quantitative continue:
Une variable quantitative est discrète si elle
ne peut prendre que des valeurs isolées,
généralement entières.
2
Saïd Chermak
pour infomaths.com
Une variable quantitative est continue si ses
valeurs peuvent être n'importe lesquelles
d'un intervalle réel.
INTRODUCTION
Vocabulaire statistique
L ’opérateur somme
VARIABLES QUALITATIVES
Variable qualitative :
Une variable statistique est qualitative si ses valeurs, ou modalités, s'expriment de
façon littérale ou par un codage sur lequel les opérations arithmétiques telles que
moyenne, somme, ... , n'ont pas de sens.
Variable qualitative nominale :
Variable qualitative ordinale :
C'est une variable qualitative dont les
modalités ne sont pas ordonnées.
C'est une variable qualitative dont les
modalités sont naturellement ordonnées
3
Saïd Chermak
pour infomaths.com
INTRODUCTION
Vocabulaire statistique
L ’opérateur somme
(1) UN OUTIL : L ’OPERATEUR SOMME Σ
DEFINITION:
p et q étant 2 entiers relatifs
q
∑x
i= p
i
= x p + x p +1 + ...... + xq
q
REMARQUE 1: i est une variable muette
Saïd Chermak
i
j= p
j
h= p
h
n
Quand il n’y a pas d’ambiguïté sur le domaine
de variation de i, celui-ci peut être omis
4
q
∑ x =∑ x =∑ x
i= p
REMARQUE 2:
q
pour infomaths.com
∑x = ∑x = ∑x
i =1
i
i
i
i
INTRODUCTION
Vocabulaire statistique
L ’opérateur somme
(2) UN OUTIL : L ’OPERATEUR SOMME Σ
∑ ka
PROPRIETE 1:
i
i
q
∑ ka
i
i= p
= k ∑ ai
i
q
= ka p + ka p +1 + ...... + kaq = k ( a p + a p +1 + ...... + aq ) = k ∑ ai
i
i
i
i
q
∑(a + b ) = (a
i= p
PROPRIETE 3 :
i= p
∑(a + b ) = ∑ a + ∑b
PROPRIETE 2:
i
i
i
i
p
i
+ bp ) + ( a p +1 + bp +1 ) + ..... + ( aq + bq )
∑ k (a + b ) = k∑ a + k∑b
i
i
i
i
q
q
i= p
i= p
= ( a p + a p +1 + ..... + aq ) + ( bp + bp +1 + ..... + bq ) = ∑ ai + ∑ bi
i
PROPRIETE 4 :
n
i
n
∑ k = nk
i =1
+ k4+244
..... +3k = nk
∑ k = k14
i =1
PROPRIETE 5:
q
n
∑ k = ( q − p + 1) k
i= p
5
Saïd Chermak
pour infomaths.com
i
Tableaux et graphiques
6
Saïd Chermak
pour infomaths.com
TABLEAUX ET GRAPHIQUES
Qualitative nominale
Qualitative ordinale
Quantitative discrète
Quantitative continue
(1) VARIABLES QUALITATIVES NOMINALES
Noms
M. Alberro
M. Hondarrague
Mme Claverotte
Melle Lopez
M. Paulien
M. Guillou
M. Lahitette
Mme Vigouroux
Melle Maleig
M. Duclos
M. Carricaburu
Mme Vidal
….
7
Couleur des yeux
Vert
Noir
Noir
Noisette
Bleu
Noir
Noisette
Noir
Bleu
Vert
Bleu
Noir
….
Saïd Chermak
pour infomaths.com
Modalités Effectifs Fréquences
Bleu
60
0,200
Noir
160
0,533
Noisette
40
0,133
Vert
40
0,133
Total :
300
1
%
20,0
53,3
13,3
13,3
100
Modalités Effectifs Fréquences
%
f1×100
modalité 1
n1
f1= n1/n
…
…
…
f i ×100
modalité i
ni
fi= ni/n
…
…
…
f k ×100
modalité k
nk
fk= nk/n
Total :
100
∑ n i = n ∑ f i =1
TABLEAUX ET GRAPHIQUES
Qualitative nominale
Qualitative ordinale
Quantitative discrète
Quantitative continue
(2) VARIABLES QUALITATIVES NOMINALES
Modalités Effectifs Fréquences
Bleu
60
0.200
Noir
160
0,533
Noisette
40
0,133
Vert
40
0,133
Total :
300
1
Diagramme circulaire ou camembert
Vert
13%
Bleu
20%
%
20,0
53,3
13,3
13,3
100
Diagramme en barres
180
160
160
140
Noisette
13%
120
100
80
60
60
40
Noir
54%
8
Saïd Chermak
pour infomaths.com
40
40
Noisette
Vert
20
0
Bleu
Noir
TABLEAUX ET GRAPHIQUES
Qualitative nominale
Qualitative ordinale
Quantitative discrète
Quantitative continue
VARIABLES QUALITATIVES ORDINALES
130 personnes ont été interrogées sur leur addiction au chocolat
Les
modalités
sont
présentées
dans l’ordre
Modalités
Effectifs = Nombre de personnes
Pas du tout (A)
10
Un peu (B)
25
Beaucoup (C)
40
Passionnément (D)
32
A la folie (E)
23
45
40
40
35
32
30
25
23
25
20
15
10
10
5
0
9
Saïd Chermak
A
B
pour infomaths.com
C
D
E
TABLEAUX ET GRAPHIQUES
Qualitative nominale
Qualitative ordinale
Quantitative discrète
Quantitative continue
(1) VARIABLES QUANTITATIVES DISCRETES
EFFECTIFS ET FREQUENCES
Nombre de produits
Nombre de
Nombre de clients
financiers
produits financiers
Bredat
2
0
103
Gauguet
3
1
115
Leremboure
0
2
95
Coustere
0
3
35
Lalisou
1
4
10
Aussagne
0
5
2
Vittorello
1
Diaz
0
Valeurs de Effectifs Fréquences
%
Etcheverry
2
la variable
Bernadet
4
f1×100
x1
n1
f1= n1/n
Miramon
1
Jaime
3
…
…
…
Dartus
2
f i ×100
xi
ni
fi= ni/n
Domege
0
…
…
…
Train
0
f k ×100
xk
nk
fk= nk/n
Piquemal
1
Total :
100
ni = n
f i =1
Laffargue
2
pour infomaths.com
…… Saïd Chermak…….
10
Clients
∑
∑
TABLEAUX ET GRAPHIQUES
Qualitative nominale
Qualitative ordinale
Quantitative discrète
(2) VARIABLES QUANTITATIVES DISCRETES
REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES
Nbre de produits financiers
xi
0
1
2
3
4
5
Effectif
ni
103
115
95
35
10
2
Fréquence
fi
0,286
0,319
0,264
0,097
0,028
0,006
Diagramme en bâtons
140
120
100
80
60
40
20
0
11
Saïd Chermak
1
2
pour0 infomaths.com
3
4
5
6
Quantitative continue
TABLEAUX ET GRAPHIQUES
Qualitative nominale
Qualitative ordinale
Quantitative discrète
Quantitative continue
(3) VARIABLES QUANTITATIVES DISCRETES
EFFECTIFS ET FREQUENCES CUMULES
Effectifs cumulés croissants:
Nombre d'individus pour lesquels la
variable est inférieure ou égale à xi.
Résultat de l'addition, de proche en
proche, des effectifs d'une distribution
observée en commençant par le 1er.
Effectifs cumulés décroissants:
Nombre d'individus pour lesquels la
variable est supérieure ou égale à xi.
Résultat de l'addition, de proche en
proche, des effectifs d'une distribution
observée en commençant par le dernier.
12
Saïd Chermak
pour infomaths.com
Nbre
Nombre de Effectifs cumulés Effectifs cumulés
produits
Clients
croissants
décroissants
financiers
0
103
103
360
1
115
257
218
2
95
142
313
3
35
47
348
4
10
12
358
5
2
2
360
Total :
360
Valeurs de la Effectif Effectifs cumulés
Effectifs cumulés
variable
croissants
décroissants
xi
ni
Ni
N’i
x1
n1
N1= n1
N’1= nk+ ….+ n1= n
x2
n2
N2= n1+ n2
N’2= nk+ ….+ n2
x3
n3
N3= n1+ n2+ n3
N’3= nk+ ….+ n3
…
…
….
….
xk-1
nk-1
Nk-1= n1+ ….+ nk-1
N’k-1= nk+ nk-1
xk
nk
Nk= n1+ ….+ nk= n
N’k= nk
Total :
n
TABLEAUX ET GRAPHIQUES
Qualitative nominale
Qualitative ordinale
Quantitative discrète
Quantitative continue
(4) VARIABLES QUANTITATIVES DISCRETES
EFFECTIFS ET FREQUENCES CUMULES
Nombre de Nombre de
produits
clients
financiers
xi
ni
0
103
1
115
2
95
3
35
4
10
5
2
Total :
360
Effectifs
cumulés
croissants
Ni
103
218
313
348
358
360
Effectifs
Fréquences
cumulés
décroissants
N’i
fi
360
0,2861
257
0,3194
142
0,2639
47
0,0972
12
0,0278
2
0,0056
1
Fréquences Fréquences
cumulées
cumulées
croissantes décroissantes
Fi
F’i
0,2861
1
0,6055
0,7139
0,8694
0,3945
0,9666
0,1306
0,9944
0,0334
1
0,0056
Il y a 313 clients possédant un nombre de produits financiers inférieur ou égal à 2
Il y a 47 clients possédant un nombre de pro. fin. supérieur ou égal à 3
La proportion de clients possédant un nombre de pro. fin. inférieur ou égal à 4 est de 99,44%
La proportion de clients possédant un nombre de pro. fin. supérieur ou égal à 1 est de 71,39%
13
Saïd Chermak
pour infomaths.com
TABLEAUX ET GRAPHIQUES
Qualitative nominale
Qualitative ordinale
Quantitative discrète
Quantitative continue
(5) VARIABLES QUANTITATIVES DISCRETES
COURBES CUMULATIVES
x
ni
Ni
0
103
103
1
1
115
218
2
2
95
313
3
3
35
348
4
4
10
358
5
5
2
360
−∞
0
+∞
xi
N(x)
0
103
218
313
348
358
360
N’i
360
257
142
47
12
2
400
N ’(x)
350
360
300
257
250
142
200
47
150
12
100
2
50
0
0
-2
-1
0
1
2
3
4
5
6
On appelle courbe cumulative croissante le tracé de la fonction N (ou F pour les fréquences)
qui à tout réel x associe N( x ) = nombre d'observations inférieur ou égal à x.
On appelle courbe cumulative décroissante le tracé de la fonction N' (ou F’ pour les fréquences)
qui a tout réel x associe N'( x ) = nombre d'observations supérieur strictement à x.
Les courbes cumulatives N(x) et N’(x) sont symétriques par rapport à n/2 : N(x) + N’(x) = n
cumulatives
F’(x) sont symétriques par rapport à 0,5 : F(x) + F’(x) = 1
Chermak F(x)
pour etinfomaths.com
14 Les courbesSaïd
TABLEAUX ET GRAPHIQUES
Qualitative nominale
Qualitative ordinale
Quantitative discrète
Quantitative continue
(1) VARIABLES QUANTITATIVES CONTINUES
Variable observée: augmentation moyenne mensuelle du salaire, en €, des employés
d’une multinationale au cours de l’année 2005.
Augmentation Effectif
18
4
2
34
21
9
36
8
9
12
38
11
25
34
0
37
16
33
19
18
10
27
43
1
2
22
6
31
15
….
35
2
22
28
30
39
42
33
2
….
0
41
26
5
1
11
42
4
21
….
4
16
11
5
8
0
1
4
0
….
Remarque1 : la variable augmentation moyenne mensuelle peut
être considérée comme continue. En arrondissant à l’euro, on l’a
discrétisée.
Une augmentation de 10 € est en fait une augmentation comprise
entre 9,5 € et 10,5 €.
Remarque2 : Une variable continue ne prend pas des valeurs
isolées, mais des valeurs appartenant à des intervalles. C'est
pourquoi, au lieu de définir des effectifs par valeurs, on définira des
effectifs par intervalles, appelés classes.
Remarque3 : Une variable discrète comportant trop de valeurs est
Chermak
pour infomaths.com
15 aussi traitéeSaïd
comme
une variable
continue.
(€)
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
…..
Total
257
318
255
307
308
159
140
84
72
55
22
13
9
7
8
21
6
2
….
2125
TABLEAUX ET GRAPHIQUES
Qualitative nominale
Qualitative ordinale
Quantitative discrète
Quantitative continue
(2) VARIABLES QUANTITATIVES CONTINUES
Augmentation (€)
[0 – 3[
[3 – 5[
[5 – 10[
[10 – 20[
[20 – 30[
[30 – 50[
Effectifs
830
615
510
92
63
15
Classes
[e 1 – e 2[
[e 2 – e 3[
….
[e k – e k+1[
Effectifs
n1
n2
….
nk
Remarque 1: Le choix des classes et arbitraire, mais elles doivent être contigües
et recouvrir l’ensemble des valeurs.
Remarque 2: Il est préférable de prendre des classes d’amplitudes égales.
Remarque 3: Il ne faut prendre ni trop ni trop peu de classes.
Remarque 4: Le choix et le nombre de classes influent sur les représentations
graphiques.
16
Saïd Chermak
pour infomaths.com
TABLEAUX ET GRAPHIQUES
Qualitative nominale
Qualitative ordinale
Quantitative discrète
Quantitative continue
(3) VARIABLES QUANTITATIVES CONTINUES
REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES
Classes
[0 – 3[
[3 – 5[
[5 – 10[
[10 – 20 [
[20 – 30[
[30 – 50[
Effectifs
830
615
510
92
63
15
effectif
900
800
700
600
500
400
300
200
100
50
30
300
250
HISTOGRAMME
200
150
100
50
50
30
0
3
17
[0 – 3[
[3 – 5[
[5 – 10[
[10 – 20 [
[20 – 30[
[30 – 50[
Effectifs Amplitude Effectifs
ni
ai
rectifiés
ni /ai
830
3
276,7
615
2
307,5
510
5
102,0
92
10
9,2
63
10
6,3
15
20
0,75
Saïd Chermak pour infomaths.com
Effectif rectifié
350
0
Classes
3
0
0
TABLEAUX ET GRAPHIQUES
Qualitative nominale
Qualitative ordinale
Quantitative discrète
Quantitative continue
(4) VARIABLES QUANTITATIVES CONTINUES
REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES
Classes
[0 – 3[
[3 – 5[
[5 – 10[
[10 – 20[
[20 – 30[
[30 – 50[
Effectifs Amplitude Effectifs
ni
ai
rectifiés
ni /ai
830
3
276,7
615
2
307,5
510
5
102,0
92
10
9,2
63
10
6,3
15
20
0,75
Effectif rectifié
350
300
250
HISTOGRAMME
200
150
100
50
50
30
3
0
0
La surface = ai × (ni/ai) est de 830 unités
La surface = ai × (ni/ai) est de 615 unités
Dans un histogramme, ce sont les surfaces des rectangles (ce que l’œil voit), qui sont
proportionnelles aux effectifs, et non les hauteurs de ces rectangles
Remarque: Le tracé de l’histogramme des fréquences est identique. Il suffit de porter
en ordonnées
la Chermak
fréquence
rectifiée
di = fi/ai, appelée densité.
Saïd
pour
infomaths.com
18
TABLEAUX ET GRAPHIQUES
Qualitative nominale
Qualitative ordinale
Quantitative discrète
Quantitative continue
(5) VARIABLES QUANTITATIVES CONTINUES
EFFECTIFS ET FREQUENCES CUMULES
Classes
Variable observée:
augmentation moyenne
mensuelle du salaire, en
€, des employés d’une
multinationale au cours
de l’année 2005.
[ei – ei+1[
[0 – 3[
[3-5[
[ 5 - 10 [
[10 - 20 [
[20 - 30 [
[30 – 50[
Total :
Effectifs Effectifs
Effectifs Fréquences Fréquences
cumulés
cumulés
cumulées
cumulées
croissants décroissants croissantes décroissantes
ni
Ni
N’i
Fi
F’i
830
830
2125
0,391
1,000
615
1445
1295
0,680
0,609
510
1955
680
0,920
0,320
92
2047
170
0,963
0,080
63
2110
78
0,993
0,037
15
2125
15
1,000
0,007
2125
Il y a 1445 employés dont l’augmentation est strictement inférieure à 5
Il y a 170 employés dont l’augmentation est supérieure ou égale à 10
Combien y-a-t-il d’employés dont l’augmentation est inférieure à 17 ?
19
Saïd Chermak
pour infomaths.com
TABLEAUX ET GRAPHIQUES
Qualitative nominale
Qualitative ordinale
Quantitative discrète
Quantitative continue
(6) VARIABLES QUANTITATIVES CONTINUES
COURBES CUMULATIVES
x
−∞ [ei – ei+1[
0
3
5
Fi
[0-3[
0,391
[3-5[
0,680
[ 5 - 10 [
0,920
10
[10 - 20 [
0,963
20
[20 - 30 [
0,993
[30 - 50 [
1,000
30
50
+∞
F(x)
F’
?0 i
1,000
?
0,391
0,609
?
0,680
0,320
0,920
0,080
0,963
0,037
0,993
0,007
1
F’i
1,000
0,609
0,320
0,080
0,037
0,007
F’(x)
?
1 l’intérieur
A
1
?
0,9
0,609
de chaque
Fi
0,8
classe, on fait
0,320
l’hypothèse
0,080
que la
0,037
répartition est
0,007
uniforme
0,7
F’i
0,6
0,5
0,4
0,3
0,2
0
0,1
0
-10
0
10
20
30
40
50
60
On appelle courbe cumulative croissante le tracé de la fonction F (N pour les effectifs) qui à tout réel x
associe F( x ) = nombre d'observations inférieur ou égal à x.
On appelle courbe cumulative décroissante le tracé de la fonction F’ (N’ pour les effectifs) qui a tout réel
Remarque: Pour une variable continue, il est indifférent de dire « inférieur ou égal » ou
x associe F’( x ) = nombre d'observations supérieur strictement à x.
« strictement inférieur ». Il en est de même pour « supérieur ou égal » ou « strictement
supérieur ».
Les courbes cumulatives F(x) et F’(x) sont symétriques par rapport à 0,5 : F(x) + F’(x) = 1
Il n’y a aucune chance qu’une observation tombe sur une borne. C’est l’imprécision de
Chermak pour infomaths.com
20 l’instrumentSaïd
de mesure et un mauvais choix des bornes qui pourrait conduire à ce résultat.
TABLEAUX ET GRAPHIQUES
Qualitative nominale
Qualitative ordinale
Quantitative discrète
Quantitative continue
(7) VARIABLES QUANTITATIVES CONTINUES
COURBES CUMULATIVES
Quelle est la proportion p d’employés dont l’augmentation est inférieure à 17 € ?
x [ei – ei+1[
Fi
F(x)
0
0
[0-3[
0,391
1
0,950,9
0,391
3
[3-5[
0,8
0,680
0,7
0,680
5
[ 5 - 10 [
0,6
0,5
0,920
0,4
10
0,920
p
17 [10 - 20 [ 0,963
0,963
20
[20 - 30 [ 0,993
30
0,993
[30 - 50 [
1
50
1
17 - 10
20 - 10
21
=
p - 0,92
0,963-0,920
Saïd Chermak
0,3
0,2
0,1
0
-10
0
10
D'où p = 0,92 +
pour infomaths.com
20
17
30
40
50
60
17 − 10
( 0,963 − 0,920 ) ≈ 95%
20 − 10
TABLEAUX ET GRAPHIQUES
RESUME
VARIABLE QUALITATIVE
VARIABLE QUANTITATIVE
Nominale
Discrète
Ordinale
Effectifs ou Fréquences
Diagramme en barres
Diagramme circulaire
22
Diagramme en barres
Modalités dans
l ’ordre
Saïd Chermak
pour infomaths.com
Continue
Effectifs ou Fréquences
Diagramme en bâtons
Histogramme
Courbes cumulatives des effectifs ou des fréquences
PARAMETRES STATISTIQUES
23
Saïd Chermak
pour infomaths.com
PARAMETRES STATISTIQUES
Les représentations graphiques ont permis une première synthèse visuelle de la
distribution des observations
Un paramètre statistique permet de résumer par une seule quantité numérique une
information contenue dans une distribution d’observations.
!
Les paramètres statistiques ne concernent que les variables quantitatives
Variable
3000
3000
2500
2500
2500
2000
2000
Tendance centrale
1500
1000
500
500
0
N° individu
Saïd Chermak
100 % - A %
Position
A%
1500
1000
0
24
Variable
Variable
3000
2000
Dispersion
1500
1000
500
0
0
0
pour infomaths.com
N° individu
0
N° individu
PARAMETRES STATISTIQUES
Position
Tendance centrale
Dispersion
(1) PARAMETRES DE TENDANCE CENTRALE
LE MODE
Une distribution est unimodale si elle présente un maximum marqué, et pas d'autres
maxima relatifs.
La lecture s’effectue sur le diagramme en bâtons ou l'histogramme.
100
90
140
80
120
70
100
60
80
50
60
40
30
40
20
20
10
0
0
0
1
2
3
4
5
6
Mode
900
1400
Mode
1900
2400
2900
3500
Classe modale
Le mode correspond à l'abscisse du maximum, c.à.d. la valeur la plus fréquente
25
Saïd Chermak
pour infomaths.com
ou plus...
PARAMETRES STATISTIQUES
Position
Tendance centrale
Dispersion
(2) PARAMETRES DE TENDANCE CENTRALE
LE MODE
Si la distribution présente 2 ou plus maxima relatifs, on dit qu'elle est bimodale ou
plurimodale.
La population est composée de plusieurs sous-populations ayant des caractéristiques de
tendance centrale différentes.
90
80
140
70
120
60
100
50
80
40
60
30
40
20
20
10
0
0
0
1
2
Mode 1
26
3
Saïd Chermak
4
5
Mode 2
6
pour infomaths.com
900
1400
1900
2400
Mode 1
2900
3500
4000
4500
Mode 2
ou
plus...
PARAMETRES STATISTIQUES
Position
Tendance centrale
Dispersion
(3) PARAMETRES DE TENDANCE CENTRALE
LA MEDIANE
Les valeurs observées doivent être rangées par ordre croissant.
La médiane M est la valeur du milieu de la série d’observations, c.à.d. telle qu'il y ait
autant d'observations "au-dessous" que "au-dessus".
Nombre impair d’observations
3
4
4
4 valeurs
27
5
6
M
Saïd Chermak
8
8
9 10
4 valeurs
Nombre pair d’observations
3
4
4
4 valeurs
5
6
8
8
4 valeurs
Intervalle médian
M = milieu = 5,5
pour infomaths.com
9
PARAMETRES STATISTIQUES
Position
Tendance centrale
Dispersion
(4) PARAMETRES DE TENDANCE CENTRALE
LA MEDIANE à partir d’une distribution discrète
xi
M
-2
28
-1
ni
F(x)
Fi
0
103
0,286
0
1
115
0,606
0,286
2
95
0,869
3
35
0,967
4
10
0,994
5
2
1
0,606
0,5
0,869
Intervalle médian
M = milieu = 1,5
0,967
0,994
1
1
1
0,5
0,5
0
0
1
2
3
M
Saïd Chermak
4
5
6
pour infomaths.com
-2
-1
0
0
xi
ni
Fi
0
103
0,286
1
77
0,500
2
95
0,764
3
35
0,861
4
10
0,889
5
40
1
1
2
3
Intervalle médian
M = milieu = 1,5
F(x)
0
0,286
0,500
0,5
0,764
0,861
0,889
1
4
5
6
PARAMETRES STATISTIQUES
Position
Tendance centrale
Dispersion
(5) PARAMETRES DE TENDANCE CENTRALE
LA MEDIANE à partir d’une distribution continue
x [ei – ei+1[
Fi
F(x)
0
0
[0-3[
3
M
5
0,391
[3-5[
[ 5 - 10 [
10
[10 - 20 [
20
[20 - 30 [
30
[30 - 50 [
50
M-3
5-3
29
=
0,391
0,680 0,5
0,680
0,920
0,920
0,963
0,963
0,993
0,993
1
1
0,5-0,391
0,680-0,391
Saïd Chermak pour infomaths.com
1
0,9
0,8
0,7
0,6
0,5 0,5
0,4
0,3
0,2
0,1
0
-10
0
3,2210
M
D'où M = 3 +
20
30
40
50
60
0,5 − 0,391
( 5 − 3) ≈ 3, 22
0,680 − 0,391
PARAMETRES STATISTIQUES
Tendance centrale
Position
Dispersion
(6) PARAMETRES DE TENDANCE CENTRALE
LA MOYENNE ARITHMETIQUE
La moyenne arithmétique est notée x
Série brute
x1, x2, … , xn
Série groupée
30
1 n
x = ∑ xi
n i=1
Valeurs de Effectifs Fréquences
la variable
x1
n1
f1= n1/n
…
…
…
xi
ni
fi= ni/n
…
…
…
xk
nk
fk= nk/n
Saïd Chermak pour infomaths.com
1 k
x = ∑ ni xi
n i=1
k
nixi k
=∑
=∑ fi x i
i=1 n
i=1
PARAMETRES STATISTIQUES
Tendance centrale
Position
Dispersion
(7) PARAMETRES DE TENDANCE CENTRALE
LA MOYENNE ARITHMETIQUE
Série classée
Classes Effectifs Fréquences Centres de classe
x 1= ( e 1 + e 2)/2
[e1 – e2[
n1
f1
x 2= ( e 2 + e 3)/2
[e2 – e3[
n2
f2
….
….
….
….
x k= ( e k + e k+1)/2
[ek – ek+1[
nk
fk
k
1 k
x = ∑ n i x i = ∑ fi x i
n i=1
i=1
31
Saïd Chermak pour infomaths.com
PARAMETRES STATISTIQUES
Position
Tendance centrale
Dispersion
(8) PARAMETRES DE TENDANCE CENTRALE
LA MOYENNE ARITHMETIQUE
Comment faire la moyenne de plusieurs populations ?
Population P2
Population P1
Effectif
n2
Moyenne x 2
Effectif
n1
Moyenne x1
Population P = P1 U P2
Effectif
Moyenne
n = n1+ n2
x?
k
nixi
nx +n x
x= 1 1 2 2 =∑
n
i=1 n
32
Saïd Chermak pour infomaths.com
Moyenne globale = moyenne des moyennes
PARAMETRES STATISTIQUES
Tendance centrale
Position
Dispersion
(9) PARAMETRES DE TENDANCE CENTRALE
PROPRIETES GENERALES
z=ax+b
y=ax
x
P (x) = moyenne, médiane, mode
33
P (y) = a P (x)
Saïd Chermak pour infomaths.com
P (z) = a P (x) + b
PARAMETRES STATISTIQUES
Tendance centrale
Position
Dispersion
(10) PARAMETRES DE TENDANCE CENTRALE
MOYENNES GEOMETRIQUE ET HARMONIQUE
Moyenne géométrique
G=
n
x1n1 x 2n 2 .....x kn k
Utilisée dans le cas de phénomènes multiplicatifs (taux de croissance moyen)
Moyenne harmonique
H=
n
k n
i
∑x
i=1
34
i
Utilisée dans le cas où l’on combine 2 variables sous forme de rapport
(pièces/heure, km/litre,…)
Saïd Chermak pour infomaths.com
PARAMETRES STATISTIQUES
Tendance centrale
Position
Dispersion
(1) PARAMETRES DE POSITION
LES FRACTILES OU QUANTILES
On appelle fractiles ou quantiles d'ordre k les (k-1) valeurs qui divisent les observations
en k parties d'effectifs égaux.
1 médiane M qui divise les observations en 2 parties égales
3 quartiles Q1, Q2, Q3 qui divisent les observations en 4 parties égales
9 déciles D1, D2, …, D9 qui divisent les observations en 10 parties égales
99 centiles C1, C2, …, C99 qui divisent les observations en 100 parties égales
35
Saïd Chermak pour infomaths.com
PARAMETRES STATISTIQUES
Position
Tendance centrale
Dispersion
(2) PARAMETRES DE POSITION
LES FRACTILES OU QUANTILES
Quartiles, déciles, centiles s’obtiennent de la même façon que la médiane.
Variable continue
Variable discrète
1
0,9
1
0,9
0,8
0,75 0,7
0,75
0,6
0,5
0,5
0,5
0,4
0,3
0,2
0,2
-2
-1
0,1
0
0
0
1
D2 M
36
2
3
4
5
6
Q3
Saïd Chermak pour infomaths.com
-10
0
10
MQ3D
9
20
30
40
50
60
PARAMETRES STATISTIQUES
Tendance centrale
Position
Dispersion
(3) PARAMETRES DE POSITION
PROPRIETES GENERALES
z=ax+b
100 % - A %
y=ax
100 % - A %
x
A%
100 % - A %
A%
A%
Q (x) = quantile
37
Q (y) = a Q (x)
Saïd Chermak pour infomaths.com
Q (z) = a Q (x) + b
PARAMETRES STATISTIQUES
Tendance centrale
Position
Dispersion
(1) PARAMETRES DE DISPERSION
Etendue : R = xmax - xmin
Intervalle interquartile : IQ = Q3 - Q1
Variance :
Série brute :
1 n
2
V = ∑ ( xi - x )
n i=1
Série groupée ou classée :
k
1 k
2
2
V = ∑ n i ( x i - x ) = ∑ fi ( x i - x )
n i=1
i=1
1 k
V = ∑ n i x i2 − x 2 = Moyenne des carrés - Carré de la moyenne
n i=1
Ecart-type :
38
σ=
V
Saïd Chermak pour infomaths.com
PARAMETRES STATISTIQUES
Position
Tendance centrale
Dispersion
(2) PARAMETRES DE DISPERSION
Comment faire la variance de plusieurs populations ?
Population P2
Population P1
Effectif
n2
Moyenne x 2
Variance V2
Effectif
n1
Moyenne x1
Variance V1
Population P = P1 U P2
Effectif
Moyenne
Variance
n = n1+ n2
x
V?
2
1 k
1 k
V = ∑ n i Vi + ∑ n i ( x i -x )
n i=1
n i=1
39
Saïd
Chermakglobale
pour infomaths.com
Variance
= Moyenne
des variances + Variance des moyennes
PARAMETRES STATISTIQUES
Tendance centrale
Position
Dispersion
(3) PARAMETRES DE DISPERSION
PROPRIETES GENERALES
z=ax+b
y=ax
x
P (x) = étendue, écart-type,
P (y) = a P (x)
intervalle
interquartile
Saïd Chermak
pour infomaths.com
40
P (z) = a P (x)
Téléchargement