Telechargé par lina happy

stat descriptive (1)

publicité
Université Ibn Zohr d’Agadir
Ecole Supérieure de Technologie de Laâyoune
Filière: Génie Informatique
Elément: Statistique descriptive
Réalisé par: Mohamed Ali Hafdi
Année: 2019
2
Table des matières
1 Distribution et représentation de séries univariées.
1.1 Introduction. . . . . . . . . . . . . . . . . . . . . . .
1.1.1 Vocabulaires et définitions. . . . . . . . . . . .
1.1.2 Typologie des caractères. . . . . . . . . . . . .
1.2 Représentation d’une série statistique. . . . . . . . .
1.2.1 Cas qualitatif. . . . . . . . . . . . . . . . . . .
1.2.2 Cas quantitatif. . . . . . . . . . . . . . . . . .
2 Eléments caractéristiques des séries statistiques
2.1 Paramètres de position ou de tendance centrale. . . .
2.1.1 Le mode. . . . . . . . . . . . . . . . . . . . .
2.1.2 La médiane. . . . . . . . . . . . . . . . . . . .
2.1.3 La médiale. . . . . . . . . . . . . . . . . . . .
2.1.4 La moyenne. . . . . . . . . . . . . . . . . . . .
2.2 Paramètres de dispersion. . . . . . . . . . . . . . . .
2.2.1 L’étendue. . . . . . . . . . . . . . . . . . . . .
2.2.2 Quartiles, déciles et percentiles. . . . . . . . .
2.2.3 L’écart absolu moyen. . . . . . . . . . . . . .
2.2.4 Variance, écart-type, coefficient de variation et
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
moments.
3 Statistique descriptive bivariée et Série chronologique.
3.1 Présentation, covariance et corrélation d’une série à deux entrée.
3.2 Ajustement linéaire d’une série à deux entrées. . . . . . . . . . .
3.3 Série chronologique. . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.1 Définition et exemples. . . . . . . . . . . . . . . . . . . .
3.3.2 Les composantes d’une série chronologique. . . . . . . . .
3.3.3 Les modèles de décomposition d’une série. . . . . . . . .
3.3.4 Prévision. . . . . . . . . . . . . . . . . . . . . . . . . . .
4 Les indices statistiques.
4.1 Indice élémentaire. . . . . .
4.2 Les indices synthétiques. . .
4.2.1 Indices de valeur. . .
4.2.2 Indices de Laspeyres.
4.2.3 Indices de Paasche. .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
5
5
6
6
6
7
.
.
.
.
.
.
.
.
.
.
9
9
9
10
11
11
13
13
13
14
15
.
.
.
.
.
.
.
17
17
18
19
19
20
21
22
.
.
.
.
.
25
25
28
28
28
29
4
TABLE DES MATIÈRES
4.2.4
Indices de Fischer. . . . . . . . . . . . . . . . . . . . . . . . .
29
Chapitre 1
Distribution et représentation de
séries univariées.
1.1
Introduction.
La statistique est l’étude de la collecte de données, leur analyse, leur traitement,
l’interprétation des résultats et leur présentation afin de rendre les données compréhensibles.
C’est à la fois une science, une méthode et un ensemble de techniques. L’analyse des
données est utilisée pour d’écrire les phénomènes étudiés, faire des pré- visions et
prendre des décisions à leur sujet. En cela, la statistique est un outil essentiel pour
la compréhension et la gestion des phénomènes complexes. Les données étudiées peuvent être de toute nature, ce qui rend la statistique utile dans tous les champs disciplinaires et explique pourquoi elle est enseignée dans toutes les filières universitaires,
de l’économie à la biologie en passant par la psychologie et bien sûr les sciences de
l’ingénieur.
La statistique consiste à :
- Recueillir des données.
- Présenter et résumer ces données.
- Tirer des conclusions sur la population étudiée et d’aider à la prise de décision.
Les statistiques descriptives visent à étudier les caractéristiques d’un ensemble d’observations
comme les mesures obtenues lors d’une expérience. L’expérience est l’étape préliminaire
à toute étude statistique. Il s’agit de prendre ”contact” avec les observations.
1.1.1
Vocabulaires et définitions.
1- Epreuve statistique: est une expérience que l’on provoque.
2- Population: est l’ensemble sur lequel porte notre étude statistique, notée Ω.
3- Individus ou unité statistique: sont les éléments de la population.
5
6
CHAPITRE. 1 : Distribution et représentation de séries univariées
4- Caractère ou variable statistique: (notée V.S) est une application
X : Ω −→ C.
L’ensemble C est l’ensemble des valeurs du caractère X (c’est ce qui est mesuré
ou observé sur les individus) (cette notion est similaire à celle d’une variable
aléatoire en probabilité).
5- Modalités: sont les différentes valeurs que peut prendre une variable statistique.
6- Série statistique: c’est la suite des valeurs prises par une variable sur les unités
d’observation.
1.1.2
Typologie des caractères.
Nous distinguons deux types des caractères:
1- Caractère qualitatif: ses modalités sont des catégories
(exemple: type de voiture, groupe sanguin, couleur des yeux, mention du diplôme,
stade d’une maladie,... ). Il est soit:
- nominal: si ses modalités ne peuvent pas être ordonnées (exemple: type de
voiture, groupe sanguin, couleur des yeux).
- ordinale: si les modalités peuvent être ordonnées (exemple: mention du diplôme,
stade d’une maladie).
2- Caractère quantitatif: si toute ses valeurs possibles sont numériques
(exemple: nombre d’enfants par famille, taille, poids, ...). Il est soit:
- discréte: si l’ensemble des valeurs possibles est dénombrable (exemple: nombre
d’enfants par famille).
- continue: si l’ensemble des valeurs possibles est continu (exemple: taille, poids).
1.2
1.2.1
Représentation d’une série statistique.
Cas qualitatif.
On considère une série statistique: (M1 , n1 ), (M2 , n2 ),...,(MN , nN ), où les Mi sont les
modalités du caractère qualitatif X, et les ni sont les effectifs correspondants. Cette
peut être présenter par deux diagrammes:
1- Diagramme en tuyaux d’orgue:
1.2 Représentation d’une série statistique
2- Diagramme en secteurs:
1.2.2
Cas quantitatif.
1- Diagramme en bâtons (caratère discrète):
7
8
CHAPITRE. 1 : Distribution et représentation de séries univariées
2- Histogramme (caratère continu):
Application:
On considère une classe de 40 étudiants avec leurs mentions de Bac:
Mention de Bac
Effectif
Passable
18
Assez-bien
16
1- Représenter par un diagramme en tuyaux d’orgue.
2- Calculer les fréquences de cette série.
3- Représenter cette série par un diagramme sectoriel.
Bien
4
Trés bien
2
Chapitre 2
Eléments caractéristiques des
séries statistiques
2.1
Paramètres de position ou de tendance centrale.
Les paramètres de position, mode (pour tout caractère) , médiane, et moyenne (seulement pour les caractères quantitatifs)), permettent de savoir autour de quelle valeur
se situent les valeurs d’une variable statistique.
2.1.1
Le mode.
Définition 2.1.1
1)- Le mode, noté M0 , est la modalité qui admet le plus grand effectif ou fréquence.
2)-
ˆ
ˆ
Dans le cas d’un caractère quantitatif continu, on parle d’une classe modale.
Si la classe modale est [xi , xi+1 [, alors le mode M0 vérifie:
M0 − xi
xi+1 − M0
xi+1 − xi
=
=
,
∆1
∆2
∆1 + ∆2
(2.1)
où ∆1 = N0 −Ni et ∆2 = N0 −Ni+1 avec N0 , Ni , et Ni+1 sont respectivement les
effectifs associés à la classe modale, à la classe précedente et à la classe suivante
de la classe modale.
∆1
ˆ De l’équation (3.1) le mode sera donc: M0 = xi +
(xi+1 − xi ) .
∆1 + ∆2
Exemples:
1)- On considère la série statistique suivante:
xi 3 6 8 15 20
ni 1 8 3 5 2
9
10
CHAPITRE. 2 : Eléments caractéristiques des séries statistiques
Le mode de cette série est M0 = 6 car il correspond à l’effectif le plus élevé
(=8).
2)- On considère un caractère quantitatif continu dont les modalités et les effectifs
correspondants sont les suivants:
Ii [5, 20[ [20, 35[ [35, 50[ [50, 65[
ni
20
26
30
10
Il est clair que la classe modale est [35, 60[. Calculons le mode M0 de cette série.
On a:
∆1
M0 = 35 +
(50 − 35),
∆1 + ∆2
avec ∆1 = 30 − 26 = 4 et ∆2 = 30 − 10 = 20. Ce qui donne:
M0 = 35 +
2.1.2
15
× 15 = 44.375
4 + 20
La médiane.
N
Définition 2.1.2 La médiane Me est la modalité qui correspond à l’effectif , telle
2
que N est le nombre des unités statistiques.
En d’autres tèrmes: c’est la modalité qui permet de couper une série statistique en
deux groupes contenant le même nombre d’individus.
Comment calculer la médiane d’une série?
a- Cas d’un caractère discrét.
Soit n le nombre d’individus dont les modalités sont ordonnées dans l’ordre croissant.
- si n est impaire, (n = 2k + 1), alors Me est la modalité d’ordre k + 1.
- si n est paire (n = 2k), alors
M1 + M2
,
2
telle que M1 et M2 sont les modalités d’ordres k et k + 1.
Me =
Exemples:
1- On considère la série de notes d’une classe: 15-2-7-8-4-11-18-10-3-2-4-4-1.
La série ordonnée est: 1-2-2-3-4-4-4-7-8-10-11-15-18. Alors Me = 4.
2- On considère la série de valeurs suivantes: 7.2-1.5-8.5-4.8-0.5-9.8.
4.8 + 7.2
= 6.
La série ordonnée est: 0.5-1.5-4.8-7.2-8.5-9.8. Alors Me =
2
Remarque 2.1.1 On peut utiliser les effectifs cumulés pour déterminer Me . Me sera
N
la modalité qui correspond au premier effectif cumulé qui dépasse .
2
11
2.1 Paramètres de position ou de tendance centrale
b- Cas d’un caractère continu.
1- En calculant les effectifs cumulés, on détermine la classe médiane Ie . On a Me ∈ Ie .
2- Par interpolation linéaire, l’expression suivante nous permet le calcul de Me :
Me = xi + (xi+1 − xi )
N/2 − Ni−1
,
Ni − Ni−1
telle que:
- Ii = [xi , xi+1 [ est la classe médiane.
- N est l’effectif total.
- Ni−1 est l’effectif cumulé de la classe Ii−1 .
- Ni est l’effectif cumulé de la classe Ii .
2.1.3
La médiale.
Définition 2.1.3 La médiale,
notée Ml , n’est que la
P
Pmédiane qui correspond à 50%
de la masse totale s =
ni xi (cas discret) ou =
ni ci (cas continu) où ci est le
entre de la classe Ii .
i
i
Exemple: Les classes des salaires des employés d’une entreprise, ainsi que leurs
effectifs, sont données dans le tableau suivant:
Ii [1000, 2000[ [2000, 3000[ [3000, 4000[ [4000, 5000[
ni
20
40
30
10
Calculons la médiane, ainsi que la médiale, de cette série.
2.1.4
La moyenne.
Le calcul d’une moyenne permet de résumer l’information chiffrée dont on dispose.
Dans ce paragraphe on verra quatre types de moyennes.
a- La moyenne arithmétique.
Définition 2.1.4
1)- On dispose d’une série de p valeurs: x1 ,...xp d’une variable statistique discrète
X.
Le réel
p
1X
1
xi ,
ma = (x1 + ... + xp ) =
p
p i=1
la moyenne arithmétique de cette série.
12
CHAPITRE. 2 : Eléments caractéristiques des séries statistiques
2)- Si les valeurs x1 ,...,xp sont affectées respectivement des effectifs n1 ,...,np telles
que n1 + ... + np = N, alors la moyenne
X̄ = ma =
p
1 X
1
(n1 x1 + ... + np xp ) =
,
N
N i=1
est appelée la moyenne arithmétique pondérée de cette série.
3)- Si X est continue, alors les xi utilisées pour calculer la moyenne de X, sont les
centres des modalités de X.
Exemples:
1)- La moyenne arithmétique de la série: 11-14-8-9, est
1
42
m = (11 + 14 + 8 + 9) =
= 10.5
4
4
2)- Soit X la variable des salaires des employés (exemple précédent). Calculons sa
moyenne.
On a
1
m=
(20 × 1500 + 40 × 2500 + 30 × 3500 + 10 × 4500) = 2800.
100
a- La moyenne géométrique.
Définition 2.1.5
1- Soit x1 ,...,xp les valeurs, supposées strictement positives, d’une série.
La moyenne géométrique mg de cette série, est:
! p1
p
Y
1
.
xi
mg = (x1 × ... × xp ) p =
i=1
2- Si les valeurs xi sont affectées des effectifs ni telle que n1 + ... + np = N, alors
! N1
p
p
Y
Y
ni
mg =
xi
xfi i ,
=
i=1
i=1
ni
.
N
Exemple: Calculons la moyenne géométrique de la série: 11-14-8-9.
On a:
1
mg = (11 × 14 × 8 × 9) 4 ≃ 10.26156
où fi =
On remarque que mg est proche de ma = 10.5.
Application:
Une quantité positive Q0 évolue de 5% une anne puis de 7% l’année suivante.
Calculer le taux moyen annuel d’évolution de Q0 .
13
2.2 Pramètres de dispersion
a- La moyenne harmonique.
Définition 2.1.6
1- Soit x1 ,...,xp les valeurs, supposées non nulles, d’une série.
La moyenne harmonique mh de cette série, est:
mh =
p
=P
.
1
1
1
p
+ ... +
i=1
x1
xp
xi
p
2- Si les valeurs xi sont affectées des effectifs ni telle que n1 + ... + np = N, alors
où fi =
ni
.
N
N
1
mh = n1
np = Pp fi .
+ ... +
i=1
x1
xp
xi
Exemple: Calculons la moyenne harmonique de la série: 11-14-8-9.
Application:
Une voiture parcourt la distance d entre deux villes A et B à une vitesse de 100km/h,
mais au retour, et à cause du brouillard, le conducteur a baissé la vitesse à 60km/h.
Calculer sa vitesse moyenne sue le trajet aller-retour.
2.2
Paramètres de dispersion.
Les paramètres de dispersion sont calculés pour les variables statistiques quantitatives.
2.2.1
L’étendue.
Définition 2.2.1 Soit X un caractère quantitatif discrét. L’étendue w de X , est la
différence entre la plus grande valeur et la plus petite valeur de X.
On a: w = xmax − xmin .
2.2.2
Quartiles, déciles et percentiles.
Définition 2.2.2 Soit X un caractère quantitatif. On appelle Quartiles les nombres
réels Q1 , Q2 , et Q3 qui partagent l’étendue w en quatres intervalles qui ont le même
effectif N/4.
L’intervalle interquartile est la différenceentre Q3 et Q1 (Q3 − Q1 ).
Propriétés 2.2.1
1- Q1 , Q2 , et Q3 sont respectivement les valeurs de X qui correspondent aux effectifs
N/4, N/2, et 3N/4 (ou aux fréquences 0.25, 0.5, et 0.75).
14
CHAPITRE. 2 : Eléments caractéristiques des séries statistiques
2- Le deuxième quartile Q2 n’est que la médiane de la série statistique.
3- L’intervalle [Q1 , Q3 ] contient 50% des valeurs de X.
Exemple: On considère la série statistique suivante:
xi 2 5 6 9 10
ni 3 2 6 7 2
Calculons les quartiles Q1 , Q2 , et Q3 .
Définition 2.2.3
1- Les déciles D1 , D2 ,..., D9 sont les réels qui partagent l’étendue en dix intervalles
de même effectif.
2- Les percentiles P1 , P2 ,..., P99 sont les réels qui partagent l’étendue en 100 intervalles de même effectif.
Remarque 2.2.1
1- D1 , D2 ,..., D9 correspondent respectivement aux effectifs N/10, 2N/10,..., 9N/10.
2- P1 , P2 ,..., P99 correspondent respectivement aux effectifs N/100, 2N/100,..., 99N/100.
2.2.3
L’écart absolu moyen.
Définition 2.2.4
1- Soit X = {(xi , ni )}i=1,...,p une variable statistique quantitative. On appelle écart
absolu moyen de X, la valeur
p
1 X
e=
ni |xi − ma |,
N i=1
(2.2)
où ma est la moyenne arithmétique de X.
2- Si la variable statistique est continue, on remplace les xi dans (3.2) par les centres
des classes.
Exemple: On considère la série statistique de l’exemple précedent. Calculons l’écart
absolu moyen.
On a:
1
(3 × 2 + 2 × 5 + 6 × 6 + 7 × 9 + 2 × 10) = 6.75,
ma =
20
alors
1
(3 × |3 − 6.75| + 2 × |5 − 6.75| + 6 × |6 − 6.75| + 7 × |9 − 6.75| + 2 × |10 − 6.75|)
e =
20
= 2.225
15
2.2 Pramètres de dispersion
2.2.4
Variance, écart-type, coefficient de variation et moments.
Définition 2.2.5
1- Soit X = {(xi , ni )}i=1,...,p une variable statistique quantitative.
i- On appelle variance de X, le nombre
!
p
p
1 X
1 X
2
2
2
ni (xi − ma ) =
ni xi − m2a .
S (X) =
N i=1
N i=1
p
ii- L’écart-type de X est S(X) = S 2 (X).
iii- Le coefficient de variation de X est le nombre
c=
(2.3)
S(X)
.
ma
2- Si la variable statistique est continue, alors sa variance (par consequent son écarttype et son coefficient de variation) se calcule en remplaçant les xi dans (3.3)
par les centres des classes.
Exemple: La variance de la variable X de l’exemple précedent est
1
3 × 22 + 2 × 52 + 6 × 62 + 7 × 92 + 2 × 102 − 6.752 = 6.6875
S 2 (X) =
20
Donc l’écart-type de X est
√
S(X) = 6.6875 ≃ 2.58602
et son coefficient de variation est
c=
.
2.58602
≃ 0.3831
6.75
Définition 2.2.6 Soit X = {(xi , ni )}i=1,...,p une variable statistique quantitative.
1- On appelle moment d’ordre r de X, la quantité
p
1 X
mr =
ni xri .
N i=1
2- On appelle moment centré d’ordre r de X, la quantité
p
1 X
ni (xi − ma )r .
µr =
N i=1
Remarque 2.2.2
- Pour r = 0, m0 = µ0 = 1.
- Pour r = 1, m1 = ma et µ1 = 0.
- Pour r = 2, µ2 = S 2 (X) = m2 − m21 .
Exemple: Calculons m3 et µ3 de X de l’exemple précedent.
16
CHAPITRE. 2 : Eléments caractéristiques des séries statistiques
Chapitre 3
Statistique descriptive bivariée et
Série chronologique.
3.1
Présentation, covariance et corrélation d’une
série à deux entrée.
Définition 3.1.1 On considère une population d’effectif n. Si on étudie deux caractères X et Y de cette population, on dit que l’on étudie une série statistique à deux
entrée. A chaque individu i (1 ≤ i ≤ n) correspond un couple (xi , yi ), où xi est la
modalité du caractère X et yi est la modalité du caractère Y associé à l’individu i.
L’ensemble des couples (xi , yi ) définit une série statistique à deux entrée.
Remarque 3.1.1 Si les couples (xi , yi ) sont affectés des effectifs, alors la série statistique se présente par un tableau de contingence.
Exemples:
1- Chaque mois, une entreprise consacre une somme X à des opérations publicitaires.
On met en regard le montant des ventes Y chaque mois. Une étude portant sur
8 mois a donné les résultats suivants exprimés en milliers de dirhams:
Mois Jan Fev Mars Avril Mai Jui Jui Août
X 0.24 0.31 0.25 0.32 0.35 0.2 0.18 0.3
Y
38
42
39
44
46 35 34
41
2- Le tableau de contingence suivant, présente une série bivariée:
XY
2
4
7
T otal
12 15 20 25 T otal
11 6 8 15
40
12 16 7 5
40
5 6 8 1
20
28 28 23 21 100
Définition 3.1.2 Soit (X, Y ) une série statistique bivariée dont les modalités sont
(xi , yi ) pour i ∈ {1, ..., N}.
17
18
CHAPITRE. 3 : Statistique descriptive bivariée et Série chronologique
- On appelle covariance de (X, Y ), le nombre
σXY
N
1 X
xi − X̄ yi − Ȳ
=
N i=1
!
N
1 X
=
xi yi − X̄ Ȳ ,
N i=1
où X̄ et Ȳ sont respectivement les moyennes arithmétiques de X et Y .
- Le nombre
ρXY =
σXY
,
σX σY
où σX et σY sont respectivement les écart-types de X et Y , est appelé la corrélation
linéaire de (X, Y ).
Remarque 3.1.2 Si la série est présenté par un tableau de contingence, alors sa
covariance est
σXY
q
r
1 XX
nij xi − X̄ yj − Ȳ
=
N i=1 j=1
q
r
1 XX
nij xi yj − X̄ Ȳ ,
=
N i=1 j=1
où nij est l’effectif qui correspond au couple (xi , yj ) dans le tableau de contingence.
Exemples: On va calculer la covariance et la corrélation des deux séries de l’exemple
précédent.
3.2
Ajustement linéaire d’une série à deux entrées.
Soit (X, Y ) une série à deux entrées dont les modalités sont (xi , yi ) et qui se présente
graphiquement par le nuage de points M(xi , yi ) pour i ∈ {1, ..., N}. Lorsque ces points
paraissent presque alignés, alors la série peut être ajuster linéairement.
Définition 3.2.1 L’ajustement linéaire de la série (X, Y ), c’est la recherche de la
droite (∆) : y = ax + b qui passe au plus près de tous les points M(xi , yi ) pour
i ∈ {1, ..., N}.
Proposition 3.2.1 La pente a et l’ordonnée à l’origine b de la droite (∆), obtenus
par la méthode des moindres carrées, sont
a=
σXY
, b = Ȳ − aX̄.
2
σX
19
3.3 Série chronologique
42
40
38
34
36
montant des ventes
44
46
Exemple: On considère la série des opérations publicitaires et le montant des ventes
(exemple précédent). La représentation graphique de cette série est la suivante:
0.20
0.25
0.30
0.35
opérations publicitaires
Il est clair que tous les points du nuage de cette série semblent presque alignés.
Soit (∆) : Y = aX + b la droite de l’ajustement linéaire de cette série. Les valeurs,
par la méthode des moindres carrées, de a et b sont:
a=
σXY
, b = Ȳ − aX̄.
2
σX
Calculons X̄, Ȳ , σX et σXY .
3.3
Série chronologique.
3.3.1
Définition et exemples.
Définition 3.3.1 La série chronologique est une série à deux entrée, dont l’un des
deux caractères est le temps (jours, mois, année,...) et on la note (Xt ).
Exemple 1
1)- cours journalières d’une action en bourse.
- consommation mensuelle d’électricité.
- nombre trimestriel de chômeurs.
- chiffre annuel des bénéfices des exportations.
20
CHAPITRE. 3 : Statistique descriptive bivariée et Série chronologique
2)- Considérons la série trimestrielle du chiffre d’affaires en milliers de dirhams des
ventes d’un magasin de 1978 à 1982:
trim.1
trim.2
trim.3
trim.4
anneé 1 année 2 année 3
430
480
510
600
670
840
820
930
1010
550
640
730
La représentation graphique de cette série est la suivante:
3.3.2
Les composantes d’une série chronologique.
Le but de la décomposition d’une série chronologique est de distinguer dans l’évolution
de la série, une tendance, des variations saisonnières qui se répètent chaque année
(semestre, trimestre, mois,...) et des variations accidentelles imprévisibles.
L’intérêt de ceci est d’une part de mieux comprendre, de mieux décrire l’évolution
de la série, et d’autre part de prévoir son évolution (à partir de la tendance et des
variations saisonnières).
a- La tendance ou composante tendancielle (Tt ): qui correspond à l’évolution
à long terme de la série, l’évolution fondamentale de la série. Généralement, elle
est linéaire: Tt = at + b.
b- La composante saisonnière (St ): qui correspond aux variations saisonnières
(par exemple: les fluctuations périodiques à l’intérieur d’une année).
21
3.3 Série chronologique
c- La composante résiduelle (εt ): correspond à des fluctuations irrégulières et
imprévisibles. Elles sont supposées en général de faible amplitude.
3.3.3
Les modèles de décomposition d’une série.
a- Modèle additif.
Définition 3.3.2 Soit (Yt ) une série chronologique. On dit que (Yt ) suit un modèle
additif si et seulement si Yt s’écrit
Yt = Tt + St + εt
, où (Tt ) est une tendance, (St ) est une composante saisonnière, et (εt ) est la composante résiduelle et qui sont supposées indépendantes deux à deux.
Propriétés 3.3.1
1- Graphiquement, l’amplitude des variations des tèrmes de la série, est constante
autour de la tendance.
2- Le modèle additif est convenable à une série chronologique si la droite passant par
les minima du graphe de la série, et celle passant par les maxima, sont à peu
prés parallèles (voir Figure 4.1 comme exemple).
Figure 3.1:
b- Modèle multiplicatif.
Définition 3.3.3 Soit (Yt ) une série chronologique. On dit que (Yt ) suit un modèle
multiplicatif si et seulement si Yt s’écrit
Yt = Tt × St + εt
, où (Tt ) est une tendance, (St ) est une composante saisonnière (on suppose que (St )
dépend de (Tt )), et (εt ) est la composante résiduelle.
Propriétés 3.3.2
22
CHAPITRE. 3 : Statistique descriptive bivariée et Série chronologique
1- Graphiquement, l’amplitude des variations des tèrmes de la série, varie en fonction du temps.
2- Le modèle multiplicatif est convenable à une série chronologique si la droite passant
par les minima du graphe de la série, et celle passant par les maxima, ne sont
pas parallèles (voir Figure 4.2 comme exemple).
Figure 3.2:
3.3.4
Prévision.
a- Détermination de la tendance (Tt ):
Proposition 3.3.1 Les coefficients a et b de la tendance Tt = at + b pour les deux
modèles additif et multiplicatif, sont
a=
où
Ȳ =
cov(T, Y ) =
cov(T, Y )
, b = Ȳ − aT̄ ,
V (T )
N
N
1 X
1 X
Yi , T̄ =
ti ,
N i=1
N i=1
N
N
1 X
1 X 2
Yi ti − Ȳ T̄ , V (T ) =
t − T̄ 2 .
N i=1
N i=1 i
Exemple 2 Cherchons la tendance pour la série de l’exemple 1 précédent: La
première chose à faire, il faut indexer les trimestres des trois année. Le tableau obtenu
est le suivant:
temps
1
2
3
4
5
6
7
8
9
10
11
12
chiffre d’affaires 430 600 820 550 480 670 930 640 510 840 1010 730
On a
Ȳ =
1
(430 + 600 + 820 + 550 + 480 + 670 + 930 + 640 + 510 + 840 + 1010 + 730) = 684.1667,
12
3.3 Série chronologique
T̄ =
cov(T, Y ) =
23
1
(1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 + 11 + 12) = 6.5,
12
1
(430 × 1 + 600 × 2 + 820 × 3 + 550 × 4 + 480 × 5 + 670 × 6 + 930 × 7
12
+640 × 8 + 510 × 9 + 840 × 10 + 1010 × 11 + 730 × 12) − Ȳ T̄
= 4766.667 − 684.1667 × 6.5
= 319.5831,
1 2
1 + 22 + 32 + 42 + 52 + 62 + 72 + 82 + 92 + 102 + 112 + 122 −6.52 = 11.91667.
12
Donc les coefficients de la tendance sont
319.5831
a=
= 26.81815, b = 684.1667 − 26.81815 × 6.5 = 509.8487
11.91667
Par conséquent la tendance est Tt = 26.81815t + 509.8487.
V (T ) =
b- Détermination de la composante saisonnière.
Etape 1: On calcule les coefficients saisonniers Sij = Yij − Tij (par exemple: i c’est
l’année et j c’est la saison (trimestre, semestre,...)) si le modèle est additif, ou
St = YTtt si le modèle est multiplicatif.
Etape 2: Pour chaque saison j (trimestre, semestre,...), on calcule la composante
saisonnière brute sj correspondant et qui est la moyenne des coefficients saisoniers
en cette saison.
Etape 3: On centre la composante saisonnière brute pour avoir finalement la composante saisonnière qu’on va utiliser dans le modèle.
Exemple 3 Cherchons la composante saisonière de la série de l’exemple 1. Tout
d’abord quel est le modèle (additif ou multiplicatif) convenable pour cette série. Le
graphique suivant montre que les droites passant par les minima et les maxima de la
série sont parallèles. Par conséquent le modèle additif est convenable:
Le tableau de la tendance est:
temps
1
2
3
4
5
6
7
8
9
10
11
12
chiffre d’aff. 430 600 820 550 480 670 930 640 510 840 1010 730
Tendance 537 563 590 617 644 671 698 724 751 778 805 832
Donc le tableau des coefficients saisoniers et la composante saisonière brute est le
suivant:
anneé 1 année 2 année 3 C.S.B
C.S.
trim.1 −107
−164
−241 −170.67 −133.505
trim.2
37
−1
62
32.67
69.835
trim.3
230
232
−241
73.67
110.835
trim.4
−67
−84
−102
−84.33 −47.165
24
CHAPITRE. 3 : Statistique descriptive bivariée et Série chronologique
1
La moyenne de C.S.B est (−170.67 + 32.67 + 73.67 − 84.33) = −37.165. Donc la
4
composante saisonière qu’on va utilisé dans le modèle est C.S..
c- Prévision.
Soit t un temps donné. La valeur prédite de Yt est Ŷt = at + b + Si , où i est la saison
qui correspond à t.
Exemple 4 On veut prédire la valeur du chiffre d’affaires pour l’anné 4 en trimestre
4. Le t ici est t = 16. Donc Tt = 26.81815 × 16 + 509.8487 = 938.9391 et Si = S4 =
−47.165. Ce qui donne Ŷt = 938.9391 − 47.165 = 891.7741.
Chapitre 4
Les indices statistiques.
On d’écrit souvent des phénomènes plus ou moins complexes en utilisant une seule
valeur qu’on appelle un indice. L’objectif d’un indice, est comparer des grandeurs
numériques qui evoluent au cours du temps et/ou de l’espace.
On trouve des indices dans de nombreux domaines. On peut citer l’indice des prix à
la consommation, l’indice des cours des titres à la bourse, l’indice de confiance des
consommateurs, l’indice de compétitivité des nations,... etc.
Deux catégories d’indices peuvent être distinguées selon le type de grandeur étudiée.
Ainsi, si l’on considère le prix d’un produit, il s’agit de grandeurs simples au sens où
la grandeur est un nombre ne prenant qu’une seule valeur dans une situation donnée.
Les indices calculés sur la base de ces grandeurs sont appelés indices élémentaires.
En revanche, le niveau général des prix, la production industrielle, le cours des actions sont des grandeurs complexes dans la mesure où leur calcul nécessite d’agréger
un ensemble de valeurs hétérogènes (prix des différents produits, production de diverses industries, cours de différentes actions). Les indices calculés sur la base de ces
grandeurs sont appelés indices synthétiques.
4.1
Indice élémentaire.
Définition 4.1.1 L’indice élémentaire d’une grandeur V à la date t base 100 à la
date 0 est
Vt
V
It/0
=
× 100.
V0
Exemple 5 Quel est l’indice du prix en 2012 base 100 en 2010 d’un produit valant
200 DH en 2017 et 300 DH en 2019?
On a
P19
300
P
I19/17
=
× 100 =
× 100 = 150.
P17
200
V
Interpretation: Soit It/0
l’indice élémentaire d’une valeur V à la date t base 100 à
V
la date 0 et soit ∆ = It/0 − 100.
1- Si ∆ > 0 alors la valeur V a augmenté de ∆% de la date 0 à la date t.
25
26
CHAPITRE. 4 : Les indices statistiques
2- Si ∆ < 0 alors la valeur V a diminué de −∆% de la date 0 à la date t.
P
Exemple 6 Rprenons l’exemple : On a I19/17
= 150 donc ∆ = 50 et par conséquent
le prix à augmenté à 50% de 2017 à 2019.
Proposition 4.1.1 (Circularité)
Si une grandeur numériques V prend les valeurs V0 , Vt et Vt1 aux instants 0, t, t1 ,
alors
1
It/0 = It/t1 × It1 /0 ×
.
100
Prenve:
On a
It/t1 × It1 /0 ×
Vt
1
Vt
1
=
× 100 × 1 × 100 ×
100
Vt1
V0
100
=
Vt
× 100
V0
It/0
Exemple 7 Le chiffre d’affaires d’une entreprise a augmenté de 30% de 2017 à 2018
et a diminué de 25% de 2018 à 2019. Le C.A. a-t-il diminué ou augmenté de 2017 à
2019?
On a I18/17 = 100 + 30 = 130 et I19/18 = 100 − 25 = 75, alors par la propriété de
circularité, on a:
I19/17 = I19/18 × I18/17 ×
130 × 75
1
=
= 97.5
100
100
Autrement dit le C.A. a diminué de 2.5%
Proposition 4.1.2 (Réversibilité)
Si une grandeur numérique V prend les valeurs V0 et Vt aux instants 0 et t, alors
It/0 =
1002
.
I0 /t
Preuve:
On a
1002
V0
× 100
Vt
Vt
=
× 100
V0
1002
=
I0/t
= It/0
27
4.1 Indices élémentaire
Exemple 8 Si un prix augmente de 20% de 2017 à 2019, que dire de son evolution
de 2019 à 2017?
On a I19/17 = 100 + 20 = 120, alors suivant la propriété de réversibilité, on a:
I17/19 =
1002
1002
=
≃ 83.33.
I19/17
120
Autrement dit, le prix a diminué de 16.67% de 2019 à 2017.
Proposition 4.1.3 (Produit des grandeurs)
Soit A, B, et C trois grandeurs.
1- Si At = Bt × Ct pour tout instant t, alors
A
B
C
It/0
= It/0
× It/0
×
2- Si At =
1
.
100
Bt
pour tout instant t, alors
Ct
A
It/0
=
B
It/0
C
It/0
× 100.
Preuve:
1- On a
B
C
It/0
× It/0
×
Bt
Ct
1
1
=
× 100 ×
× 100 ×
100
B0
C0
100
=
=
Bt × Ct
× 100
B0 × C0
At
× 100
A0
A
= It/0
.
2- Le résultat de 2- se déduit en suivant la même démarche suivi en 1-.
Exemple 9 Soit P et Q les prix et quantités d’un produit vendu par une entreprise.
Si le prix de ce produit augmente de 60% de 2005 à 2010 et si les quantités vendues
ont diminué de 50% de 2005 à 2010, alors quelle est l’évolution des recettes R de 2005
à 2010?
Q
P
On a : I10/05
= 100 + 60 = 160 et I10/05
= 100 − 50 = 50 et on a aussi R = P × Q en
tout instant, alors d’aprés la propriété du produit des quantités, on a
Q
R
P
I10/05
= I10/05
× I10/05
×
160 × 50
1
=
= 80.
100
100
Autrement dit les recettes ont diminué de 20%.
28
4.2
CHAPITRE. 4 : Les indices statistiques
Les indices synthétiques.
En économie, les grandeurs étudiées sont souvent complexes, c’est-à-dire composées
de plusieurs grandeurs simples qu’il faut synthétiser. Ainsi, l’indice des prix à la
production dans une industrie, est calculé sur la base des prix de 240 produits. Il
s’agit d’un indice synthétique résumant les 240 indices élémentaires relatifs au prix
de chacun des produits considérés.
4.2.1
Indices de valeur.
En économie, on étudie souvent l’évolution des prix, des quantités et de leur produits,
appelés valeurs. Trois types d’indices peuvent alors être calculés: indice des prix, indice
des quantités et indice de valeur.
Définition 4.2.1 On considère une grandeur g composée de k éléments g i , i =
1, ..., k. Pi0 , Pit , Qi0 , et Qit sont respectivement les prix et les quantités à l’instant 0
et t d’un élément g i .
L’indice de valeur
Pk
Pit Qit
V
It/0 = Pki=1
× 100.
i=1 Pi0 Qi0
Exemple 10 Considérons une entreprise qui vend les produits b1 , b2 , b3 , et b4 . On
veut expliquer l’évolution du chiffre d’affaires réalisé entre 2 dates 0 et t à partir
de l’évolution des prix pratiques et celle des quantités vendues. Les données sont
consignées dans le tableau suivant:
b Pi0 Qi0 Pit Qit
b1 5 20 8 15
b2 6 30 7 20
b3 8 40 9 30
b4 10 10 11 20
On a
V
It/0
=
8 × 15 + 7 × 20 + 9 × 30 + 11 × 20
× 100 ≃ 107.14.
5 × 20 + 6 × 30 + 8 × 40 + 10 × 10
Donc le chiffre d’affaires a augmenté de 0 à t de 7.14%.
4.2.2
Indices de Laspeyres.
Définition 4.2.2 Les indices de Laspeyres des prix et des quantités sont respectivement d efinis par:
LPt/0
=
Pk
Pit Qi0
Pki=1
i=1 Pi0 Qi0
× 100 ,
LQ
t/0
Pk
= Pki=1
i=1
Pi0 Qit
Pi0 Qi0
× 100.
29
4.2 Les indices synthétiques
Exemple 11 Calculons les indices de Laspeyres des prix et des quantités des données
de l’exemple précédent.
On a
8 × 20 + 7 × 30 + 9 × 40 + 11 × 10
LPt/0 =
× 100 = 120,
5 × 20 + 6 × 30 + 8 × 40 + 10 × 10
5 × 15 + 6 × 20 + 8 × 30 + 10 × 20
× 100 ≃ 90.71.
LQ
t/0 =
5 × 20 + 6 × 30 + 8 × 40 + 10 × 10
Intérpretation:
- LPt/0 = 120 implique que à quantités fixées de 0 à t, les prix ont augmenté de
120-100=20%.
- LQ
t/0 ≃ 90.71 implique que à prix fixées de 0 à t, les quantités ont diminué de
100-90.71=9.29%.
4.2.3
Indices de Paasche.
Définition 4.2.3 Les indices de Paasche des prix et des quantités sont respectivement définis par:
P
Pt/0
=
Pk
Pit Qit
Pki=1
i=1 Pi0 Qit
× 100 ,
Q
Pt/0
Pk
= Pki=1
Pit Qit
i=1 Pit Qi0
× 100.
Exemple 12 Calculons les indices de Paasche des prix et des quantités des données
de l’exemple précédent.
On a
8 × 15 + 7 × 20 + 9 × 30 + 11 × 20
P
Pt/0
=
× 100 ≃ 118.11,
5 × 15 + 6 × 20 + 8 × 30 + 10 × 20
8 × 15 + 7 × 20 + 9 × 30 + 11 × 20
Q
× 100 ≃ 89.29.
Pt/0
=
8 × 20 + 7 × 30 + 9 × 40 + 11 × 10
Intérpretation:
P
- Pt/0
≃ 118.11 implique que à quantités fixées de 0 à t, les prix ont augmenté de
118.11-100=18.11%.
Q
- Pt/0
≃ 89.29 implique que à prix fixées de 0 à t, les quantités ont diminué de
100-89.29=10.17%.
4.2.4
Indices de Fischer.
Définition 4.2.4 L’indice de Fisher des prix (resp. des quantités) est défini comme
la moyenne géométrique des indices de Laspeyres et de Paasche des prix (resp. des
quantit es), et on a:
q
q
Q
Q
P
P
Ft/0
= LPt/0 × Pt/0
et Ft/0
= LQ
t/0 × Pt/0 .
30
CHAPITRE. 4 : Les indices statistiques
Exemple 13 Les indices de Fischer des prix et des quantités (exemple précédent)
de 0 à t, sont:
√
√
Q
P
Ft/0
= 120 × 118.11 ≃ 119.05 et Ft/0
= 90.71 × 89.29 ≃ 90.
On résume les trois indices dans le tableau suivant:
Q
Q
V
P
P
It/0
LPt/0 Pt/0
Ft/0
LQ
Pt/0
Ft/0
t/0
107.14 120 118.11 119.05 90.71 89.29 90
Intérpretation: D’une vue globale, l’augmentation du chiffres d’affaires est à cause
de l’augmentation des prix est importante par rapport à la dimunition des quantités.
Proposition 4.2.1 (Relation entre les indices) On a:
V
It/0
= LPt/0 × LQ
t/0
Q
P
= Pt/0
× Pt/0
Q
P
= Ft/0
× Ft/0
Téléchargement