dispersion

publicité
Les caractéristiques de
dispersion
Thème 3
Hubert LASSERRE
Les mesures de dispersion
• Etendue
• Ecart absolu moyen
• Intervalles entre quartiles, déciles,
centiles
• Diagramme en boites (boite à
moustaches) ou à pattes
• Variance
• Ecart type
• Coefficient de variation
Objectifs
• Pour mesurer la dispersion ou la
variabilité des observations on utilise le
plus souvent la variance et l'écart type.
• D'autres caractéristiques de
dispersion dont certaines ont
l'avantage d'avoir une signification
très concrète sont présentées ici.
• Citons par exemple l'intervalle entre les
quantiles proposé par le savant belge
Adolphe Quételet en 1846.
L’étendue
• L'étendue est la différence entre le plus
grand et le plus petit des nombres
x1, x2, . . . , xi, . . . ,xn.
• Cette caractéristique présente
l'inconvénient de ne tenir compte que
des valeurs extrêmes qui sont parfois
accidentelles ou exceptionnelles.
L’étendue
Exemple
• Durant le dernier été la température
maximale a été de 39 degrés Celsius et
la température minimale de 7 degrés
Celsius, l'étendue est de 32 degrés.
• Cette caractéristique ne donne aucune
indication sur le groupement plus ou
moins important des températures
autour d'une valeur centrale.
L’écart absolu moyen
• L'écart absolu moyen de n nombres
x1,x2,...,xi,...,xn autour d'un nombre a est défini
par :
• Ea = 1/n [(x1 – a) + (x2 – a) +... + (xi – a) +... +
(xn – a)]
• xi – a représente la valeur absolue de xi - a.
L’écart absolu moyen
• On prend généralement pour a, la moyenne
arithmétique x ou la médiane Me.
• L'écart absolu moyen est minimal pour a =
médiane.
• Quand on ne précise pas : x = 1. Ainsi :
• E = 1/n . Ʃ xi – x ou
E = 1/n . Ʃni xi – x = Ʃ fi xi – x
(i = 1,n)
Intervalle entre quartiles,
déciles, centiles
• L'intervalle entre le troisième et le
premier quartile soit Q3 – Q1 est un
indicateur de dispersion autour de la
médiane Me.
25 %
25 %
Q1
25 %
Me
25 %
Q3
Intervalle entre quartiles,
déciles, centiles
• En effet, cet indicateur Q3 - -Q1, correspond à
un intervalle qui regroupe 50 % des
observations autour de la médiane.
• On peut aussi utiliser (Q3 - Q1)/2 (intervalle
semi-interquartile).
• L'intervalle entre le neuvième et le premier
décile D9 – D1 est aussi un excellent indicateur
de dispersion, sa signification est très
concrète puisqu'il correspond à un intervalle
qui regroupe 80 % des observations autour de
la médiane.
Intervalle entre quartiles,
déciles, centiles
• L'intervalle entre deux centiles peut
également être utilisé pour mesurer une
dispersion des observations.
• Par exemple, l'intervalle entre le quatrevingt-dix-neuvième et le premier centile
contient 98 % des observations.
40 %
10 %
D1
40 %
Me
10 %
D3
Diagramme en boites (boites à
moustache) ou à pattes
• La boîte à pattes (box-plot en anglais)
fournit d'un seul coup d'oeil des
informations d'une distribution
concernant la tendance centrale,
l'asymétrie, la dispersion.
• Cette représentation a été proposée par
J.W. Tukey (USA) en 1977.
Diagramme en boites (boites à
moustache) ou à pattes
min
max
Q1
me
Q3
• Au lieu de mettre les quartiles, on peut
mettre les déciles.
• L'axe peut être porté verticalement ou
horizontalement.
Diagramme en boites (boites à
moustache) ou à pattes
• Le diagramme se construit de la façon suivante :
– les valeurs de la variable sont repérées sur un axe ;
– sur cet axe, on reporte le minimum (min) et le
maximum (max) des observations ainsi que la
médiane (Me), le premier quartile (Q1), le troisième
quartile (Q3).
• Le rectangle construit parallèlement à l'axe entre
le 1er et le 3ème quartile est « la boîte ».
• Cette visualisation (centre, dispersion,
asymétrie) est très utile pour comparer des
séries statistiques.
Précision des unités de mesure
• Les indicateurs de dispersion présentés
sont des nombres exprimés dans les
mêmes unités que les nombres xi.
Précision des unités de mesure
• Si l'on veut comparer la dispersion de
plusieurs séries exprimées dans des
unités différentes ou à des périodes
différentes, au lieu de Q3 – Q1 on peut
prendre (Q3 – Q1)/Me, et au lieu de
D9 – D1 on peut prendre (D9 – D1)/Me.
• Ces caractéristiques sont sans
dimension, c'est-à-dire indépendantes
des unités de mesure.
L’utilisation de l’écart type est
préférée à l’écart absolu moyen
• L'utilisation de l'écart absolu est compliquée à
utiliser d'un point algébrique car :
xi – x = xi – x
si xi > x
et : xi – x = - (xi – x)
si xi < x
• L'écart absolu moyen se prête mal aux
opérations de dérivation.
• Pour cette raison il est préférable d'utiliser
plutôt l'écart type σ ou la variance.
Propriétés souhaitables des
indicateurs de dispersion
• Le statisticien Yule en 1945 a défini les
propriétés souhaitables pour une
caractéristique de valeur centrale ou de
dispersion :
– être définie de façon objective en ce sens que
deux personnes différentes aboutissent au même
résultat,
– dépendre de toutes les observations,
– avoir une signification concrète. Par exemple pour
mesurer la dispersion, l'écart entre le neuvième
décile et le premier décile qui contient 80 % des
observations a une signification plus concrète pour
un non-spécialiste que l'écart type,
Propriétés souhaitables des
indicateurs de dispersion
– être simple à calculer (les moyens de
calculs modernes permettent de
s'affranchir de cette propriété),
– être peu sensible aux fluctuations
d'échantillonnage (les caractéristiques
d'une population ne sont souvent connues
que de façon approximative à partir d'un
échantillon issu de cette population, les
fluctuations d'échantillonnage sont faibles
si les caractéristiques obtenues avec
d'autres échantillons varient peu).
Objectifs : variance et écart type
• Résumer une distribution statistique
concernant un caractère quantitatif
observé sur n individus par une seule
caractéristique telle que la moyenne ou
la médiane est insuffisant.
• La moyenne ou la médiane
représentent une valeur centrale de la
distribution.
Objectifs : variance et écart type
• La statistique commence précisément là
où il y a variabilité ; il faut donc définir au
minimum une valeur centrale et une mesure
de dispersion autour de cette valeur
centrale.
• La variance est la caractéristique la plus
utilisée pour mesurer la dispersion ou
l'étalement des données autour de la
moyenne. L'écart type est la racine carrée de
la variance. Cette notion de variance est
apparue avec la théorie des moindres carrés.
Définition de la variance et de
l’écart type
• La variance de n nombres x1, x2, …, xn, est
définie par :
• V(x) = 1/n . [(x1 – x)² + (x2 – x)² + … +
(xi – x)² + … + (xn – x)²]
= 1/n . Ʃ(xi – x)² (i = 1, n)
•
• Si plusieurs valeurs sont égales et que la
valeur de xi est observée ni fois avec :
Ʃ ni = n, fi = ni / n
Définition de la variance et de
l’écart type
• La formule de la variance devient :
• V(x) = 1/n . Ʃ ni (xi – x)² = Ʃ fi (xi – x)²
• L'écart type, noté σ ou σx est la racine carrée
de la variance (Standard deviation en anglais).
V(x) = σx²
• Soit :
σx = √ 1/n Ʃ(xi – x)²
Formule développée de la
variance
• V(x) = 1/n . Ʃ (xi – x)²
= 1/n . Ʃ (xi² – 2xix + x²)
= 1/n [(x1²-2x1x+x²)+[(x2²-2x2x+x²)+…]
= 1/n . Ʃxi² - 2x Ʃxi/n + 1/n . nx²
= 1/n . Ʃxi² - x²
• V(x) = x² - x² « moyenne des carrés moins carré
de la moyenne »
Formule développée de la
variance
• La formule avec les pondérations est :
V(x) = 1/n . Ʃ ni.xi² - x² = Ʃfixi² - x²
La variance augmente avec la
dispersion
• La variance augmente lorsque les
données se dispersent davantage.
• C'est une mesure de la dispersion qui
permet de faire des comparaisons entre
diverses populations ou échantillons.
La variance augmente avec la
dispersion
• Considérons les deux distributions concernant la
distribution du même caractère dans deux
populations :
– la ième observation de la distribution 1 est notée x1i
– la ième observation de la distribution 2 est notée x2i
• Supposons que les deux distributions ci-après et
concernant le même caractère aient la même
moyenne :
x1 = x2 = x
La variance augmente avec la
dispersion
Distribution 1, écart type σ1
x1i – x1
x1
x1i
Distribution 2, écart type σ2 > σ2 > σ1
x2i – x2
x2
x2i
La variance augmente avec la
dispersion
• Les écarts à la moyenne sont les
quantités : (x1i – x1) et (x2i -x2).
• Il est clair que les observations de la
distribution 2 sont plus étalées ou plus
dispersées que celles de la distribution
1 ; ceci se traduira par des écarts à la
moyenne plus élevés.
• Ainsi l'écart type σ2 sera supérieur à σ1
(ou σ2² > σ1²).
La variance augmente avec la
dispersion
• La dispersion peut s'apprécier visuellement
avec les histogrammes :
• Les observations de la deuxième série
représentées par l'histogramme de droite sont
plus dispersées.
Propriétés
•
•
•
•
•
•
c est une constante : V(x + c) = V(x)
a est une constante : V(ax) = a² V(x)
V(-x) = V(x)
V(x+y) = V(x) + V(y) + 2COV(x,y)
V(x-y) = V(x) + V(y) – 2COV(x,y)
Si x et y sont indépendants :
COV(x,y) = 0
Propriétés
• COV(x,y)
= 1/n . Ʃ(xi – x) (yi – y)
= (1/n.Ʃxiyi) - xy
• V(ax+by) = a²V(x) + b²V(y) + 2abCOV(x,y)
• V(ax-by) = a²V(x) + b²V(y) - 2abCOV(x,y)
Coefficient de variation
• CV(x) = σx / x
• Cette caractéristique de dispersion est
indépendante des unités de mesure,
puisque σx et x s'expriment dans la même
unité.
• Elle n'est pas très facile à utiliser et à
interpréter si x est proche de 0.
Etalement des données pour
une distribution normale
• De nombreuses distributions se rapprochent
de la distribution normale.
• Dans ce cas environ 95 % des observations
sont comprises entre x - 2σx et x + 2σx.
• La valeur exacte pour la loi normale est 1,96
au lieu de 2.
• Environ 68 % des observations se dispersent
entre x - σx et x + σx et 99,7 % se dispersent
entre x - 3σx et x + 3σx.
Exercice
• Soit la température moyenne à Paris au
cours du mois de janvier, pendant dix
années consécutives :
- 2,5
0,0
- 1,1
5,6
5,3
- 1,9
0,8
0,3
6,8
4,7
• Calculez la moyenne arithmétique et
l’écart type de la distribution.
Les phénomènes aléatoires
Thème 4
Hubert LASSERRE
Notions de théories des
probabilités
• Variables aléatoires et lois de probabilité
discrètes
– Fonction de répartition, espérance mathématique,
variance et écart-type
– Somme de variables aléatoires
• Lois continues : loi normale
–
–
–
–
Définition
Variable centrée réduite
Usage d’une table de la loi Normale
Intervalles de confiance bilatéraux de la loi
Normale
Loi de probabilité d’une variable
aléatoire discrète
Objectifs
• Les modèles mathématiques permettent de
formaliser le comportement des phénomènes
aléatoires.
• Après avoir défini le concept de probabilité, il
convient de définir le concept de variable
aléatoire.
• Dans une première approche nous dirons
qu'une variable aléatoire consiste à attribuer
à chaque résultat de l'expérience aléatoire un
nombre.
Loi de probabilité d’une variable
aléatoire discrète
Objectifs
• Par exemple en jouant à pile ou face
avec une pièce de monnaie, si le côté
pile apparaît vous gagnez 100 euros, si
le côté face apparaît vous perdez 100
euros (ou vous gagnez - 100 euros).
• Cette variable aléatoire est discrète car
elle prend des valeurs isolées + 100 et
- 100.
Loi de probabilité d’une variable
aléatoire discrète
Objectifs
• Définir la loi de probabilité d'une variable
aléatoire consiste à déterminer les
probabilités des différentes valeurs de
cette variable aléatoire.
• Dans cet exemple la variable aléatoire prend
les valeurs + 100 et - 100 avec les
probabilités de 1/2 et 1/2.
• Les variables aléatoires (v. a.) ou aléas
numériques sont définies avec des nombres
réels.
Loi de probabilité d’une variable
aléatoire discrète
Définition d'une variable aléatoire discrète
• Soit l'univers Ω, constitué d'un nombre
fini d'éléments ou d'une infinité
dénombrable d'éléments.
• Ω = {ω1, ω2, …, ωi, …, ωn, …}
• Définir une variable aléatoire X consiste
à associer à chaque élément ω de Ω un
nombre réel x.
Loi de probabilité d’une variable
aléatoire discrète
Définition d'une variable aléatoire discrète
• Ω
R.
• ω
X(ω) = x
Loi de probabilité d’une variable
aléatoire discrète
Loi de probabilité (ou distribution) d'une
variable aléatoire discrète
• Définition
• Soit X une variable aléatoire discrète
définie sur l'univers Ω.
• La probabilité de l'événement (X = xi)
est la probabilité de l'union des
événements de Ω qui ont pour image xi.
Loi de probabilité d’une variable
aléatoire discrète
Loi de probabilité (ou distribution) d'une variable
aléatoire discrète
• Définition
• Si ω2, ω4, ω7 vérifient : X(ω2) = X(ω4) =
X(ω7) = xi alors P(X = xi) = pi = P(ω2 U ω4 U
ω7) = P(ω2) + P(ω4) + P(ω7)
• La loi de probabilité de X est l'ensemble des
couples (xi, pi) ; elle peut être présentée dans
un tableau.
Loi de probabilité d’une variable
aléatoire discrète
x
x1
x2
…
xi
…
xn
Total
P(X=x)
p1
p2
…
pi
…
pn
1
Loi de probabilité d’une variable
aléatoire discrète
• Pour tout xi, P(X = xi) = pi ≥ 0 et Ʃpi = 1
• Une loi de probabilité discrète est définie
par les couples (xi,pi)
avec P(X = xi) = pi ≥ 0 et Ʃpi = 1
Loi de probabilité d’une variable
aléatoire discrète
• Loi d’un couple de variables aléatoires
• Soit X une variable aléatoire définie sur Ω1 et Y une
variable aléatoire définie sur Ω2
X(ω1) = x et Y(ω2) = y, Z = (X,Y) est un couple de
variables aléatoires (X, Y)
z = Z(ω1,ω2) = (X(ω1),Y(ω2)) = (x,y)
• La loi de Probabilité du couple de variables aléatoires
(X, Y) est définie par l'ensemble des Couples (x, y) et
les probabilités d'obtenir ces couples (désignée
également par loi conjointe).
Loi de probabilité d’une variable
aléatoire discrète
•
•
•
•
•
Loi d’un couple de variables aléatoires
Ainsi si l'on note :
pij = P(X = xi ;Y = yi)
pij = P(X = xi) . P(Y = yj/X = xi)
pij = P(Y = yj) . P(X = xi/Y = yi)
Loi de probabilité d’une variable
aléatoire discrète
Loi d’un couple de variables aléatoires
• Les variables X et Y sont indépendantes si
tous les événements X = xi et Y = yj le sont,
c'est-à-dire :
pij = P(X = xi) . P(Y = yi) = pi.pj
• Pour tout i et tout j : pij = pi . pj <=> X et Y sont
indépendantes
• La modélisation la plus classique en statistique
inductive sur les intervalles de confiance, les
tests, se base sur des variables aléatoires
indépendantes en probabilité.
Loi de probabilité du couple
(X,Y)
X Y
x1
x2
…
xi
…
xp
Total
y1
p11
p21
…
pi1
…
pp1
p.1
y2
p12
p22
…
pi2
…
pp2
p.2
…
…
…
…
…
…
…
…
yj
p1j
p2j
…
pij
…
ppj
p.j
…
…
…
…
…
…
…
…
yq
p1q
p2q
…
piq
…
ppq
p.q
Total
p1.
p2.
…
pi.
…
pp.
p.. =
1
Loi de probabilité d’une variable
aléatoire discrète
Composition de plusieurs variables aléatoires
• une variable aléatoire est définie comme une
application en mathématiques.
• Il est donc possible de faire avec les variables
aléatoires toutes les opérations classiques des
applications : la somme, le produit, le quotient
de deux variables aléatoires.
• Soit :
– X une variable aléatoire définie sur Ω, Sx =
{ensembles des valeurs x}
– Y une variable aléatoire définie sur Ω, Sy =
{ensembles des valeurs y}
Loi de probabilité d’une variable
aléatoire discrète
Composition de plusieurs variables aléatoires
• Addition Z = X + Y
• Pour ω є Ω, Z(ω) = (X + Y)(ω) = X(ω) + Y(ω),
soit z = x + y.
• Cette relation définit la loi d'addition de deux
variables aléatoires, elle a été notée + pour la
distinguer du signe + qui concerne l'addition
des nombres réels. Pour la suite on emploie le
même symbole et on note : Z = X + Y.
Espérance mathématique et
moments non centrés d’une variable
aléatoire discrète
Objectifs
• Blaise Pascal, dans une lettre à Fermat
le 29 juillet 1654, introduit la notion
d'espérance à propos d'un problème
posé par le chevalier de Méré.
• Dans un jeu de pile ou face, chaque
joueur mise 32 pistoles, le joueur qui a
obtenu trois manches consécutives
empoche le total, soit 64 pistoles.
Espérance mathématique et
moments non centrés d’une variable
aléatoire discrète
Objectifs
• Les joueurs sont obligés de se séparer alors que l'un
des deux a gagné une manche ; comment partager
les 64 pistoles ? 32 et 32 est-il un partage équitable ?
• Non, pense Pascal puisque le joueur qui a gagné une
manche a plus de chances de gagner la partie ; aussi
Pascal plutôt que de laisser à chacun sa mise
propose de partager les 64 pistoles en fonction de
l'espoir de gain de chacun, c'est ainsi qu'est apparue
cette notion d'espérance mathématique, le nom est
resté.
Espérance mathématique et
moments non centrés d’une variable
aléatoire discrète
Objectifs
• En statistique descriptive la moyenne
arithmétique est la caractéristique de
tendance centrale la plus utilisée pour
résumer une distribution.
• En probabilité, l'espérance mathématique
d'une variable aléatoire X, notée E(X) , est
la caractéristique de tendance centrale la
plus utilisée pour résumer une
distribution.
Espérance mathématique et
moments non centrés d’une variable
aléatoire discrète
Objectifs
• Les moments permettent de calculer d'autres
caractéristiques d'une distribution de
probabilité (variance, asymétrie...).
• Lorsque la moyenne exacte d'une population
est inconnue, la moyenne d'un échantillon
issu de cette population fournit une
approximation de la moyenne exacte de la
population.
Espérance mathématique et
moments non centrés d’une variable
aléatoire discrète
Objectifs
• Lorsqu'un échantillon peut être modélisé
comme les réalisations d'une variable
aléatoire, la moyenne x des réalisations x1, x2,
. . . , xi, . . . , xn de cette variable aléatoire X
fournit une valeur approchée de l'espérance
mathématique E(X) lorsque cette valeur est
inconnue.
• Il est possible de donner une idée de la
précision du résultat par un intervalle de
confiance.
Espérance mathématique et
moments non centrés d’une variable
aléatoire discrète
• Espérance mathématique d’une variable
aléatoire discrète : E(X)
• La loi de probabilité d’une variable aléatoire X
est donnée par le tableau suivant :
X=x
x1
x2
…
xi
…
xn
Total
P(X=x)
p1
p2
…
pi
…
pn
1
Espérance mathématique et
moments non centrés d’une variable
aléatoire discrète
• L’espérance mathématique de X est le
nombre :
• E(X) = p1x1 + p2x2 + … + pixi + … = pnxn
• E(X) = Ʃpixi
Espérance mathématique et
moments non centrés d’une variable
aléatoire discrète
Exemple :
• Calculez l’espérance mathématique du tirage
suivant :
X=x
- 200
50
100
300
P(X=x)
0,25
0,40
0,25
0,10
Espérance mathématique et
moments non centrés d’une variable
aléatoire
discrète
Propriétés :
• E(aX) = a E(X)
• E(X + Y) = E(X) + E(Y)
• E(X.Y) = E(X) . E(Y)
si X et Y sont indépendants
Variance et moments centrés d’une
variable aléatoire discrète
Objectifs
• Résumer une distribution ou une loi de
probabilité par une seule caractéristique de
valeur centrale telle que l'espérance
mathématique est insuffisant.
• Après des expériences aléatoires, les
réalisations de cette variable aléatoire se
dispersent autour de cette valeur centrale.
• La caractéristique de dispersion la plus
utilisée est la variance.
Variance et moments centrés d’une
variable aléatoire discrète
Objectifs
• L'écart type est la racine carrée de la
variance.
• L'espérance mathématique et la
variance (ou l'écart type) constituent les
deux principales caractéristiques d'une
variable aléatoire ou d'une loi de
probabilité.
Variance et moments centrés d’une
variable aléatoire discrète
Objectifs
• Lorsque la variance exacte d'une population
est inconnue, la variance d'un échantillon issu
de cette population fournit une approximation
de la variance exacte.
• Lorsqu'un échantillon peut être modélisé
comme les réalisations d'une variable
aléatoire, il est possible de donner une idée
de la précision du résultat sur la variance par
un intervalle dit de confiance.
Variance et moments centrés d’une
variable aléatoire discrète
Définition de la variance et de l’écart-type
• Soit une loi de probabilité d’une variable
aléatoire X définie par l’ensemble des
couples (xi,pi)
X=x
x1
x2
…
xi
…
xn
Total
P(X=x)
p1
p2
…
pi
…
pn
1
Variance et moments centrés d’une
variable aléatoire discrète
• V(X) = E[X – E(X)]²
• V(X) = Ʃpixi (xi – E(X))²
• En posant E(X) = m, il vient :
V(X) = Ʃpixi (xi – m)²
• L’écart-type σx est la racine carrée de la
variance : σx = V(X)
Variance et moments centrés d’une
variable aléatoire discrète
Formule développée de la variance
• V(X) = E(X²) – [E(X)]²
Propriétés :
• V(a) = 0
• V(X + a) = V(X)
• V(aX) = a² V(X)
• V(-X) = V(X)
Variance et moments centrés d’une
variable aléatoire discrète
Covariance et corrélation de deux
variables X et Y
• Cov (X,Y) = E[(X – E(X)) (Y – E(Y))]
• Cov(X,Y) = E(X,Y) – E(X).E(Y)
• Cov(X,Y) = ƩƩpij xiyj – (Ʃpi. xi) (Ʃp.j yj)
Variance et moments centrés d’une
variable aléatoire discrète
Covariance et corrélation de deux
variables X et Y
Si deux variables sont indépendantes :
• E(X) . E(Y) = E(XY)
• Cov(X,Y) = 0
• Cov(X,Y) = Cov(Y,X)
• Cov(aX,bY) = ab Cov(X,Y)
• Cov(X,X) = V(X)
Variance et moments centrés d’une
variable aléatoire discrète
• Variable centrée réduite
• Soit une variable aléatoire X ayant pour
espérance E(X) = m et un écart-type σx
• Y = X – E(X) est la variable centrée
σx
réduite associée à X.
Elle vérifie E(Y) = 0 et V(Y) = 1
Variance et moments centrés d’une
variable aléatoire discrète
Remarque
• Ce changement de variable est très utilisé en
statistique lorsque l'on étudie la variabilité
d'un phénomène lié à la variabilité de
plusieurs variables hétérogènes.
• La variabilité, en terme de variance, dépend
du choix des unités et une façon de donner
une influence équilibrée à chaque variable
est de les transformer en variables centrées
réduites.
Variance et moments centrés d’une
variable aléatoire discrète
• Variance de l’addition de deux variables
aléatoires
• V(X+Y) = V(X) + V(Y) + Cov(X,Y)
• V(X-Y) = V(X) + V(Y) - Cov(X,Y)
• V(aX+bY) = a²V(X) + b²V(Y) + ab Cov(X,Y)
• V(aX-bY) = a²V(X) + b²V(Y) – ab Cov(X,Y)
• X et Y indépendants : V(X+Y) = V(X) + V(Y)
Loi normale ou loi de LaplaceGauss
Objectifs
• La loi de Laplace-Gauss joue un rôle
particulièrement important dans la théorie des
probabilités et en statistique car c'est une loi
limite vers laquelle tendent les autres lois de
probabilités pour des conditions que l'on
rencontre fréquemment dans la pratique.
• C'est pour cette raison qu'il est d'usage
courant de la désigner par le terme de loi
normale.
Loi normale ou loi de LaplaceGauss
Objectifs
• C'est pour cette raison qu'il est d'usage
courant de la désigner par le terme de loi
normale.
• En particulier, le résultat suivant qui découle
du théorème central limite revient souvent :
la somme ou la moyenne de plus de trente
variables aléatoires indépendantes qui
suivent la même loi de probabilité suit
approximativement une loi normale.
Loi normale ou loi de LaplaceGauss
Objectifs
• En appliquant ce résultat, il est facile de constater
qu'une somme de variables de Bernoulli
indépendantes de même paramètre p, qui constitue
une loi binomiale se rapproche d'une loi normale.
• Lors d'un sondage d'opinions, le nombre d'individus
de l'échantillon qui présentent une caractéristique
donnée obéit à une loi binomiale et le pourcentage
observé correspondant peut être approximé par une
variable aléatoire normale ; cela facilite le traitement
des résultats en statistique.
Loi normale ou loi de LaplaceGauss
• Une variable aléatoire normale X
dépend de deux paramètres,
l'espérance mathématique m = E(X) et
l'écart type noté σ ou σx.
• Il existe une infinité de lois normales
différentes lorsque m et σ varient.
• La variable aléatoire T = X – m
σ
• vérifie E(T) = 0 et σT = 1.
Loi normale ou loi de LaplaceGauss
• Dans le cas où X suit une loi normale, T
suit aussi une loi normale.
• Pour un calcul de probabilités sur X, il
est d'usage courant d'utiliser la table qui
donne la fonction de répartition de la
variable normale centrée réduite notée
T ou U ou V.
Loi normale ou loi de LaplaceGauss
Loi normale centrée réduite
• T est la variable centrée réduite si sa
densité en tout point réel t est la
suivante :
– f(t) =
t є ]-∞, +∞[
1 e-1/2t²
2π
Loi normale ou loi de LaplaceGauss
Graphe de la densité
• L’aire totale de la courbe est égale à 1
Loi normale ou loi de LaplaceGauss
• E(T) = 0 (symétrie)
• P(T > 0) = P(T < 0) = 0,5
• V(T) = 1
• σT = 1
Loi normale ou loi de LaplaceGauss
Loi normale centrée réduite
t2
• P(t1<T≤t2) = f(t) dt = F(t2) – F(t1)
t1
Loi normale ou loi de LaplaceGauss
• F primitive de f ne correspond pas à un
type de fonction connue, des tables
statistiques pallient cet inconvénient en
fournissant pour les valeurs de t
positives les quantités :
• F(t) = P(T≤t) =
1 e-1/2x² dx
2π
Loi normale ou loi de LaplaceGauss
Loi normale ou loi de LaplaceGauss
Loi normale de paramètres m et σ : N(m,σ)
• La densité de probabilité d'une variable
aléatoire normale X de paramètres m et a
est définie dans lR de la façon suivante :
• F(x) =
1
e-1/2[(x-m)/ σ]²
2πσ
+∞
• Et vérifie
f(x) dx = 1
-∞
Loi normale ou loi de LaplaceGauss
• Graphe de f
Loi normale ou loi de LaplaceGauss
Espérance mathématique
• E(X) = m
• Ce résultat est évident du fait de la
symétrie par rapport à la droite d'équation
x=m;
• P(X < m) = P(X > m) = 0,5 ; la médiane est
aussi égale à m.
Loi normale ou loi de LaplaceGauss
Variance
• V(X) = σ²
Relation entre la loi normale centrée et une
variable quelconque
Si X
N(m,σ) alors T = X – m
N(0,1)
σ
Si T
N(0,1) alors X = m +TσN(m,σ)
Loi normale ou loi de LaplaceGauss
• Additivité
• (X1 + X2)
N(m1 + m2 ; √ σ1² + σ2²)
Loi normale ou loi de LaplaceGauss
Loi normale ou loi de LaplaceGauss
Loi normale ou loi de LaplaceGauss
Loi normale ou loi de LaplaceGauss
Loi normale ou loi de LaplaceGauss
Téléchargement