Quantiles Fichier

publicité
Chapitre VIII
Quantiles
Table des matières
A Généralités
1
B Diagramme en boîte (ou boîte à moustaches) (séries discrètes)
3
C Détermination des quantiles des séries discrètes
4
D Détermination des quantiles des séries continues
5
E Quantiles empiriques
6
F Une caractérisation de la médiane
6
A Généralités
Dénition 1
a) Soit P une probabilité sur R de fonction de répartition F et α un réel appartenant l'intervalle
]0, 1[. On appelle quantile (ou fractile) d'ordre α de P tout réel ν vériant
P (] − ∞, ν]) ≥ α et P ([ν, +∞[) ≥ 1 − α,
ou de façon équivalente
F (ν) ≥ α et F (ν−) ≤ α.
b) Soit X une variable aléatoire réelle dénie sur un espace probabilisé (Ω, F, P ), de fonction
de répartition F . On appelle quantile d'ordre α ∈]0, 1[ de X tout quantile d'ordre α de PX .
Un quantile d'ordre α de X est donc un réel ν vériant les deux conditions
F (ν) ≥ α et F (ν−) ≤ α, ou de façon équivalente P (X ≤ ν) ≥ α et P (X ≥ ν) ≥ 1 − α.
Remarque 2
Il est aisé de constater que
- si F −1 (α) = {θ} θ est l'unique quantile d'ordre α
- si F −1 (α) = [a, b[ ou si F −1 (α) = [a, b] avec a < b, l'ensemble des quantiles d'ordre α est
l'intervalle [a, b]
1
- si F −1 (α) = ∅ le réel θ = inf{t ∈ R : F (t) ≥ α} est l'unique quantile d'ordre α.
Remarque 3
Si la variable X admet une densité h, un quantile d'ordre α de X est un réel θ qui vérie
Rθ
R +∞
l'une des deux égalités équivalentes −∞
h(x)dx = α ou θ h(x)dx = 1 − α.
Dénition 4
-
La médiane est le quantile d'ordre 1/2.
Le premier quartile est le quantile d'ordre 1/4.
Le troisième quartile est le quantile d'ordre 3/4.
Le ie décile, 1 ≤ i ≤ 9, est le quantile d'ordre i/10.
Le ie vingtile, 1 ≤ i ≤ 19, est le quantile d'ordre i/20.
Le ie centile, 1 ≤ i ≤ 99, est le quantile d'ordre i/100.
Théorème 5
L'ensemble des quantiles d'ordre α d'une variable aléatoire réelle est un intervalle fermé
borné non vide.
Lorsque cet ensemble est de la forme [a, b], avec a < b, on convient parfois de dire que le
quantile d'ordre α est le centre (a + b)/2 de cet intervalle.
Preuve
Soit F la fonction de répartition de X .
1. Désignons par M l'ensemble des quantiles d'ordre α de X . Soient x et y des éléments de
M tels que x < y , et soit z ∈]x, y[. Comme F (z) ≥ F (x) ≥ α et F (z−) ≤ F (y−) ≤ α,
z est un élément de M, ce qui prouve que M est un intervalle.
2. L'ensemble I− = {x ∈ R : F (x) ≥ α} est un intervalle de la forme [a, +∞[ avec a ∈ R ;
en eet :
(a) I− est un intervalle car F est croissante
(b) I− est illimité à droite car lim F (t) = 1
t→+∞
(c) I− est limité à gauche car lim F (t) = 0
t→−∞
(d) la borne gauche de I− appartient à I− car F est continue à droite.
3. Soit x ∈]−∞, a[ ; comme par dénition de I− a = inf{t ∈ R : F (x) ≥ α}, on a F (x) < α ;
par conséquent F (a−) ≤ α, ce qui prouve que a est le plus petit quantile d'ordre α.
4. L'ensemble I+ = {x ∈ R : F (x−) ≤ α} est un intervalle de la forme ] − ∞, b] avec
b ∈ R ; la démonstration est analogue à celle de 2. et repose sur le fait que l'application
x → F (x−) est croissante et continue à gauche.
2
5. On prouve comme en 3. que b est le plus grand quantile d'ordre α. On déduit nalement
de ce qui précède que M = [a, b].
Dénition 6 (Fonction quantile)
Si F est la fonction de répartition d'une variable aléatoire réelle X , on appelle fonction
quantile de X l'inverse généralisé de F , i.e. l'application G dénie sur ]0, 1[ et à valeurs dans
R dénie par :
∀ α ∈]0, 1[
G(α) = inf{t ∈ R : F (t) ≥ α}.
La démonstration du théorème 5 montre que pour tout α ∈]0, 1[ G(α) est le plus petit
quantile d'ordre α ; en particul ier lorsque F −1 (α) = [a, b[ ou F −1 (α) = [a, b], avec a < b, on
a G(α) = a.
Calcul avec le logiciel R
La commande quantile(x, α, type = 1) fournit le quantile d'ordre α, en le prenant égal à
a si l'ensemble des quantiles d'ordre α est l'intervalle [a, b] ; la commande quantile(x, type = 1)
donne les trois quartiles selon le même principe.
La commande quantile(x, α, type = 2) fournit le quantile d'ordre α, en le prenant égal à
a+b
2 si l'ensemble des quantiles d'ordre α est l'intervalle [a, b] ; la commande quantile(x, type =
2) donne les trois quartiles selon le même principe.
B Diagramme en boîte (ou boîte à moustaches) (séries discrètes)
Il en existe plusieurs dénitions ; toutes ont en commun la boîte centrale : la base
inférieure de la boîte correspond au premier quartile Q1 ; la boîte est séparée en deux parties
par un trait correspondant à la médiane ; la base supérieure de la boîte correspond au troisième
quartile Q3 .
1) Dans les manuels de 1re S la barre située à l'extrémité de la moustache inférieure correspond au premier décile D1 et la barre située à l'extrémité de la moustache supérieure
correspond au neuvième décile D9 . On fait parfois gurer la plus petite et la plus grande
valeur.
2) Le logiciel R possède une commande boxplot qui appliquée à une liste a trace une boîte
à moustache de la façon suivante :
- la barre inférieure correspond au plus petit élément de a supérieur ou égal à Q1 −1, 5(Q3 −
Q1 ) et la barre supérieure au plus grand élément de a inférieur ou égal à Q3 + 1, 5(Q3 − Q1 )
- les valeurs situées en dehors de l'intervalle [Q1 − ∆, Q3 + ∆], où ∆ = 1, 5(Q3 − Q1 ), sont
représentées individuellement au-delà des barres.
3
C Détermination des quantiles des séries discrètes
Fonction de répartition
La fonction de répartition des fréquences
cumulées d'une série statistique discrète
Pk
(x1 , n1 ), ..., (xk , nk ), d'eectif total N =
i=1 nk et de fréquences
Pkfi = ni /N ,1 est
Pk par dénition est la fonction de répartition F de la probabilité P = i=1 fi δxi = n i=1 ni δxi .
L'application F vérie :
a) si x ∈] − ∞, x1 [
F (x) = 0
b) si x ∈ [xk , +∞[
F (x) = 1
c) si x ∈ [xi , xi+1 [
F (x) = Fi , pour i = 1, ..., k − 1.
Quantiles
Soit F la fonction de répartition des fréquences cumulées d'une série discrète (x1 , n1 ), ..., (xk , n
et soit α ∈]0, 1[.
a) S'il existe un indice i tel que F (xi ) = α, l'ensemble des quantiles d'ordre α de la série
est l'intervalle [xi , xi+1 ].
b) Sinon le quantile d'ordre α de la série est la valeur xi vériant F (xi−1 ) < α < F (xi ).
Remarque 7
Une médiane peut aussi se dénir de la façon suivante :
P
une médiane est un réel en lequel l'application f (x) = ki=1 ni |x − xi | atteint son
minimum.
Cas des séries non regroupées
Pour une série discrète dont les valeurs ne sont pas regroupées x1 ≤ x2 ≤ ... ≤ xn , le
quantile d'ordre α ∈]0, 1[ de la série est donné par la règle suivante :
a) si nα ∈/ N le quantile d'ordre α est x[nα]+1 ([nα] désigne la partie entière de nα)
b) si nα = q ∈ N l'ensemble des quantiles d'ordre α est l'intervalle [xq , xq+1 ].
Dans le cas où nα = q ∈ N on pourra convenir de dire que le quantile d'ordre α de la série
est xq +x2 q+1 . On pourra aussi le prendre égal à xq , valeur en accord avec celle donnée par la
fonction quantile.
Remarque 8
1) Le cas des séries non regroupées se ramène au cas des série regroupées en regroupant les
valeurs égales.
2) Le cas des séries regroupées se ramène au cas des séries non regroupées en considérant la
série x1 ≤ ... ≤ x1 ≤ x2 ≤ ... ≤ x2 ≤ ... ≤ xk , où la valeur xi est répétée ni fois.
4
Exemple 9
On considère la série statistique suivante.
-
Valeurs
10 15 20 25 30 35 40
Eectifs
10 12 34 21 12 9 7
Eectifs cumulés 10 22 56 77 89 98 105
105/10 = 10, 5 , le premier décile est D1 = 15
105/4 = 26, 25 , le premier quartile est Q1 = 20
105/2 = 52, 5 , la médiane est µ = 20
3
4 105 = 78, 75 , le troisième quartile est Q3 = 30
9
10 105 = 94, 5 , le neuvième quartile est D9 = 35.
D Détermination des quantiles des séries continues
Fonction de répartition
Soit F la fonction de répartition des fréquences cumulées de la série statistique continue
ci-dessous.
Classes [a0 , a1 [ [a1 , a2 [ ... [ap−1 , ap [
Eectifs
n1
n2
...
np
Par dénition F est la fonction de répartition de la probabilité P = pi=1 fi Uai−1, ai , où Ua,b
désigne la loi uniforme sur l'intervalle [a, b].
F est continue et ane par morceaux et vérie :
a) si x ∈] − ∞, a0 ]
F (x) = 0
b) si x ∈ [ap , +∞[
F (x) = 1
P
c) F (ai ) = Fi pour tout indice i = 1, ..., p − 1, où Fi = ik=1 fk est la ie fréquence cumulée.
P
Quantiles
Soit F la fonction de répartition des fréquences cumulées de la série statistique continue
ci-dessous.
Classes [a0 , a1 [ [a1 , a2 [ ... [ap−1 , ap [
Eectifs
n1
n2
...
np
Soit α ∈]0, 1[ ; un quantile d'ordre α de la série est un réel ν qui vérie F (ν) = α ; autrement
dit l'ensemble des quantiles d'ordre α est l'intervalle F −1 ({α}).
5
E Quantiles empiriques
Dénition 10
Soit x1 ≤ x2 ≤ ... ≤ xn une suite de réels. Pour tout α ∈]0,
on appelle quantile d'ordre
P1[
n
1
α de cette suite le quantile d'ordre α de la probabilité P = n i=1 δxi .
On vérie que ce quantile est donné par la règle pratique suivante :
- si nα ∈/ N le quantile d'ordre p est x[nα]+1
- si nα = q ∈ N l'ensemble des quantiles d'ordre α est l'intervalle [xq , xq+1 ].
Convention 11
Dans le cas où nα = q ∈ N on conviendra de dire que le quantile d'ordre α de la suite
est xq , valeur en agrément avec celle donnée par la fonction quantile.
On considère une probabilité Q sur R qui admet un unique quantile d'ordre α que l'on
note θα ; si F désigne la fonction de répartition de Q, F −1 ({α}) est donc soit vide, soit égal à
{θα }. Soit (Xn )n≥1 une suite indépendante de variables aléatoires réelles dénies sur un espace
probabilisé (Ω, F, P ) et ayant toutes pour loi Q.
Soit n un entier non nul. La statistique d'ordre de rang n de la suite (Xn )n≥1 est le vecteur
aléatoire à valeurs dans Rn (Y1n , Y2n , ..., Ynn ) tel que pour tout ω ∈ Ω la suite Y1n (ω) ≤ Y2n (ω) ≤
... ≤ Ynn (ω) représente la suite réordonnée croissante de la suite X1 (ω), X2 (ω), ..., Xn (ω).
On dénit une variable aléatoire ϑαn sur Ω de la façon suivante : pour tout ω ∈ Ω ϑαn (ω)
est le quantile d'ordre α de la suite Y1n (ω) ≤ Y2n (ω) ≤ ... ≤ Ynn (ω), en tenant compte de la
convention ci-dessus. On a alors le résultat suivant.
Théorème 12
La suite de variables aléatoires réelle (ϑαn )n≥1 converge presque sûrement vers θα .
F Une caractérisation de la médiane
Rappel 13
Soit f une application convexe dénie sur un intervalle ouvert I de R. L'application f est
continue, dérivable à droite et à gauche. Si a < b sont des éléments de I
fg (a) ≤ fd (a) ≤
f (b) − f (a)
≤ fg (b) ≤ fd (b).
b−a
En conséquence
- si fd (c) < 0, alors f est strictement décroissante sur I∩] − ∞, c]
- si fd (c) > 0, alors f est strictement croissante sur I ∩ [c, +∞[.
6
Théorème 14
Soit µ une probabilité sur R admettant un moment d'ordre un. L'application
Z
|x − a|dµ(x)
ϕ(a) =
dénie possède les propriétés suivantes :
1. ϕ est convexe
2. lim [ϕ(a) + a] = Eµ et
lim [ϕ(a) − a] = −Eµ
a→−∞
a→+∞
3. l'ensemble des points où ϕ atteint son minimum est l'ensemble des médianes de µ.
Preuve
1. Si λ ∈ [0, 1], pour tous réels a et b
Z
ϕ(λa + (1 − λ)b) =
|x − (λa + (1 − λ)b)|dµ
Z
|λ(x − a) + (1 − λ)(x − b)|dµ
Z
Z
≤ λ |x − a|dµ + (1 − λ) |x − b|dµ
=
= λϕ(a) + (1 − λ)ϕ(b).
2. De
Z
a
Z
+∞
(a − x)dµ +
ϕ(a) =
Z−∞
+∞
Z
(x − a)dµ +
=
a
Z
+∞
a
(x − a)dµ −
−∞
Z a
a
Z
(x − a)dµ
a
Z
a
(x − a)dµ +
−∞
(a − x)dµ
−∞
(x − a)dµ + 2
(a − x)dµ
−∞
Z a
= Eµ − a + 2
(a − x)dµ.
=
−∞
−∞
On déduit immédiatement la première limite, puisque pour x ≤ a < 0 on a la majoration
a − x ≤ |x|, et le théorème de convergence dominée s'applique.
De façon analogue
Z
∞
ϕ(a) = −Eµ + a + 2
(x − a)dµ,
a
avec l'inégalité x − a ≤ x dès que 0 < a < x.
3. La variable X = 1]−∞,a] (x)(a − x) étant à valeurs positives
Z
a
Z
(a − x)dµ =
−∞
Z
+∞
Xdµ =
Z
µ(X ≥ t)dt.
µ(X > t)dt =
0
0
7
+∞
Par le changement de variable a − t = u, notant Fµ la fonction caractéristique de µ
Z
+∞
Z
µ(X ≥ t)dt =
0
+∞
Z
a
µ(a − x ≥ t)dt =
Z
µ(x ≤ u)du =
−∞
0
a
Fµ (u)du.
−∞
L'application Fµ est continue à droite, et en conséquence l'application
Z
a
R 3 a −→
Fµ (u)du
−∞
est dérivable à droite, de dérivée en a égale à Fµ (a). La dérivée à droite de ϕ est donc
donnée par
ϕ0d (a) = −1 + 2Fµ (a).
De façon analogue, remarquant que
Z
a
+∞
Z
a
µ(a − x > t)dt =
(a − x)dµ =
−∞
Z
Fµ (u−)du,
−∞
0
et que l'application R 3 u −→ Fµ− (u) est continue à gauche, on a
ϕ0g (a) = −1 + 2Fµ (a−).
Soit [µ, ν] l'ensemble des médianes. Si c < µ alors Fµ (c) < 21 , et donc ϕ0d (c) < 0, et en
conséquence ϕ est strictement décroissante sur ] − ∞, µ]. Si c > ν alors Fµ (c−) > 21 , et
donc ϕ0g (c) > 0, et en conséquence ϕ est strictement croissante sur ] − ∞, ν].
Si µ = ν , l'application ϕ atteint son minimum absolu en l'unique point µ.
Si µ < ν , alors pour tout point x ∈]µ, ν[ , on a Fµ (x) = Fµ (x−) = 12 , et en conséquence
ϕ0g (x) = ϕ0d (x) = 0, ce qui prouve que ϕ est constante sur [µ, ν], et l'on conclut que ϕ
atteint son minimum absolu sur [µ, ν].
8
9
Téléchargement