Chapitre VIII Quantiles Table des matières A Généralités 1 B Diagramme en boîte (ou boîte à moustaches) (séries discrètes) 3 C Détermination des quantiles des séries discrètes 4 D Détermination des quantiles des séries continues 5 E Quantiles empiriques 6 F Une caractérisation de la médiane 6 A Généralités Dénition 1 a) Soit P une probabilité sur R de fonction de répartition F et α un réel appartenant l'intervalle ]0, 1[. On appelle quantile (ou fractile) d'ordre α de P tout réel ν vériant P (] − ∞, ν]) ≥ α et P ([ν, +∞[) ≥ 1 − α, ou de façon équivalente F (ν) ≥ α et F (ν−) ≤ α. b) Soit X une variable aléatoire réelle dénie sur un espace probabilisé (Ω, F, P ), de fonction de répartition F . On appelle quantile d'ordre α ∈]0, 1[ de X tout quantile d'ordre α de PX . Un quantile d'ordre α de X est donc un réel ν vériant les deux conditions F (ν) ≥ α et F (ν−) ≤ α, ou de façon équivalente P (X ≤ ν) ≥ α et P (X ≥ ν) ≥ 1 − α. Remarque 2 Il est aisé de constater que - si F −1 (α) = {θ} θ est l'unique quantile d'ordre α - si F −1 (α) = [a, b[ ou si F −1 (α) = [a, b] avec a < b, l'ensemble des quantiles d'ordre α est l'intervalle [a, b] 1 - si F −1 (α) = ∅ le réel θ = inf{t ∈ R : F (t) ≥ α} est l'unique quantile d'ordre α. Remarque 3 Si la variable X admet une densité h, un quantile d'ordre α de X est un réel θ qui vérie Rθ R +∞ l'une des deux égalités équivalentes −∞ h(x)dx = α ou θ h(x)dx = 1 − α. Dénition 4 - La médiane est le quantile d'ordre 1/2. Le premier quartile est le quantile d'ordre 1/4. Le troisième quartile est le quantile d'ordre 3/4. Le ie décile, 1 ≤ i ≤ 9, est le quantile d'ordre i/10. Le ie vingtile, 1 ≤ i ≤ 19, est le quantile d'ordre i/20. Le ie centile, 1 ≤ i ≤ 99, est le quantile d'ordre i/100. Théorème 5 L'ensemble des quantiles d'ordre α d'une variable aléatoire réelle est un intervalle fermé borné non vide. Lorsque cet ensemble est de la forme [a, b], avec a < b, on convient parfois de dire que le quantile d'ordre α est le centre (a + b)/2 de cet intervalle. Preuve Soit F la fonction de répartition de X . 1. Désignons par M l'ensemble des quantiles d'ordre α de X . Soient x et y des éléments de M tels que x < y , et soit z ∈]x, y[. Comme F (z) ≥ F (x) ≥ α et F (z−) ≤ F (y−) ≤ α, z est un élément de M, ce qui prouve que M est un intervalle. 2. L'ensemble I− = {x ∈ R : F (x) ≥ α} est un intervalle de la forme [a, +∞[ avec a ∈ R ; en eet : (a) I− est un intervalle car F est croissante (b) I− est illimité à droite car lim F (t) = 1 t→+∞ (c) I− est limité à gauche car lim F (t) = 0 t→−∞ (d) la borne gauche de I− appartient à I− car F est continue à droite. 3. Soit x ∈]−∞, a[ ; comme par dénition de I− a = inf{t ∈ R : F (x) ≥ α}, on a F (x) < α ; par conséquent F (a−) ≤ α, ce qui prouve que a est le plus petit quantile d'ordre α. 4. L'ensemble I+ = {x ∈ R : F (x−) ≤ α} est un intervalle de la forme ] − ∞, b] avec b ∈ R ; la démonstration est analogue à celle de 2. et repose sur le fait que l'application x → F (x−) est croissante et continue à gauche. 2 5. On prouve comme en 3. que b est le plus grand quantile d'ordre α. On déduit nalement de ce qui précède que M = [a, b]. Dénition 6 (Fonction quantile) Si F est la fonction de répartition d'une variable aléatoire réelle X , on appelle fonction quantile de X l'inverse généralisé de F , i.e. l'application G dénie sur ]0, 1[ et à valeurs dans R dénie par : ∀ α ∈]0, 1[ G(α) = inf{t ∈ R : F (t) ≥ α}. La démonstration du théorème 5 montre que pour tout α ∈]0, 1[ G(α) est le plus petit quantile d'ordre α ; en particul ier lorsque F −1 (α) = [a, b[ ou F −1 (α) = [a, b], avec a < b, on a G(α) = a. Calcul avec le logiciel R La commande quantile(x, α, type = 1) fournit le quantile d'ordre α, en le prenant égal à a si l'ensemble des quantiles d'ordre α est l'intervalle [a, b] ; la commande quantile(x, type = 1) donne les trois quartiles selon le même principe. La commande quantile(x, α, type = 2) fournit le quantile d'ordre α, en le prenant égal à a+b 2 si l'ensemble des quantiles d'ordre α est l'intervalle [a, b] ; la commande quantile(x, type = 2) donne les trois quartiles selon le même principe. B Diagramme en boîte (ou boîte à moustaches) (séries discrètes) Il en existe plusieurs dénitions ; toutes ont en commun la boîte centrale : la base inférieure de la boîte correspond au premier quartile Q1 ; la boîte est séparée en deux parties par un trait correspondant à la médiane ; la base supérieure de la boîte correspond au troisième quartile Q3 . 1) Dans les manuels de 1re S la barre située à l'extrémité de la moustache inférieure correspond au premier décile D1 et la barre située à l'extrémité de la moustache supérieure correspond au neuvième décile D9 . On fait parfois gurer la plus petite et la plus grande valeur. 2) Le logiciel R possède une commande boxplot qui appliquée à une liste a trace une boîte à moustache de la façon suivante : - la barre inférieure correspond au plus petit élément de a supérieur ou égal à Q1 −1, 5(Q3 − Q1 ) et la barre supérieure au plus grand élément de a inférieur ou égal à Q3 + 1, 5(Q3 − Q1 ) - les valeurs situées en dehors de l'intervalle [Q1 − ∆, Q3 + ∆], où ∆ = 1, 5(Q3 − Q1 ), sont représentées individuellement au-delà des barres. 3 C Détermination des quantiles des séries discrètes Fonction de répartition La fonction de répartition des fréquences cumulées d'une série statistique discrète Pk (x1 , n1 ), ..., (xk , nk ), d'eectif total N = i=1 nk et de fréquences Pkfi = ni /N ,1 est Pk par dénition est la fonction de répartition F de la probabilité P = i=1 fi δxi = n i=1 ni δxi . L'application F vérie : a) si x ∈] − ∞, x1 [ F (x) = 0 b) si x ∈ [xk , +∞[ F (x) = 1 c) si x ∈ [xi , xi+1 [ F (x) = Fi , pour i = 1, ..., k − 1. Quantiles Soit F la fonction de répartition des fréquences cumulées d'une série discrète (x1 , n1 ), ..., (xk , n et soit α ∈]0, 1[. a) S'il existe un indice i tel que F (xi ) = α, l'ensemble des quantiles d'ordre α de la série est l'intervalle [xi , xi+1 ]. b) Sinon le quantile d'ordre α de la série est la valeur xi vériant F (xi−1 ) < α < F (xi ). Remarque 7 Une médiane peut aussi se dénir de la façon suivante : P une médiane est un réel en lequel l'application f (x) = ki=1 ni |x − xi | atteint son minimum. Cas des séries non regroupées Pour une série discrète dont les valeurs ne sont pas regroupées x1 ≤ x2 ≤ ... ≤ xn , le quantile d'ordre α ∈]0, 1[ de la série est donné par la règle suivante : a) si nα ∈/ N le quantile d'ordre α est x[nα]+1 ([nα] désigne la partie entière de nα) b) si nα = q ∈ N l'ensemble des quantiles d'ordre α est l'intervalle [xq , xq+1 ]. Dans le cas où nα = q ∈ N on pourra convenir de dire que le quantile d'ordre α de la série est xq +x2 q+1 . On pourra aussi le prendre égal à xq , valeur en accord avec celle donnée par la fonction quantile. Remarque 8 1) Le cas des séries non regroupées se ramène au cas des série regroupées en regroupant les valeurs égales. 2) Le cas des séries regroupées se ramène au cas des séries non regroupées en considérant la série x1 ≤ ... ≤ x1 ≤ x2 ≤ ... ≤ x2 ≤ ... ≤ xk , où la valeur xi est répétée ni fois. 4 Exemple 9 On considère la série statistique suivante. - Valeurs 10 15 20 25 30 35 40 Eectifs 10 12 34 21 12 9 7 Eectifs cumulés 10 22 56 77 89 98 105 105/10 = 10, 5 , le premier décile est D1 = 15 105/4 = 26, 25 , le premier quartile est Q1 = 20 105/2 = 52, 5 , la médiane est µ = 20 3 4 105 = 78, 75 , le troisième quartile est Q3 = 30 9 10 105 = 94, 5 , le neuvième quartile est D9 = 35. D Détermination des quantiles des séries continues Fonction de répartition Soit F la fonction de répartition des fréquences cumulées de la série statistique continue ci-dessous. Classes [a0 , a1 [ [a1 , a2 [ ... [ap−1 , ap [ Eectifs n1 n2 ... np Par dénition F est la fonction de répartition de la probabilité P = pi=1 fi Uai−1, ai , où Ua,b désigne la loi uniforme sur l'intervalle [a, b]. F est continue et ane par morceaux et vérie : a) si x ∈] − ∞, a0 ] F (x) = 0 b) si x ∈ [ap , +∞[ F (x) = 1 P c) F (ai ) = Fi pour tout indice i = 1, ..., p − 1, où Fi = ik=1 fk est la ie fréquence cumulée. P Quantiles Soit F la fonction de répartition des fréquences cumulées de la série statistique continue ci-dessous. Classes [a0 , a1 [ [a1 , a2 [ ... [ap−1 , ap [ Eectifs n1 n2 ... np Soit α ∈]0, 1[ ; un quantile d'ordre α de la série est un réel ν qui vérie F (ν) = α ; autrement dit l'ensemble des quantiles d'ordre α est l'intervalle F −1 ({α}). 5 E Quantiles empiriques Dénition 10 Soit x1 ≤ x2 ≤ ... ≤ xn une suite de réels. Pour tout α ∈]0, on appelle quantile d'ordre P1[ n 1 α de cette suite le quantile d'ordre α de la probabilité P = n i=1 δxi . On vérie que ce quantile est donné par la règle pratique suivante : - si nα ∈/ N le quantile d'ordre p est x[nα]+1 - si nα = q ∈ N l'ensemble des quantiles d'ordre α est l'intervalle [xq , xq+1 ]. Convention 11 Dans le cas où nα = q ∈ N on conviendra de dire que le quantile d'ordre α de la suite est xq , valeur en agrément avec celle donnée par la fonction quantile. On considère une probabilité Q sur R qui admet un unique quantile d'ordre α que l'on note θα ; si F désigne la fonction de répartition de Q, F −1 ({α}) est donc soit vide, soit égal à {θα }. Soit (Xn )n≥1 une suite indépendante de variables aléatoires réelles dénies sur un espace probabilisé (Ω, F, P ) et ayant toutes pour loi Q. Soit n un entier non nul. La statistique d'ordre de rang n de la suite (Xn )n≥1 est le vecteur aléatoire à valeurs dans Rn (Y1n , Y2n , ..., Ynn ) tel que pour tout ω ∈ Ω la suite Y1n (ω) ≤ Y2n (ω) ≤ ... ≤ Ynn (ω) représente la suite réordonnée croissante de la suite X1 (ω), X2 (ω), ..., Xn (ω). On dénit une variable aléatoire ϑαn sur Ω de la façon suivante : pour tout ω ∈ Ω ϑαn (ω) est le quantile d'ordre α de la suite Y1n (ω) ≤ Y2n (ω) ≤ ... ≤ Ynn (ω), en tenant compte de la convention ci-dessus. On a alors le résultat suivant. Théorème 12 La suite de variables aléatoires réelle (ϑαn )n≥1 converge presque sûrement vers θα . F Une caractérisation de la médiane Rappel 13 Soit f une application convexe dénie sur un intervalle ouvert I de R. L'application f est continue, dérivable à droite et à gauche. Si a < b sont des éléments de I fg (a) ≤ fd (a) ≤ f (b) − f (a) ≤ fg (b) ≤ fd (b). b−a En conséquence - si fd (c) < 0, alors f est strictement décroissante sur I∩] − ∞, c] - si fd (c) > 0, alors f est strictement croissante sur I ∩ [c, +∞[. 6 Théorème 14 Soit µ une probabilité sur R admettant un moment d'ordre un. L'application Z |x − a|dµ(x) ϕ(a) = dénie possède les propriétés suivantes : 1. ϕ est convexe 2. lim [ϕ(a) + a] = Eµ et lim [ϕ(a) − a] = −Eµ a→−∞ a→+∞ 3. l'ensemble des points où ϕ atteint son minimum est l'ensemble des médianes de µ. Preuve 1. Si λ ∈ [0, 1], pour tous réels a et b Z ϕ(λa + (1 − λ)b) = |x − (λa + (1 − λ)b)|dµ Z |λ(x − a) + (1 − λ)(x − b)|dµ Z Z ≤ λ |x − a|dµ + (1 − λ) |x − b|dµ = = λϕ(a) + (1 − λ)ϕ(b). 2. De Z a Z +∞ (a − x)dµ + ϕ(a) = Z−∞ +∞ Z (x − a)dµ + = a Z +∞ a (x − a)dµ − −∞ Z a a Z (x − a)dµ a Z a (x − a)dµ + −∞ (a − x)dµ −∞ (x − a)dµ + 2 (a − x)dµ −∞ Z a = Eµ − a + 2 (a − x)dµ. = −∞ −∞ On déduit immédiatement la première limite, puisque pour x ≤ a < 0 on a la majoration a − x ≤ |x|, et le théorème de convergence dominée s'applique. De façon analogue Z ∞ ϕ(a) = −Eµ + a + 2 (x − a)dµ, a avec l'inégalité x − a ≤ x dès que 0 < a < x. 3. La variable X = 1]−∞,a] (x)(a − x) étant à valeurs positives Z a Z (a − x)dµ = −∞ Z +∞ Xdµ = Z µ(X ≥ t)dt. µ(X > t)dt = 0 0 7 +∞ Par le changement de variable a − t = u, notant Fµ la fonction caractéristique de µ Z +∞ Z µ(X ≥ t)dt = 0 +∞ Z a µ(a − x ≥ t)dt = Z µ(x ≤ u)du = −∞ 0 a Fµ (u)du. −∞ L'application Fµ est continue à droite, et en conséquence l'application Z a R 3 a −→ Fµ (u)du −∞ est dérivable à droite, de dérivée en a égale à Fµ (a). La dérivée à droite de ϕ est donc donnée par ϕ0d (a) = −1 + 2Fµ (a). De façon analogue, remarquant que Z a +∞ Z a µ(a − x > t)dt = (a − x)dµ = −∞ Z Fµ (u−)du, −∞ 0 et que l'application R 3 u −→ Fµ− (u) est continue à gauche, on a ϕ0g (a) = −1 + 2Fµ (a−). Soit [µ, ν] l'ensemble des médianes. Si c < µ alors Fµ (c) < 21 , et donc ϕ0d (c) < 0, et en conséquence ϕ est strictement décroissante sur ] − ∞, µ]. Si c > ν alors Fµ (c−) > 21 , et donc ϕ0g (c) > 0, et en conséquence ϕ est strictement croissante sur ] − ∞, ν]. Si µ = ν , l'application ϕ atteint son minimum absolu en l'unique point µ. Si µ < ν , alors pour tout point x ∈]µ, ν[ , on a Fµ (x) = Fµ (x−) = 12 , et en conséquence ϕ0g (x) = ϕ0d (x) = 0, ce qui prouve que ϕ est constante sur [µ, ν], et l'on conclut que ϕ atteint son minimum absolu sur [µ, ν]. 8 9