Universit´e de Rouen
Math´ematiques
Masters de Math´ematiques, AIMAF, MA et MINMACS
Ann´ee 2023-2024 Statistique 1. Fiche n1
Mod`eles statistiques.
Absolue continuit´e. Mesure dominante. Dans ce paragraphe, si (X,(Pθ)θΘ) est un mod`ele statistique domin´e par
une mesure dominante µ, on notera, pour tout θΘ, fθ=dPθ
une densit´e de Pθpar rapport `a µ(dont l’existence est
assur´ee par le th´eor`eme de Radon-Nikodym). On appelle vraisemblance du mod`ele l’application d´efinie par :
L:X × ΘR+
(x, θ)7→ fθ(x).
1. Mesure dominante dans le cas discret. Soit (X,(Pθ)θΘ) un mod`ele discret c’est-`a-dire un mod`ele o`u l’espace
des observations Xest fini ou d´enombrable. Montrez que ce mod`ele est domin´e par la mesure de comptage µsur Xet
donnez l’expression d’une vraisemblance.
2. Domination d’un mod`ele d’´echantillonnage. Montrer que le mod`ele X,(Pθ)θΘest domin´e si et seulement
si Xn,Pn
θθΘl’est pour tout nN. Dans ce cas, donner l’expression d’une vraisemblance pour le mod`ele
d’´echantillonnage de taille n.
La cons´equence remarquable est que pour montrer qu’un mod`ele d’´echantillonnage Pn
θθΘest domin´e, il suffit de
montrer que le mod`ele de base (Pθ)θΘl’est. De plus, la vraisemblance du mod`ele d’´echantillonnage s’obtient directement
`a partir du mod`ele de base.
3. Mod`eles homog`enes.
(a) Montrez que pour tout θΘ, la densit´e fθest strictement positive Pθ–presque-sˆurement. On pourra poser pour
tout θΘ,Aθ={x∈ X;fθ(x)>0}(cet ensemble est appel´e µ-support essentiel de fθ). Donnez un exemple o`u
celle-ci n’est pas strictement positive µ–presque partout.
(b) Montrez que, pour tout θΘ, fθ>0µ–presque partout si et seulement si la mesure µest ´equivalente `a chacune
des lois Pθ. Exprimez dans ce cas une densit´e de µpar rapport `a Pθ.
(c) On dit que le mod`ele (X,(Pθ)θΘ) est homog`ene si
θΘθ0ΘPθPθ0.
Montrez qu’un mod`ele est homog`ene si et seulement s’il admet une dominante µet une vraisemblance Lassoci´ee
strictement positive µ–presque partout.
(d) Les mod`eles suivants sont-ils homog`enes : (E(θ))θ>0, (U([0, θ]))θ>0, (B(θ))θ]0,1[ et (B(θ))θ[0,1] ?
Identifiabilit´e.
4. Identifiabilit´e d’un mod`ele d’´echantillonnage. Montrer que (X,(Pθ)θΘ) est identifiable si et seulement si Xn,(Pθn)θΘ
l’est pour tout nN.
La cons´equence remarquable est que pour montrer qu’un mod`ele d’´echantillonnage Pn
θθΘest identifiable, il suffit de
montrer que le mod`ele de base (Pθ)θΘl’est.
5. Des crit`eres d’identifiabilit´e. On ´etudie un mod`ele (X,(Pθ)θΘ). S’il est domin´e, on notera fθ=dPθ
. Lorsque
X R, on note, pour tout θΘ, Fθla fonction de r´epartition de toute v.a.r. Xde loi Pθ, et ϕθsa fonction
caract´eristique.
On rappelle que pour tous θ, θ0Θ, Pθ=Pθ0fθ=fθ0µ–presque partout Fθ=Fθ0, et ´egalement :
Pθ=Pθ0ϕθ=ϕθ0. La densit´e, la fonction de r´epartition et la fonction caract´eristique, constituent donc des outils
pour montrer l’identifiabilit´e d’un mod`ele. On prendra garde que l’´egalit´e de densit´es µ-presque partout est d´elicate `a
utiliser lorsque la mesure dominante µest la mesure de Lebesgue.
Dans beaucoup de mod`eles, chaque loi Pθest identifiable au sein de la famille (Pθ)θΘsimplement `a partir d’un
ou plusieurs de ses moments. En effet : θ, θ0Θ, Pθ=Pθ0⇒ ∀t > 0,Eθ(Xt) = Eθ0(Xt), Notons que la r´eciproque
de cette implication est en g´en´eral fausse (sauf dans certains cas, avec des hypoth`eses suppl´ementaires sur les lois, par
exemple si leur support est born´e, voir le TD de Probabilit´es et analyse stochastique sur les fonctions caract´eristiques),
mais que ce n’est pas un probl`eme pour la question de l’identifiabilit´e. L’autre int´erˆet des moments est qu’ils fournissent
ensuite des estimateurs (voir le chapitre sur l’Estimation et la m´ethode des moments).
1
(a) Soit nN. Montrer que le mod`ele {0,1}n,(B(θ)n)θ[0,1](o`u B(θ) d´esigne la loi de Bernoulli de param`etre θ)
est identifiable, `a l’aide de tous les crit`eres ´evoqu´es ci-dessus.
(b) Faire de mˆeme avec le mod`ele ((R+)n,(E(θ)n)θR+) (o`u (E(θ) d´esigne la loi exponentielle de param`etre θ).
Attention encore une fois lorsqu’on utilise la densit´e de la loi par rapport `a la mesure de Lebesgue.
6. Un mod`ele non identifiable : le mod`ele probit. On plante une graine, et on observe son d´eveloppement `a un
instant donn´e :
Y=1 si la graine a germ´e,
0 sinon.
Pour mod´eliser la situation, on suppose l’existence d’une variable biologique Xde loi N(m, σ2), appel´ee capacit´e de
germination de la graine, telle que Y={X>0}. Calculer la loi de Y, donner le mod`ele et montrer qu’il n’est pas
identifiable. Il s’agit du mod`ele image par R+du mod`ele N(m, σ2)(m,σ2)R×R+.
Calcul de lois. Somme de v.a. ind´ependantes. Convolution.
7. Statistiques d’ordre. On se place sur un espace de probabilit´e (X,A,P). On consid`ere un nechantillon de v.a.r.
X1, . . . , Xnde mˆeme loi admettant pour densit´e fpar rapport `a la mesure de Lebesgue, et de fonction de r´epartition
F. Pour tout ω∈ X tel que X1(ω), . . . , Xn(ω) sont deux `a deux distincts, on d´efinit σωcomme la permutation de
l’ensemble {1, . . . , n}telle que Xσω(1)(ω)< Xσω(2)(ω)<··· < Xσω(n)(ω).
(a) Montrer que pour tous i, j ∈ {1, . . . , n},P(Xi=Xj) = 0 et en d´eduire que ω7→ σωest d´efinie p.s. sur X, mesurable,
et donner sa loi.
(b) Calculer P(σ(i) = k) pour tout i, k ∈ {1, . . . , n}.
(c) On note pour simplifier Xσω(i)(ω) = X(i)(ω) pour tout i∈ {1, . . . , n}.
(i) V´erifier que X(1), . . . , X(n)sont des v.a. d´efinies p.s. sur Xet que le n-uplet (X(1), . . . , X(n)), appel´e n-
´echantillon r´eordonn´e, admet une densit´e que l’on calculera.
(ii) Calculer la loi de X(1), de X(n), du couple (X(1), X(n)) et enfin de X(i)pour i∈ {2, . . . , n 1}.
8. Convolution de mesures. Soit dNet Ψ : Rd×RdRdl’application d´efinie par Ψ(x, y) = x+y. Soit µet ν
deux mesures born´ees d´efinies sur la tribu bor´elienne de Rd. On appelle produit de convolution de µet νet on note
µν, la mesure sur Rdimage de µνpar l’application Ψ.
(a) Montrer que le produit de convolution de deux mesures de probabilit´e est une mesure de probabilit´e.
(b) Montrer que pour toute partie mesurable Hde Rd,
µν(H) = ZRd
ν(Hx)(x) = ZRd
µ(Hy)(y).
(c) Montrer que est une loi de composition interne commutative et associative dans l’ensemble des mesures de
probabilit´e et admet comme ´el´ement neutre δ0.
(d) Soit Xet Ydeux variables al´eatoires ind´ependantes de lois respectives µet ν. Montrer que la variable al´eatoire
X+Ya pour loi µν.
(e) En d´eduire par r´ecurrence que si X1, . . . , Xnsont des variables al´eatoires ind´ependantes de lois respectives µ1, . . . , µn
alors la v.a. Sn=Pn
i=1 Xia pour loi µ1∗ ··· ∗ µn.
9. Loi de la somme de v.a. ind´ependantes. Convolution de densit´es. On suppose dans cet exercice que X1, . . . , Xn
(nN) sont des v.a.r. ind´ependantes, et on pose Sn=Pn
i=1 Xi. L’exercice pr´ec´edent a montr´e que la loi de Snest la
convolution des lois des Xi.
(a) Convolution de lois discr`etes. On suppose de plus dans cette question que X1et X2sont `a valeurs dans N;
pour tout kN,pk=P(X1=k) et qk=P(X2=k). Montrer que pour tout kN:
P(S2=k) =
k
X
i=0
piqki=
k
X
i=0
pkiqi.
(b) Exemples.
(i) Quelle est la loi de Snsi pour tout i∈ {1, . . . , n},Xisuit la loi de Bernoulli B(p) o`u p[0,1] ? En d´eduire
la loi de Snlorsque pour tout i∈ {1, . . . , n},Xisuit la loi binomiale B(ki, p), o`u kiN.
(ii) Quelle est la loi de Snsi pour tout i∈ {1, . . . , n},Xisuit la loi de Poisson de param`etre λi>0 ?
(iii) Quelle est la loi de la somme de nvariables g´eom´etriques G(p) (sur N) ? Dans un jeu de pile ou face, que
mod´elise cette loi ? Cette loi porte aussi les noms de loi de Pascal, ou loi binomiale n´egative, de param`etres
net p.
2
(c) Convolution de lois `a Lebesgue-densit´e. Dans cette question, on suppose que X1et X2sont `a densit´e par
rapport `a la mesure de Lebesgue sur R, not´ees respectivement fet g. Montrer que S2admet pour densit´e fg,
c’est-`a-dire la fonction d´efinie par :
yR, f g(y) = ZR
f(x)g(yx)dx =ZR
f(yx)g(x)dx.
(d) Exemples.
(i) Lois normales. Quelle est la loi de Sn, si pour tout i∈ {1, . . . , n}Xisuit la loi normale N(µi, σ2
i), o`u
(µi, σ2
i)R×R+? Si µ1=··· =µn=µet σ2
1=··· =σ2
n=σ2, quelle est la loi de Xn=Sn
n?
(ii) Mˆemes questions avec les lois de Cauchy.
(e) Convolution d’une loi discr`ete et d’une loi `a densit´e. On suppose maintenant que X1est `a valeurs dans
Navec pour tout nN,pn=P(X1=n) et que X2admet une densit´e fpar rapport `a la mesure de Lebesgue.
Montrer que S2admet une densit´e par rapport `a la mesure de Lebesgue, qu’on d´eterminera.
(f) Exemple. Calculer la densit´e de S2lorsque X1suit la loi normale centr´ee r´eduite et X2suit la loi de Rademacher,
c’est-`a-dire : P(X2= 1) = P(X2=1) = 1
2.
(g) Interpr´eter les questions (a),(c),(e) de cet exercice en termes de convolution de mesures et d’absolue continuit´e.
`
A noter. Dans beaucoup de cas (ceux `a Lebesgue-densit´e surtout), il est possible de calculer la fonction ca-
ract´eristique (f.c.) des lois concern´ees. Il est `a noter qu’avec la f.c., les calculs, notamment de convolution, sont souvent
plus simples. En effet, la f.c. (qui ´equivaut `a une transform´ee de Fourier) transforme la convolution en produit : si X
et Ysont deux v.a.r. ind´ependantes, ϕX+Y(t) = ϕX(t)ϕY(t) pour tout tR. Voir le TD de Probabilit´es et analyse
stochastique.
10. Lois Gammas. Lois exponentielles. Lois du Chi-deux. Pour a > 0, on pose Γ(a) = R
0exxa1dx. On rappelle
que la fonction Γ est d´efinie sur R+; qu’elle v´erifie la relation Γ(a+ 1) = aΓ(a) pour tout a > 0 (faire une int´egration
par parties) et que pour tout nN, Γ(n) = (n1)!.
Une variable al´eatoire r´eelle est dite v.a. gamma de param`etres aet λ(a > 0, λ > 0), not´ee G(a, λ), si sa loi a la
Lebesgue-densit´e γa,λ, o`u :
xRγa,λ(x) = λa
Γ(a)eλxxa11R+(x).
(a) Soit Xune variable al´eatoire de loi G(a, λ). Calculer E(X) et Var(X). On pourra mˆeme montrer que pour tout
t > 0,E(Xt) = Γ(a+t)
λtΓ(a).
(b) Soit Xune v.a. de loi G(a, λ) et µ > 0. Montrer que µX a pour loi G(a, λ/µ).
(c) Soient Xet Ydeux v.a. ind´ependantes de lois respectives G(a, λ) et G(b, λ). On pose U=X+Y,V=X
X+Yet
W=X/Y .
(i) Montrer que le couple (U, V ) a pour densit´e de probabilit´e
f(U,V )(u, v) = λa+b
Γ(a)Γ(b)eλuua+b1va1(1 v)b11]0,[×]0,1[(u, v)
(ii) En d´eduire que Uet Vsont ind´ependantes, que Z1
0
xa1(1 x)b1dx =Γ(a)Γ(b)
Γ(a+b), et que Γ(1/2) = π.
(iii) Montrer que U=X+Ya pour loi G(a+b, λ) et en d´eduire la loi de la somme Snde nvariables ind´ependantes
de lois G(a1, λ), . . . , G(an, λ).
(iv) Calculer la loi de V.La loi de Vest appel´ee loi Beta de premi`ere esp`ece de param`etres aet b.
(v) Montrer que Uet Wsont ind´ependantes et calculer la loi de W.Cette loi est appel´ee loi Beta de seconde
esp`ece.
(d) Loi exponentielle. Montrer que la loi exponentielle E(λ) correspond `a la loi G(1, λ). En d´eduire la loi de la somme
Snde nvariables ind´ependantes de loi E(λ).
(e) Loi du chi-deux. Soit X= (X1, . . . , Xn) un n-´echantillon de loi N(0,1). Montrer que la loi de la v.a. kXk2
2=
Pn
k=1 X2
kest G(n/2,1/2). Cette loi est aussi appel´ee loi du chi-deux `a ndegr´es de libert´e et est not´ee χ2(n).
11. Loi de Fisher. On suppose que Uet Vsont deux variables ind´ependantes telles que Uχ2(m) et Vχ2(n). Montrer
que S=U+Vet F=U/m
V/n sont ind´ependantes et d´eterminer la loi de F.Cette loi est aussi appel´e loi de Fisher de
degr´es de libert´e met n. Elle apparaˆıt lors de tests statistiques dans le mod`ele lin´eaire.
12. Loi de Student. On suppose que Xet Usont deux variables ind´ependantes telles que X∼ N(0,1) et Uχ2(n).
Montrer que la variable T=X
U/n admet une densit´e que l’on calculera. La loi de Test appel´ee loi de Student `a n
degr´es de libert´e.
3
Mod`eles usuels. Mod`eles exponentiels.
13. Dans chacun des cas suivants, donner le mod`ele correspondant au n-´echantillon d’observations X= (X1, . . . , Xn), et
´etudier sa domination (le cas ´ech´eant, donner les densit´es par rapport `a la mesure dominante), son identifiabilit´e, et
pr´eciser s’il est de type exponentiel (`a ne pas confondre avec les lois exponentielles...).
(a) Mod`eles discrets usuels.
(i) Xisuit la loi de Bernoulli B(θ), o`u θ[0,1].
(ii) Xisuit la loi uniforme U({0,1, . . . , θ}) o`u θN.
(iii) Xisuit la loi de Poisson P(θ), o`u θR+.
(b) Mod`eles `a Lebesgue-densit´e usuels.
(i) Xisuit la loi uniforme U([0, θ]) ; o`u θR+.
(ii) Xisuit la loi normale N(m, σ2), o`u θ= (m, σ2)R×R+.
(iii) Xisuit la loi gamma G(a, λ), o`u θ= (a, λ)R+×R+.
14. Quelques propri´et´es des mod`eles exponentiels.
(a) Montrer que si un mod`ele est exponentiel, alors le mod`ele ´echantillonnage associ´e est encore exponentiel.
(b) Montrer que si un mod`ele est exponentiel, alors le mod`ele image par la statistique privil´egi´ee Test encore exponentiel.
(c) Montrer qu’un mod`ele domin´e est exponentiel si et seulement s’il est homog`ene et la famille {ln fθ;θΘ}est
de dimension finie. Dans ce cas, une famille g´en´eratrice est donn´ee par X, T1, . . . , Tro`u T= (T1, . . . , Tr) est une
statistique privil´egi´ee.
15. Mod`eles exponentiels et statistiques d’ordre.
(a) Montrer que si (X,(Pθ)θΘ) est un mod`ele exponentiel, alors le mod`ele image par les statistiques d’ordre, c’est-`a-
direcelui associ´e aux observations (X(1), . . . , X(n)), est aussi exponentiel.
(b) On consid`ere le mod`ele Rn,(Pn
(λ,a))(λ,a)R×R+o`u P(λ,a)admet pour densit´e x7→ λeλ(xa)R+(xa).
(i) Calculer le mod`ele image par les statistiques d’ordre.
(ii) Montrer que le mod`ele image associ´e aux observations (X(2) X(1), . . . , X(n)X(1)) est exponentiel, et que
le param`etre λsuffit `a l’identifier.
4
1 / 4 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !