ce qui revient à dire que, pour tout h:
E[h(X)uf(X)] = E[h(X)f(Y)].(3)
De plus si gest une fonction telle que E[h(X)g(X)] = E[h(X)f(Y)] pour tout hmesurable
bornée, alors on a que g(x) = uf(x)pour tout xtel que P(X=x)>0. En effet, si r(x) = g(x)−
uf(x)on doit avoir que E[h(X)r(X)] = 0 et donc en choisissant h(x) = sign r(x)on a que
E[h(X)r(X)] = E[|r(X)|] = Px:P(X=x)>0|r(x)|P(X=x) = 0 ce qu’implique que r(x) = 0 pour
tout xtq. P(X=x)>0. De plus on a que la v.a. P(uf(X)g(X)) = 0 et donc que uf(X) =
g(X)presque sûrement.
On utilisera donc l’eq. (3) pour définir directement l’espérance conditionnelle comme une v.a.
E[f(Y)|X] = uf(X)telle que (3) soit satisfaite pour tout hmesurable bornée (en effet il suffit
que soit valable pour tout h(x) = 1A(x)fonction caractéristique d’un ensemble Amesurable). Le
prix à payer est que l’unicité de l’espérance conditionnelle est valable « à ensemble de mesure
nulle prés »: il est clair que on peut changer la définition de uf(x)pour tout x∈Boù Best
n’importe quel evenement tel que P(X∈B) = 0 sans affecter la propriété (3). L’avantage
majeure de cette nouvelle définition est sa généralité.
3 Sous-tribus
Soit (Ω,F,P)un espace de probabilité. Soit Xune variable aléatoire (F-mesurable) à valeurs
dans Rd. La tribu σ(X)engendrée par Xest la plus petite sous-tribu B ⊆ F telle que Xsoit B-
mesurable. Une caractérisation équivalente (pour laquelle on donne pas de preuve) est que σ(X)
est l’image par X−1de la tribu Borelienne de Rd:
σ(X) = A∈ F:∃B∈ B(Rd), A ={ω∈Ω: X(ω)∈B}.
En général si (X1,, Xn)est un n-uplet de v.a. réelles alors σ(X1, , Xn) = σ(X)où X=
(X1, , Xn)est une v.a. à valeurs dans Rn. La généralisation à une suite finie des v.a. vecto-
rielles ne pose pas de problèmes.
On utilisera le résultat suivante (admis) dans la suite.
Théorème 1. Soit Xune v.a. à valeurs dans l’espace mesurable (Θ,H)et Yune v.a. réelle
σ(X)mesurable. Alors il existe une fonction mesurable h: Θ →Rtelle que Y=h(X).
(Ω, σ(X)) X(Θ,H)
Yց ւh◦X
(R,B(R))
Exemple 2. Soit X= 1 avec probabilité pet X= 0 avec probabilité 1−p. Alors
σ(X) = ∅,Ω, X −1({0}), X−1({1}).
Les sous-tribus B ⊆ F que nous allons considérer vont correspondre à des informations partielles
sur le modèle. Au sens que l’information nous permet de répondre de façon sûre à la question si
l’expérience aléatoire ω∈Ωappartient à un ensemble B∈ B. Par exemple σ(X)doit être inter-
prété comme l’information sur ωdonnée par la connaissance de la valeur de X. La tribu triviale
{∅,Ω}correspond à une information nulle, et la tribu Fest une information complète.
Exemple 3. Soit Ω = [0,1], et F=B([0,1]), la tribu borelienne sur [0,1] (i.e. la tribu engendrée
par les sous-ensembles ouverts de [0,1]). Soit F1=σ(0,1/2],]1/2,1]) = {[0,1/2],]1/2,1],[0,1],∅}.
Alors la tribu F1⊂ F, et permet de savoir si le point se trouve à gauche ou à droite de 1/2. En
particulier, si X1(ω) = 1[0,1/2](ω), ω ∈Ω, alors F1=σ(X1). Soit maintenant X2(ω) = 1[0,1/4](ω) +
1]1/2,3/4](ω), et F2=σ(X1, X2). Alors
F2=σ([0,1/4],]1/4,1/2],]1/2,3/4],]3/4,1])
2Section 3