Chapitre 1
Notions fondamentales de la
Théorie des Probabilités
Université d’Artois
Faculté des Sciences Jean Perrin
Probabilités (Master 1 Mathématiques-Informatique)
Daniel Li
Dans ce chapitre, nous allons donner les définitions de base concernant la
Théorie des Probabilités.
Il faut plutôt voir ce cours plus comme un cours de techniques probabilistes
que comme un cours de Probabilités : on ne cherchera pas à donner d’interpré-
tation “concrète” des notions et des résultats présentés dans ce cours. C’est en
quelque sorte le “minimum vital de Probabilités” que doit posséder tout mathé-
maticien.
1 Espace de probabilité
Une probabilité (ou mesure de probabilité) est une mesure positive P
sur un espace mesurable (Ω,A)telle que P(Ω) = 1 . On dit aussi loi de pro-
babilité. Le triplet (Ω,A,P)est appelé espace de probabilité.
La Théorie des Probabilités utilise la Théorie de la mesure, mais, pour des
raisons historiques, a un langage qui lui est propre (ce qui est d’ailleurs peut-être
à l’origine de la réticence, voire de l’ostracisme, dont la majorité des mathéma-
ticiens ont fait preuve par le passé, et encore parfois aujourd’hui, envers les
Probabilités). On a le dictionnaire suivant :
notation point de vue ensembliste point de vue probabiliste
ωpoint de observation
AApartie mesurable événement
ωA ω est dans la partie Al’événement Aest réalisé par ω
AB A est contenu dans B A implique B
ensemble vide événement impossible
ensemble plein événement certain
ABréunion de Aet B A ou B
ABintersection de Aet B A et B
1
Si l’on considère qu’un espace de probabilité est la modélisation d’une expé-
rience, un point ωde peut aussi être vu comme le résultat, ou la réalisation,
de l’expérience modélisée par (Ω,A,P). On dit aussi que ωest une éventualité.
Par rapport au point de vue ensembliste, dans lequel la notion de base est le
point, qui peut ou non appartenir à une partie donnée, dans le point de vue pro-
babiliste, il faut plutôt inverser les rôles : la notion de base est l’ensemble des
événements, et chaque événement peut être réalisé ou non par une observation.
Pour deux événements Aet B, dire que ωABs’exprime en disant que
ωréalise l’événement Aou l’événement B, et ωABen disant que ωréalise
l’événement Aet l’événement B.
Comme Aest une tribu, si l’on a une famille dénombrable d’événements
An,n>1, alors les ensembles suivants sont des événements :
Sn>1An: on a ωSn>1Ansi l’un au moins des événements Anest réalisé
par ω.
Tn>1An: on a ωTn>1Ansi tous les événements Ansont réalisés par ω.
lim
n→∞ An: on a ωlim
n→∞ An=Tn>1Sk>nAksi une infinité des événements
Ansont réalisés par ω.
lim
n→∞
An: on a ωlim
n→∞
An=Sn>1Tk>nAksi tous les événements An,
sauf un nombre fini, sont réalisés par ω.
On a bien sûr lim
n→∞
Anlim
n→∞ An.
Le résultat suivant, bien que très facile, est extrêmement utile.
Théorème 1.1 (Lemme de Borel-Cantelli)
Si
P
n=1
P(An)<+, alors on a : Plim
n→∞ An= 0 .
Définition 1.2 Pour tout événement A, on dit que :
Aest presque impossible si P(A) = 0 ;
Aest presque sûr, ou presque certain, si P(A) = 1.
La notion de “presque sûr” est la version probabiliste de la notion de “presque
partout”. Lorsque l’événement Aest l’ensemble des ωpour lesquels une certaine
propriété est vraie, on dit que cette propriété est presque sûrement vraie
si Aest presque sûr. On notera en abrégé p.s. pour “presque sûrement”.
Comme lim
n→∞ An)c= lim
n→∞
(Ac
n), le lemme de Borel-Cantelli dit que, sous
l’hypothèse Pn>1P(An)<+, on a lim
n→∞
(Ac
n)presque sûrement ; par consé-
quent, le lemme de Borel-Cantelli s’exprime de la façon plus utile suivante :
2
Théorème 1.3 (Lemme de Borel-Cantelli) Si P
n=1 P(Bc
n)<+, alors
presque sûrement,tous les événements Bnsont réalisés, à l’exception d’un
nombre fini.
Preuve 1. Pour tout n>1, on a PSk>nAk6Pk>nP(Ak); donc, puisque
la suite Sk>nAkn>1est décroissante :
Plim
n→∞ An= lim
n→∞
P[
k>n
Ak6lim
n→∞ X
k>n
P(Ak) = 0 ,
puisque la série converge.
Preuve 2. La condition Pn>1P(An)<+signifie que la fonction Pn>11IAn
est P-intégrable ; elle est donc finie P-presque partout, ce qui est le résultat
annoncé.
2 Variables aléatoires
Définition 2.1 On appelle variable aléatoire, en abré v.a. (vectorielle,
à valeurs dans Rd), toute application mesurable X: (Ω,A)Rd,Bor (Rd).
Pour d= 1, on autorise Xà prendre ses valeurs dans R; elle doit donc être
mesurable pour Bor (R). On dit que c’est une variable aléatoire réelle ; en
abrégé v.a.r. .
On conviendra par la suite que R1=R.
Si d > 1, on dira aussi vecteur aléatoire.
Si X= (X1, . . . , Xd)est un vecteur aléatoire, alors les Xksont des v.a.r. ; ré-
ciproquement, si X1, . . . , Xdsont des v.a.r., à valeurs dans R, alors (X1, . . . , Xd)
est un vecteur aléatoire.
Remarque. Il faut noter que, contrairement à ce que peux laisser croire le
nom, une variable aléatoire est une fonction, et non pas une variable. Cette
terminologie trompeuse est, là encore, due à des raisons historiques, datant de
l’époque où l’on avait pas conscience de la distinction entre une fonction et sa
valeur en un point.
Terminologie. On dit que la v.a.r. Xa un moment d’ordre p,16p < , si X
Lp(Ω,A,P). Lorsque Xest intégrable (on utilisera plutôt ce terme que celui
de moment d’ordre 1), son intégrale est appelée espérance (mathématique) de
X; on dit aussi que c’est la moyenne de X. On la note :
E(X) = Z
X dP.
3
On dit que la variable aléatoire Xest centrée lorsque E(X) = 0. La v.a.r.
XE(X)(mis pour XE(X)1I) est appelée la v.a. centrée associée à X; elle
est évidemment centrée.
Lorsque XL2(Ω,A,P), on définit la variance de Xpar :
Var (X) = E[XE(X)]2.
Ce nombre (qui est positif) mesure les variations de Xautour de sa moyenne.
On la calcule habituellement par la formule suivante :
Proposition 2.2 Var (X) = E(X2)[E(X)]2.
Preuve. Il suffit de développer :
E[XE(X)]2=EX22E(X)X+ [E(X)]2
=E(X2)2E(X)E(X)+[E(X)]2,
car E(1I) = 1.
Notons que l’on a Var (aX) = a2Var (X)pour tout aR. Pour revenir à
l’ordre de grandeur initial, on utilise l’écart-type :
σX=pVar (X).
Autrement dit : σX=kXE(X)kL2(Ω,A,P).
Le nombre kXkL2(P)= [E(X2)]1/2est appelé moyenne quadratique de X.
Lorsque l’on mesure les résultats d’une expérience aléatoire par une variable
aléatoire X, l’espace de probabilité (Ω,A,P)est une modélisation de la si-
tuation liée à cette expérience. Cette modélisation peut être faite de diverses
façons, ce qui veut dire que l’espace (Ω,A,P), et en particulier la probabi-
lité P, n’a pas de sens intrinsèque. Ce qui est important, c’est la répartition
des valeurs que peut prendre X, et leur fréquence. C’est pourquoi le concept
suivant, qui précise ces fréquences d’apparitions, est fondamental ; d’ailleurs
avant l’axiomatisation de la Théorie des Probabilités par Kolmogorov en 1933,
les Probabilistes ne voyaient les variables aléatoires qu’à travers leur loi.
Définition 2.3 On appelle loi de la variable aléatoire Xla mesure-image
de la probabilité Ppar X. On la note PX. On dit aussi loi de probabilité
de X. On l’appelle encore la distribution de la variable aléatoire X.
Cela signifie que pour tout borélien Bde Rd, on a :
PX(B) = P(XB),
4
P(XB)étant la notation usuelle pour :
P({ωΩ ; X(ω)B}) = PX1(B).
PXest donc une mesure de probabilité sur Rd. Si Qest une mesure de proba-
bilité sur Rd, on note XQpour exprimer que Xa la loi Q, c’est-à-dire que
Q=PX; on a donc XPX.
Si la loi de Xa une densité fXpar rapport à la mesure de Lebesgue, on dit
que Xpossède la densité fX.
Rappelons que pour toute fonction f:RdRborélienne positive ou PX-
intégrable, on a :
ZRd
f(x)dPX(x) = Z
f[X(ω)] dP(ω),
soit : ZRd
f(x)dPX(x) = Ef(X),
f(X)est la notation habituelle pour la composée fX.
Ainsi, lorsque Xest une v.a.r.,Xest intégrable si et seulement si P({X=
−∞}) = P({X= +∞}) = 0 et :
ZR|x|dPX(x)<+;
et alors :
E(X) = ZR
x dPX(x).
On notera que, Xétant intégrable, elle est presque sûrement finie, c’est-à-dire
presque sûrement à valeurs dans R(soit PX({−∞,+∞})=0) ; on peut donc
intégrer sur Rau lieu d’intégrer sur R.
Pour une expérience mesurée par une v.a. X, il est important de savoir quels
sont les événements liés à cette expérience.
Définition 2.4 On appelle tribu engendrée par la variable aléatoire X
la plus petite sous-tribu AXde Apour laquelle Xreste mesurable.
On la note aussi σ(X)(à ne pas confondre avec l’écart-type !).
Proposition 2.5 On a : AX={X1(B) ; BBor(Rd)}.
5
1 / 16 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !