Que faire lorsqu`on considère plusieurs variables en même temps ?

Chapitre 3
Que faire lorsqu’on considère
plusieurs variables en même temps ?
On va la plupart du temps se limiter à l’étude de couple de variables aléatoires, on peut
bien sûr étendre les notions introduites à l’étude de nvariables aléatoires, n2.
On considère deux variables aléatoires Xet Y. On aimerait savoir s’il existe un lien entre
les deux variables et le quantifier.
Exemple 0.1 On peut se demander s’il y a influence de la pollution par CO2sur l’évolution
des cancers . La variable Xmodélisera alors le taux de CO2 et la variable Yle nombre de
cancer.
1 Cas de variables indépendantes
On dit de deux variables qu’elles sont indépendantes si la connaissance de l’une ne donne au-
cune information sur la connaissance de l’autre. C’est le cas le plus simple à étudier. Lorsque
cela est possible, on essaye au maximum de travailler avec des variables indépendantes.
Définition 1.1 Deux variables aléatoires Xet Ysont indépendantes si pour tous intervalles
Aet Bde Ron a
IP(XA, Y B) = IP(XA)IP(YB).
Proposition 1.2 Deux v.a. Xet Ysont indépendantes
dans le cas discret pour tous x, y,
IP(X=x, Y =y) = IP(X=x)IP(Y=y),
dans le cas continu, notons fXla densité de Xet fYla densité de Y, on a
pour tout intervalles A, B de R
IP(XA, Y B) = !A
fX(x)dx !B
fY(y)dy.
la transformée de Laplace du couple vérifie pour tout (u, v),
L(X,Y )(u, v) = LX(u)LY(v)L(X,Y )(u, v) = E[euX+vY ].
33
34 CHAPITRE 3. COUPLE DE VARIABLES
pour toutes fonctions h, g :RR
E[h(X)g(Y)] = E[h(X)]E[g(Y)].
Définition 1.3 Les variables aléatoires X1, . . . , Xnsont indépendantes si pour tout inter-
valles A1, . . . , Ande Ron a
IP(X1A1, . . . , XnAn) =
n
"
i=1
IP(XiAi).
Une suite de variables (Xn)nindépendantes est une suite telle que pour toute sous partie
finie IN, les variables (Xi)iIsont indépendantes.
Remarque 1.4 Si les v.a. X1, . . . , Xnsont indépendantes, alors elles sont indépendantes
deux à deux.
Attention La réciproque est fausse ! Par exemple, soient Xet Ydeux variables indépen-
dantes de même loi : IP(X= 1) = IP(X=1) = 1/2. On considère Z=XY . Les variables
sont deux à deux indépendantes, mais pas mutuellement indépendantes.
Dans la nature les objets, les événements, les comportements sont rarement indépendants
les uns des autres. Modéliser la chaîne de nucléotides dans un brin d’ADN par des variables
indépendantes à valeurs dans {a, c, g, t}est trop simpliste et loin de la réalité car on sait
qu’il y a des zones codantes et d’autres non.
Exemple 1.5 Considérons les enfants de parents hétérozygotes de génétopye Aa. La dis-
tribution des enfants est
IP(AA) = 1/4IP(Aa) = 1/2IP(aa) = 1/4.
On choisit de façon aléatoire 240 de ces enfants. On définit N1, N2, N3le nombre d’enfants
de génotype AA,Aa et aa respectivement.
1. Les variables N1,N2et N3suivent respectivement des lois Binomiales B(240,1/4),
B(240,1/2) et B(240,1/4).
2. Ces variables ne sont pas indépendantes, car N1+N2+N3= 240 (si on connait les
valeurs de N1et N2, on en déduit facilement la valeur de N3).
3. Soit k1, k2, k3N. Si k1+k2+k3'= 240, on a
IP(N1=k1, N2=k2, N3=k3) = 0.
Si k1+k2+k3= 240, on a
IP(N1=k1, N2=k2, N3=k3) = 240!
k1!k2!k3!#1
4$k1#1
2$k2#1
4$k3.
On remarque que
IP(N1=k1, N2=k2, N3=k3)'=IP(N1=k1)IP(N2=k2)IP(N3=k3).
Les variables ne sont eectivement pas indépendantes.
On dit que le triplet (N1, N2, N3)suit la loi multinomiale M(240,(1/4,1/2,1/4)).
2. QUE FAIRE S’IL EXISTE UN LIEN ENTRE LES VARIABLES ? 35
Définition 1.6 On eectue un sondage avec remise (ou sur une population susament
grande) avec dréponses possibles sur une sous-population de taille n.
On note p1la proportion dans la population totale d’individu correspondant à la première
réponse, p2la proportion dans la population totale d’individu correspondant à la deuxième
réponse, . . . , pdla proportion dans la population totale d’individu correspondant à la der-
nière réponse.
On définit N1le nombre d’individus ayant choisi la première réponse, N2ceux qui ont choisi
la seconde,. . . , Ndceux qui ont choisi la dernière réponse.
Alors la loi de (N1, N2, . . . , Nd)est appelée loi multinomiale Md(n, p), avec nN,
n1,pi]0,1[ tels que p1+p2+.. +pd= 1.
P(N1=k1, N2=k2, ..., Nd=kd) = n!
k1!k2!...kd!pk1
1pk2
2...pkd
davec
d
%
i=i
ki=n
C’est une généralisation de la loi Binomiale. Pour d= 2, on retrouve la loi Binomiale.
2 Que faire s’il existe un lien entre les variables ?
Comme on a définit la loi d’une variable aléatoire, on va définir la loi d’un couple de variables.
2.1 Cas des variables discrètes
Propriétés 2.1 Soient Xet Ydeux variables discrètes. La loi du couple (X, Y )est définie
par l’ensemble des probabilités :
IP(X=x, Y =y)pour toutes valeurs possibles xet y.
Remarque 2.2 Notons DXet DYl’ensemble des valeurs possibles de Xet de Yrespecti-
vement. On peut retrouver les lois de chacune des variables à partir la loi de couple.
Soit xDX, on a
IP(X=x) = IP(X=xet YDY) = %
yDY
IP(X=x, Y =y)
De même, pour yDY, on a IP(Y=y) = &xDXIP(X=x, Y =y).
À partir de la loi du couple, on retrouve facilement la loi de chacune des variables. Par
contre, des lois de chacune des variables on ne peut pas déduire la loi du couple, car elles
ne rendent pas compte des connections, des liens qui existent entre les variables.
Dans le cas où les variables sont discrètes et prennent un petit nombre de valeurs, on écrit
en général la loi du couple sous la forme d’un tableau :
Y\X . . . Somme des colonnes
.
.
. IP(X=x, Y =y)IP(Y=y)
Somme des lignes IP(X=x)
36 CHAPITRE 3. COUPLE DE VARIABLES
Exemple 2.3 1. On lance une pièce truquée 3 fois. La probabilité de tomber sur "Pile"
est 2/3. Soit Xle nombre de "Face" obtenu dans les deux premiers jets et Yle nombre
de "Face" obtenu dans les deux derniers jets. La loi de (X, Y )est donnée par
y\x0 1 2 IP(Y=y)
0'2
3(3=8
27
1
3'2
3(2=4
27 0 4/9
11
3'2
3(2=4
27
1
3'2
3(2+'1
3(22
3=6
27 '1
3(22
3=2
27 4/9
2 0 '1
3(22
3=2
27 '1
3(3=1
27 1/9
IP(X=x) 4/9 4/9 1/9
2. L’université de Rennes 1 veut évaluer l’eet de l’ore MIPE sur le campus et voir
quel système d’exploitation est apprécié des étudiants. Les proportions collectées sont
résumées dans un tableau :
Système d’exploitation
Filière Windows Mac OS Linux
Biologie 0.07 0.05 0.02
Droit/Économie 0.08 0.02 0
Informatique 0.25 0.13 0.09
Mathématiques 0.21 0.04 0.04
On déduit de ce tableau les proportions d’élèves qui ont profité de l’ore MIPE en
fonction des filières, ainsi que la répartition des systèmes d’exploitation sur le campus.
Exercice 2.4 On eectue une suite infinie de lancers indépendants d’un dé équilibré. On
note les lancers à partir de 1. On définit les deux variables aléatoires :
Xest égale au numéro du lancer qui donne le premier 6,
Yest égale au nombre de 5obtenus avant le premier 6.
Déterminer la loi du couple (X, Y ).
Corrigé : Le couple est à valeurs dans N×Navec Y < X. Par conséquent si kn, IP(X=n, Y =k) = 0
et si k < n,
IP(X=n, Y =k) = IP(“k fois 5et pas de 6sur les n1premiers lancers et un 6au nème lancer.”)
= n1
k!1
6«k4
6«n1k1
6.
!
2.2 Cas des variables à densité
Définition 2.5 La loi du couple de v.a. (X, Y )est dite à densité s’il existe une fonction
f(X,Y )de deux variables telle que le fonction de répartition du couple vérifie pour tout
(u, v)R2
IP(Xu, Y v) = !u
−∞ !v
−∞
f(X,Y )(x, y)dxdy
satisfaisant les conditions suivantes :
1. f(X,Y )(x, y)0pour tout (x, y)R2,
2. QUE FAIRE S’IL EXISTE UN LIEN ENTRE LES VARIABLES ? 37
2. !+
−∞ !+
−∞
f(X,Y )(x, y)dxdy = 1.
On peut facilement retrouver la densité à partir de la fonction de répartition. En dérivant
une fois par rapport à chacune des variables la fonction de répartition, on obtient
f(X,Y )(u, v) = 2
uvF(X,Y )(u, v).
Proposition 2.6 Si le couple (X, Y )admet une densité. Alors, pour tout AR×R
IP((X, Y )A) = !!A
f(X,Y )(x, y)dxdy.
Par conséquent, Xet Ysont indépendantes si et seulement si pour tous x, y
f(X,Y )(x, y) = fX(x)fY(y).
Remarque 2.7 De même que pour les variables discrètes, on peut retrouver facilement les
lois de chacune des variables. Soit uR, on a
FX(u) = IP(Xu) = IP((X, Y )]− ∞, u]×]− ∞,+[)
=!u
−∞ )!+
−∞
f(X,Y )(x, y)dy*dx.
La densité de Xest fX(x) = !+
−∞
f(X,Y )(x, y)dy. De même, la densité de Yest fY(y) = !+
−∞
f(X,Y )(x, y)dx.
Exemple 2.8 1. Considérons le couple (X, Y )de densité f(X,Y )(x, y) = 3/8(x2+xy/2)I[0,1]×[0,2](x, y).
Cette fonction est bien une densité de probabilité. On en déduit la densité de X:
fX(x) = !+
−∞
f(X,Y )(x, y)dy =!2
0
3
8(x2+xy
2)dy
=3
4x(x+ 2) si x[0,1]
On peut calculer par exemple IP(X > Y ):
IP(X > Y ) = !+
−∞ #!x
−∞
f(X,Y )(x, y)dy$dx =!1
0)!x
0
3
8(x2+xy
2)dy*dx
=3
8!1
0
2x3dx =1
4.
2. Considérons le couple (X, Y )de densité
f(X,Y )(x, y) = c(y2x2)eysi y < x < y, y > 0
Cette fonction est bien une densité de probabilité lorsque c= 1/8. Les densités de X
et Ysont :
fX(x) = 1
4(|x|+ 1)e|x|pour xR
et fY(y) = 1
6y3eypour y > 0
1 / 12 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !