Covariance

Telechargé par yass.m09
Optimal Sup-Spé. Le n°1
Calculer une covariance
Maths Spé - Concours 2015
Problématique
Comment calculer la covariance d’un couple de variables aléatoires réelles discrètes Xet Ydéfinies sur un même
espace probabilisé p, A, P q? Quelles sont les propriétés de la covariance ?
Réponse
Attention !
Rappelons pour commencer que la covariance d’un couple de variables aléatoires n’existe pas toujours ! Pour
justifier l’existence de la covariance d’une variable aléatoire, deux cas se présentent :
si pX, Y qpqest fini, alors le couple pX, Y qadmet une covariance,
si pX, Y qpqest infini, alors le couple pX, Y qadmet une covariance admet une variance si et seulement
si, la série double ř
pxi,yjqPpX,Y qpq
pxi´EpXqqpyj´EpYqqPpXxi, Y yjqconverge.
Une condition suffisante d’existence : si Xet Yadmettent un moment d’ordre 2, alors le couple pX, Y qadmet
une covariance.
Rappel de cours
Théorème de transfert pour un couple de variables aléatoires. Si la série double
ř
pxi,yjqPpX,Y qpq
fppxi, yjqPpXxi, Y yjqconverge, alors fppX, Y qq admet une espérance, et on a alors :
EpfppX, Y qqq “ ř
pxi,yjqPpX,Y qpq
fppxi, yjqPpXxi, Y yjq.
Lorsque l’existence de la covariance du couple pX, Y qa été établie, on a alors le choix entre utiliser la définition
(rare) ou la formule de Huygens. :
Optimal Sup/Spé - 11, rue Geoffroy l’Angevin 75004 Paris - tel : 01.40.26.78.78 - www.optimalsupspe.fr
-Concours 2015 2
Rappel de cours
Définition.
covpX, Y q “ ErpX´EpXqqpY´EpYqqs.
Formule de König-Huygens.
covpX, Y q “ EpXY q ´ EpXqEpYq.
Propriétés.
covpX, Xq “ VpXq,
covpX, Y q “ covpY, Xq,
covpaX `bY, Zq “ a covpX, Zq ` b covpY, Zq.
1. Le calcul de la covariance : attention au support de pX, Y q
Pour calculer la covariance, il faut le plus souvent se ramener à la formule de König-Huygens et calculer EpXY q.
Dans ce calcul, qui se fait toujours à l’aide du théorème de transfert, il ne faut pas oublier qu’il s’agit d’une double
somme, et non d’une somme simple. Attention également aux indices : dans certains exercices, il peut arriver que X
et Ysoient liées, par exemple que Xsoit toujours inférieure à Y. Il faut calculer la somme sur le support du couple,
à savoir sur pX, Y qpq. Par exemple, si Xreprésente le plus petit numéro obtenu et Yle plus grand numéro obtenu
dans une suite de deux tirages sans remise d’une boule dans une urne contenant nboules numérotées de 1àn, alors X
est toujours inférieur strictement à Y. Dans cet exemple, il ne faut pas calculer la double somme pour chaque valeur
iet jde Xet de Ymais pour chaque valeur possible pi, jqdu couple pX, Y q, avec ici la condition iăj.
2. Covariance et corrélation linéaire
Lorsque covpX, Y q ą 0, on dit que les variables Xet Ysont positivement corrélées. L’interprétation d’une cova-
riance positive est la suivante : plus Xest élevé, plus, en moyenne, Yest élevé (et réciproquement).
Lorsque covpX, Y q ă 0, on dit que les variables Xet Ysont négativement corrélées. L’interprétation d’une cova-
riance positive est alors la suivante : plus Xest élevé, plus, en moyenne, Yest petit (et réciproquement).
Enfin, lorsque covpX, Y q “ 0, on dit que les variables Xet Yne sont pas corrélées.
La covariance est un outil pour mesurer la corrélation linéaire entre deux variables aléatoires.
3. Le coefficient de corrélation linéaire
Rappel de cours
Le coefficient de corrélation linéaire. Lorsque pX, Y qadmet une covariance, on définit le coefficient de
corrélation linéaire du couple pX, Y q, et l’on note ρX,Y , le nombre :
ρX,Y covpX, Y q
σpXqσpYq.
Propriété. On a :
|ρX,Y |ď1.
Le coefficient de corrélation linéaire mesure le degré de corrélation entre Xet Y. Si ce coefficient vaut `1,Yest
une fonction affine (ou quasi affine) de X, c’est-à-dire que l’on a (presque sûrement) YaX `b, et l’on a : aą0.
De façon analogue, si ce coefficient vaut ´1,Yest une fonction affine (ou quasi affine) de X, c’est-à-dire que l’on a
(presque sûrement) YaX `b, et l’on a : aă0.
Plus le coefficient de corrélation entre Xet Yest élevé, plus la corrélation est forte entre les variables Xet Y. En
3-Concours 2015
statistiques, on a coutume d’évaluer qu’un modèle linéaire prédit correctement les variations de Yen fonction de X
dès lors que le coefficient de corrélation est supérieur en valeur absolue à 0,8.
4. Indépendance et corrélation.
Il faut se souvenir que deux variables indépendantes ne sont pas corrélées :
Rappel de cours
Si Xet Ysont indépendantes, alors covpX, Y q “ 0.
Attention !
La réciproque est fausse.
5. Un exemple
Considérons Xle plus petit numéro obtenu, et Yle plus grand numéro obtenu, dans une suite de deux tirages sans
remise d’une boule dans une urne contenant nboules numérotées de 1àn.
Des calculs de probabilités prouvent que pX, Y qpq “ pi, jq P rr 1, n ss2,1ďiăjďn(, et que pour tout couple
pi, jqPpX, Y qpq, P pXi, Y jq “ 2
npn´1q. Cette somme comportant ˆn
2˙termes (voir le Polycopié Dénom-
brements), on vérifie que la somme des probabilités fait 1, ce qui est le cas. Des calculs de lois, puis d’espérance,
prouvent également que : EpXq “ n`1
3, et que EpYq “ 2pn`1q
3(voir le Polycopié Probabilités). Intéressons-
nous ici au calcul de la covariance.
Commençons d’abord par préciser que Xet Yprennent un nombre fini de valeurs, donc admettent un moment
d’ordre 2, ce qui suffit à établir l’existence de la covariance de pX, Y q. On a, d’après le théorème de transfert :
EpXY q=ř
1ďiăjďn
ijP pXi, Y jq.
EpXY q “ 2
npn´1q
n
ř
j2
j
j´1
ř
i1
i
EpXY q “ 2
npn´1q
n
ř
j2
jpj´1qj
2.
EpXY q “ 1
npn´1q
n
ř
j2
pj3´j2q.
En ajoutant et en retranchant 1, il vient :
EpXY q “ 1
npn´1q
n
ř
j1
pj3´j2q.
EpXY q “ 1
npn´1qˆn2pn`1q2
4´npn`1qp2n`1q
6˙,
soit après calculs :
EpXY q “ pn`1qp3n`2q
12 .
D’après la formule de König-Huygens, il vient :
-Concours 2015 4
covpX, Y q “ pn`1qp3n`2q
12 ´EpXqEpYq.
Comme : EpXq “ n`1
3et que EpYq “ 2pn`1q
3, on a finalement :
covpX, Y q “ pn`1qp3n`2q
12 ´2pn`1q2
9,
et l’on peut ainsi conclure :
covpX, Y q “ pn`1qpn´2q
36 .
Interprétation du signe de la covariance : il est logique que covpX, Y q ą 0puisque ici, plus Xprend une valeur
élevée, plus, en moyenne Yprend une valeur élevé. En effet, si l’on a obtenu un grand numéro, noté k, comme valeur
pour X(i.e. si le plus petit des deux numéros est égal à k), cela interdit au plus grand des deux numéros obtenus, Y,
de prendre des valeurs petites (toutes les valeurs inférieures ou égales à kétant désormais impossibles). Ainsi, plus X
est élevé, plus, en moyenne, Yest élevé. Les variables Xet Ysont positivement corrélées.
Remarque
On a vu que l’indépendance de deux variables aléatoires réelles discrètes impliquait la nullité de la covariance
de ce couple, et que la réciproque était fausse. Il n’en reste pas moins que la contraposée de cette propriété est
vraie (si Aimplique B, non-Bimplique toujours non-A).
Ici, puisque covpX, Y q ‰ 0(dès lors que ną3, on déduit de la propriété précédente, par contraposée, que X
et Yne sont pas indépendantes.
Enfin, on peut remarquer que la covariance s’annule lorsque n2. C’est logique, car s’il y a deux boules dans
l’urne, Xet Ysont constantes, égales respectivement à 1et 2. Or, deux variables constantes sont indépendantes,
et donc de covariance nulle.
6. Conclusion
En guise de conclusion on rappellera l’importance qu’il y a à interpréter les résultats en probabilités, ici le signe
de la covariance, et à bien connaître les liens entre indépendance et corrélation. On pourra aussi rappeler que le calcul
n’est pas la seule arme disponible pour déterminer une covariance :
Point méthode
Calculer une covariance : une méthode alternative. Lorsque l’on connaît la variance de X`Yainsi
que les variance respectives de Xet de Y, on peut utiliser les propriétés de la variance :
VpX`Yq “ VpXq ` VpYq ` 2covpX, Y q,
d’où :
covpX, Y q “ 1
2rVpX`Yq ´ VpXq ´ VpYqs.
Application : cette astuce pourrait s’appliquer à l’exemple précédent, sous réserve d’avoir préalablement calculé
VpXqet VpYq. On peut en effet remarquer que X`Yest la somme des deux premiers numéros obtenus. En
notant N1et N2les variables aléatoires correspondantes au premier et au second numéro obtenu, N1suit
clairement une loi uniforme sur rr 1, n ss. Il en est de même pour N2(malgré l’absence de remise) puisque toutes
les boules jouent un rôle symétrique. Dès lors : VpX`Yq “ VpN1`N2q “ VpN1q ` VpN2q ` 2covpN1, N2q “
2ˆn2´1
12 `2covpN1, N2q. Le calcul de covpN1, N2q, si on l’a déjà effectué préalablement, permet de trouver
VpX`Yq, puis par différence, de retrouver la covariance de Xet Y. La méthode directe était toutefois ici plus
rapide.
1 / 4 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !