Calcul de covariance : Maths Spé - Concours

Telechargé par yass.m09

Téléchargement

Optimal Sup-Spé. Le n°1

Calculer une covariance

Maths Spé - Concours 2015

Problématique

Comment calculer la covariance d’un couple de variables aléatoires réelles discrètes Xet Ydéﬁnies sur un même

espace probabilisé pΩ, A, P q? Quelles sont les propriétés de la covariance ?

Réponse

Attention !

Rappelons pour commencer que la covariance d’un couple de variables aléatoires n’existe pas toujours ! Pour

justiﬁer l’existence de la covariance d’une variable aléatoire, deux cas se présentent :

— si pX, Y qpΩqest ﬁni, alors le couple pX, Y qadmet une covariance,

— si pX, Y qpΩqest inﬁni, alors le couple pX, Y qadmet une covariance admet une variance si et seulement

si, la série double ř

pxi,yjqPpX,Y qpΩq

pxi´EpXqqpyj´EpYqqPpX“xi, Y “yjqconverge.

Une condition suﬃsante d’existence : si Xet Yadmettent un moment d’ordre 2, alors le couple pX, Y qadmet

une covariance.

Rappel de cours

Théorème de transfert pour un couple de variables aléatoires. Si la série double

pxi,yjqPpX,Y qpΩq

fppxi, yjqPpX“xi, Y “yjqconverge, alors fppX, Y qq admet une espérance, et on a alors :

EpfppX, Y qqq “ ř

pxi,yjqPpX,Y qpΩq

fppxi, yjqPpX“xi, Y “yjq.

Lorsque l’existence de la covariance du couple pX, Y qa été établie, on a alors le choix entre utiliser la déﬁnition

(rare) ou la formule de Huygens. :

Optimal Sup/Spé - 11, rue Geoffroy l’Angevin 75004 Paris - tel : 01.40.26.78.78 - www.optimalsupspe.fr

-Concours 2015 2

Rappel de cours

Déﬁnition.

covpX, Y q “ ErpX´EpXqqpY´EpYqqs.

Formule de König-Huygens.

covpX, Y q “ EpXY q ´ EpXqEpYq.

Propriétés.

—covpX, Xq “ VpXq,

—covpX, Y q “ covpY, Xq,

—covpaX `bY, Zq “ a covpX, Zq ` b covpY, Zq.

1. Le calcul de la covariance : attention au support de pX, Y q

Pour calculer la covariance, il faut le plus souvent se ramener à la formule de König-Huygens et calculer EpXY q.

Dans ce calcul, qui se fait toujours à l’aide du théorème de transfert, il ne faut pas oublier qu’il s’agit d’une double

somme, et non d’une somme simple. Attention également aux indices : dans certains exercices, il peut arriver que X

et Ysoient liées, par exemple que Xsoit toujours inférieure à Y. Il faut calculer la somme sur le support du couple,

à savoir sur pX, Y qpΩq. Par exemple, si Xreprésente le plus petit numéro obtenu et Yle plus grand numéro obtenu

dans une suite de deux tirages sans remise d’une boule dans une urne contenant nboules numérotées de 1àn, alors X

est toujours inférieur strictement à Y. Dans cet exemple, il ne faut pas calculer la double somme pour chaque valeur

iet jde Xet de Ymais pour chaque valeur possible pi, jqdu couple pX, Y q, avec ici la condition iăj.

2. Covariance et corrélation linéaire

Lorsque covpX, Y q ą 0, on dit que les variables Xet Ysont positivement corrélées. L’interprétation d’une cova-

riance positive est la suivante : plus Xest élevé, plus, en moyenne, Yest élevé (et réciproquement).

Lorsque covpX, Y q ă 0, on dit que les variables Xet Ysont négativement corrélées. L’interprétation d’une cova-

riance positive est alors la suivante : plus Xest élevé, plus, en moyenne, Yest petit (et réciproquement).

Enﬁn, lorsque covpX, Y q “ 0, on dit que les variables Xet Yne sont pas corrélées.

La covariance est un outil pour mesurer la corrélation linéaire entre deux variables aléatoires.

3. Le coeﬃcient de corrélation linéaire

Rappel de cours

Le coeﬃcient de corrélation linéaire. Lorsque pX, Y qadmet une covariance, on déﬁnit le coeﬃcient de

corrélation linéaire du couple pX, Y q, et l’on note ρX,Y , le nombre :

ρX,Y “covpX, Y q

σpXqσpYq.

Propriété. On a :

|ρX,Y |ď1.

Le coeﬃcient de corrélation linéaire mesure le degré de corrélation entre Xet Y. Si ce coeﬃcient vaut `1,Yest

une fonction aﬃne (ou quasi aﬃne) de X, c’est-à-dire que l’on a (presque sûrement) Y“aX `b, et l’on a : aą0.

De façon analogue, si ce coeﬃcient vaut ´1,Yest une fonction aﬃne (ou quasi aﬃne) de X, c’est-à-dire que l’on a

(presque sûrement) Y“aX `b, et l’on a : aă0.

Plus le coeﬃcient de corrélation entre Xet Yest élevé, plus la corrélation est forte entre les variables Xet Y. En

3-Concours 2015

statistiques, on a coutume d’évaluer qu’un modèle linéaire prédit correctement les variations de Yen fonction de X

dès lors que le coeﬃcient de corrélation est supérieur en valeur absolue à 0,8.

4. Indépendance et corrélation.

Il faut se souvenir que deux variables indépendantes ne sont pas corrélées :

Rappel de cours

Si Xet Ysont indépendantes, alors covpX, Y q “ 0.

Attention !

La réciproque est fausse.

5. Un exemple

Considérons Xle plus petit numéro obtenu, et Yle plus grand numéro obtenu, dans une suite de deux tirages sans

remise d’une boule dans une urne contenant nboules numérotées de 1àn.

Des calculs de probabilités prouvent que pX, Y qpΩq “ pi, jq P rr 1, n ss2,1ďiăjďn(, et que pour tout couple

pi, jqPpX, Y qpΩq, P pX“i, Y “jq “ 2

npn´1q. Cette somme comportant ˆn

2˙termes (voir le Polycopié Dénom-

brements), on vériﬁe que la somme des probabilités fait 1, ce qui est le cas. Des calculs de lois, puis d’espérance,

prouvent également que : EpXq “ n`1

3, et que EpYq “ 2pn`1q

3(voir le Polycopié Probabilités). Intéressons-

nous ici au calcul de la covariance.

Commençons d’abord par préciser que Xet Yprennent un nombre ﬁni de valeurs, donc admettent un moment

d’ordre 2, ce qui suﬃt à établir l’existence de la covariance de pX, Y q. On a, d’après le théorème de transfert :

EpXY q=ř

1ďiăjďn

ijP pX“i, Y “jq.

EpXY q “ 2

npn´1q

j“2

j´1

i“1

EpXY q “ 2

npn´1q

j“2

jpj´1qj

EpXY q “ 1

npn´1q

j“2

pj3´j2q.

En ajoutant et en retranchant 1, il vient :

EpXY q “ 1

npn´1q

j“1

pj3´j2q.

EpXY q “ 1

npn´1qˆn2pn`1q2

4´npn`1qp2n`1q

6˙,

soit après calculs :

EpXY q “ pn`1qp3n`2q

12 .

D’après la formule de König-Huygens, il vient :

-Concours 2015 4

covpX, Y q “ pn`1qp3n`2q

12 ´EpXqEpYq.

Comme : EpXq “ n`1

3et que EpYq “ 2pn`1q

3, on a ﬁnalement :

covpX, Y q “ pn`1qp3n`2q

12 ´2pn`1q2

et l’on peut ainsi conclure :

covpX, Y q “ pn`1qpn´2q

36 .

Interprétation du signe de la covariance : il est logique que covpX, Y q ą 0puisque ici, plus Xprend une valeur

élevée, plus, en moyenne Yprend une valeur élevé. En eﬀet, si l’on a obtenu un grand numéro, noté k, comme valeur

pour X(i.e. si le plus petit des deux numéros est égal à k), cela interdit au plus grand des deux numéros obtenus, Y,

de prendre des valeurs petites (toutes les valeurs inférieures ou égales à kétant désormais impossibles). Ainsi, plus X

est élevé, plus, en moyenne, Yest élevé. Les variables Xet Ysont positivement corrélées.

Remarque

On a vu que l’indépendance de deux variables aléatoires réelles discrètes impliquait la nullité de la covariance

de ce couple, et que la réciproque était fausse. Il n’en reste pas moins que la contraposée de cette propriété est

vraie (si Aimplique B, non-Bimplique toujours non-A).

Ici, puisque covpX, Y q ‰ 0(dès lors que ną3, on déduit de la propriété précédente, par contraposée, que X

et Yne sont pas indépendantes.

Enﬁn, on peut remarquer que la covariance s’annule lorsque n“2. C’est logique, car s’il y a deux boules dans

l’urne, Xet Ysont constantes, égales respectivement à 1et 2. Or, deux variables constantes sont indépendantes,

et donc de covariance nulle.

6. Conclusion

En guise de conclusion on rappellera l’importance qu’il y a à interpréter les résultats en probabilités, ici le signe

de la covariance, et à bien connaître les liens entre indépendance et corrélation. On pourra aussi rappeler que le calcul

n’est pas la seule arme disponible pour déterminer une covariance :

Point méthode

Calculer une covariance : une méthode alternative. Lorsque l’on connaît la variance de X`Yainsi

que les variance respectives de Xet de Y, on peut utiliser les propriétés de la variance :

VpX`Yq “ VpXq ` VpYq ` 2covpX, Y q,

d’où :

covpX, Y q “ 1

2rVpX`Yq ´ VpXq ´ VpYqs.

Application : cette astuce pourrait s’appliquer à l’exemple précédent, sous réserve d’avoir préalablement calculé

VpXqet VpYq. On peut en eﬀet remarquer que X`Yest la somme des deux premiers numéros obtenus. En

notant N1et N2les variables aléatoires correspondantes au premier et au second numéro obtenu, N1suit

clairement une loi uniforme sur rr 1, n ss. Il en est de même pour N2(malgré l’absence de remise) puisque toutes

les boules jouent un rôle symétrique. Dès lors : VpX`Yq “ VpN1`N2q “ VpN1q ` VpN2q ` 2covpN1, N2q “

2ˆn2´1

12 `2covpN1, N2q. Le calcul de covpN1, N2q, si on l’a déjà eﬀectué préalablement, permet de trouver

VpX`Yq, puis par diﬀérence, de retrouver la covariance de Xet Y. La méthode directe était toutefois ici plus

rapide.

1 / 4 100%

Documents connexes

COUPLES DE VARIABLES ALÉATOIRES DISCRÈTES

TD 4 : Espérance, variance et indépendance

1 Densité 2 Théorie des tests

Etude simultanée de deux caractères statistiques

Série statistique double à l`aide d`un exemple

Récap statistiques usuelles

Modélisation des flux de carbone sur plusieurs sites de prairies et

TRPA2: Algorithme EM et apprentissage des param

Consulta: subjectFacets:"COVARIANCE GENETIQUE DIRECTES

Cours 8 - Laurent Carraro

Statistique pour ingénieur

Covariance

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Calcul de covariance : Maths Spé - Concours

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Calcul de covariance : Maths Spé - Concours

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib