Variables aléatoires 1- Qu'est-ce qu'une variable aléatoire ? Variable aléatoire qualitative Exemple : La loterie des couleurs Jouons à la loterie avec une roue "non truquée" divisée en 10 secteurs égaux : 1 rouge, 2 jaunes, 4 verts, 3 bleus. Quelles sont les probabilités des événements suivants ? : « on a un rouge » (1/10 ) « on a un jaune « (2/10 ) , « on a un vert « (4/10 ) « on a un bleu » (3/10 ) . A chaque réalisation de l'expérience aléatoire consistant à faire tourner la roue, on peut associer la valeur de la variable "couleur", qui peut être l'un des éléments de l'ensemble {rouge, jaune, vert, bleu}, avec certaines probabilités. On dit que "couleur" est une variable aléatoire. L'ensemble {rouge, jaune, vert, bleu} n'étant pas numérique, la variable "couleur" est une variable aléatoire qualitative, dont les 4 modalités, ou catégories sont : rouge, vert, bleu, jaune. Variable aléatoire discrète Exemple : gain à la loterie Supposons maintenant que le rouge permette de gagner 100 € et le jaune 50 €, les autres couleurs ne rapportant rien. A chaque tour de roue, la variable X = "somme gagnée" peut prendre les valeurs numériques : {0, 50, 100} avec certaines probabilités : X est une variable aléatoire numérique. Par exemple : la probabilité de gagner 50 € est : P (X = 50) = P (avoir un jaune) = 0.2 La probabilité de gagner quelque chose est : P (X 0) = 1 - P (X = 0) = 1- 0.7 = 0.3 Variable aléatoire (numérique) continue Une variable aléatoire continue prend ses valeurs sur un ensemble non dénombrable, généralement un intervalle réel. Exemple : taille X d'une personne adulte choisie au hasard dans une population. Cette taille peut prendre n'importe quelle valeur d'un intervalle réel, par exemple : E x = [1 ; 2.3 [, (en mètres) .Ce qui compte ici, ce n'est pas la probabilité d'obtenir un point isolé de E x , mais la probabilité d'événements de la forme : X < 1.5 , ou X>1.8 , ou 1.45 < X < 1.55, etc. 1 Autres exemples de variables aléatoires continues : - durée de l'attente à un guichet (en mn par exemple) - diamètre d'une pièce mécanique (en cm) - délai séparant l'entrée de 2 clients dans une boutique (en s) - durée de vie d'un appareil (durée de fonctionnement avant la 1ère panne) (en h) 2-Loi de probabilité d’une variable aléatoire Exemple: reprenons l'exemple de la loterie On peut considérer qu'il s'agit d'une expérience aléatoire où l'univers des possibles est : des parties de par les probabilités élémentaires : P( rouge)=0.1 ; P(jaune)= 0.2 ; P(vert)= 0.4 ;P(bleu)= 0.3 Soit X la somme gagnée. C'est une application qui à tout élément de associe un élément de : E x = {0, 50, 100} On a ainsi défini une probabilité PX sur E x , appelée loi de probabilité X, ou distribution de X : PX ({0}) = P (X = 0) = 0.7 PX ({50}) = P (X = 50 = 0.2 PX ({100}) = P (X = 100) = 0.1 Ainsi, à partir de la probabilité P sur , on définit, par transfert au moyen de X, une probabilité P X sur E x , au moyen des probabilités élémentaires : PX ({ xi }) = P ( X = xi ) .On peut représenter la loi de probabilité de X par un diagramme en bâtons : xi 0 50 100 pi 0.7 0.2 0.1 De manière générale, une loi de probabilité est une application X d’un espace probabilisé sur un ensemble fini ou infini dénombrable E x = { x1 , x 2 ,….,x i ,.. } telle qu’on puisse calculer p i = P(X= x i ), les p i étant des nombres positifs de somme (finie ou infinie) égale à 1. 2 3- Fonction de répartition variable aléatoire discrète La loi de probabilité de X peut aussi être décrite par la fonction de répartition F, qui à tout nombre réel x associe F(x) = P(X x). Si on reprend l’exemple de la loterie, F(x) est la probabilité d’avoir un gain inférieur ou égal à x €. Si x<0, P(X<x)=0 Si 0 x<50, F(x) = P(X x)= P(X=0) = 0.7 Si 50 x<100, F(x) = P ((X=0) (X=50))= P(X=0) + P(X=50)=0.7+0.2 = 0.9 Si x 100, F(x)= 1 La fonction de répartition d’une variable aléatoire discrète est une fonction en escalier croissante de 0 à 1. variable aléatoire continue Exemple : M. Martin a décidé de prendre l'autobus. Il ne connaît pas les horaires de passage mais il sait que ce bus passe régulièrement toutes les 15 mn. La durée de son attente est une variable aléatoire X à valeur dans l'intervalle [ 0 , 15 [ . Cet intervalle n'est pas dénombrable : on ne peut pas l'écrire sous la forme : { x1 , x2 , ... , xi , ... }. On dira que X est une variable aléatoire continue, c'est-à-dire que l'ensemble de ses valeurs est un ensemble continu (généralement un intervalle réel ou entier). Ici, on ne cherchera pas de probabilité de la forme P (X = xi). En effet la probabilité d'attendre très exactement 3 mn par exemple, et pas 3 mn et 1/100e de seconde, ni 3 mn moins 1/millionnième de seconde ... sera nulle. Pour tout x, P (X = x) = 0. Par contre, on pourra calculer des probabilités d'intervalles, de la forme : - probabilité d'attendre moins de 10 mn, ou entre 3 et 5 mn, ou plus de 5 mn, etc... Pour cela, X sera caractérisé par sa fonction de répartition : F (x) = P (X "X x). x " signifie l'événement correspondant, dont on calcule la probabilité. . Si x < 0, (X . Si x x) = (événement impossible), donc F (x) = 0 15, (X x) = (événement certain), donc F (x) =1 . Si x et y sont 2 nombres de [0,15], avec x < y : on a F(x) F(y) 3 En conclusion F est une fonction croissante (au sens large) de 0 à 1. Ne connaissant absolument rien sur l'horaire de passage du dernier bus, M. Martin va considérer que la probabilité d'avoir à attendre entre 10 et 11 mn est la même que celle d'attendre entre 4 et 5 mn, ou entre 12.5 et 13.5 mn, etc... Autrement dit, P (a < X b) = F (b) - F (a) sera proportionnel à b - a, donc F est linéaire sur [ 0 , 15 [ : si x 0 F(x)=0 = x / 15 si 0 x 15 si x 1 =1 Cas général : La fonction de répartition F d'une variable aléatoire continue est une fonction continue, croissante de 0 à 1 (au sens large). F(x)=P(X x) Pour tout x réel, P ( X = x ) = 0 et Pour tous a et b réels, P ( a X < b ) = P ( a <X b ) = P ( a < X < b ) = P ( a X b ) = F ( b ) - F ( a ) puisque la probabilité en un point est nulle. 4- Fonction de densité d’une variable aléatoire continue On appelle fonction de densité f d'une variable aléatoire continue la dérivée de la fonction de répartition F. b P(a<X b)=F(b)-F(a)= f ( x)dx (surface entre la courbe de f et le segment de l'axe des a abscisses d'extrémités x = a et x = b) 4 : 5 –Espérance, Variance et écart type d’une variable aléatoire Espérance Définition : Si X est une variable aléatoire discrète, qui prend les valeurs {x1,...,xk}, l'espérance de X est définie par : Linéarité : Cas de deux variables aléatoires X et Y indépendantes : Variance Pour calculer la variance, il faut que l'espérance existe; si tel est le cas, on donne V(X)= E[X – E(X)] 2 = p i [x i - E(X)] 2 i Par construction, la variance est positive. Son calcul n'est pas forcément aisé, heureusement il existe une formule alternative pour mener ce calcul: Formule de Koenig : avec E(X²)= pi xi2 , i V(X)= E(X 2 ) – [E(X)] 2 5 Contrairement à l'espérance, la variance n'est pas forcément linéaire; V(X+Y) V(X)+V(Y). La linéarité V(X + Y) = V(X) + V(Y) n'est vérifiée que pour X, Y indépendantes. On définit la covariance entre X, Y, notée cov(X; Y), vérifiant V(X+Y)=V(X)+V(Y) + 2cov (X ;Y) Bien entendu, si X et Y sont indépendantes, leur covariance est nulle. Ecart-type : (X) = V (X ) Covariance : Définition : cov(X, Y)=E [(X-E(X)) (Y-E(Y))] Propriétés : cov(X,Y)= : cov(Y,X) cov(X,Y)= E(XY)- E(X)E(Y) X et Y indépendants cov(X, Y)=0, la réciproque étant fausse. Exemple: La va X admet la loi de probabilité suivante. Exemple: La va X admet la loi de probabilité suivante. xi 1 2 3 pi 1/6 1/3 1/2 E(X)= (1/6)x1+(1/3)x2+(1/2)x3= 7/3 V(X)= E[X-7/3] 2 = p i [x i -E(X)] 2 = 1/6[1-7/3] 2 +1/3 [2-7/3] 2 +1/2 [3-7/3] 2 =5/9 i Vérifions la formule alternative: E(X²)= pi xi2 =(1/6)1 2 +(1/3)2 2 +(1/2)3 2 =6 et V(X)= E(X 2 ) – [E(X)] 2 =6-(7/3) 2 =5/9 i 6