II. Variable aléatoire Slide 1 of 20 Une expérience On lance n=10 fois une pièce et on compte le pourcentage de “pile” obtenu soit Sn = In[1]:= S[n_] := Total[Table[RandomInteger[1], {n}]] ' n In[2]:= n = 10 S[n] Table[S[n], {i, 0, 20}] Out[2]= # pile n . 10 1 Out[3]= 5 Out[4]= 3 3 1 7 3 3 3 1 7 1 3 7 3 2 3 4 1 1 3 1 1 , , , , , , , , , , , , , , , , , , , , 5 5 2 10 5 5 10 2 10 2 5 10 5 5 5 5 10 2 5 2 2 S[n] est une fonction aléatoire qui peut prendre les valeurs 0, 1 3 7 9 , 15 , 10 , 25 , 12 , 35 , 10 , 45 , 10 , 10 i n On cherche alors à connaitre la loi de probabilité de Sn ? C’est à dire PSn = pour i=0,1..,n-1,n ? 1 2 Slide 2 of 20 On répète l’expérience plusieurs fois ... On réalise k=20 tirages de Sn In[5]:= Out[7]= k = 20; n = 10; tirages = Table[S[n], {k}] '' N {0.1, 0.4, 0.2, 0.6, 0.7, 0.2, 0.4, 0.7, 0.8, 0.4, 0.5, 0.2, 0.6, 0.6, 0.3, 0.5, 0.9, 0.6, 0.3, 0.4} Question 1 Quelle est le nombre de tirages pour lesquels on a obtenu autant de piles que de faces ? 4/5 de piles ... ? In[8]:= Out[8]= In[9]:= Out[9]= In[10]:= Count[tirages, .5] 2 Count[tirages, .8] 1 3 Question 2 Comment représente-on un histogramme des résultats ? Slide 3 of 20 In[11]:= k = 20; n = 10; tirages = Table[S[10], {k}]; histogramme = Table[{i ' n, Count[tirages, i ' n]}, {i, 0, n}]; ListPlot[histogramme, Filling ( Axis, PlotRange ( All] Out[15]= On remarque que les graphes obtenus diffèrent sensiblement selon les tirages. remarquons toutefois que la somme des valeurs est toujours égale à k. On définit loi empirique h comme l’histogramme normalisé h= histogramme k 4 In[16]:= k = 20; n = 10; tirages = Table[S[10], {k}]; h = Table[{i ' n, Count[tirages, i ' n] ' k}, {i, 0, n}]; ListPlot[h, Filling ( Axis, PlotRange ( All] Out[20]= On remarque que les graphes de la loi empirique obtenus diffèrent sensiblement selon les tirages mais que la somme des valeurs est maintenant toujours égale à 1. 5 Slide 4 of 20 Augmentons le nombre de tirages (k=100) In[21]:= k = 100; n = 10; tirages = Table[S[10], {k}]; h = Table[{i ' n, Count[tirages, i ' n] ' k}, {i, 0, n}]; ListPlot[h, Filling ( Axis, PlotRange ( All] Out[25]= Les diagrammes obtenus varient moins 6 Slide 5 of 20 Augmentons encore le nombre de tirages (k=100 000) In[26]:= k = 100 000; n = 10; tirages = Table[S[10], {k}]; h = Table[{i ' n, Count[tirages, i ' n] ' k}, {i, 0, n}]; ListPlot[h, Filling ( Axis, PlotRange ( All] Out[30]= In[31]:= Out[34]= k = 100 000; n = 10; tirages = Table[S[10], {k}]; h = Table[{i ' n, Count[tirages, i ' n] ' k}, {i, 0, n}] '' N {{0., 0.00106}, {0.1, 0.00941}, {0.2, 0.04443}, {0.3, 0.11685}, {0.4, 0.20521}, {0.5, 0.24579}, {0.6, 0.2064}, {0.7, 0.11778}, {0.8, 0.0425}, {0.9, 0.0096}, {1., 0.00097}} La limite est alors la loi de probabilité recherchée Question 3 Quelle est la probabilité pour que le pourcentage de pile est compris entre .3 et .6 P(.3 ≤ Sn ≤ .6) = P(Sn ∈ {.3, .4, .5, .6}) = P(Sn = .3) + P(Sn = .4) + P(Sn = .5) + P(Sn = .6) ≈ h(.3) + h(.4) + h(.5) + h(.6) 7 P(.3 ≤ Sn ≤ .6) = P(Sn ∈ {.3, .4, .5, .6}) = P(Sn = .3) + P(Sn = .4) + P(Sn = .5) + P(Sn = .6) ≈ h(.3) + h(.4) + h(.5) + h(.6) 8 Slide 6 of 20 Aléatoire Variable Definition. Une variable aléatoire est une fonction de l’ensemble des évènements dans 0 (pour le moment). 9 Exemples On tire n fois à pile ou face et on compte le pourcentage de fois que l’on obtient pile In[35]:= S[n_] := Count[ RandomInteger[1, {n}] , 1] ' n S[10] k = 100 000; n = 10; tirages = Table[S[n], {k}]; Histogram[tirages, {0.1}, "Probability", LabelingFunction ( Above] 3 Out[36]= 5 Out[40]= 10 Exemples Slide 7 of 20 On tire deux dés et on s’intéresse à la somme des chiffres présent sur la face supérieure de ces dés. In[41]:= Out[46]= S[n_] := RandomInteger[{1, 6}] + RandomInteger[{1, 6}] k = 100 000; n = 10; tirages = Table[S[10], {k}]; h = Table[{i, Count[tirages, i] ' k}, {i, 0, 12}]; ListPlot[h, Filling ( Axis, PlotRange ( All] 11 Exemples Slide 8 of 20 On tire à pile ou face et on s’arrète lorque l’on obtient pile. La variable aléatoire est le nombre de tirages réalisés In[47]:= S[n_] := Block[{i = 1}, While[RandomInteger[1] * 0, i ++]; Return[i]] k = 100 000; n = 10; tirages = Table[S[10], {k}]; h = Table[{i, Count[tirages, i] ' k}, {i, 0, Max[tirages]}]; ListPlot[h, Filling ( Axis, PlotRange ( All] Out[52]= ◼ ... donner d’autres exemples 12 Slide de 9 of 20 Loi Probabilité Definition. La loi de probabilité d’une variable aléatoire X sur un univers Ω est la fonction de 0 dans [0,1] définie par f(x)=p(X=x) . Certains auteurs l’appellent également fonction de densité, ici nous réserverons le terme de fonction de densités aux variable aléatoires continues. La loi de probabilité de la variable aléatoire somme de deux dés est définie par le tableau suivant On peut expliquer les test obtenus précédemment In[53]:= Out[58]= S[n_] := RandomInteger[{1, 6}] + RandomInteger[{1, 6}] k = 100 000; n = 10; tirages = Table[S[10], {k}]; h = Table[{i, Count[tirages, i] ' k}, {i, 0, 12}]; ListPlot[h, Filling ( Axis, PlotRange ( All] 13 Slide 10 Loi deof 20 probabilité Diagramme de toutes les possibilités, et calcul de # cas favorables # cas possibles x 2 3 4 5 6 7 8 9 10 11 12 f (x) = p (X = x) 1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1 36 14 In[59]:= univers = Tuples[Range[6], {2}] n = Length[univers] valeurs = Map[Total, univers] densité = Table[Count[valeurs, i], {i, 2, 12}] ' n Total[densité] BarChart[densité, ChartLabels ( Range[11] + 1, LabelingFunction ( Above] Out[59]= {{1, 1}, {1, 2}, {1, 3}, {1, 4}, {1, 5}, {1, 6}, {2, 1}, {2, 2}, {2, 3}, {2, 4}, {2, 5}, {2, 6}, {3, 1}, {3, 2}, {3, 3}, {3, 4}, {3, 5}, {3, 6}, {4, 1}, {4, 2}, {4, 3}, {4, 4}, {4, 5}, {4, 6}, {5, 1}, {5, 2}, {5, 3}, {5, 4}, {5, 5}, {5, 6}, {6, 1}, {6, 2}, {6, 3}, {6, 4}, {6, 5}, {6, 6}} Out[60]= 36 Out[61]= {2, 3, 4, 5, 6, 7, 3, 4, 5, 6, 7, 8, 4, 5, 6, 7, 8, 9, 5, 6, 7, 8, 9, 10, 6, 7, 8, 9, 10, 11, 7, 8, 9, 10, 11, 12} Out[62]= 1 36 Out[63]= Out[64]= 1 , 1 18 , 1 12 , 1 9 , 5 36 , 1 6 , 5 36 , 1 9 , 1 12 , 1 18 , 1 36 15 Slide 11 of 20 de répartition Fonction Definition. La fonction de répartition d’une variable aléatoire X sur un univers Ω est la fonction de 0 dans [0,1] définie par F(x)=p(X≤x) . x 2 3 4 5 6 7 8 9 10 11 12 f (x) = p (X = x) 1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1 36 La fonction de répartition de la variable aléatoire somme de deux dés est définie par le tableau suivant x 2 3 4 5 6 7 8 9 10 11 F (x) = p (X ≤ x) 1 36 3 36 6 36 10 36 15 36 21 36 26 36 30 36 33 36 35 36 12 36 36 =1 16 In[65]:= répartition = Accumulate[densité] BarChart[répartition, ChartLabels ( Range[11] + 1, LabelingFunction ( Above] Out[65]= 1 36 Out[66]= , 1 12 , 1 6 , 5 18 , 5 12 , 7 12 , 13 18 , 5 6 , 11 12 , 35 36 , 1 17 Slide 12 of 20 Propriétés ◼ Une loi de probabilité prend des valeurs entre 0 et 1 ◼ La somme des valeurs de la loi de probabilité est égale à 1 : ∑N i=1 f (xi ) = 1 ◼ La fonction de partition est positive ou nulle, croissante, et sa plus grande valeur est 1 18 Slide 13 of 20 Espérance L’espérance E(X) d’une variable aléatoire X correspond à la moyenne des valeurs que l’on obtiendrait en faisant une infinité de tirages. C’est la moyenne des valeurs de la variable aléatoire pondérées par leur probabilité N E(X)=∑N i=1 xi p(X = xi ) = ∑i=1 xi f (xi ) Exemple : somme de deux dés In[67]:= Out[67]= In[68]:= x 2 3 4 5 6 7 8 9 10 11 12 f (x) = p (X = x) 1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1 36 univers {{1, 1}, {1, 2}, {1, 3}, {1, 4}, {1, 5}, {1, 6}, {2, 1}, {2, 2}, {2, 3}, {2, 4}, {2, 5}, {2, 6}, {3, 1}, {3, 2}, {3, 3}, {3, 4}, {3, 5}, {3, 6}, {4, 1}, {4, 2}, {4, 3}, {4, 4}, {4, 5}, {4, 6}, {5, 1}, {5, 2}, {5, 3}, {5, 4}, {5, 5}, {5, 6}, {6, 1}, {6, 2}, {6, 3}, {6, 4}, {6, 5}, {6, 6}} Map[Total, univers] Mean[Map[Total, univers]] Out[68]= {2, 3, 4, 5, 6, 7, 3, 4, 5, 6, 7, 8, 4, 5, 6, 7, 8, 9, 5, 6, 7, 8, 9, 10, 6, 7, 8, 9, 10, 11, 7, 8, 9, 10, 11, 12} Out[69]= 7 19 Slide 14 of 20 et Ecart-type Variance La variance Var(X) d’une variable aléatoire X correspond à la moyenne de carrés des distances à l’espérance E(X), que l’on obtiendrait en faisant une infinité de tirages. Var(X ) = E (X 'E(X ))2 2 = ∑N i=1 (xi ' E(X )) p(X = xi ) 2 = ∑N i=1 (xi ' E(X )) f (xi ) L’écart-type ( d’une variable aléatoire X est la racine carrée de la variance Var (X ) (= Exemple : somme de deux dés, calculer l’espérance, la variance et l’écart-type In[70]:= Out[70]= x 2 3 4 5 6 7 8 9 10 11 12 f (x) = p (X = x) 1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1 36 univers {{1, 1}, {1, 2}, {1, 3}, {1, 4}, {1, 5}, {1, 6}, {2, 1}, {2, 2}, {2, 3}, {2, 4}, {2, 5}, {2, 6}, {3, 1}, {3, 2}, {3, 3}, {3, 4}, {3, 5}, {3, 6}, {4, 1}, {4, 2}, {4, 3}, {4, 4}, {4, 5}, {4, 6}, {5, 1}, {5, 2}, {5, 3}, {5, 4}, {5, 5}, {5, 6}, {6, 1}, {6, 2}, {6, 3}, {6, 4}, {6, 5}, {6, 6}} 20 In[71]:= X = Map[Total, univers] Ex = Mean[X] Mean[(X , Ex) ^ 2] Mean[(X) ^ 2] Mean[(X) ^ 2] , Mean[(X)] ^ 2 Variance[X] Out[71]= {2, 3, 4, 5, 6, 7, 3, 4, 5, 6, 7, 8, 4, 5, 6, 7, 8, 9, 5, 6, 7, 8, 9, 10, 6, 7, 8, 9, 10, 11, 7, 8, 9, 10, 11, 12} Out[72]= 7 35 Out[73]= 6 329 Out[74]= 6 35 Out[75]= 6 Out[76]= 6 21 Slide 15 of 20 Propriétés Théorème de König : Var(X ) = EX 2 ' E (X )2 22 Slide 16 of 20de variables aléatoires Somme Le problème est, à partir de deux variables aléatoires discrètes X et Y, indépendantes, de déterminer la loi de probabilité de la variable aléatoire S=X+Y. Pour simplifier, on supposera que X et Y sont à valeurs dans 3. La loi de probabilité de S est alors x P(S=x)=P ⋃ (X = i ⋂ Y = x 6 i) i=0 ces évènements sont disjoints donc x =∑i=0 P(X=i ⋂Y=x-i) X et Y sont indépendantes donc x =∑i=0 P(X=i)P(Y=x-i) par définition de f et g x =∑i=0 f (i) g(x 6 i) x Définition. La convolution discrète de deux fonction f et g est la fonction f7g(x)=∑i=0 f (i) g(x 6 i) 23 Slide 17 of 20 Propriétés Théorème. La loi de probabilité de la somme X+Y de deux variables aléatoires discrètes X et Y, indépendantes, de loi de probabilité respectivement f et g est la convolution discrète x f*g(x)==∑i=0 f (i) g(x ' i) Théorème. L’espérance de la somme X+Y de deux variables aléatoires discrètes X et Y, est la somme des espérances de X et de Y. Théorème. La variance de la somme X+Y de deux variables aléatoires discrètes X et Y, indépendantes, est la somme des variances de X et de Y Corrolaire. La variance de la moyenne X = variable aléatoire X est Var(X) = 82 n 1 n ∑ni=1 Xi de n variables aléatoires discrètes Xi , de même loi qu’une 24 Slide 18 of 20 Estimation sans biais de la variance Lorsque l'on estime la variance à partir d'un échantillon de taille n, la variance utilisée est un peu différente de la définition. En effet, appliquer la définition sur un échantillon produit un biais du fait que c'est le même échantillon qui sert à estimer la moyenne E(x) et la variance. Exemples In[77]:= Out[78]= n = 20; liste = RandomInteger[9, n] Mean[(liste , Mean[liste]) ^ 2] Mean[liste ^ 2] , Mean[liste] ^ 2 n Mean[(liste , Mean[liste]) ^ 2] ' (n , 1) Variance[liste] {6, 8, 7, 2, 5, 1, 9, 8, 8, 5, 2, 6, 3, 7, 9, 4, 1, 8, 5, 7} 2619 Out[79]= 400 2619 Out[80]= 400 2619 Out[81]= 380 2619 Out[82]= 380 25 Slide 19 of 20 Estimation sans biais de la variance Si l'on désigne par x = 1 n ∑ni=1 xi et Vn = 1 n 1 ∑ni=1 (xi ' x)2= n ∑ni=1 xi2 ' x2 , on peut montrer que E(Vn) = Preuve 2 En effet on a E(Vn ) = 19n ∑ni=1 Exi2 6 E(x ) Pour le premier terme 19n ∑ni=1 Exi2 = 19n ∑ni=1 EX 2 = EX 2 = E (X )2 + V(X ) Pour le second, on remarque tout d’abord que E(x)=E(X) et que V (x) = 2 1 n V (X ) on déduit que 1 n E(x ) = E(x)2 + V(x) = E(x)2 + V(X ) On en déduit donc que E(Vn ) = n61 n V(X ) Estimateur sans biais de la variance L'estimateur sans biais de la variance est Vn61 = Preuve. En effet, E(Vn61 ) = n V n61 n n n n61 E(Vn ) = V(X)=V(X) n61 n61 n = 1 n61 2 ∑ni=1 Xi 6 X . n'1 Var(X). n 26 Slide 20 of 20 Définitions ◼ Une variable aléatoire est dite centrée si son espérance est nulle. Remarque. Si X est une variable aléatoire d’espérance E(X) alors X-E(X) est centrée ◼ Une variable aléatoire est dite réduite si son écart type est égal à 1. Remarque. Si X est une variable aléatoire de variance 8 2 alors ◼ Une variable aléatoire réduite et centrée est dite X 8 est réduite standardisée Remarque. Si X est une variable aléatoire d’espérance E(X) et de variance 8 2 alors X 6E(X ) 8 est réduite