Probabilités et variables aléatoires

publicité
Probabilités et
variables aléatoires
Adapté de Yannis Korilis, Christian St-Jean, Dave
DeBarr, Bob Carpenter, Jennifer Chu-Carroll et
plusieurs autres
Expérience aléatoire et probabilité


Suite d’évènements dont les variables varient dans des
intervalles de valeurs connus, sans que les valeurs précises le
soient avec une certitude absolue
La fréquence d’occurrence de chaque valeur est utilisée
comme mesure relative de sa certitude, ou probabilité
d’occurrence
P( x   ) 
nombre de fois que l ' on observe x  
nombre d ' observations des valeurs de x
Approche évènementielle
 Expérience aléatoire : Suite d’évènements pris dans un espace
 sur lequel est définie une probabilité P.



Un événement est une partie de  notée A.
Chaque événement possède une probabilité P(A) telle que, dans
l’espace probabilisé (, A, P), on a :
P()=1
(il est certain qu’un évènement se produise, sans savoir lequel)
P(A) + P(Ac)=1
(Si un évènement ne se produit pas, un des autres se produira)
La loi de probabilité triviale est :
Cas discret
Card ( A)
P( A) 
Card ()
Cas continu
P(A) p(x)dx
A
Approche par variable aléatoire


Variable numérique dont les valeurs dépendent des résultats
d’une expérience aléatoire

Représente une projection de (, A, P) dans un espace numérique

Permet le calcul des probabilités par des méthodes de l’analyse
mathématique au lieu de raisonner sur des ensembles
Variable aléatoire discrète : ses valeurs sont dénombrables

Espérance : la valeur moyenne

Variance : l’écart quadratique moyen par rapport à la valeur
2
moyenne
V ( X )  E  X  E ( X )
E ( X )  E x P( X  x)


Variable aléatoire continue


Ses valeurs sont des nombres réels
Utilise une fonction de densité de probabilité :
 positive, intégrable ,

 f(x)dx 1,


P(a  X b)  f(x)dx
Fonction de probabilité cumulative :
x
F ( x)  P( X  x) 


Espérance :  ( X ) 

 f (t )dt

 x f ( x) dx


Variance :  2 ( X )   x   ( x) 2 f ( x) dx

b
a
Variables aléatoires indépendantes et
conditionnelles
 Probabilité conditionnelle :
P(A/ B)
P(AB)
P(B)
 Évènements indépendants : P(A B)  P(A)P(B)
 Variables aléatoires
indépendantes :
p X ,Y ( x ,y ) p X ( x ) pY ( y )
 Théorème de Bayes :
P(A/ B)
P(B/ A)P(A)
P(B)
P(Ai / B)
P(B/ Ai)P(Ai)
P(B/ Ak)P(Ak)
k
Lois de probabilité discrètes
(Comme quoi, les hasards ne sont pas tous pareils !)
 Loi uniforme

X={1,2,…,n} : P ( X  k ) 
 Loi de bernoulli

X={0,1} :
1
n
E(X) n1
2
n21
V(X)
12
P( X  1 )  p
E(X) p
V(X) p(1 p)
 Loi binomiale
L’évènement de probabilité p apparaît k fois en n essais
=> n épreuves de bernoulli, avec les combinaisons de k dans n

X={0,1,2, …, n) :
 Loi géométrique
P( X  k )  Cnk pk ( 1  p )nk
E(X)n p
V(X)n p(1 p)
L’évènement de probabilité p apparaît au kième essais
=> k épreuves de bernoulli, avec X=1 à la kième et 0 avant :
P( X  k )  P( X1  0; X 2  0;...; X k  1)  (1  p)k 1 p
E(X) 1
p

1 p
V(X) 2
P
Loi sans mémoire : La probabilité de l’événement au kième
essai ne dépend pas de l’historique des évènements
 Propriété ignorée par les joueurs !
 Loi de Poisson
Le nombre moyen d’occurrence d’un événement X dans un temps T est k
 X={0,1,…} :
k

P( X  k )  e 
k!
E(X)


 = nombre moyen d’événement par unité de temps.
Relation avec la loi binomiale :

V(X)
Si p<0.1 et n>50 : B(n,p)P(np)
Lois de probabilité continues
 Loi uniforme
x0;a
E( x ) 
a
2
f(x) 1
a a2
V( x ) 
 Loi exponentielle
F(x) x
a
12
Utilisée en fiabilité pour représenter une espérance de vie
x0
f(x)ex
E( x ) 


V( x ) 
1
2
E(x)= 1/ est souvent appelé MTBF (« mean time between failures ») et  est
le taux de défaillance


1
F(x)1ex
P(X > x)=probabilité d’attendre plus de x avant l’apparition d’un phénomène
lorsque 1/ est le temps moyen d’attente.
Loi sans mémoire : le passé ne permet pas de prédire l’avenir.
 Loi Gamma
Généralisation de la loi exponentielle utilisée dans les files d’attentes. P(X > x) =
probabilité d’attendre plus de x minutes avant la kième apparition du phénomène
étudié, avec 1/ comme temps moyen d’attente entre deux apparitions du
phénomène.
x0
f(x)
k xk 1
(k)
E( x ) 
k

ex

(k) yk 1e ydy
0
V( x ) 
k
2
 Loi de Gauss (« normale »)
Loi fondamentale en statistique. Très souvent utilisée en modélisation.
xm
1
2 2
2
x
f(x)
1 e
 2
E( x )m
si


V ( x ) 2
X N(m;) X m N(0;1)

Loi limite de caractéristiques issues d’un échantillon de
grande taille.
On a les convergences suivantes (souvent abusées dans les
sondages !):

B(n;p)N(np;np(1-p)) (np et n(1-p) supérieurs à 5)

P()N(; ) (avec >18)
 Loi du Chi 2 (Khi-deux de Pearson)
Si Z1,Z2,...,Zk N(0;1)
k
Z
2
i
i1
(2k)
Dite « chi2 à k degrés de liberté »
 Loi de Student
Si
Z N(0;1)
Z t(k)
2k
k
Dite « Student à k degrés de liberté »
 Loi de Fisher-Snédécor
2k
k F(k;l)
l2
l
Dite « Fisher à k, l degrés de liberté »
Exemple 1
• Un système de prise de décision binaire comprend trois modules
indépendants et pend une décision positive s’il y unanimité chez les
trois modules. Sachant que la probabilité d’une décision négative
par un module est 0.02, 0.05 et 0.10, respectivement, quelle est la
probabilité que le système prenne une décision positive?
P(A) =P(décision négative par module A) = 0.02
P(B) = P(décision négative par module B) = 0.05
P(C) = P(décision négative par module C) = 0.10
P(décisio positive)  P( A et B et C )  P ( A  B  C ) 
P( A ) P ( B ) P(C ) 
1  P( A) 1  P( B) 1  P(C )   0.98  0.95  0.90  0.8379
Exemple 2
Une machine utilise quatre dispositifs D1, D2, D3, D4 dont la défaillance
peut intervenir de manière indépendante. La machine tombe en panne si
D1 est défaillant ou que deux de D2, D3, D4 les sont.
Si Ai dénote le fait que Di fonctionne sans défaillance pendant un
intervalle T, quelle est la probabilité de fonctionnement correct de la
machine durant l’intervalle si P(A1)=0.80, P(A2)=0.85, P(A3)=0.90 P(A4)=0.90 ?
A( A1 A2  A3  A4 )
( A1 A2  A3  A4 )
( A1 A2  A3  A4 )( A1 A2  A3  A4 )
P(A)0.800.850.900.900.800.150.900.90...0.7704
Exemple 3
Un système S se présente de manière aléatoire sous deux états, 0 et 1,
avec P(S=0)= 0.4 et P(S=1)=0.6. Une station T1 fournit des informations
potentiellement erronées sur l’état de S. La probabilité que T1 soit juste
pour l’état 0 est 0.98 ; la probabilité qu’elle le soit pour l’état 1 est 0.95.
A un instant donné, T1 reporte S dans l’état 0. Quelle est la probabilité
que S soit vraiment dans l’état 0 ?
Posons E1 : {S est dans l’état 0}, O1 : {S est observé dans l’état 0 par T1 }
P(E1 )=0.4
P(O1 | E1 )=0.98
P( E1 / O1 ) 
S=0
S=1
P(O1 | cE1 )=0.05
P(O1 / E1 ) P( E1 )
 0.929
P(O1 / E1 ) P( E1 )  P(O1 / E1 ) P( E1 )
T1=0
0.392
0.03
0.422
T1=1
0.008
0.57
0.578
0.4
0.6
1
P( E1 / O1 ) 
0.39
 0.93
0.42
Exemple 4
Un système S se présente de manière aléatoire sous deux états, 0 et 1,
avec P(S=0)= 0.4 et P(S=1)=0.6. Deux stations T1 et T2 fournissent des
informations sur l’état de S. La probabilité d’erreur de T1 est 0.02 et celle
de T2 est 0.06
A un instant donné, T1 donne S dans l’état 0 et T2 donne S dans l’état 1.
Quelle est la probabilité que S soit dans l’état 0 ?
Posons E0 {S est dans l’état 0} et E1 {S est dans l’état 1}
O:{S est observé dans l’état 0 par T1 et dans l’état 1 par T2 }
P(E0 )=0.4 P(E1 )=0.6
P(O | E0 )=0.98*0.06 (= prob. que T1 soit vraie et T2 soit fausse sachant que S
est dans l’état 0)
P(O | E1 )=0.02*0.94
P( E0 / O) 
P(O / E0 ) P( E0 )
0.0588  0.40

 0.68
P(O / E0 ) P( E0 )  P(O / E1 ) P( E1 ) 0.0588  0.4  0.0188  0.60
Exemple 5
 Une machine tombe en panne selon la loi exponentielle avec un facteur
=0.5/heure. Quelle est la probabilité que la machine tombe en panne entre
la première et deuxième heure après le démarrage.
P(1hr  T  2hr )  P(T  2hr )  P(T  1hr )
 1  e 0.5 / hr2 hr   1  e 0.5 / hr1hr   0.24
 La durée de vie d'un composant d'un système est supposée suivre une loi
exponentielle de paramètre . Un grand nombre de ces composants sont
testés et on a observé que 5% ne durent pas plus de 100 heures.
Estimer la probabilité qu'un composant pris au hasard dure plus de 200
heures, ou T est la durée de la vie en heures
La probabilité de survie est
Pour T > 200,
P(T 100)1(1e100)0.95e100
Exemple 6
Le taux global de défaillance d’un processus est la somme des taux de chaque
composant et ceux-ci suivent une loi de mortalité exponentielle. Les taux
élémentaires sont donnés par des documents fournis par le designer.
Pour un taux de défaillance  = 12 10-6 h-1 et pour un fonctionnement
continu pendant 208 jours par an, donnez la probabilité théorique que le
processus fonctionne encore au bout de ces 208 jours.
t = 24 x 208 » 5000 heures
la probabilité théorique que le processus est fonctionnel encore est alors de
R(5000) = e-0.000012.x5000 = 0,9418. Ceci signifie que la probabilité d'avoir une
défaillance pendant la durée de fonctionnement de 5000 heures est de
f = 1 - 0,9418 = 0,0582 soit 5,8 %.
Téléchargement