Corrige.

publicité
Probabilités 3 IF
Devoir Surveillé 2015
Durée : 1h30.
Tous documents autorisés. Calculatrices autorisées.
Le barème est donné à titre indicatif et est susceptible de changer.
Exercice 1. (11.5 points)
On s'intéresse à la modélisation des tremblements de terre par une loi de Poisson. Soit N le
nombre de séismes survenant dans une zone donnée en un an et soit M la magnitude minimale
des séismes. Alors on suppose que pour n ∈ N et m > 0,
P (N = n, M > m) =
e−αm n − exp(−αm) (θ − m)c
e
11[0,θ] (m)
n!
θc
avec α ∈ R, θ > 0, c > 0.
Rappel : 1
1[0,θ] (m) = 1 si m ∈ [0, θ] et 0 sinon.
1. Que vaut P(M > m) pour tout m > 0 ? En déduire la densité de M . On exprimera les
résultats en fonction de α, θ et c.
P
= n, M > m) =
(θ−m)c
11[0,θ] (m).
θc
1.5pt
P(M > m) =
1.5pt
fM (m) est la dérivée de P(M 6 m) et vaut fM (m) =
n∈N P(n
c(θ−m)c−1
11[0,θ] (m),
θc
2. Montrer que N | M > m suit une loi de Poisson de paramètre λm que l'on déterminera.
N et M sont-ils indépendants ?
P(N | M > m) =
λm = e−αm .
0.5pt
P(N =n,M >m)
.
P(M >m)
On obtient une loi de Poisson de paramètre
En réalité un choix usuel en sismologie est celui de la loi de GutenbergRichter qui suppose une relation de la forme λm = exp(a − αm).
0.5pt N et M ne sont pas indépendantes car la loi de N | M > m dépend de m.
Remarque :
On étudie plus précisément dans la suite N (m) = (N | M > m), le nombre de séismes par an
ayant une magnitude supérieure à m avec m > 0 xé. Au vu des questions précédentes N (m)
suit une loi de Poisson de paramètre λm :
P (N (m) = n) =
λnm −λm
e
.
n!
3. Quel est le nombre moyen de séismes sur une année ? Combien y a-t-il de jours en moyenne
entre deux séismes ? Quel est la probabilité qu'il y ait au moins un séisme dans une
année ? On ne s'intéresse ici qu'aux séismes de magnitude supérieure à m et on exprimera
les résultats en fonction de λm .
0.5pt
nombre moyen de séismes an un an=EN (m) = λm ,
1
nombre de jours en moyenne entre deux séismes=365/EN (m) = 365/λm ,
0.5pt probabilité qu'il y ait au moins un séisme dans une année=P(N (m) > 1) = 1 −
P(N = 0) = 1 − e−λm .
0.5pt
4. Supposons que l'on ait observé le nombre de tremblements de terre N1 (m), N2 (m), . . . Nk (m)
sur k années. On suppose que les variables (Ni (m))i=1,...,p sont indépendantes. Justiez
P
que Xk = k1 ki=1 Ni (m) converge presque-sûrement vers λm quand k tend vers l'inni.
1pt
Les Ni (m) sont i.i.d et ENi (m) = λm donc ceci résulte de la loi forte des grands
nombres.
5. En appliquant le théorème de la limite centrale, donnez une loi asymptotique de Xk .
Les Ni (m) sont i.i.d, ENi (m) = λm et V ar(Ni (m)) = λm . En appliquant le
√
m loi
théorème de la limite centrale, k X√k −λ
→ N (0, 1).
λm
1.5pt
Xk est approximativement de loi N (λm , λkm ) pour k grand.
6. Supposons que λm = 0.1. En supposant l'approximation de la question précédente valable,
quelle est la probabilité d'avoir observé plus de 3 séismes en k = 10 ans ?
On cherche P(X10 > 0.3).
En utilisant l'approximation précédente, P(X10 > 0.3) ' P(U > 2) avec U ∼ N (0, 1).
Par lecture de la table, on en déduit P(X10 > 0.3) ' 1 − 0.9772 = 0.0228 soit une
probabilité d'environ 2.3%.
0.5pt
1pt
1pt
7. Quelle critique peut-on apporter à cette modélisation ?
1pt
Pas de prise en compte des dépendances possibles entre les survenues des séismes
(répliques).
Exercice 2. (5 points)
Lors d'un appel à un moteur de recherche, celui-ci doit trier les diérents sites référencés. Le
principe PageRank utilisé par Google utilise la modélisation par les chaînes de Markov. Nous
évoquons ici cette modélisation.
Dans un premier temps à l'aide d'une méthode de fouilles de données, le moteur de recherche
récupère un nombre ni de sites internet correspondant à la recherche eectuée. La procédure
PageRank consiste alors à attribuer à ces sites un rang qui correspond à leur importance de
référencement.
Supposons qu'il y ait N sites notés {1, . . . , N } sélectionnés à la première étape. Soit Xk le k-ème
site internet visité par un utilisateur ctif. Le site contient des liens vers les autres sites. Soit
Ki le nombre total de liens vers d'autres sites contenus sur la page i. Nous noterons
pi,j
(
1/Ki
=
0
si le site i contient un lien vers le site j
si le site i ne contient pas de lien vers le site j.
On ne prend pas en compte l'auto-référencement ici.
2
On suppose que l'utilisateur clique de façon aléatoire sur les liens, et qu'ainsi P (Xk+1 = j|Xk =
i) = pi,j pour tout k ∈ N, que le site j ait déjà été visité ou non. Ce problème peut donc être
modélisé par une chaîne de Markov homogène. Soit G la matrice de transition.
Dans la suite nous considérons :



G=


?
?
?
?
?

1/3 1/3 0
1/2 0 1/2

0
0
0 

1/4 0 1/4
1/3 1/3 0
1/3
0
1
1/4
0
La chaîne associée est ergodique.
1. Compléter le premier vecteur colonne de la matrice de transition.
1pt
La somme de chaque ligne doit être égale à 1.
2. Que vaut N ici ? Que vaut p2,3 ?
1pt
N = 5, p2,3 = 1/2.
3. Quel site internet a le plus de liens entrants directs ?
0.5pt
Le numéro 3.
4. Parmi les lois suivantes, laquelle est une loi invariante pour cette chaîne de Markov ?
π (1)
π (2)
π (3)
π (4)
=
=
=
=
0.2 0.2 0.2 0.2 0.2
0.09 0.34 0.29 0.09 0.19
0.15 0.64 0.27 0.54 0.19
−0.09 0.48 0.29 0.54 −0.14
Aucune.
1.5pt
En procédant par élimination il s'agit de π (2) (π (3) et π (4) ne sont pas des lois et
n'est clairement pas solution).
π (1)
5. Quel site internet doit être proposé en premier par le moteur de recherche selon vous ?
Commentez.
Avec le principe PageRank, il faut proposer le site numéro 2.
0.5pt L'idée est que le site de référence n'est pas celui qui a le plus de liens directs mais
celui vers lequel on a la plus forte probabilité de tomber dans nos recherches.
0.5pt
Exercice 3. (3.5 points)
Un canal de communication transmet des signaux codés en bits valant 0 et 1. On note Xk le
k -ème bit envoyé. On sait que les '1' représentent une proportion p = 0.4 et les '0' une proportion
1 − p dans les messages envoyés. Ainsi, pour tout k ∈ N, P(Xk = 1) = p. On se place dans un
cadre simple et on suppose que les Xk sont indépendants.
La reception est perturbée et seuls 90% des bits sont bien reçus, 10% étant modiés (c'est-à-dire
envoyés en '1' et reçus en '0' et reciproquement). On suppose que les transmissions de chaque
bit (et les perturbations éventuelles) sont indépendantes. Soit Yk le k-ème bit reçu.
3
1. Quelle est la probabilité d'avoir Yk = 1 ?
1pt
P(Yk = 1) = P(Yk = 1|Xk = 1)P(Xk = 1) + P(Yk = 1|Xk = 0)P(Xk = 0) =
0.9p + 0.1(1 − p) = 0.42
2. Quelle est la probabilité que Xk = 1 sachant qu'on a reçu Yk = 1 ?
1.5pt
P(Xk = 1|Yk = 1) =
P(Yk =1|Xk =1)P(Xk =1)
P(Yk =1)
' 0.86
3. Quelle est la probabilité que l'on recoive un seul 1 sur trois bits sachant que l'on a envoyé
111 ?
1pt
La probabilité recherchée est 3 P(Yk = 1|Xk = 1)P(Yk = 0|Xk = 1)2 = 2.7%
4
Téléchargement