Statistiques II

publicité
Exercices Lois discrètes Lois continues
Statistiques II
Alexandre Caboussat
[email protected]
Classe : Mardi 11h15 - 13h00
Salle : C110
http://campus.hesge.ch/caboussata
12 avril 2011
A. Caboussat, HEG
STAT II, 2011
1 / 27
Exercices Lois discrètes Lois continues
Exercice 3.3 (suite)
On note N le nombre de personnes à interroger pour obtenir exactement
3 personnes connaissant l’entreprise (p étant toujours égal à 0.6).
3
Quelle est la loi de N? Donner son espérance et sa variance.
4
Calculer P(N > 3).
A. Caboussat, HEG
STAT II, 2011
2 / 27
Exercices Lois discrètes Lois continues
Exercice 3.4
1
Calculer p, la probabilité qu’un individu de cette ville achète le
journal A.
2
Quelle loi suit N ? Donner son espérance et sa variance.
3
Calculer P(N = 2), P(N > 2) et P(N = 0).
A. Caboussat, HEG
STAT II, 2011
3 / 27
Exercices Lois discrètes Lois continues
Exercice 3.4 (suite)
On s’intéresse maintenant au nombre de personnes que l’on doit
interroger pour obtenir deux acheteurs du journal.
4
Calculer P(N = 4) et P(N > 4).
A. Caboussat, HEG
STAT II, 2011
4 / 27
Exercices Lois discrètes Lois continues
Exercice 3.7
1
En fonction des informations données, quelle est la loi de
distribution de la variable X ? Calculer son espérance et sa variance.
2
Calculer la probabilité que dans l’échantillon sélectionné il y ait
exactement 2 entreprises créées après l’an 2000.
A. Caboussat, HEG
STAT II, 2011
5 / 27
Exercices Lois discrètes Lois continues
Loi de Poisson
Nous nous intéressons maintenant à un phénomène purement
aléatoire se produisant un certain nombre de fois durant un laps de
temps donné ou sur une surface donnée. Les différentes réalisations
du phénomène sont supposées indépendantes les unes des autres.
Si λ représente le nombre moyen de réalisations du phénomène
dans l’intervalle de temps étudié ou sur la surface étudiée, alors une
variable Y représentant le nombre de survenances du phénomène
suit une loi de Poisson:
Y ∼ Poisson(λ)
A. Caboussat, HEG
STAT II, 2011
6 / 27
Exercices Lois discrètes Lois continues
Construction de la loi de Poisson
Considérons un intervalle de temps de longueur T . Si l’on divise
l’intervalle [0,T ] en un grand nombre g de sous-intervalles de
longueur T /g , il est possible d’admettre que le phénomène pourra
se produire au plus une fois dans chaque sous-intervalle.
A. Caboussat, HEG
STAT II, 2011
7 / 27
Exercices Lois discrètes Lois continues
Construction de la loi de Poisson (2)
La probabilité d’observer le phénomène dans l’un des intervalles est
p = λ/g et il est possible d’associer une variable de Bernoulli Xi à
chacun des intervalles:
0
xi
p(xi ) (1 − gλ )
1
λ
g
où 0 dénote la non-survenance du phénomène et 1 sa survenance.
A. Caboussat, HEG
STAT II, 2011
8 / 27
Exercices Lois discrètes Lois continues
Construction de la loi de Poisson (3)
La variable Y représentant le nombre total de réalisations sur [0, T ]
s’exprime alors comme la somme des Xi :
Y =
g
X
Xi
i=1
et elle suit une loi binomiale de paramètres g et p = λ/g :
λ
Y ∼ Bin g ,
g
avec
E(Y ) = λ
Var(Y ) = λ
A. Caboussat, HEG
1−
λ
g
STAT II, 2011
9 / 27
Exercices Lois discrètes Lois continues
Construction de la loi de Poisson (4)
La loi de Poisson proprement dite correspond au cas où le nombre
g d’intervalles tend vers l’infini, c’est-à-dire au cas où la taille de
chacun de ces intervalles devient infinitésimale.
Dans ce cas,
Y ∼ Poisson(λ)
et la distribution de probabilité s’écrit
P(Y = y ) =
A. Caboussat, HEG
e −λ λy
y!
STAT II, 2011
10 / 27
Exercices Lois discrètes Lois continues
P(Y = y )
=
=
lim
g →∞
lim
g →∞
=
λy
y!
=
λy
y!
g
y
A. Caboussat, HEG
λ
1−
g
g!
y ! (g − y )!
g −y y
λ
g
g −y y
λ
λ
λ
1−
1−
g
g
gy
g −y
λ
λ
g (g − 1) . . . (g − y + 1)
·
1
−
1
−
g →∞
gy
g
g
lim
lim
g
(g − 1)
g →∞ g
|{z} |
1
=
g
{z
→1
}
. . . (g − y + 1) ·
|
g
{z
→1
}
„
« „
«
λ −y
λ g
1−
1−
g
g
|
{z
}|
{z
}
→e −λ
→1
e −λ λy
y!
STAT II, 2011
11 / 27
Exercices Lois discrètes Lois continues
Loi de Poisson
La loi de Poisson a pour propriétés: E(Y ) = Var(Y ) = λ. Ainsi, la
loi de Poisson est caractérisée par le fait que son espérance est
égale à sa variance.
Remarque: Le nombre possible de succès y n’est pas borné
supérieurement, donc l’ensemble de modalités que peut prendre la
variable Y est l’ensemble des nombres naturels N. Cet ensemble est
infini, mais dénombrable, ce qui fait de Y une variable aléatoire
discrète.
A. Caboussat, HEG
STAT II, 2011
12 / 27
Exercices Lois discrètes Lois continues
Loi de Poisson
Exemple: Chaque jour, 48 personnes en moyenne se présentent au
service des urgences d’un hôpital régional. En supposant que ces
personnes arrivent de façon parfaitement aléatoire durant les 24
heures, quelle est la probabilité d’observer l’arrivée de 3 personnes
en 1 heure?
Y : nombre de personnes arrivant en une heure.
λ = 48/24=2 personnes par heure en moyenne.
Y ∼ Poisson(2)
=⇒ E(Y ) = Var(Y ) = 2
P(Y = 3) =
e −2 23
= 0.180
3!
y
0
1
2
3
4
...
p(y ) 0.135 0.271 0.271 0.180 0.090 . . .
A. Caboussat, HEG
STAT II, 2011
13 / 27
Exercices Lois discrètes Lois continues
Loi de Poisson
Lorsque l’unité de temps ou de surface est multipliée par un
coefficient ω, on obtient une nouvelle loi de Poisson de paramètre
ω λ.
Loi suivie par la variable Y24 représentant le nombre de personnes
arrivant durant 24 heures:
Y24 ∼ Poisson(24 · λ) = Poisson(48)
A. Caboussat, HEG
STAT II, 2011
14 / 27
Exercices Lois discrètes Lois continues
Lois de probabilités continues
A. Caboussat, HEG
STAT II, 2011
15 / 27
Exercices Lois discrètes Lois continues
Introduction
Dans beaucoup de situations, le nombre de modalités que peut
prendre une variable aléatoire est très grand, voire infini. En
statistique inférentielle notamment, les caractéristiques d’un
échantillon telles que la moyenne ou la variance peuvent prendre
une infinité de valeurs différentes. Ces quantités sont alors
représentées par des lois de probabilité continues. Les plus utilisées
sont
la loi uniforme; X
la loi exponentielle; X
la loi normale (loi de Laplace-Gauss);X
la loi du chi-2;
la loi de Student;
la loi de Fisher-Snedecor.
A. Caboussat, HEG
STAT II, 2011
16 / 27
Exercices Lois discrètes Lois continues
Introduction
Ces lois sont parfaitement connues et des tables statistiques
permettent de déterminer les probabilités qui leurs sont associées.
L’utilisation de ces lois permet notamment de calculer des
intervalles de confiance et de tester des hypothèses statistiques.
A. Caboussat, HEG
STAT II, 2011
17 / 27
Exercices Lois discrètes Lois continues
Variable aléatoire continue
Une variable aléatoire continue X prend ses valeurs dans un
ensemble continu. Cet ensemble peut être n’importe quel intervalle,
qui est un sous-ensemble de l’ensemble des réels R (éventuellement
R tout entier):
X ∈ [v , w ]
avec v , w ∈ R, v < w .
Le nombre de valeurs possibles de X étant infini, chacune de ces
valeurs a une probabilité nulle. En revanche, il est possible de
calculer la probabilité associée à n’importe quel sous-intervalle [a, b]
de [v , w ]:
P(X = x) = 0,
P(X ∈ [a, b]) ≥ 0,
A. Caboussat, HEG
pour x ∈ [v , w ]
pour a < b,
[a, b] ⊆ [v , w ]
STAT II, 2011
18 / 27
Exercices Lois discrètes Lois continues
Fonction de densité
Une distribution continue est définie soit par sa fonction de densité,
soit par sa fonction de répartition.
Une distribution continue peut être représentée par un
histogramme. Si l’on dispose d’un grand nombre d’observations, il
est possible de définir des classes de très petite amplitude. A la
limite, les classes devienent d’amplitude nulle et l’histogramme
devient une courbe. Cette courbe est la fonction de densité de la
variable aléatoire continue X , notée f (x).
A. Caboussat, HEG
STAT II, 2011
19 / 27
Exercices Lois discrètes Lois continues
Fonction de densité
A. Caboussat, HEG
STAT II, 2011
20 / 27
Exercices Lois discrètes Lois continues
Fonction de densité
La fonction de densité n’est pas une distribution de probabilité. En
effet, pour tout x ∈ [v , w ],
P(X = x) = 0, mais f (x) ≥ 0.
En revanche, la probabilité d’être dans un intervalle de longueur dx
très petit est donnée par f (x) dx:
P(X ∈ [x, x + dx]) = f (x) dx
La probabilité de se trouver dans un intervalle [a, b] est définie
comme l’aire sous la fonction de densité:
A. Caboussat, HEG
STAT II, 2011
21 / 27
Exercices Lois discrètes Lois continues
Fonction de densité
Mathématiquement, cela revient à calculer l’intégrale de la fonction
f (x) entre a et b:
Z
P(X ∈ [a, b]) =
b
f (x) dx
a
Pour que la fonction f (x) soit une fonction de densité, on doit
avoir
Z ∞
P(X ∈ ] − ∞, ∞[) = 1 =
f (x) dx
−∞
f (x) ≥ 0,
pour
x ∈R
Remarque: Contrairement aux lois de probabilité, il est tout à
fait possible que f (x) > 1 pour certaines valeurs de x. Cependant,
vu que l’aire totale sous la courbe doit être égale à 1, f (x) ne
pourra pas être supérieure à 1 sur un trop grand intervalle.
A. Caboussat, HEG
STAT II, 2011
22 / 27
Exercices Lois discrètes Lois continues
Fonction de répartition (ou de distribution)
La fonction de répartition, notée F (x), donne pour toute valeur x
la probabilité d’être inférieur ou égal à x. Cela correspond à la
surface sous la fonction de densité à gauche de x:
Z x
f (x) dx
F (x) = P(X ≤ x) =
−∞
La fonction de répartition vérifie F (−∞) = 0, F (∞) = 1.
La probabilité d’être dans un intervalle [a, b] est donnée par
P(X ∈ [a, b]) = F (b) − F (a)
A. Caboussat, HEG
STAT II, 2011
23 / 27
Exercices Lois discrètes Lois continues
Complémentarité
Par complémentarité, la relation suivante est vérifiée pour toute
fonction de répartition:
A. Caboussat, HEG
STAT II, 2011
24 / 27
Exercices Lois discrètes Lois continues
Symétrie
Si la fonction de densité est symétrique autour d’une valeur µ, alors
A. Caboussat, HEG
STAT II, 2011
25 / 27
Exercices Lois discrètes Lois continues
Monotonie
Puisque P(X ∈ [a, b]) = F (b) − F (a) ≥ 0, alors F (a) ≤ F (b) quels
que soient a < b, c’est à dire que F n’est jamais décroissante. On
dit que F est monotone non décroissante.
A. Caboussat, HEG
STAT II, 2011
26 / 27
Exercices Lois discrètes Lois continues
Exercices
A. Caboussat, HEG
STAT II, 2011
27 / 27
Téléchargement