Variables aléatoires et Lois de probabilité - Estimation

publicité
Variables aléatoires
et Lois de probabilité
- Estimation
Jean Gaudart
Laboratoire d’Enseignement et de Recherche
sur le Traitement de l’Information Médicale
[email protected]
Faculté de Médecine
Université de la Méditerranée
J Gaudart, LERTIM, Aix-Marseille Université
2011
1
plan
1. Variables Aléatoires
2. Lois de Distribution
2.1 Présentation
2.2 Loi Uniforme
2.3 Loi Normale
2.4 Loi de Student
2.5 Loi du Chi 2
2.6 Loi de Bernoulli et Loi Binomiale
2.7 Loi de Poisson
3. Estimation
3.1 Estimations ponctuelles
3.2 Estimations par intervalle
J Gaudart, LERTIM, Aix-Marseille Université
2011
2
Variable Aléatoire
Lois de distribution
Estimation
Présentation
Caractéristiques
1. Variables Aléatoire
1.1 Présentation
• Exemples
– Age (en années)
– Tension artérielle systolique (en mmHg)
– Stades de gravités d’une maladie (0-1-2-3-4)
– Sexe (Homme/Femme)
– Cancer (Présence/Absence)
– Nombre de malades
– …
→ Mesures qui varient d’un individu à l’autre
J Gaudart, LERTIM, Aix-Marseille Université
2011
3
Variable Aléatoire
Lois de distribution
Estimation
Présentation
Caractéristiques
• Caractériser une variable aléatoire ⇒ statistiques
descriptives
–
–
–
–
–
–
Age (en années)
Moyenne, variance, % classes d’âges
Tension artérielle systolique (en mmHg) Moyenne, variance
Stades de gravités d’une maladie (0-1-2-3-4) n, %
n, %
Sexe (Homme/Femme)
Cancer (Présence/Absence) n, %
Moyenne, variance, % >k
Nombre de malades
J Gaudart, LERTIM, Aix-Marseille Université
2011
4
Variable Aléatoire
Lois de distribution
Estimation
Présentation
Caractéristiques
• Exemple
– Pourcentage d’individus par classe d’âge dans la population
française, au 1er Janvier 2011
%
Mesure : Age
J Gaudart, LERTIM, Aix-Marseille Université
2011
5
Présentation
Caractéristiques
Variable Aléatoire
Lois de distribution
Estimation
1.2 Caractéristiques d’une V.A.
• Variables Qualitatives
⇒ Mesure d’une qualité
– Sexe (Homme/Femme)
– Maladie (Présence/Absence)
– Stades de gravité (0-1-2-3-4)
Attention aux codes
Plusieurs modalités, 1 individu ∈ 1 seule modalité
⇒ Types
– Nominal : sans ordre
– Ordinale : avec ordre
J Gaudart, LERTIM, Aix-Marseille Université
2011
6
Variable Aléatoire
Lois de distribution
Estimation
Présentation
Caractéristiques
⇒ Caractéristiques
–
–
–
–
–
Nombre d’individus par modalités
Pourcentages d’individus par modalités
Classe modale, classe médiane
Pourcentages d’individus > une classe (VA ordinales)
Diagramme bâton
J Gaudart, LERTIM, Aix-Marseille Université
2011
7
Variable Aléatoire
Lois de distribution
Estimation
Présentation
Caractéristiques
• Variables Quantitatives
⇒ Mesure d’une quantité
– Âge
– TAS
– Nombre d’enfants dans une fratrie
Plusieurs valeurs, 1 individu = 1 seule valeur
⇒ Types
– Continue : ex TAS
– Discrète : ex Nombre d’enfants
Les VA continues sont souvent discrétisées : Âge en années
J Gaudart, LERTIM, Aix-Marseille Université
2011
8
Variable Aléatoire
Lois de distribution
Estimation
Présentation
Caractéristiques
⇒ Caractéristiques
–
–
–
–
Moyenne, variance, mode, médiane
Nombre ou % d’individus par classes (VA discrétisées)
Pourcentages d’individus > une Valeur
Histogramme
J Gaudart, LERTIM, Aix-Marseille Université
2011
9
Variable Aléatoire
Lois de distribution
Estimation
Présentation
Lois
2. Lois de distribution
2.1 Présentation
Depuis plusieurs siècles, de nombreuses mesures ont été
réalisées et caractérisées
⇒Caractéristiques similaires / types de mesures
⇒Classification de types de mesures
⇒Règles ou lois et propriétés mathématiques
Exemple: loi Normale
J Gaudart, LERTIM, Aix-Marseille Université
2011
10
• Exemple : Tension Artérielle Systolique
n = 58; m=126 mmHg; var=75,9 mmHg²;
min=106mmHg; max=143 mmHg
0.00
0.01
0.02
Density
0.03
0.04
0.05
Histogram of TAS
110
120
130
140
TAS4
J Gaudart, LERTIM, Aix-Marseille Université
2011
11
Variable Aléatoire
Lois de distribution
Estimation
Présentation
Lois
f(x)
x
J Gaudart, LERTIM, Aix-Marseille Université
2011
12
Variable Aléatoire
Lois de distribution
Estimation
2.2 Loi Uniforme
⇒ Caractéristiques
Présentation
Loi Uniforme
 1
f ( x ) =  (b − a ) si a ≤ x ≤ b

0 si non
– min = a, max = b
a+b
µ=
2
2
(
b − a)
σ² =
12
J Gaudart, LERTIM, Aix-Marseille Université
2011
13
Variable Aléatoire
Lois de distribution
Estimation
Présentation
Loi Normale
2.3 Loi Normale (Laplace – Gauss)
f (x ) =
⇒ Caractéristiques
– moyenne = µ, variance = σ²
 1  x − µ  2 
exp −  2  
2
 2  σ  
2σ π
1
n
µ=
∑x
i =1
n
n
σ² =
∑ (x
i =1
i
i
− µ )²
n
J Gaudart, LERTIM, Aix-Marseille Université
2011
14
Variable Aléatoire
Lois de distribution
Estimation
Présentation
Loi Normale
• cas particulier: la loi Normale centrée réduite
µ= 0 et σ²=1
J Gaudart, LERTIM, Aix-Marseille Université
2011
15
Variable Aléatoire
Lois de distribution
Estimation
Présentation
Loi de Student
2.4 Loi de Student (William Gosset)
⇒ Caractéristiques
– moyenne = µ, variance = σ², degrés de liberté = ν
J Gaudart, LERTIM, Aix-Marseille Université
2011
16
Présentation
Loi du Chi 2
Variable Aléatoire
Lois de distribution
Estimation
2.5 Loi du Chi 2 (Karl Pearson)
⇒ Caractéristiques
– degrés de liberté = ν
µ =ν
σ ² = 2ν
J Gaudart, LERTIM, Aix-Marseille Université
2011
17
Variable Aléatoire
Lois de distribution
Estimation
Présentation
Loi Bernoulli / Binomiale
2.6 Loi de Bernoulli et loi Binomiale (Jacques Bernoulli)
⇒ Loi de Bernoulli => loi des variables binaires
(succès/échec; 0/1)
⇒Caractéristiques
– Probabilité que la mesure prenne la valeur 1 p(X=1)= p
 p si x = 1

P ( X = x ) = 1 − p si x = 0
 0 si non

µ=p
σ ² = p (1 − p )
J Gaudart, LERTIM, Aix-Marseille Université
2011
18
Variable Aléatoire
Lois de distribution
Estimation
Présentation
Loi Bernoulli / Binomiale
⇒ Loi Binomiale=> loi du nombre de succès
⇒ Caractéristiques
– Probabilité de succès p
– Nombre de sujets (nombre d’épreuves) n
µ = np
p (1 − p )
σ² =
n
J Gaudart, LERTIM, Aix-Marseille Université
2011
19
Variable Aléatoire
Lois de distribution
Estimation
Présentation
Loi de Poisson
2.7 Loi de Poisson (Siméon-Denis Poisson)
⇒loi des variables de comptage
⇒Caractéristiques
– Nombre moyen λ
µ=λ
σ² = λ
J Gaudart, LERTIM, Aix-Marseille Université
2011
20
• exemple : SARM, comptage des prélèvements positifs
0.04
0.03
0.00
0.01
0.02
Density
0.05
0.06
Histogram of SAR
15
20
25
30
35
40
45
SARM
J Gaudart, LERTIM, Aix-Marseille Université
2011
21
Théorème central limite
Soit Xn une suite de n variable aléatoires de même loi
quelconque , de moyenne µ et de variance σ²
Si n est grand, M suit une loi Normale de moyenne µ et de
variance σ²/n
http://www.aiaccess.net/French/Glossaires/GlosMod/f_gm_central.htm
J Gaudart, LERTIM, Aix-Marseille Université
2011
22
3. Estimation
3.1 Estimation ponctuelle
Quelles sont les vraies valeurs, dans la population,
lorsqu’on ne possède que des observations faîtes sur un
échantillon?
Valeur la plus vraisemblable => estimation ponctuelle
• Exemples:
− TAS moyenne chez un type de patients
− % BMI>35 dans la population
− Nombre moyen d’infections nosocomiales dans un
hôpital
J Gaudart, LERTIM, Aix-Marseille Université
2011
23
J Gaudart, LERTIM, Aix-Marseille Université
2011
24
Références
Jean Bouyer:
éditions INSERM
,
Jean Bouyer: Epidémiologie, méthodes quantitatives,
éditions INSERM
Coll.: Biostatistiques, éditions Omnisciences
J Gaudart, LERTIM, Aix-Marseille Université
2011
25
Téléchargement