Variables aléatoires et Lois de probabilité - Estimation Jean Gaudart Laboratoire d’Enseignement et de Recherche sur le Traitement de l’Information Médicale [email protected] Faculté de Médecine Université de la Méditerranée J Gaudart, LERTIM, Aix-Marseille Université 2011 1 plan 1. Variables Aléatoires 2. Lois de Distribution 2.1 Présentation 2.2 Loi Uniforme 2.3 Loi Normale 2.4 Loi de Student 2.5 Loi du Chi 2 2.6 Loi de Bernoulli et Loi Binomiale 2.7 Loi de Poisson 3. Estimation 3.1 Estimations ponctuelles 3.2 Estimations par intervalle J Gaudart, LERTIM, Aix-Marseille Université 2011 2 Variable Aléatoire Lois de distribution Estimation Présentation Caractéristiques 1. Variables Aléatoire 1.1 Présentation • Exemples – Age (en années) – Tension artérielle systolique (en mmHg) – Stades de gravités d’une maladie (0-1-2-3-4) – Sexe (Homme/Femme) – Cancer (Présence/Absence) – Nombre de malades – … → Mesures qui varient d’un individu à l’autre J Gaudart, LERTIM, Aix-Marseille Université 2011 3 Variable Aléatoire Lois de distribution Estimation Présentation Caractéristiques • Caractériser une variable aléatoire ⇒ statistiques descriptives – – – – – – Age (en années) Moyenne, variance, % classes d’âges Tension artérielle systolique (en mmHg) Moyenne, variance Stades de gravités d’une maladie (0-1-2-3-4) n, % n, % Sexe (Homme/Femme) Cancer (Présence/Absence) n, % Moyenne, variance, % >k Nombre de malades J Gaudart, LERTIM, Aix-Marseille Université 2011 4 Variable Aléatoire Lois de distribution Estimation Présentation Caractéristiques • Exemple – Pourcentage d’individus par classe d’âge dans la population française, au 1er Janvier 2011 % Mesure : Age J Gaudart, LERTIM, Aix-Marseille Université 2011 5 Présentation Caractéristiques Variable Aléatoire Lois de distribution Estimation 1.2 Caractéristiques d’une V.A. • Variables Qualitatives ⇒ Mesure d’une qualité – Sexe (Homme/Femme) – Maladie (Présence/Absence) – Stades de gravité (0-1-2-3-4) Attention aux codes Plusieurs modalités, 1 individu ∈ 1 seule modalité ⇒ Types – Nominal : sans ordre – Ordinale : avec ordre J Gaudart, LERTIM, Aix-Marseille Université 2011 6 Variable Aléatoire Lois de distribution Estimation Présentation Caractéristiques ⇒ Caractéristiques – – – – – Nombre d’individus par modalités Pourcentages d’individus par modalités Classe modale, classe médiane Pourcentages d’individus > une classe (VA ordinales) Diagramme bâton J Gaudart, LERTIM, Aix-Marseille Université 2011 7 Variable Aléatoire Lois de distribution Estimation Présentation Caractéristiques • Variables Quantitatives ⇒ Mesure d’une quantité – Âge – TAS – Nombre d’enfants dans une fratrie Plusieurs valeurs, 1 individu = 1 seule valeur ⇒ Types – Continue : ex TAS – Discrète : ex Nombre d’enfants Les VA continues sont souvent discrétisées : Âge en années J Gaudart, LERTIM, Aix-Marseille Université 2011 8 Variable Aléatoire Lois de distribution Estimation Présentation Caractéristiques ⇒ Caractéristiques – – – – Moyenne, variance, mode, médiane Nombre ou % d’individus par classes (VA discrétisées) Pourcentages d’individus > une Valeur Histogramme J Gaudart, LERTIM, Aix-Marseille Université 2011 9 Variable Aléatoire Lois de distribution Estimation Présentation Lois 2. Lois de distribution 2.1 Présentation Depuis plusieurs siècles, de nombreuses mesures ont été réalisées et caractérisées ⇒Caractéristiques similaires / types de mesures ⇒Classification de types de mesures ⇒Règles ou lois et propriétés mathématiques Exemple: loi Normale J Gaudart, LERTIM, Aix-Marseille Université 2011 10 • Exemple : Tension Artérielle Systolique n = 58; m=126 mmHg; var=75,9 mmHg²; min=106mmHg; max=143 mmHg 0.00 0.01 0.02 Density 0.03 0.04 0.05 Histogram of TAS 110 120 130 140 TAS4 J Gaudart, LERTIM, Aix-Marseille Université 2011 11 Variable Aléatoire Lois de distribution Estimation Présentation Lois f(x) x J Gaudart, LERTIM, Aix-Marseille Université 2011 12 Variable Aléatoire Lois de distribution Estimation 2.2 Loi Uniforme ⇒ Caractéristiques Présentation Loi Uniforme 1 f ( x ) = (b − a ) si a ≤ x ≤ b 0 si non – min = a, max = b a+b µ= 2 2 ( b − a) σ² = 12 J Gaudart, LERTIM, Aix-Marseille Université 2011 13 Variable Aléatoire Lois de distribution Estimation Présentation Loi Normale 2.3 Loi Normale (Laplace – Gauss) f (x ) = ⇒ Caractéristiques – moyenne = µ, variance = σ² 1 x − µ 2 exp − 2 2 2 σ 2σ π 1 n µ= ∑x i =1 n n σ² = ∑ (x i =1 i i − µ )² n J Gaudart, LERTIM, Aix-Marseille Université 2011 14 Variable Aléatoire Lois de distribution Estimation Présentation Loi Normale • cas particulier: la loi Normale centrée réduite µ= 0 et σ²=1 J Gaudart, LERTIM, Aix-Marseille Université 2011 15 Variable Aléatoire Lois de distribution Estimation Présentation Loi de Student 2.4 Loi de Student (William Gosset) ⇒ Caractéristiques – moyenne = µ, variance = σ², degrés de liberté = ν J Gaudart, LERTIM, Aix-Marseille Université 2011 16 Présentation Loi du Chi 2 Variable Aléatoire Lois de distribution Estimation 2.5 Loi du Chi 2 (Karl Pearson) ⇒ Caractéristiques – degrés de liberté = ν µ =ν σ ² = 2ν J Gaudart, LERTIM, Aix-Marseille Université 2011 17 Variable Aléatoire Lois de distribution Estimation Présentation Loi Bernoulli / Binomiale 2.6 Loi de Bernoulli et loi Binomiale (Jacques Bernoulli) ⇒ Loi de Bernoulli => loi des variables binaires (succès/échec; 0/1) ⇒Caractéristiques – Probabilité que la mesure prenne la valeur 1 p(X=1)= p p si x = 1 P ( X = x ) = 1 − p si x = 0 0 si non µ=p σ ² = p (1 − p ) J Gaudart, LERTIM, Aix-Marseille Université 2011 18 Variable Aléatoire Lois de distribution Estimation Présentation Loi Bernoulli / Binomiale ⇒ Loi Binomiale=> loi du nombre de succès ⇒ Caractéristiques – Probabilité de succès p – Nombre de sujets (nombre d’épreuves) n µ = np p (1 − p ) σ² = n J Gaudart, LERTIM, Aix-Marseille Université 2011 19 Variable Aléatoire Lois de distribution Estimation Présentation Loi de Poisson 2.7 Loi de Poisson (Siméon-Denis Poisson) ⇒loi des variables de comptage ⇒Caractéristiques – Nombre moyen λ µ=λ σ² = λ J Gaudart, LERTIM, Aix-Marseille Université 2011 20 • exemple : SARM, comptage des prélèvements positifs 0.04 0.03 0.00 0.01 0.02 Density 0.05 0.06 Histogram of SAR 15 20 25 30 35 40 45 SARM J Gaudart, LERTIM, Aix-Marseille Université 2011 21 Théorème central limite Soit Xn une suite de n variable aléatoires de même loi quelconque , de moyenne µ et de variance σ² Si n est grand, M suit une loi Normale de moyenne µ et de variance σ²/n http://www.aiaccess.net/French/Glossaires/GlosMod/f_gm_central.htm J Gaudart, LERTIM, Aix-Marseille Université 2011 22 3. Estimation 3.1 Estimation ponctuelle Quelles sont les vraies valeurs, dans la population, lorsqu’on ne possède que des observations faîtes sur un échantillon? Valeur la plus vraisemblable => estimation ponctuelle • Exemples: − TAS moyenne chez un type de patients − % BMI>35 dans la population − Nombre moyen d’infections nosocomiales dans un hôpital J Gaudart, LERTIM, Aix-Marseille Université 2011 23 J Gaudart, LERTIM, Aix-Marseille Université 2011 24 Références Jean Bouyer: éditions INSERM , Jean Bouyer: Epidémiologie, méthodes quantitatives, éditions INSERM Coll.: Biostatistiques, éditions Omnisciences J Gaudart, LERTIM, Aix-Marseille Université 2011 25