Université René Descartes LMD Sciences de la Vie et de la Santé
UFR Biomédicale, M1 de Santé Publique
45 rue des Saints-Père, 75 006 Paris Spécialité Biostatistique
M1
COURS de BIOSTATISTIQUE I
Bases : Probabilités, Estimation et Tests.
C. Huber
1
C. Huber
Table des matières
I Probabilités. Principes des tests et de l'estimation
1 Introduction 3
2 Calcul de probabilités et variables aléatoires réelles 3
3 Quelques lois de probabilité 5
A Lois continues 5
a. Lois normales 5
b. Lois exponentielles 7
c. Lois gamma 7
d. Lois du chi deux 8
e. Lois béta 9
f. Lois de Fisher-Snedecor 10
g. Lois de Student 10
B Lois discrètes 10
a. Lois de Bernoulli 10
b. Lois binomiales 10
c. Lois multinomiales 11
d. Lois de Poisson 11
4 Approximations 12
a. Approximation normale de la binomiale 12
b. Approximation normale d'une somme 12
c. Approximation de Poisson de la binomiale 13
d. Approximation normale du chi deux 13
5 Principe des tests 14
6 Principe de l'estimation et maximum de vraisemblance 15
II Tests d'ajustement
1 Introduction 17
2 Test d'ajustement du chi2 pour une loi spécifiée 17
a. cas discret 17
b. cas continu 18
3 Test d'ajustement du chi2 avec estimation de paramètres 19
4 Test de Kolmogorov-Smirnov pour un échantillon 23
III Mise en évidence de liaisons : tests d'indépendance
1 Cas de deux variables discrètes 25
a. à deux valeurs 25
b. à un nombre quelconque de valeurs 27
2 Cas d'une variable continue et d'une variable à deux valeurs 29
Test de comparaison de deux échantillons 30
Tests non paramétriques 32
Test de la médiane 33
Test de Wilcoxon 35
Test de Kolmogorov-Smirnov pour 2 échantillons 36
2
C. Huber
3 Cas de deux variables continues 38
a. Couple normal : test du coefficient de corrélation 38
b. Cas général : tests non paramétriques 39
coefficient de corrélation des rangs de Spearman 39
coefficient de corrélation de Kendall 41
c. Intervention d'un troisième facteur 43
coefficient de corrélation partielle 43
IV Tests non paramétriques pour comparer k échantillons
1 k échantillons indépendants 45
Extension du test de la médiane 46
Test de Kruskal-Wallis 49
2 k échantillons liés 52
Test de Cochran 52
Test de Friedman 54
V Exercices 57
Tables
Normale T1
Student T2
Chi deux T3
T4
Kolmogorov-Smirnov pour un échantillon T5
Wilcoxon, Mann-Whitney T6
T7
T8
T9
T10
Spearman T11
Kolmogorov-Smirnov pour deux échantillons T12
T13
Kendall T14
Fisher-Snedecor T15
T16
T17
T18
Kruskal-Wallis T19
T20
Friedman T21
T22
Probabilités et notions fondamentales 3
I Introduction :
Quelques notions de probabilités. Tests et estimateurs simples.
1 - Introduction
Nous introduisons dans ce chapitre les bases de probabilités nécessaires à la
compréhension des méthodes d'analyse statistique ainsi que les notions de base pour
l'estimation de paramètres et les tests d'hypothèses.
Le chapitre II, intitulé "Tests d'ajustement", traite le problème qui consiste à vérifier si une
variable aléatoire obéit effectivement à une loi de probabilité donnée à l'avance. C'est une
généralisation du problème de comparaison d'une proportion observée à une proportion
théorique, où la question est de savoir si une variable de Bernoulli obéit ou non à une loi
théorique donnée.
Le chapitre III concerne les tests d'homogénéité et d'indépendance, qui servent à mettre en
évidence des liaisons, par exemple entre un facteur de risque et une maladie. Cet exemple
conduit à la comparaison de deux proportions observées, qui peut être considéré:
- Soit comme un test d'homogénéité de deux échantillons d'une variable en {0,1}, (malades
et non-malades) : on se demande si le facteur de risque est présent dans la même proportion
dans les deux échantillons.
- Soit comme un test d'indépendance entre deux variables prenant les valeurs 0 ou 1.
Les tests de comparaison de deux échantillons sont de trois types:
- approchés: ils utilisent l'approximation normale, ce qui est possible lorsque la taille de
l'échantillon est assez grande,
- paramétriques: ils nécessitent de faire une hypothèse précise sur la loi des observations.
- non-paramétriques: ces derniers ont l'avantage d'être valables même lorsque les échantillons
sont très petits et de ne pas nécessiter d'hypothèse sur la loi les données, (contrairement par
exemple au test de Student qui, lui, exige que les variables suivent une loi normale, ce qui
n'est pas toujours le cas.).
Le chapitre IV donne des tests non paramétriques pour comparer plus de deux échantillons.
2 - Calcul des probabilités et variables aléatoires réelles
Voici, après l'exemple ci-dessous, quelques unes des propriétés les plus importantes d'une
probabilité définie sur un espace formé de E, ensemble fondamental des résultats possibles
de l'épreuve aléatoire et d'une famille de parties de E, appelées événements et formant une
tribu a. Ces événements seront notés A, B, C, D,... .
C. Huber
Probabilités et notions fondamentales 4
Exemple
Si on examine des patients en notant la présence ou l'absence de trois symptômes tels que
maux de tête (S1), insomnie (S2) et vertiges (S3), lorsqu'ils sont atteints d'une maladie M,
l'ensemble E des résultats possibles de l'examen a 2x2x2 = 8 éléments qui sont les
événements élémentaires :
(0,0,0) lorsque aucun des trois symptômes n'est présent,
(1,0,0) lorsque seul le premier est présent, etc..
(1,1,1) lorsque les trois symptômes sont présents.
a) Probabilité que A ou B se produisent : (additivité de la probabilité)
Si A et B sont deux événements d'intersection vide , c'est à dire qu'ils ne peuvent pas se
produire ne même temps, alors la probabilité que l'un ou l'autre se produise est égale à la
somme de leurs probabilités respectives :
P(AUB) = P(A)+P(B) .
b) Probabilité qu'un événement ne se produise pas : (complémentaire d'un événement)
Si A ne se produit pas, c'est que c'est son complémentaire Ac dans E qui se produit :
P(Ac) = 1 - P(A)
c) Probabilité que A se produise sachant que b s'est produit : (probabilité conditionnelle)
La probabilité de A conditionnellement à b est notée comme P(A|B) ou P(A|B) et définie
comme
P(A|B) = P(AB) / P(B)
Exemple :
Quelle est la probabilité de tirer un roi de cœur d'un jeu de 52 cartes ? Que devient cette
probabilité si on sait que la carte tirée est rouge ? si on sait qu'elle est noire ? si on sait que
c'est une figure ?
d) Probabilité que A et B se produisent ensemble :
Si A et B se produisent ensemble, c'est que l'intersection de A et B, notée AB, se
produit. Par définition même de la probabilité de A conditionnellement à B, notée P(A|B), on
a
P(AB) = P(A|B)P(B) = P(B|A)P(A)
Ces deux égalités sont toujours valables, sans condition.
e) Indépendance de deux événements :
Si A et B sont indépendants , P(AB) = P(A) P(B),
P(A|B) = P(A) ,
P(B|A) = P(B) .
Ces trois égalités sont équivalentes. Chacune d'elles peut être prise pour définition de
l'indépendance de A et B.
Espérance et variance d'une variable aléatoire réelle :
Si X est une variable aléatoire réelle (v.a.r.) , son espérance, ou moyenne, EX et sa
variance Var(X), sont ainsi définies :
C. Huber
1 / 67 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !