P - Tutorat Associatif Toulousain

publicité
Tutorat Associatif Toulousain
133, Route de Narbonne
31062 TOULOUSE CEDEX
Année universitaire 2015 - 2016
P.A.C.E.S
UE4 : Évaluation des méthodes d'analyse
appliquées aux sciences de la vie et de la
santé
BIOSTATISTIQUES
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
1
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
2
Préface
Ce polycopié est destiné aux étudiants en Première Année Commune aux Études de
Santé (P.A.C.E.S.) en complément des enseignements dispensés à la faculté.
En aucun cas les informations contenues dans ce polycopié ne
pourront engager la responsabilité des facultés de médecine et
de pharmacie ou de mesdames et messieurs les professeurs.
L'année 2010-2011 a été marquée par la réforme de la PACES, et nous avons
fait tout notre possible pour réadapter ce polycopié aux nouveaux cours. Nous avons
tâché autant que possible d'éliminer les items traitant de parties de cours obsolètes.
Nous nous excusons d'avance si toutefois des QCMs inadaptés nous auraient
échappés. Nous vous invitons à signaler toute erreur ou toute remarque sur le forum
de Tutoweb ou bien lors des permanences.
Ce polycopié a été réalisé, revu, corrigé et complété par les équipes successives de
tuteurs.
Un merci tout particulier à Elodie Bernard, Emma Clot et Raphaël Fourès pour leur
travail exemplaire.
Compilé par Jack Holliday
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
3
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
4
SOMMAIRE
–
Notions Élémentaires – Fonctions.....................p 7
–
Biostatistiques..................................................p 38
–
Lois de Probabilités.........................................p 63
–
Tests Statistiques .............................................p 76
–
Épidémiologie..................................................p 97
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
5
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
6
I - Notions Élémentaires - Fonctions – Synthèse
Plan
Rappels – Définitions
Fonctions usuelles :
–
inverse
–
polynomiale
–
racine carrée
–
exponentielle
–
logarithme
–
trigonométriques
Analyse des fonctions :
–
domaine de définition
–
variations
–
extrema
–
limites et asymptotes
–
tableau de variation
Fonctions de plusieurs variables :
–
application partielle
–
dérivée partielle
–
différentielle
–
extrema
Incertitude :
–
incertitude absolue
–
incertitude relative
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
7
I. RAPPELS - DEFINITIONS
•
Domaine de définition Df : C'est l'ensemble des éléments x pour lesquels f(x) existe.
•
Symétrie:
◦ Par rapport à un point:
▪ La symétrie de centre O est la transformation qui pour tout point M, associe le point
M' tel que O soit le milieu de MM'.
▪ La symétrie par rapport à l'origine f (-x)= -f(x) (fonction "impaire")
◦
Par rapport à une droite:
▪ Le point B est le symétrique du point A par rapport à la droite d si la droite d est la
médiatrice du segment [AB] .
▪ Symétrie par rapport à l'axe des ordonnées f (-x) = f (x) (fonction "paire").
•
Périodicité: f est dite périodique de période P si f ( x+P ) = f(x) ; ou le graphe de f est
invariant par translation d'un vecteur ( P,0).
•
Variations:
◦ f étant dérivable sur I, pour tout intervalle J inclus dans I :
▪ Si f '(x) > 0, pour tout x de J, alors f est strictement croissante sur J.
▪ Si f '(x) < 0, pour tout x de J, alors f est strictement décroissante sur J.
▪ Si f '(x) = 0, pour tout x de J, alors f est constante sur J.
◦
Exemple:
◦
Astuce : vérifiez toujours l'intervalle de définition avant de dériver car si la fonction
n'existe pas pour une partie de l'intervalle demandé, vous n'avez pas à aller plus loin.
Continuité :une fonction f est continue sur son domaine de définition lorsqu'elle est continue
en tout point de son domaine de définition (tracer de courbe sans lever la main).
•
Asymptotes :
◦ Une droite d'équation x = x0 est asymptote à la courbe de la fonction f lorsque lim x-->x0
f(x) = ±
◦ Une droite d'équation y = y0 est asymptote à la courbe de la fonction f lorsque limx-->±∞
f(x)= y0
◦ Il existe également des asymptotes obliques : la droite d'équation y = ax + b est
asymptote à la courbe représentative de la fonction f (x) lorsque limx-- >±∞ f(x)8
•
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
8
(ax+b)=0.
II. FONCTIONS USUELLES
1. Fonction inverse f(x) = 1/x
•
Variations : Strictement décroissante sur ]- ;0 [ puis sur ]0; ]
attention ! pas strictement décroissante sur IR* car pour -x<x on a f(-x)<f(x)
•
Limites : lim
8
Df = IR* (continue sur son intervalle de définition).
8
•
1
=0
x →+∞ x
1
lim =0
x →−∞ x
1
lim =−∞
x →0 x
1
lim =+∞
x →0 x
-
+
8
asymptote verticale en 0, d'équation x = 0
asymptote horizontale en +/d'équation y = 0.
•
Symétrie : La fonction inverse est impaire.
2. Fonctions polynômes f(x) = anxn + an-1xn-1 + ... + a1x + a0
•
•
D(f) = IR
continues sur IR
Limites d'un polynôme
La limite d'un polynôme en ±
8
•
est équivalente à son monôme de plus haut degré
•
Symétrie des monômes
Un monôme admet une symétrie axiale si n pair,
une symétrie par rapport à l'origine si n impair.
•
Voir les variations et limites des monômes grâce à leur représentation graphique selon le
degré n pair/impair et le coefficient positif/négatif dans le polycopié de la fac.
Les polynômes n'ont pas de propriétés remarquables par rapport aux symétries et variations
•
•
•
Df =IR+ ou [0 ;+
8
3. Fonction racine f(x)=√ x
[.
Variations : Strictement croissante et continue ; pas de propriétés de symétrie
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
9
Limites : Limx-->+∞=+
•
Propriétés
fonction racine est négligeable en +
8
8
•
devant toute fonction polynôme de degré ≥1.
4. Exponentielle f(x) = exp (x)
Df=R.
•
Variations : Strictement croissante
•
Limites : limx→+
limx→-
8
8
8
exp x = +
exp x = 0 ( asymptote horizontale y=0 en -
)
Propriétés :
exp(x+y) = exp(x) * exp(y) et exp(-x) = 1/exp(x).
exp ( 0 ) =1
Les fonctions polynômes et racine carré sont négligeables devant l'exponentielle en +
8
•
8
•
5. Logarithme f(x) = ln (x)
Df = R+*
•
Variations :Strictement croissante sur Df
•
Limites :
Limx→+ (ln x)= +
limx→0 (ln x) = - ( asymptote verticale en 0+ )
•
•
•
•
•
•
Propriétés :
ln est la fonction réciproque de l'exp, ainsi pour x dans R ln(exp(x)) = x et exp(ln(x)) = x
pour x dans R+*
Pour x > 0 et y > 0
ln ( x.y ) = ln (x) + ln (y)
ln( x/y) = ln ( x) - ln (y)
ln (x)p= p*ln(x)
ln est négligeable en +
devant les fonctions racine carré, polynômes, et exponentielle.
LogA(x)= ln(x)/ln(A)
ln ( 1) = 0
8
•
8
8
8
•
6. Fonctions Trigonométriques
•
Définition : le couple (cos α ; sin α ) représente les coord. d'un point M du cercle trigo.,
repéré par un angle α à partir de la demi-droite [Ox).
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
10
•
•
Fonction cos est sin : f(x) = cos (x) et f(x) = sin (x)
◦
Df = IR
◦
Variations :
La fonction cos est décroissante sur [0;π ]et croissante sur [π; 2π].
La fonction sin est croissante sur [-π/2; π/2] et décroissante sur[π/2; 3π/2]
◦
Périodicité :
cos et sin sont périodiques de période 2π ( ou : les courbes sont invariantes par
translation de vecteur ( 2 π ; 0))
◦
Symétrie :
La fonction cos est paire et la fonction sin est impaire.
Fonction tan f( x) = tan (x)
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
11
◦
◦
tan x = (sin x) /(cos x)
Df = IR privé de π/2 +k. π
(k ⋲ Z)
◦
Variations :
tan est croissante sur tout intervalle ]- π/2 + k. π ; π/2 + k. π[ (k ⋲ Z) mais non croissante
sur Df
◦
Limites :
limα→π/2- =+
et limα→π/2+ = d'équation x = π/2 + k. π (k ⋲ Z)
8
Symétrie, continuité, périodicité :
tan est impaire ;
périodique de période π ;
continue sur tout intervalle ]- π/2 + k. π ; π/2 + k. π[ (k ⋲ Z) mais non continue sur Df
8
◦
donc tan admet une infinité d' asymptotes verticales
III.ANALYSE DES FONCTIONS
1. Domaine de définition
•
opérations +,-,x :
◦
◦
◦
•
Le domaine de définition de la fonction entière est l'intersection des domaine de
définition des fonctions qui la composent, ou dit autrement :
Donnent une fonction dont Df est l'intersection des domaines f et g. Df Dg .
D'où le Df n'existe seulement si les Df des 2 fonctions f et g ne sont pas disjoints.
◦
Rmq : /!\ Vérifiez toujours si les intervalles sont compatibles lorsqu'on vous demande un
calcul, ça peut vous faire gagner du temps si ce n'est pas le cas!
◦
Exemple : 7x + 2/x
Df 7x => IR
Df 2/x => IR*
Df 7x + 2/x => IR*
Opération ÷ :
◦
◦
◦
Le domaine de définition d'un quotient est l'intersection des domaines de définition du
numérateur et du dénominateur privé des valeurs qui annulent le dénominateur :
Le quotient de deux fonctions f par g est la fonction qui, à tout réel x de Df Dg tel que
g(x) ≠ 0, associe le réel f(x)/g(x), que l'on note f/g.
Exemple : (x^ 3)/(√ x)
Df x^3 => IR
Df √ x => IR+ et √ x =0 <=> x =0
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
12
Df (x^ 3)/(√ x) => IR+*
•
Composée de deux fonctions f suivie de g notée : f o g
◦
Le domaine de définition de la fonction composée f o g sont les valeurs x telles que g( x)
appartient à Df
◦
Exemple :
Soit g (x) = x2 - 1 définie sur IR ; g(x) est positif entre ]-∞; -1] [1 ; +∞[ et négatif sur
]-1;1[
f(x) √x définie sur IR+
f o g = f(g(x)) = √x²−1 est définie sur ]-∞; -1] [1 ; +∞[ car ce sont les valeurs x qui
donnent des g(x) positifs (appartenant à IR+)
◦
◦
◦
2. Variations
•
Propriétés à connaître sur les sens de variations
◦
Influence d'un coefficient
▪ Si k > 0 les fonctions f et kf ont le même sens de variations.
▪ Si k < 0 les fonctions f et kf ont des sens de variations contraires
◦
Somme de fonctions :
- la somme de 2 fonctions croissante donne une fonction croissante
- la somme de 2 fonctions décroissante donne une fonction décroissante.
◦
Produit et quotient : il n'existe pas de règle, il faut alors dériver la fonction
◦
Variations des fonctions composées : elle suit la règle des signes ++ => +
- - => +
- + => -
Astuce: Les deux fonctions dans le même sens ça monte toujours, sinon ça descend.)
•
Détermination générale des variations : dérivées
Définition
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
13
Soit f une fonction définie sur un intervalle ouvert contenant x0. On dit que f est dérivable en x0 si
la quantité f( x0+h)-f( x0) admet une limite finie quand h tend vers 0.
h
Cette limite est appelée nombre dérivé de f en x0 et notée f '(x0)
.
Dérivées des fonctions usuelles
•
f
f'
k
0
k.x
k
xn
nxn-1
1/x
-1/x2
√x
1/2√x
ex
ex
ln(x)
1/x
sin(x)
cos(x)
cox(x)
-sin(x)
Astuce : Pour éviter de confondre les dérivés de cos et sin (au niveau de la négation) pensez
que « le Cos est Chiant donc sa dérivé est négative » (triste si vous préférez) .
Dérivées des fonctions et opérations
Soit u et v deux fonctions dérivables sur le même ensemble D.
•
f
f'
k.u
k.u'
u+v
u'+v'
u.v
u'v+uv'
1/u
-u'/u²
u/v
(u'v-uv')/v²
un
n.u'.un-1
ln(u)
u'/u
√u
u'/2√u
vou
v '(u(x)) *u '
Sens de variation : f est strictement :
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
14
◦
◦
◦
Croissante sur I si pour tout x ⋲ I, f '(x) > 0.
Décroissante sur I si pour tout x ⋲ I, f '(x) < 0.
Constante sur I si pour tout x ⋲ I, f '(x) = 0.
3. Extrema
•
•
Extrema : Dans le cas de fonctions d'1 variable : si la dérivée s'annule en changeant de
signe en xo, alors f admet un extremum local en xo
attention : Pour que f admette un extremum, il faut que sa dérivée s'annule en changeant de
signe.
Par contre, si on affirme que f possède un extremum en a, alors sa dérivée s'annule en
changeant de signe en a . Si f possède un extremum en a, alors sa dérivée s'annule, c'est vrai
aussi mais la réciproque est fausse.
Exemple : une fonction croissante avec un plateau possède une dérivée nulle à ce niveau,
mais elle ne possède pas d'extremum car la dérivée ne change pas de signe
4. Calcul de limites
-
-
+
8
?
+
8
a-b
-
+
-
8
8
a
-
-
8
+
8
-
?
±
?
±
-
8
8
?
±
-
+
+
-
8
+
±
8
ab
?
8
0
8
a≠0
?
8
0
8
0
-
8
0
+
8
b≠0
8
0
8
Produit
x
•
?
8
b
8
+
•
?
Différence
8
•
8
-
8
+
8
+
+
-
8
+
8
a+b
8
a
-
8
+
8
b
8
+
8
Somme
8
•
Quotient
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
15
?
0
0
0
8
a/b
0
0
8
±
8
?
?
8
±
8
?
?
±
+
±
±
-
-
8
0
a≠0
+
8
b≠0
8
0
8
x
•
Rappels :
•
•
Tout polynome au voisinage de +/- ∞ est équivalent à son terme de plus haut degré
Tout polynome au voisinage de 0 est équivalent à son terme de plus bas degré
a/∞ => 0
a/0 => ∞
0/∞ => 0
•
Formes indéterminées
•
•
•
∞/∞
◦
◦
◦
◦
•
•
•
•
•
•
•
0/0
0*∞
∞-∞
∞/∞ ou 0/ 0 peuvent se résoudre :
par le théorème de l'hopital
par les croissances comparées si on cherche la limite en + ∞
∞ - ∞ peut se résoudre :
par l'utilisation d'une quantité conjuguée
croissances comparées en + ∞
0*∞ peut se résoudre :
par les croissances comparées quand on cherche la limite en + ∞.
Les FI peuvent parfois être traitées par des équivalents, notamment grâce au DL1
Equivalents : Si f ~ g en A (réel ou ±∞) et si limA f = L, alors limA g = L
conditions d'utilisation :
Un produit ou un quotient de deux fonctions peut être remplacé par le produit ou le quotient
de deux fonctions équivalentes.
Une somme de deux fonctions ne peut pas en général être remplacée par la somme de deux
fonctions équivalentes.
Si g = o(f ) alors (f + g) ~ f (rappel « g= o(f) » signifie que g est négligeable devant f).
théorème de l'hopital :
dans les cas exposés ci dessus, il s'agit de remplacer f(x)/g(x) par f'(x)/g'(x) puis f'(x)/g'(x)
par f''(x)/g''(x) etc jusqu'à lever la forme indéterminée
croissances comparées :
dans les cas exposés ci-dessus, il s'agit de comparer les comportements des fonctions en + ∞
afin d'en déduire laquelle est négligeable devant l'autre et de restreindre la limite à trouver à
la fonction dominante.
Rappel : en + ∞ ; ln (x) < √ x < x < a^x < e ^x
Ex : Lim de 5x - √ x en + ∞
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
16
•
•
•
Il s'agit d'une FI de la forme ∞ - ∞ que l'on peut résoudre par les croissances comparées.
En + ∞, la fonction racine carrée est négligeable devant la fonction affine, on dit que la
fonction est équivalente à 5x en + ∞, la limite est donc + ∞.
quantité conjuguée :
Dans les cas exposés ci-dessus, il s'agit de multiplier et diviser par la quantité conjuguée
afin de lever l'indétermination, marche à suivre
a-b = a- b * (a+b)/(a+b) = (( a-b)*(a+b))/a+b = (a^2-b^2) / (a+b)
En résumé :
Trouver les limites de fonctions nécessite de connaître les calculs des limites, la résolution
des FI et les limites des fonctions usuelles
5. Tableau de variation
•
Exemple :
soit f(x)=x²-6x+1
donc f '(x)=2x-6
or pour Xo =3 f '(Xo)=0
f '(X)<0 pour X<3
► f(x) est décroissante pour X<3
f '(X)>0
X>3
► f(x) est croissante pour X>3
Le tableau de variation permet de faire la synthèse de l'analyse de la fonction, il
regroupe le domaine de définition, les limites, les variations, et permet de connaître les
extrema locaux, de vérifier que l'on ne s'est pas trompé.
IV. FONCTIONS DE PLUSIEURS VARIABLES
1. Développement limité d'ordre 1
•
Le développement limité (DL) d'une fonction f au voisinage d'un point x 0 est une
approximation polynomiale de f en x 0 .
son expression générale s'écrit : f (x 0+h)=a 0+a 1.h+...+(a n). hn+h. ϵ( h) avec Limh→0
ϵ(h)=0
Le polynôme a 0+a1.h +...+(a n ). h n est la partie régulière du DL
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
17
h. ϵ(h) est le reste, qui est négligeable si la variable est suffisamment proche de
•
•
•
x0 .
Le DL d'ordre 1 est un cas particulier des DL où la partie régulière est une fonction affine
( on parle alors d'approximation affine ou linéaire de la fonction en x 0 ) ; et h. ϵ(h) est
« infiniment petit d'ordre 1 », il est négligeable devant h donc on note h. ϵ(h)=o(h) .
Définition DL1 : D ϵ ℝ admet un développement limité d'ordre 1 en x 0 ϵ D lorsqu'il
existe a ϵ ℝ et qu'il existe une fonction ϵ dont la limite en 0 est 0 , tel que pour tout h
vérifiant ( x 0 + h) ϵ D, on ait :
f ( x 0+h)= f ( x 0 )+a.h+h.ϵ(h) ; a= f ' ( x 0 ) = coefficient directeur de la tangente en
x0 .
Principe :Il s'agit d'approcher f(x) par une fonction affine au « voisinage » de x 0 , Formule
à retenir :
f ( x 0+h)= f ( x 0 )+ f ' (x 0)h+o (h)
•
Objectif: le développement limité est un outil mathématique facilitant le calcul
des limites d'une fonction ( traiter les formes indéterminées) et de sa dérivée
à partir de ces information, il est alors possible de détermine les extrema d'une fonction et de
dresser son tableau de variations.
(En effet, le principe est de faciliter l'étude d'une fonction f(x) en la décomposant en une
somme de fonctions affines ( les DL1, de type y = ax + b) définies par leurs dérivées ( la
dérivée définissant la pente de la droite et étant égale à a). En étudiant chaque dérivée, on est
ainsi capable de connaître les variations de la fonction f(x))
•
exemple : Trouver le DL1 de g( x) = x^2 – ln( x-1) au voisinage de
g(2) = 2^2 – ln ( 2-1) = 4
g'(x) = 2x - ( (1)/( x-1)) ; g'(2) = 3
d'où g ( 2 + h) = 4 + 3h + h. ϵ(h)
•
Notation
◦
x0 = 2
Δ indique une différence , sur la fonction ou les valeurs de x
( sur la fonction par exemlpe : Δ f x0 = f (x 0 +Δ x)− f ( x 0) )
d indique une variation infinitésimale d'ordre 1, sur les valeurs de x ou sur les valeurs de
f(x) (provoquées par unne variation infintésimale dx autour de x 0 )
f ( x 0+h)= f ( x 0 )+ah+ο(h)
f
(x 0+h)− f (x 0 )=ah+ο( h)
<=>
<=> df x0 =ah+ο( h)
◦
•
df
= f ' ( x 0)
dx
= pente de la tangente en x 0
= nombre dérivé en x 0
Remarque : a=
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
18
•
•
Dans le cas d'une différence, si on néglige le terme d'erreur ο( Δ x ) , Δ f ≈a Δ x (pas
d'égalité).
Dans le cas d'une différence infinitésimale, ο( h) n'est pas négligé et on ne fait donc pas
d'approximation : df =a.dx (égalité)
VII.
FONCTION DE PLUSIEURS VARIABLES
Def : elles sont de type f ( x ; y ; z)
Objectif : en Biostatistiques, les FPV sont fréquemment utilisée pour modéliser des phénomènes
faisant intervenir plusieurs paramètres.
•
Objectif :
◦
◦
•
Fonction à une variable :
◦
◦
•
f ( x 0+h0 )= f ( x0 )+ah0+ο(h0 ) où ah 0+ο( h0 ) représente la variation de la
fonction.
a correspond à f ' ( x 0) = dérivée de f en x 0 .
Fonction à n variables :
◦
◦
◦
•
h y est une variation par rapport à x y . On cherche à découvrir la nouvelle fonction
f (x y +h y ) après sa variation par rapport à f ( x y ) pour connaître l'allure de f(x)
autour de xy.
Les applications permettent de savoir les marges d'erreur à cause d'une mesure ou les
effets de la modifications d'une variable (ajustement de l'erreur) sur l'ensemble de la
fonction.
f ( x 1+h1, x 2+h2 ...+x n+h n)= f (x 1, x 2 ... , x n )+L(h1, h2 ... , h n)+ο(h1, h2 ... , h n) où
L( h1 ... hn )+ο(h1 ... h n) représente la variation de la fonction.
L correspond à df ( x1... xn(h1 ...hn)) = différentielle de f en x 1 ... x n .
Comme ο( h0) et ο( h1 ... h n) tendent vers 0 et sont négligeables, les variations de la
fonction dépendent de ah ou L(h1 ... hn ) .
Synthèse des représentations graphiques
◦
◦
◦
◦
◦
La représentation graphique d'une fonction à n variables est une hypersurface (surface
à plus de 3 dimensions) ; la représentation graphique d'une fonction à 2 variables est une
surface.
La représentation graphique d'une application partielle de cette fonction est une section
de cette hypersurface par un plan vertical car toutes les variables sont fixées sauf une.
La représentation graphique d'une dérivée partielle de cette fonction est une section de
l'hyperplan de la différentielle par un plan vertical.
La représentation graphique de la différentielle est un hyperplan tangent en un point de
l'hypersurface de cette fonction.
Un extremum local se traduit graphiquement par un plan horizontal tangent à
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
19
l'hypersurface
1. Application partielle
•
Objectif : Pour étudier une FPV « complexe » ; on la décompose en plusieurs fonctions à 1
variables, plus simple à étudier : les « applications partielles » ; c'est l'outil de base qui va
permettre de déterminer les dérivées partielles puis de construire la différentielle.
•
Une application partielle s'obtient en fixant toutes les variables sauf une.
Ainsi, une FPV à n variables possède n applications partielles qui donnent n dérivées
partielles
•
Exemple : f(x, y, z) = 3x + 2y – z
la première application partielle est f( x) = 3x + 2y – z où y et z sont considérés comme des
constantes, seul x varie.
2. Dérivée partielle
Def : La dérivée partielle est la dérivée de l'application partielle correspondante.
(∂ f )
Elle se note
( pente de la tangente dans un plan vertical)
(∂ x n)
•
Exemple :
Soit f(x, y, z) = 3x + 2y – z ;
La dérivée partielle selon x se note:
(∂ f )
(∂ x )
= 3 qui est la dérivée de l'application partielle
f( x) = 3x + 2y – z.
3. Différentielle
•
La différentielle c'est la somme des dérivées partielles, sans oublier la multiplication par les
h ( ou dx) ( c'est la somme des différentielles partielles)
elle se note : . ; ou encore :
L(h1 ... hn )=a 1 h1 ... a n hn ou df ( x ... x (h ... h ))=
1
◦
n
1
n
(∂ f )
(∂ f )
h1 +...+
h
(∂ x 1 )
(∂ x n ) n
Exemple numérique :
2
( x1 )
f (x 1, x 2 )=
( x 2)
▪
1ere application partielle : je fixe toutes les variables sauf une, d'où x2 = a, ainsi f
(x 21 )
varie seulement en fonction de x1. On a donc : f ( x 1)=
a
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
20
2
▪
2eme application partielle :
▪
1ere dérivée partielle :
f ( x 2 )=
f ' ( x 1)=
(b )
x2
x 1=b
où
2.x 1 (∂ f )
=
a
(∂ x1 )
f ' ( x 2)=
−(b 2 ) (∂ f )
=
( x 22) ( ∂ x 2 )
▪
2eme dérivée partielle :
▪
Différentielle pour un point donné : x1=b et x2=a
(∂ f )
(∂ f ) 2
b2
df (b , a )( h1, h 2)=h1.
+h2.
= x.h 1− 2 . h2
(∂ x 1)
(∂ x 2) a
x
(on additionne les dérivées partielles sans oublier les multiplications par h)
▪
Fonction :
2
f (x 1+h1, x 2+h2 )=[ f ( x 1, x 2 )]+[ L(h1, h2 )]+[ο(h1, h2 )]=[
▪
Ainsi, on peut dire que la variation de h 1 autour de
x2
▪
x1
2
b2
]+[ x 1 . h1− 2 . h 2 ]+[ο(h1, h 2)]
x2
a
x2
x 1 et de h 2 autour de
2
b2
induit une variation de la fonction de Δ f ( x)= x 1. h1− 2 . h 2 .
a
x
L'intérêt de cette méthode est de constater l'importance de la variation en fonction de
la variable ( x 1 ou x 2 ou... x n ) et de déterminer le sens de cette variation.
Application : Extrema
Théorème :
◦
•
•
Si une fonction à plusieurs variables f est différentiable sur son domaine de définition
Ω et si elle admet un extremum au voisinage d'un point ( x 1, x 2, ... , x n ) n'étant pas
sur la « frontière » de Ω , alors la différentielle de f en ( x 1, x 2, ... , x n ) est nulle :
df (x 1, x 2, ... , x n)=0
A retenir :
Si la différentielle s'annule en un point, c'est à dire que toutes les dérivées partielles qui
la composent s'annulent, la fonction admet un point critique ; tous les points critiques ne
sont pas des extrema
Si la fonction admet un extremum en un point, alors la différentielle s'annule; ( car un
extremum est un cas particulier des points critiques)
En particulier, pour un point critique d'une fonction à deux variables, si une application
partielle atteint un maximum et l'autre un minimum alors on a un point selle (et non un
extremum).
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
21
◦
◦
◦
Exemple : f(x,y)= x2 – y2 on obtient
f'(x1)= 2x et
f'(y1)= -2y
Les 2 dérivées partielles s'annulent en 0, donc on a un point critique en (0;0).
MAIS 0 est un minimum pour f(x1) et un maximum pour f(y1) ► ce ne peut pas être un
extremum.
V. INCERTITUDES
La mesure
Lorsque nous prenons une mesure, nous ne pouvons pas prétendre que celle-ci correspond à la
valeur exacte de la grandeur mesurée. Que la mesure soit celle d'une longueur, d'une masse, d'un
volume ou d'un intervalle de temps, nous devons inévitablement nous rendre à l'évidence que notre
mesure est plus ou moins proche de la réalité.
•
•
L'erreur
L'erreur, c'est l'écart entre la mesure et la valeur exacte. Puisque la valeur exacte est souvent
inaccessible, l'erreur est inconnue, d'où la notion d'incertitude
1. Incertitude déterministe
•
L'incertitude ou la variation sur la fonction y ( Δ y ) est due à celle de sa variable x (
Δ x ) : Δ y= f ( x 0−Δ x)− f ( x 0 ) .
Il existe 2 cas à retenir :
◦ f est monotone (toujours croissante ou toujours décroissante sur son ensemble de
définition) : L'incertitude ou la variation maximale Δ y (max ) correspond à
f (x 0+Δ x) ou f (x 0−Δ x) .
◦
f n'est pas monotone (f est croissante et décroissante sur son ensemble de définition) :
L'incertitude ou la variation maximale Δ y (max ) ne correspond pas forcément à
f (x 0+Δ x) ou à f (x 0−Δ x) .
•
Nous utiliserons dans ce cas un modèle linéaire ( donc monotone ) sur une fonction à une
variable.
•
La variation de la fonction représente une fraction des variations de la variable.
Soit Δ y=a Δ x . On peut dire que Δy représente α% de Δx, ou encore que les variations
a
de y autour de f(x0) représentent α% des variations de x autour de x0. (Rq : α=
).
100
On ne distingue pas les cas Δ x>0 et Δ x<0 car la variation de Δ y est de même
amplitude quel que soit le signe de Δ x .
•
•
•
Souvent, on fait une approximation pour arriver à ce modèle linéaire facile à utiliser (à
l'aide d'un développement limité)
•
Exemple :
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
22
Développement limité de v (x)= K √x au voisinage de x 0 .
dv
K
v (x 0+Δ x)=v( x 0 )+ Δ x+ο(Δ x)=v( x 0 )+
. Δ x+ο(Δ x) <=>
dx
(2 √x 0 )
K
K
v (x 0+Δ x)−v( x 0 )=
. Δ x+ο(Δ x) <=> Δ y=
. Δ x+ο(Δ x) .
(2 √x 0 )
(2 √x 0)
•
•
Donc si l'on néglige ο(Δ x) (approximation), Δ v≈
K
.Δ x .
(2 √x 0 )
•
Un problème de notation se pose:
◦ On utilise d'abord la différence infinitésimale:
df.dx
df.dx
. Remarque : on peut
df = f ( x+dx)− f (x)=
= f ' ( x). dx <=> df =
dx
dx
dire que les deux dx sont « différents »: en haut c'est la variation autour de x, en bas de
la convention pour définir une dérivée (df/dx= f'(x)).
df
Δ x quand Δx est petit .
◦ On en déduit Δ f ≈
dx.
◦ De même, pour une fonction à plusieurs variables,
Δ f ≈a 1 Δ x 1+a 2 Δ x 2+...+a n Δ x n se déduit de la différentielle :
df =a1 dx 1+...+an d n .
•
Exemple : f(x;y) = ln (1+xy) :
◦
◦
◦
y0
x0
dx+
dy .
(1+ x 0 y 0)
(1+ x 0 y 0)
Application numérique : pour (x0 ; y0) = (0; 0,5).
df = 0,5 dx autrement dit, lorsque x et y varient faiblement autour de 0 et 0,5, les
variations de f représentent environ 50% des variations de x.
Je cherche la différentielle : df =
2. Incertitude absolue
L'incertitude absolue est une estimation de l'erreur que fait l'expérimentateur. L'incertitude absolue
est l'écart maximum possible entre la mesure et la valeur exacte. La mesure et son incertitude
absolue constituent un domaine de valeurs possibles à l'intérieur duquel se trouve la valeur exacte.
L'incertitude absolue s'exprime généralement avec un seul chiffre en utilisant les mêmes unités que
celles associées à la mesure.
Exemple :
23,4 ± 0,5 cm
Formule :
Δ f max≈
•
(∂ f )
(∂ f )
. Δ x1 +...+
. Δ xn
(∂ x 1)
(∂ x n )
Les variations des variables peuvent se compenser. On calcule alors l'incertitude en
maximisant f :
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
23
∣
Δ f max≈
Et non :
•
∣ ∣
∣
(∂ f )
(∂ f )
. Δ x 1 +...+
. Δ xn
(∂ x 1)
(∂ x n)
∣
Δ f max ≈
∣ Attention ! (piège classique et erreur facile).
(∂ f )
(∂ f )
. Δ x 1+...+
. Δxn
(∂ x 1 )
(∂ x n)
NB : Pensez que pour les incertitudes il vaut mieux trop que pas assez (question de
sécurité).
3. Incertitude relative
L'incertitude relative est le rapport entre l'incertitude absolue et la mesure. Ce rapport est
habituellement exprimé en pourcentage.
Exemple :
23,4 ± 0,5 cm pourrait aussi s'écrire 23,4 ± 2%
L'incertitude relative permet de comparer la précision de différentes mesures. La mesure la plus
précise est celle dont l'incertitude relative est la plus faible.
df
•
Il s'agit de
.
f
•
Pour faciliter le calcul, on utilise aussi la dérivée logarithmique de f : d ( ln f )
[dln( f ( x))] 1
df
df
•
= (x).
<=> d (ln ( f ))=
f
dx
f
dx
•
Pour calculer la dérivée logarithmique d'une fonction de plusieurs variables, suffit de
prendre les variables les unes après les autres et appliquer cette dérivée à chacune d'elles
•
Exemple : f(x;y) = 3xy-²
ln(f) = ln(3xy²) = ln(3) + ln(x) + ln(y-²) = ln(3) + ln(x) – 2ln(y)
d ln ( f )
d ln ( f )
df
1
2
=d ln ( f )=
dx+
dy= dx− dy
f
dx
dy
x
y
•
Voici quelques phrases qu'on peut déduire (les plus demandées en qcm) :
◦
Pour (x;y)=(2,1) càd pour une variation dx autour de 2 et dy autour de 1, la variation
1
dx−2dy .
relative de f (càd df/f) est d'environ
2
◦
Si y est fixé (dy=0), un variation dx autour d'une valeur de x élevée provoque une
variation relative environ nulle. En effet : df/f = dx/x, donc si x est très grand dx/x tend
vers 0 et donc df/f aussi.
◦
Une petite augmentation de x autour de x0 positif, et une petite diminution de y autour de
y0 positif, provoque une petite augmentation relative de f. En effet : dx/x0 > 0 et
−2dy
>0 sachant que y0 est positif et que dy est négatif.
y0
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
24
Notions élémentaires – fonctions QCMs
QCM 1 : Concernant les propriétés sur les fonctions :
A. La fonction inverse est continue sur R-* et sur R+*. Il s'agit d'une fonction paire.
B. La fonction inverse a pour limite -∞ en 0-.
C. Une fonction polynôme est toujours impaire.
D. Un polynôme se comporte à l'infini de la même façon que le monôme de plus bas degré qui lui
est équivalent.
E. La fonction racine n'a pas de propriété de symétrie.
QCM 2 : Trouver les propositions exactes :
A. La fonction ln est définie sur R+ comme la fonction réciproque de exp.
B. La fonction cos est décroissante sur (0 ; π).
cos x
C. La fonction tan est définie par tan  x=
.
 sinx 
π
D. Pour la fonction tan, limite en
par valeur inférieure = +∞.
2
df
E. Le nombre dérivé a en xo est noté f'(xo) ou
ǀ xo.
dx
QCM 3 : Indiquer pour les propositions suivantes si elles sont vraies ou fausses :
A. ( tan x )' = 1+tan ² x
B.  tan x  ' = 1
cos ² x
C. lim [1 0,8 x ]=1
x ∞
D. lim [ 4 1,1 x ]=4
x ∞
E. lim [ 4 1,1 x ]=∞
x∞
QCM 4 : Une fonction peut être dite :
A. Impaire si f(x) = f(-x) uniquement.
B. Paire si elle est centrée en 0 et que f(x) = f(-x) uniquement.
C. Impaire si elle est symétrique par rapport à l'origine et que f(-x) = -f(x) uniquement.
D. Impaire si son ensemble de définition est symétrique par rapport à l'origine du repère,
f(-x) = -f(x) et sa courbe est symétrique par rapport à l'origine du repère uniquement.
E. Paire si elle est symétrique par rapport à l'axe des abscisses uniquement.
QCM 5 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :
A. La fonction f(x) = x² est paire.
B. Ln (exp (x)) = x pour tout x Є ]-∞ ; +∞[.
C. La fonction tangente est défini par tanθ = cosθ/sinθ.
D. La fonction tangente est croissante sur la totalité de son ensemble de définition.
E. Si une fonction f admet un DL1 en xo alors f est dérivable en x0.
QCM 6 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
25
A. Ln(ab) = ln(a) + ln(b).
B. Ln (a3)= 3ln(a).
C. ln   a=  lna  .
D. La fonction tangente est paire.
E. La fonction cosinus est paire.
QCM 7 : Soient f  x = x ; g(x) = 3x + 2 ; h(x) = f°g :
A. h  x =3 x2 .
B. h(x)= 3  x + 2.
C. La fonction h(x) est définie sur ℝ.
D. La fonction h(x) est définie dur ℝ+.
E. La fonction h(x) est définie sur [-2/3; +∞[.
QCM 8 : Soit f(x)= (x4 + 5x3 -10x +3)²
A. f'(x)= 2x (4x6 + 15x4 -10x²).
B. f'(x)= 2x (4x3 + 15x² -10).
C. f'(x)= 2 (4x3 +15x² -10)(x4 +5x3 -10x +3).
D. L’ensemble de définition de la fonction est ]-∞ ; +∞[.
E. L’ensemble de définition de la fonction est : ℝ+.
QCM 9 : Calcul de limites : Quelle(s) est(sont) la(ou les) proposition(s) inexacte(s) :
A. lim
x →0
+
x 3+5x 2
=+∞ .
3x 4+2x
lim xe – x =∞ .
B. x
∞
2
C. lim cosxln  x – 25=– ∞ .
x 5
+
1
=∞ .
x 1 x 1
ln ( x )
E. lim
est une FI.
x
x →+∞
D. lim
QCM 10 : Soit g(x) = 1/(  ln  x – 1) :
A. g(x) admet une asymptote verticale : y = e.
B. g(x) admet une asymptote horizontale x = 0.
C. g(x) n’admet aucune asymptote.
D. L’ensemble de définition de g est ℝ+.
E. L’ensemble de définition de g est : [+1 ; e[∪]e ; +∞[.
QCM 11 : Soit g(x)= 1/(  ln  x -1) :
A. lim g  x=– ∞ .
–
x e
g  x=∞ .
B. lim
x e
C. lim g  x=∞ .
–
+
x e
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
26
g  x=– ∞ .
D. lim
x e
E. g(x) est une fonction impaire.
+
QCM 12 : Soit f(x,y,t) = e3t (x2 + y)/t :
A. ∂f/∂x = 2xe3t/t.
B. ∂f/∂y = e3tx2/t.
C. ∂f/∂t = (e3t (x2+ y) (3t – 1))/t2.
D. Différentielle de f : df= (2xe3t/t )dx + (e3tx2/t)dy + (e3t (x2+ y) (3t – 1))/t2dt.
E. Différentielle de f : df= (2xe3t/t )dx + (e3t/t)dy + (e3t (x2+ y) (3t – 1))/t2dt.
QCM 13 : Soit f(x)= x exp(-x2/2) :
A. f ’(x)= exp (-x2/2) (1+x2)
B. Le tableau de variation de f est :
x
-∞
f ‘(x)
+
F (x)
Croissante
-1 -1
1 1
Décroissante
+∞
+
Croissante
C. f admet deux extremums sur son ensemble de définition.
D. f admet un minimum local nul.
E. f admet un maximum local.
QCM 14 : Soit la fonction f  x =
2cosx
:
2sinx
A.
f '  x=
−2 sinxsin²x2 cosxcos²x
2sinx ²
B.
f '  x=
− 2 sinx2 cosx1
2sinx ²
C.
f '  x=
2 sinx2 cosx1
2sinx ²
D. L'ensemble de définition de la fonction est R.
E. L'ensemble de définition de la fonction est ]-8 ; 1[ U ]1 ; +8[.
QCM 15: Soit l'équation d'une mole de gaz parfait PV=nRT où P, V, n et T représentent
respectivement la pression, le volume, le nombre de mole, la température. R est une constante.
A. V/ T = n/P
B. P/ V = (nRT)/V
C. T/ P = V/n
D. n/ T = -(PV)/(RT2)
E. n/ T = (PV)/(RT2)
QCM 16 : Soient
f(x) une fonction monotone sur R strictement croissante.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
27
g(x) une fonction monotone sur R strictement décroissante.
h(x) une fonction monotone sur R strictement décroissante.
A. h>0, h.f(x) est croissant sur R.
B. h<0, h.f(x) est décroissant sur R.
C. fog est croissant sur R.
D. fog est décroissant sur R.
E. goh est décroissant sur R.
QCM 17 : Soit T =2 
∂T

=
A.
∂ L  Lg
B.
∂T

=2
∂L
 Lg
C.
∂T  Lg
=
∂g
g²
D.
∂g

=4
∂L
T
E.
∂ g −16 L
=
∂L
T²

L
:
g
2
2
QCM 18 : Soient f  x =3  x4 et g  x= x 26 x5 :
A.
f o g  x =3  x4 ²63  x45
B. f o g  x =3  x²6x54
C. f o g  x =9 x542  x
D. L'ensemble de définition de la fonction f°g est ℝ+.
E. L'ensemble de définition de la fonction f°g est ]–∞ ; -5[ U ]-1 ; +∞[.
QCM 19 : Soit la fonction h  x =sin x cos – x  :
A. h '  x=cos x cos – x sin x sin – x 
B. h '  x=cos²  xsin 2  x 
C. Dh = ℝ.
D. Dh = [-1;1].
E. Si f  x ; y=sin x cos  – y alors
∂f
=cos x cos  – y 
∂x
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
28
2
QCM 20 : Soit la fonction f définie par f  x =3 x 
2k
:
3 x2
A. Df = ]–∞ ; 0[ U ]0 ; +∞[.
B. Df = ]–∞ ; 0] U ]0 ; +∞[.
C.
∂f
2
= 3
∂ k 3x
D. f '  x=6 x
– 3k
x4
E. Df = ℝ.
QCM 21 : L = a tan b où a et b sont des variables indépendantes. Sachant que a=4 et b=45° et
que ces valeurs sont connues à 2% près, quelle est l'incertitude de L ?
A. 1,52 %.
B. 3 ,21 %.
C. 5,14 %.
D. 8,96 %.
E. 12,54 %.
QCM 22 : Soit f(x)=(2x²+mx+1)/(x+1) : déterminer m pour que la fonction définie par f(x) ait
une asymptote oblique passant par l'origine. On nommera cette AO : E(x).
A. E(x)= ax.
B. m=0.
C. m=1.
lim f  x =∞ .
D. x
∞
E. E(0)=1.
QCM 23 : Soit f(x)=x/ln(x) :
A. Df =]– ∞ ;1[∪]1;∞ [ .
B. lim f  x= FI .
x 0
C. f(x) admet une asymptote verticale : V=> x=1.
1
1
.
D. f  x ' = ln  x –
ln  x 2
E. lim f  x= lim f  x .
 
x – 1

x 1
QCM 24 : Quelle(s) est(sont) la(les) proposition(s) exacte(s) :
A. Si f  x = x 410 x 2 – 5 x 33 alors f ’  x =3 4 x 320 x – 5 x 410 x 2 – 5 x32 .
B. Si g  x=10 x –
5 x 2 – 10
10 x  x 23 – 5 x 2 – 104 x
g
'

x
=
alors
.
 x 232
 x 233
5 x 2 – 10
10 x  x 23 – 5 x 2 – 104 x
C. Si g  x=10 x –
alors g '  x =
.
 x 232
 x 2 34
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
29
5 x 2 – 10
10 x 233 – 10x  x 23−5 x 2 – 10 4 x
D. Si g  x=10 x –
alors g '  x =
.
 x 232
 x 233
E. Si g  x=10 x –
5 x 2 – 10
10 x 233 – 10x  x 235 x 2 – 10 4 x
g
'

x
=
alors
.
 x 232
 x 233
QCM 25 : Soit f la fonction définie par f(x)=cos²(x) :
A. f est une fonction périodique de période

.
2
B. f est une fonction périodique de période .
C. L'axe de symétrie de la fonction f est

.
2
D. L'axe de symétrie de la fonction f est .
E. La fonction f ne présente pas d'axe de symétrie.
QCM 26 : Soient f  x =6 x 212 x4 et g  x=
A. f ° g  x =
6
12

4 .
4
 x3  x32
B. g ° f  x =
6
12

4 .
4
 x3  x32
C. f ° g  x =
236 x3 2 x3 
 x34
2
1
2 :
 x3
4
D. L'ensemble de définition de la fonction f est ℝ\{-3}.
E. L'ensemble de définition de la fonction g est ℝ\{-3}.
QCM 27 : Soit la fonction f  x , y , z=
x–y
:
 z y 2
∂f
1
A. ∂ x  x , y , z =
.
 z y 2
B.
∂f
− z  y2−2 x − y z  y
 x , y , z =
.
4
∂y
 z y 
∂f
−1
C. ∂ x  x , y , z =
.
 z y 2
D.
− z  y−2 x − y
∂f
 x , y , z =
.
∂y
 z  y 3
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
30
E.
∂f
−2x y−z
 x , y , z =
∂y
 z y 3
.
QCM 28 : Quelle(s) est(sont) la(les) proposition(s) exacte(s) :
5 x4 yx
∂f
54y
 x , y , z =
A. Si f  x , y , z=
alors
.
zy
∂x
z y
−5x4xy 
∂f
5 x4 yx
 x , y , z =
B. Si f  x , y , z=
alors
.
∂y
zy
 z y 2
∂g
 x , y , z =5y4zy .
C. Si g  x , y , z =x 2 5y4zy  alors
∂x
∂g
 x , y , z =9yx 2 .
D. Si g  x , y , z =x 2 5y4zy alors
∂z
∂h
−1
3z
E. Si h  x , y , z =
alors ∂ y  x , y , z =
2 .
2 xy
 2x y
QCM 29 : Soit la fonction : f(x,y,z) = 2x²+(1/y)z … :
A- La première application partielle de f considère x comme une variable et y et z nulles.
B- Dans la seconde application partielle, y et x sont constantes.
C- La dérivée de la troisième application partielle de f est : (-1/y²).
D- Pour dériver cette fonction il faut additionner ses dérivées partielles.
E- f'(x,y,z) = 4x+(1/y)+(z/y²).
QCM 30 : Soit f la fonction définie par f(x)=
−5x 3+2x+4
. Indiquer si les propositions sont
3x+2
vraies ou fausses :
A. f est définie sur ]-∞ ; -3/2[ U ]-3/2 ; +∞[.
B. f est définie sur ]-∞ ; 0[ U ]0; +∞[.
−15x 2+2
C. f '(x) =
.
3
(−15x²+2)(3x+2)+3(5x 3−2x−4)
D. f '(x) =
.
(3x+2)²
E. f est équivalente en ±∞ à un polynôme de degré impair.
QCM 31 : Soit f la fonction définie par f(x) =
−cos ( x )
. Indiquer si les propositions sont
sin ( x )
vraies ou fausses :
A. f(x) = −tan( x) .
B. f est périodique de période π.
1
C. f '(x) =
.
tan² ( x) cos² ( x)
1
D. f '(x) =
.
sin² ( x)
E. La limite de f quand x tend vers π+ (c'est-à-dire à droite de π) est -∞.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
31
3
QCM 32 : Soit la fonction f définie par f(x,y,z) = 3zy+
x²+5y
2
. Indiquer si les propositions
sont vraies ou fausses :
A. f et ses dérivées partielles sont définies sur IR3.
∂f
=x .
B.
∂x
∂ f 15y²
=
C.
.
∂y
2
D. Une application partielle est une fonction avec plusieurs variables.
E. Chaque application partielle est équivalente à un plan 3D.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
32
Notions Élémentaires - Fonctions, ce qu’il fallait répondre :
1 : BE
6 : ABE
11 : AC
16 : ABD
21 : C
26 : ACE
31 : D
2 : BDE
7 : AE
12 : ACE
17 : AE
22 : AD
27: ABDE
32 : AD
3 : ABCE
8 : CD
13 : CE
18 : B
23 : CD
28 : A
4:D
9 : ABDE
14 : ABD
19 : ACE
24 : AE
29 : D
5 : ABE
10 : E
15 : D
20 : A
25 : B
30 : D
Pourquoi certaines réponses sont fausses :
QCM 1 :
A. Cette fonction est impaire.
C. Les polynômes ont rarement des propriétés de symétrie.
D. De la même façon que le monôme de plus bas degré.
QCM 2 :
A. sur R+*.
C. tan(x) = sin(x)/cos(x).
QCM 3 :
A. (VRAI) car tan(x) = sin(x)/cos(x), on dérive sur le mode de (u/v)'= (u'*vu*v')/(v2).
On obtient (cos2x + sin2x)/cos2x qui par simplification peut donner les 2
résultats.
B. (VRAI) cos2x + sin2x = 1.
D. Pour Ax si A>1 alors Ax tend vers l'infini si x tend vers l'infini.
QCM 4 :
A. Pair => f(x) = f(-x) et Impair => f(x)= -f(-x).
B. Si D(f) (ensemble de définition) est symétrique par rapport à l'origine.
f(x)=x2 +1 est une fonction paire même si f(x) n'est jamais égal à 0 ; mais
D(f)=IR qui est symétrique par rapport à 0.
C. et E. Voir B et 3 conditions nécessaires ( f(x)= f(-x), symétrie de D, symétrie
par rapport à l'axe).
QCM 5 :
C. tanθ=sinθ/cosθ.
D. La fonction tangente n'est croissante que sur les parties connexes de
l’ensemble de définition (dire qu'elle est croissante sur la totalité de son
ensemble de définition voudrait dire que pour tout x1<x2 alors tan(x1)<tan(x2)
ce qui est faux si on regarde par exemple -π/3 et 0).
QCM 6 :
C. ln(  a ) = ½ ln(a).
D. La fonction tangente est impaire (symétrie par rapport à un point et non
axiale).
QCM 7 :
B. Cf. A.
C. et D. Df = (-2/3 ; +∞). Attention, même si effectivement ℝ+ est inclus dans Df,
on demande toujours la TOTALITE de l'ensemble.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
33
QCM 8 :
A. et B. Cf C.
D. Vrai, car c'est une fonction polynôme.
E. Cf D.
QCM 9 :
A. Pour une limite vers 0, la limite d'une fonction rationnelle polynôme est égale
à celle de ces termes de plus bas degrés. Ici, elle tend vers 0.
B. Elle est égale à 0.
D. Elle est égale à ½.
E. Elle est égale à 0 (x est prioritaire devant ln(x)).
QCM 10 :
A. g'(x)= -ln(x)/(2(√(ln(x))-1)2 ) et ln(x)≥ 0 donc x≥1 et √(ln(x))-1≠0 donc x≠e.
Donc asymptote verticale en x = e.
B. Asymptote horizontale en y = 0.
C. Il y a 2 asymptotes (cf A et B).
D. Voir E.
QCM 11 :
B. Cf. A.
D. Cf. C.
E. g(-x) est différent de –g(x), de plus le domaine de définition n'est pas
symétrique par rapport à O.
QCM 12 :
B. df/dt = (e3t)/t.
D. Cf. E.
QCM 13 :
A. f’(x)=exp (–x²/2) (1-x²).
B. Le tableau correct est décroissante puis croissante puis décroissante sur les
mêmes intervalles.
D. Il n'est pas nul.
QCM 14 :
A. B. et C. On prend u  x =2cosx et v  x=2sinx
Alors, on a u ’  x =−sinx et v ’  x =cosx
f '  x=
u ' . v−u.v ' −sinx.2sinx− 2cosx . cosx
=
v²
2sinx
=
−2 sinx−sin²x−2 cosx−cos²x − 2 sinxsin²x2 cosxcos²x
=
2sinx  ²
2sinx  ²
Comme
sin²xcos²x=1 , f ’  x =
− 2 sinx2 cosx1
2sinx ²
D. et E. L’ensemble de définition : 2sinx≠0
Or, on sait que : −1sinx1
En ajoutant 2, on obtient −122sinx12 → 12sinx3
Donc 2sinx 0 (jamais nul) donc l’ensemble de définition est R.
QCM 15 :
A. Ecrivez d'abord l'équation demandé, ici V =nRT/P avant de la dériver. On
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
34
obtient (nR)/P.
B. On obtient –(nRT)/V2.
C. On obtient V/(nR).
E. n/ T = -(PV)/(RT2).
QCM 16 :
C. fog décroissante.
E. goh croissante.
QCM 17 :
B. cf A.
∂T
π Lg
πL g
C.
=– √ 2 =– 2 √ .
∂g
g
g √L
D. et E.
∂ g 4π²
=
.
∂ L T2
QCM 18 :
A. Il s'agit de g°f(x) et non de f°g(x).
C. Il s'agit de g°f(x) et non de f°g(x).
D. Pour trouver l'ensemble de définition, il faut x 26 x50 , on obtient :x1=
-5 et x2= -1.
x
–∞
-5
-1
+∞
x² + 6x + 4
+
0
0
+
E. cf D.
QCM 19 :
B. Cf A. (cos(-x))'= -(-1*sin(-x))=sin(x). On peut aussi remplacer cos(-x) par
cos(x) pour simplifier.
D. Cf C.
QCM 20 :
ATTENTION ici on a f(x) et non f(x ;k) donc k est une constante !
B. cf A.
C. On ne peut dériver par k car c’est une constante.
−4k
D. f '(x) = 6x+ 3 .
3x
E. cf A... .
QCM 22 :
A. Vrai : b=0 car AO passe par l'origine.
B. m=2. Une asymptote oblique implique que lim f(x)-(ax+b)=o quand x→+∞.
On pose donc lim(2x2+mx+1)/(x+1)-(ax+b)=0 => lim((2-a)x2+(m-a-b)x+(1-b))/
(x+1)=0 avec b=0
D'où lim 2-a=0 => a=2 ; lim m-a=0 => m=a et lim1/(x+1)=0 pour tout x.
C. m=2.
E. E(0)=0, A0 passe par origine.
QCM 23 :
A. ]0;1[ ∪]1;+∞[.
f  x=0 .
B. lim
x 0
E. lim f  x=– ∞ .
x – 1
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
35
lim f  x =∞ .
x1
QCM 24 :
B. C. et D. Cf E.
QCM 25 :
A. Cf B. cos2(x+)= -cos(x) * -cos(x)= cos2(x) Voir cercle trigonométrique
D. E. La fonction ne présente pas un seul axe de symétrie mais plusieurs dont

,
,….
2
QCM 26 :
B. g ° f  x =
1
1
=
.
2
2
6x 12x43 6x 12x72
2
D. Définie sur IR.
QCM 27 : C. Cf A.
QCM 28 :
B. Car de la forme u/v avec u=5 x4 xy , u ’ =4 x , v =z y , v ' =1 .
D'où :
4x  z  y−5x4xy.1 4xz4xy−5x−4xy 4xz−5x
∂f
 x , y , z =
=
=
.
∂y
 z y 2
 z y 2
 z y 2
C. Car g  x , y , z =x 2 5y4zy=5yx2 4zyx 2 .
D'où
∂g
 x , y , z =10xy8xyz=xy 108z .
∂x
∂g
2
2
D. ∂ z  x , y , z =04yx =4yx .
E. Si on prend : u=3 z , u ’ =0 , v =2 x y et v '=1 .
O×2x y −3z×1
∂h
−3z
 x , y , z =
=
2
∂y
2x y 
 2x y2
QCM 29 :
A.Constantes ! Pas nulles, attention important pour les dérivées.
B. x et z !
C. 1/y.
E. 4x+(1/y)-(z/y²).
QCM 30 :
A. et B. f est définie sur ]-∞ ; -2/3[ U ]-2/3 ; +∞[. Attention à ne pas confondre
2/3 et 3/2 dans la précipitation, il faut toujours bien vérifier.
C. Voir D.
E. Elle est équivalente à un polynôme de degré pair.
QCM 31 :
A. f(x) =
QCM 32 :
C.
−1
tan( x)
∂f
15y²
=3z+
.
∂y
2
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
36
D. C'est une fonction d'une seule variable.
E. C'est équivalent à un plan 2D.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
37
II - Biostatistiques - Synthèse
MESURE DES PHENOMENES BIOLOGIQUES,
NOTION DE VARIABILITÉ ET DE LEUR SOURCE
Les modèles mathématiques sont des représentations de la réalité.
Ils sont :
•
Simplifiés.
•
Multiples.
•
Jamais parfait.
•
Un cadre mathématique.
•
Prédictifs (théorie → réalité) ou descriptifs (réalité → théorie).
Dans les métiers de la santé, les décisions sont sous incertitude.
1. Sources de variabilité
Ainsi, une mesure comporte toujours une erreur (le but étant de la limiter) par rapport à la réalité.
Il convient alors de tenir compte de plusieurs sources de variabilités pour pouvoir conclure sur un
résultat :
Équation
Valeur
Variabilité
Valeur
x i , j , k ,l
=μ
+ ai
+ bi , j
X
=μ
+A
+B
+C
+D
Mesure in
fine
Valeur
moyenne de
la population
Valeur
spécifique
de Dupont
Valeur de
Dupont à
l'instant de
la mesure
Variation
due aux
conditions
de mesure
Variation
due à l'erreur
de mesure
Valeur
InterIntraindividuelle individuelle individuelle
Hypothétique, vraie
+ ci , j ,k
+ d i , j ,k ,l
Analytique Analytique
(pré(instrumenta
instrumental
le)
e)
« Bruit »
(Cette addition est à comprendre comme la somme des facteurs influençant la mesure et non au
sens algébrique, les QCMs là-dessus sont répétitifs et permettent d'intégrer cette notion)
•
•
•
La variabilité inter-individuelle met en avant la différence entre les individus.
La variabilité intra-individuelle est la variabilité biologique d'un moment à un autre chez un
même individu
•
Exemple : Un individu ne présentera pas toujours le même taux de glycémie et ce
même si les conditions de mesures sont considérées comme identiques.
La variabilité analytique pré instrumentale est liée aux conditions d'examen.
•
Exemple : La fréquence cardiaque pour un même individu sera différente selon
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
38
•
si elle est mesurée au repos ou après un effort.
Tandis que la variabilité analytique instrumentale est liée à l'incertitude des instruments
diagnostiques.
Les erreurs possibles sur une mesure sont de deux types :
•
Erreur aléatoire => Manque de précision.
•
Biais => Manque d'exactitude.
•
Une même mesure peut cumuler un manque d'exactitude et un manque de précision.
Une mesure précise peut être avec ou sans biais et donc inexacte ou exacte.
L'exemple de la balistique (ou du tir à l'arc) est particulièrement intéressant : si on manque
d'exactitude mais qu'on est précis les balles iront toujours au même endroit mais à côté de la cible,
tandis que si l'on manque de précision, on visera la bonne cible mais on visera mal et les balles
iront quand même à côté tout en se répartissant autour de la cible de manière aléatoire (si on tire
un nombre assez important de balles, elles décriront un halo autour de la cible sans, en théorie,
jamais l'atteindre!)... Le but est donc de bien viser tout en visant la bonne cible et d'allier précision
et exactitude : éviter les biais (=décalages) et réduire l'aléa (qui parasite la mesure).
•
•
On passe du « monde hypothétique, vrai » (μ + A) au « monde expérimental, observé » (X =
μ + A + B + C + D) par DEDUCTION c'est à dire prédire à partir d'une MODELISATION
théorique (par exemple la météo)
On passe du « monde expérimental, observé » (X = μ + A + B + C + D) au « monde
hypothétique, vrai » (μ + A) par INDUCTION (par exemple trouver une théorie à partir
d'un fait observé).
2. Décomposition de la variabilité d'une mesure
Si variabilité de X :
Plus cette variabilité est celle de A par rapport à celle de B, C, D, plus la distinction entre les
individus augmente.
¡ ATTENTION !
Il existe d'autres incertitudes sur : les causes des maladies, le pronostic, l'efficacité des traitements...
En fait il en existe pour chaque facteur qui s'ajoute et qu'il faut prendre en compte.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
39
STATISTIQUES DESCRIPTIVES
I. MESURE DE LA TENDANCE CENTRALE
Il s’agit de trouver un indicateur de position centrale et donc de résumé des variations dans la
répartition des différentes valeurs, celui-ci nous servira ensuite de référence à partir duquel on
déterminera l’éloignement des autres valeurs et donc la puissance du test statistique :
•
La moyenne : Pour les variables QUANTITATIVES, c’est la plus fréquemment utilisée.
Si on a n fois x, on calcule la moyenne pondérée : E ( X )= ̅ x= 1 ∑n ni x i
i=1
n
{E(X) correspond à l'espérance mathématique de la série statistique, càd la moyenne
théorique et peut être différente de celle observée, mais les deux sont souvent confondues}
•
La médiane : Pour les variables QUANTITATIVES ET QUALITATIVES ORDINALE.
C’est la valeur du caractère correspondant à un effectif cumulé égal à la moitié de l’effectif
total (valeur pour laquelle il y a 50% de l'effectif au delà et 50% en deça).
ATTENTION :
•
si le nombre N de valeur est impair, il ne faut pas prendre la valeur
correspondant à N/2 mais bien celle de (N+1)/2 !!!!!
•
si le nombre N de valeur est pair la valeur médiane peut être TOUTE valeur
de l'intervalle [x(N/2) ; x (N/2 +1)]
•
si détermination par le calcul : TOUJOURS classer les valeurs par ordre
croissant
ASTUCE : Pour le calcul de la médiane, plutôt que d’essayer de déchiffrer la formule du
cours qui ressemble à rien, reportez vous à l’exemple ci-dessous qui risque de vous inspirer
un peu plus…
Le mode : Pour les variables QUANTITATIVES DISCRETE ET QUALITATIVES.
C’est la valeur de la série qui a le plus grand effectif (fastoche), pour les variables continues
on parle de classe modale (la pointe, le sommet, l'apex de la courbe! Ce qui est « à la
mode »
est ce que fait le plus grand nombre de personne en général).
ATTENTION : une distribution peut présenter plusieurs modes (→ unimodale, bimodale,
plurimodales...)
REMARQUES : lorsque la distribution est symétrique, la moyenne, la médiane et le mode
sont confondus. En revanche, si la distribution est biaisée on aura :
◦ A droite (plus étalée à droite) : Mode<Médiane<Moyenne (à droite du mode et de la
médiane) .
◦ A gauche (plus étalée à gauche) : Mode>Médiane>Moyenne (à gauche du mode et de la
médiane).
•
•
Quartiles :
Quartiles partagent la série en 4 intervalles de même taille =>25%.
Déciles partagent la série en 10 intervalles de même taille =>10%.
Percentiles partagent la série en 100 intervalles de même taille=>1%
Remarques:
•
Le mode est le seul paramètre utilisable pour les variables qualitatives
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
40
•
•
nominales .
Q2 = médiane
Attention à ordonner les données par ordre croissant.
II. MESURE DE LA DISPERSION
Après avoir déterminé la valeur centrale, pour bien connaître notre série statistique il nous reste à
évaluer comment les autres valeurs de la série se disposent autour de celle-ci…
Ces indicateurs de dispersions sont pour les variables QUANTITATIVES
•
Etendue : xmax-xmin (sert à évaluer « l’étalement » de la série et déterminer des valeurs
aberrantes = trop écartées, qui sortent du cadre logique de la mesure) => Peu stable car
n'utilise que 2 données.
•
Espace interquartile : Le plus souvent entre le 1et le 3éme quartile : QR=Q3-Q1=P75-P25
REMARQUE : Les quartiles et les intervalles interquartiles sont représentés en boxplot
•
Ecart moyen :
n
•
∑ ( x i− ̅
i=1
x)
Rq : la somme est toujours nulle, donc on utilise plutôt :
n
Variance et écart-type :
o Variance : c’est la moyenne des carrés des écarts à la valeur moyenne.
n
∑ ( xi − ̅ x) ²
σ ²= i=1
n
=> La variance augmente avec la dispersion des valeurs.
o Ecart-type : C’est la racine carré de la variance.
√
σ= (
∑
n
( x i − ̅ x )²
i=1
n
)
Attention : Un changement d’origine ne modifie pas la variance : σ ( x+b )=σ ( x ) .
Donc si ̅ y=a ̅ x+b alors σ 2 ( y )=σ ²( x ) et σ (y)= a σ( x)
o Variance et écart-type estimé : Si on ne connaît pas l’écart-type de la population, on
ne l’estime pas par celui de l’échantillon mais par la formule :
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
41
s=
nσ
n−1
Attention : On utilise σ lorsqu’il s’agit de l’échantillon et « s » lorsqu’il s’agit d’une estimation à
l’échelle de la population.
Coefficient de variation : Il est super utile car il permet de comparer différents phénomènes
quelques soient leurs unités (par exemple de faire une association entre une série statistique
σ
sur le poids des PACES par rapport à leur nombre d’heures de travail) : CV = ̅ x
•
Remarque, on utilisera de préférence pour :
▪ Une distribution symétrique : médiane, espace inter quartile, quantiles.
▪ Une distribution asymétrique : moyenne et écart-type.
Astuce : Apprenez par cœur la synthèse sur les indicateurs de tendance centrale, ça risque de vous
servir pour les QCM !
Démarche statistique :
Description des données de l'échantillon → Tests statistiques → Généralisation → Conclusion sur
la population
III. EXEMPLE
Un échantillon de PACES a été interrogé, voici le résultat des différents poids recensés en milieu
d’année, la moyenne de cette série est 70 et l’écart-type est 14.
Poids
Effectif
[50;60[
20
[60;70[
40
[70;80[
20
A. La moyenne de cette série est sous la forme
[80;90[
15
n
∑i=1 ni x i
[90;100[
5
avec les xi représentés par les centres
n
de classe.
B. La médiane de cette série est 65.
C. Le mode est 65.
D. Le coefficient de variation de cette série est égal à 0.2.
E. Le moment d’ordre 1 est égal à 70.
Réponse : AE
B.
On sait que la médiane se situe dans la classe [60 ;70[ puisque c’est dans celle-ci que se
situe l’effectif cumulé croissant 50. Mais elle ne se situe pas au centre de la classe
puisque les effectifs dans chaque classes ne sont pas les mêmes, voici la méthode pour
la calculer (méthode du cours) :
x
Ecc
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
42
60
20
Mediane
50
70
60
Ecc = Effectif cumulé croissant.
M e−60
50−20 3
30
= = ⇔ ( M e−60 )=¿
⇔ Me= 67,5
70−60
60−20 4
4
Autrement formulé :
Mediane → 50% des Ecc
Amplitude de l'intervalle [60;70] = 10
1 effectif inclus dans [60;70] correspond donc à 10/40 = ¼ de l'intervalle [60 ; 70]
Or, on sait que l'effectif cumulé croissant 50 correspond à 20 de l'intervalle [50;60] + 30 de
l'intervalle [60;70]).
Donc Me = 60 + 30 x ¼ = 67,5
C.
Le mode n’est là non plus le centre de classe (malgré qu’il appartienne à la classe
[60;70[ qui a le plus grand effectif) car les effectifs correspondant aux classes qui
l’entourent ne sont pas les mêmes. Autrement dit, sur une représentation graphique les
pentes qui entourent le mode(représenté par le sommet) ne sont pas les mêmes.
D.
Le coefficient de variation est C V = s , il ne faut donc pas utiliser l’écart-type mais
̅ x
n
σ
son estimation s=
> σ donc C V >0,2 .
n−1
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
43
PROBABILITÉS CONDITIONNELLES
I. GÉNÉRALITÉS :
•
•
On note (E) l'ensemble des événements élémentaires possibles. P(E) =1
Soit A et B deux événements élémentaires possibles.
0⩽P ( A)⩽1
◦
A∈( E)
◦
•
B∈( E)
0⩽P ( B)⩽1
On note
P ( A)=1− P( A)
A événement contraire de A.
◦
A∪ B ensemble des événement qui réalisent soit A soit B.
◦
A∩ B ensemble des événements qui réalisent à la fois A et B.
◦
On distingue deux cas :
A et B sont incompatibles (exclusifs)
A et B ne sont pas incompatibles
P ( A∩ B)=0
P ( A∩ B)≠0
P ( A∪ B)= P ( A)+ P ( B)
P ( A∪ B)= P ( A)+ P ( B)− P ( A∩B)
Il existe 3 types d'ensemble (E) :
•
Fini
•
Infini dénombrable → Ensemble des entiers
•
Infini indénombrable → Ensemble des réels
II. PROBABILITÉS CONDITIONNELLE OU A POSTERIORI :
•
On note P (A/ B) la probabilité de réaliser l’événement A sachant que l’événement B
est réalisé.
P ( A/ B)=
P ( A∩ B)
P ( B)
On parle de :
•
Probabilité a priori → P(A)
•
Probabilité à posteriori (conditionnelle) → P(A/B)
•
Notion d'indépendance:
Deux événements sont dits indépendants si le fait de savoir si A s'est produit ne donne aucune
information sur la probabilité de B. Soit P(A/B)=P(A).
Et donc : P(AinterB)=P(A)*P(B)
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
44
ASTUCE : La formule si dessus permet de vérifier rapidement si deux évènements sont
indépendants.
ATTENTION : A et B ne sont pas forcement exclusifs. Indépendant est différent d'exclusif.
III.THÉORÈME DE BAYES
Calcul des probabilités a posteriori d’un événement ( P (A/ B) ) en fonction des
probabilités a priori ( P ( A) ).
•
P ( A+/B+ )=
P ( A+∩B+)
P (B+ / A+)× P ( A+)
P ( B+/ A+)× P (A+ )
=
=
P ( B+)
P ( A+∩B+)+ P ( A-∩B+) P (B+ / A+ )× P ( A+)+ P ( B+ / A-)× P ( A-)
IV. APPLICATION AUX TESTS DIAGNOSTICS
Soit :
M+ :
M- :
VP :
FP :
T+ :
VN :
T- :
FN :
Sujet malade .
Sujet non malade.
Vrai positif (sujet malade et positif au test).
Faux positif (sujet non malade et positif au test).
Sujet positif au test.
Vrai négatif (sujet non malade et négatif au test).
Sujet négatif au test.
Faux négatif (sujet malade et négatif au test).
Un test diagnostic se caractérise par la sensibilité, la spécificité, la valeur prédictive positive, la
valeur prédictive négative.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
45
•
Sensibilité Se
➔ Probabilité d'être positif au test chez les sujets malades.
Se=P (T+ / M+)=
VP
VP+ FN
La sensibilité est une probabilité conditionnelle calculée chez les malades.
•
Spécificité Spe
➔ Probabilité d'être négatif au test chez les sujets sains.
Spe= P (T-/ M-)=
VN
VN + FP
La spécificité est une probabilité conditionnelle calculée chez les non malades.
•
Valeur prédictive positive VPP
➔ Probabilité d'être malade chez les sujets positifs au test.
VPP=P (M+ / T+)=
•
VP
VP+ FP
Valeur prédictive négative VPN
➔ Probabilité d'être sain chez les sujets négatifs au test.
VPN= P (M-/ T-)=
VN
VN +FN
Remarque : La sensibilité et la spécificité sont des caractéristiques intrinsèques du test, elles ne
dépendent pas de la prévalence de la maladie et varient en sens inverse. Par contre, les valeurs
prédictives sont directement influencées par la prévalence de la maladie :
◦ Si la prévalence augmente, la valeur prédictive positive augmentera( et la valeur
prédictive négative diminuera).
◦ Si la prévalence diminue, la valeur prédictive négative augmentera( et la valeur
prédictive positive diminuera).
En utilisant le théorème de Bayes, on peut exprimer les différentes grandeurs :
On note p la prévalence de la maladie. P(M+) = p
VPP=P( M+/ T+)=
P (M + )×P (T + /M +)
P (M+∩T+)
P (M+)×P (T+/ M+)
=
=
P (T + )
P (M+∩T+)+P (M-∩T+) P (M + )×P (T + /M +)+P ( M -)×P (T +/ M -)
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
46
VPP=
VPN =P (M-/ T-)=
p×Se
p×Se+(1− p)×(1−Spe)
P (M -)× P(T - / M -)
P(M-∩T-)
P (M-)×P (T-/M-)
=
=
P(T -)
P (M-∩T-)+P(M+∩T-) P ( M -)×P (T - / M -)+P (M +)×P (T - /M +)
VPN=
(1− p)×Spe
(1− p)×Spe+ p×(1−Se )
V. CAS PARTICULIER D'UNE VARIABLE QUANTITATIVE AVEC UN SEUIL :
Pour tous les QCMs de ce type, il est fortement conseillé de refaire le schéma ainsi que le tableau
suivant avant de répondre :
M+
M-
T+
VP
FP
T-
FN
VN
Sur le schéma avec les courbes on peut visualiser :
•
•
Si on augmente le seuil (« on déplace la barre vers la droite »), on diminue le nombre de
FP et de VP (donc Se diminue) , et on augmente le nombre de VN et FN (donc Sp
augmente).
Il est plus dur d'être positif si le seuil est plus haut (donc plus dur à atteindre)
Si on diminue le seuil(« on déplace la barre verticale vers la gauche »), on augmente le
nombre de VP et FP (donc Se augmente) et on diminue le nombre de VN et FN (donc
Sp diminue).
On détermine ensuite si la sensibilité (ou la spécificité) augmente ou diminue en l'exprimant en
fonction de VP,FP,VN,FN. (voir page précédente).
Par exemple, si le seuil est plus élevé, le nombre de VP diminue et le nombre de FN augmente. Or il
VP
y a toujours autant de malades (M+ = VP+FN) donc la sensibilité diminue.
Se=
VP +FN
Remarque : Les valeurs de Sensibilité et Spécificité varient toujours en sens inverse, ainsi si
vous connaissez l'évolution d'une des deux valeurs, vous pouvez en déduire l'autre (utile pour les
QCMs)
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
47
VI. COURBE ROC
Elle permet de déterminer la qualité d'un test diagnostic en exprimant la sensibilité en fonction
de (1-spécificité), chaque point de la courbe correspondant à la valeur d'un seuil.
Plus un test possède des valeurs de sensibilité et de spécificité élevées (proche de 1), plus il a un
intérêt diagnostic.
Ainsi plus la courbe représentative du test est proche du point de coordonnées (0,1) qui correspond
a une Spécificité maximale (1-Spé =0 donc Spé =1) et une sensibilité maximale (Se=1 ), plus le test
comporte un intérêt diagnostic.
Lorsque la courbe se rapproche de la diagonale cela revient à classer les malades et les non malades
au hasard.
Dans l'exemple du cours :
•
Le test A est le plus informatif car sa courbe représentative est la plus proche du point (0,1).
•
Le test B est moins informatif que le test A mais plus informatif que le test C.
•
Le test C ne comporte aucun intérêt diagnostic (équivalent a classer les sujets sains et
malades au hasard).
VII.
QCM D'APPLICATION :
QCM 1 : Un test de dépistage d'une nouvelle maladie auto-immune est réalisé dans une
population de 100 sujets dont 28 malades et 72 non malades. On dénombre 21 sujets positifs au
test parmi les malades et 9 sujets positifs au test parmi les non malades. On veut évaluer la
qualité de ce test diagnostic :
A. Le nombre de faux négatifs est de 9.
B. La valeur prédictive négative est égale à 90%.
C. La sensibilité du test diagnostic est égale à 75%.
D. La spécificité du test diagnostic est égale à 70%.
E. Si la prévalence de cette maladie augmente, la sensibilité du test sera plus élevée.
QCM 2 : Ce test de dépistage repose sur le dosage d'anticorps spécifiques. Un sujet est considéré
comme positif au test si son taux sanguin est supérieur à une valeur précise.
A. Si on augmente la valeur du seuil de positivité du test, cela diminuera la spécificité.
B. Si on diminue la valeur du seuil de positivité du test, cela augmentera le nombre de faux
positifs.
C. Si la modification de la valeur du seuil de positivité du test s'accompagne d'une hausse du
nombre de faux négatifs,la sensibilité diminuera.
D. Si la modification de la valeur du seuil de positivité du test s'accompagne d'une hausse de la
sensibilité, la spécificité diminuera.
E.. Si la prévalence de la maladie diminue, la valeur prédictive négative augmentera.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
48
QCM d'Application, ce qu’il fallait répondre :
1 : BC
2 : BCDE
Pourquoi certaines réponses sont fausses :
QCM 1 :
Pour répondre à ce type de QCM, il faut toujours réaliser un tableau (si il ne
vous ait pas déjà donné dans l'énoncé).
Malades (M+)
Non malades (M-)
Test positif (T+)
VP = 21
FP = 9
30
Test négatif (T-)
FN = 28-21= 7
VN = 72-9= 63
70
28
72
100
A. Faux : Le nombre de faux négatifs est égal à 7 (cf tableau)
B. Vrai :
VPN =
VN
63 90
= =
VN +FN 70 100
C. Vrai :
Se=
VP
21 75
= =
VP+FN 28 100
Spe=
VN
63 87,5
= =
VN +FP 72 100
D. Faux :
E. Faux : Les valeurs de sensibilité et de spécificité ne dépendent jamais de la
prévalence de la maladie.
QCM 2 :
Pour répondre à ce QCM, il est conseillé de refaire rapidement le schéma « cas
particulier d'une variable quantitative avec un seuil » page 4
A. Faux. Si on augmente la valeur du seuil, le nombre de VN augmentera tandis
que la somme VN+FP restera constante, donc la spécificité augmentera.
Spe=
VN
VN +FP
B. Vrai. Voir schéma.
C. Vrai. Si on augmente le nombre de FN, on diminue le nombre de VP, donc la
sensibilité diminuera.
Se=
VP
VP +FN
D. Vrai. Les valeurs de sensibilité et de spécificité varient toujours en sens
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
49
inverse.
E. Vrai. Si la prévalence diminue, la probabilité d'être sain augmente, donc la
valeur prédictive négative augmente. Par contre, la valeur prédictive positive
diminue mais dans les deux cas, cela illustre le fait qu'on a moins de chance
d'être malade, quel que soit le résultat du test, ce qui est normal puisque la
prévalence de cette maladie diminue.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
50
Biostatistiques QCMs
QCM 1 : On mesure le cholestérol chez 100 patients, chaque patients étant prélevé 2 fois. On
obtient au total 200 mesures. Quelles variabilités participent à la dispersion de ces 200 mesures ?
A. La variabilité intra-individuelle
B. La variabilité inter-individuelle
C. La variabilité instrumentale.
D. La variabilité inter-individuelle et les variabilités analytiques mais pas la variabilité intraindividuelle puisqu'il y a 100 patients.
E. La variabilité intra-individuelle et inter-individuelle mais pas les variabilités analytiques puisque
chaque patient a été prélevé 2 fois.
QCM 2 : On mesure la protéine K 30 fois dans le même tube, issu d'un seul prélèvement
sanguin.
A. On s'attend à trouver 30 fois le même résultat.
B. Il y a de la variabilité inter-individuelle.
C. Il y a de la variabilité intra-individuelle.
D. Il y a de la variabilité instrumentale et pré-instrumentale
E. On s'attend à trouver de légères différences dans les résultats du fait de la variabilité inter et intra
individuelle.
QCM 3 : Définitions
A. On peut transformer une variable ordinale en variable nominale.
B. Le degré de douleur est une variable qualitative ordinale.
C. Le nombre de télévision par foyer est une variable qualitative discrète.
D. La couleur des yeux est une variable qualitative nominale.
E. On étudie 150 familles. Pour chacune d'entre elles on connait le nombre d'enfants et le budget
pour les vacances : Une famille est une unité statistique.
QCM 4 et 5 : On teste sur une population de 80 souris un médicament stimulant pour la
mémoire, contre la pathologie d'Alzheimer. Pendant un mois de traitement elles ont parcouru
quotidiennement un labyrinthe technique afin de mémoriser la sortie. Le jour J du test, on
chronomètre le temps (exprimé en secondes) que met la souris pour sortir. On a regroupé les
résultats dans des intervalles d'étendues régulières :
Valeurs
centrales
Intervalles
Nombre de souris
Effectif cumulé
[77,50 ; 82,50[
8
8
[82,50 ; 87,50[
23
31
[87,50 ; 92,50[
31
62
[92,50 ; 97,50[
14
76
[97,50 ; 102,50[
4
80
Ces résultats pour être interprétés sont comparés au Quartile 3 (75 %) du test placebo de
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
51
référence qui est Q3' = 93,02
Ici on a admis qu'un résultat est défavorable pour un médicament testé si le Q3 du test est
supérieur au Q3' du placebo. Si au contraire c'est inférieur, le médicament est dit « candidat
potentiel » pour avoir agit positivement sur au moins 75 % des souris.
QCM 4: Concernant ce test, quelles sont les affirmations vraies (valeurs arrondies) :
A. Q3 = 93,21.
B. Q3 = 92,18.
C. Q3 = 97,14.
D. Le médicament est défavorable.
E. Le médicament est « candidat potentiel ».
QCM 5 : Concernant ce test, quelles sont les affirmations vraies, sachant que la somme des
n
écarts des carrés de ce test est
∑  X − X  ²
i=1
= 2 034,69 (Toutes les valeurs sont arrondies) :
A. La moyenne est égale à 88,94.
B. L'écart type estimé s est s = 25,76.
C. L'écart type estimé s est s = 25,43.
D. Le Coefficient de Variation est CV = 0,2 896.
E. Le Coefficient de Variation est CV = 0,0 571.
QCM 6 : Le cholestérol est véhiculé dans le sang par des systèmes de transport aux rôles très
différents : les lipoprotéines LDL (lipoprotéines de petite densité) et HDL (lipoprotéines de haute
densité).
Lorsqu'on mesure le cholestérol dans le sang, on mesure séparément cholestérol-HDL et
cholestérol-LDL, l'ensemble formant le cholestérol total :
Individu
1
2
3
4
5
HDL (g/L)
0,70
1,25
2,00
0,35
1,15
LDL (g/L)
0,95
1,55
2,02
0,70
1,20
A. HDL est une variable quantitative discrète.
B. LDL est une variable quantitative continue.
C. La moyenne arithmétique du HDL dans cette expérience est 1,284.
D. La moyenne arithmétique du HDL dans cette expérience est 1,09.
E. La moyenne arithmétique du LDL dans cette expérience est 1,09.
QCM 7 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :
A. Le mode est une caractéristique intéressante si la distribution est symétrique.
B. La moyenne est sensible aux valeurs anormalement petites ou grandes.
C. Il existe 2 types de variables : quantitative et qualitative.
D. Les variables quantitatives peuvent être discrètes ou continues.
E. Les variables qualitatives ordinales sont dichotomiques.
QCM 8 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :
A. L'étude du tabagisme représente une variable qualitative ordinale.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
52
n
B. La formule de la variance est :
∑  xi – x 
2
 2 = i=1
n
C. La médiane partage une suite croissante en 2 parties contenant chacune au plus 50% des valeurs.
D. Pour une distribution symétrique le mode, la médiane et la moyenne correspondent au même
point.
E. La médiane est un quartile.
QCM 9 : La température est relevée chaque heure pendant 4 jours dans une forêt. Les 97 résultats obtenus ont été triés et sont rassemblés dans le tableau suivant :
Température
Nombre de fois où
cette température a
été relevée
A.
B.
C.
D.
E.
14,5
5
15
7
15,5
10
16
12
16,5
15
17
10
17,5
11
18
9
18,5
7
19
7
19,5
4
La médiane correspond à 15,5°.
la médiane correspond à 16,5°
la moyenne est égale à 17,8
La moyenne est égale à 16,8°.
Le coefficient de variation est le rapport de la moyenne à l’écart type.
QCM 10 : Après la première colle de mathématiques les notes des étudiants en PACES a Purpan
ont été reportées dans le tableau suivant :
Notes
Nombre d'étudiants
0-4
200
5-9
185
10 - 15
305
16-20
110
A. Q1 = 4.
B. Q2 ≈ 10,41.
C. Q2 ≈ 10,25.
D. 75% des étudiants ont obtenu une note ≤ 13,52.
E. 75% des étudiants ont obtenu une note ≤ 13, 85.
QCM 11 : On recense le nombre d'ordinateurs par foyer. L'enquête porte sur un échantillon de
10 foyers.
Voici le tableau observé :
Nombre d'ordinateurs
Nombre de foyers
0
2
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
53
1
3
2
2
3
2
4
1
On s'intéresse à la distribution du nombre d'ordinateurs par foyer.
A. L'étendue est de 4
B. Le mode est égale à 4
C. La médiane est égale a 1,5
D. La moyenne est égale à 0,17
E. On ne peut pas calculer la moyenne car il s'agit d'un variable quantitative discrète.
QCM 12 : Soient A et B deux évènements :
A. Si A et B sont exclusifs alors P(AUB) = Ø.
B. P(A/B) = P(A et B)/P(A).
C. Si P(A et B) = P(A) x P(B) alors A et B sont indépendants.
D. La sensibilité d'un test diagnostique représente la probabilité qu'un individu malade ait un test
positif.
E. La spécificité d'un test diagnostique représente la probabilité qu'un individu malade ait un test
négatif.
QCM 13 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :
A. La loi de probabilité d'une variable aléatoire continue est : P(x< X < x+dx)= f(x).dx.
∞
B. La fonction f(x) densité de probabilité de X est telle que :
∫
f  x d x =1
–∞
C. La fonction de répartition f(x) telle que f'(x)= f(x) a une limite en +∞ qui tend vers +∞.
D. Si f(x)= 0,5 alors x représente la médiane.
E. P(a<X<b) = f(a) – f(b).
QCM 14 : Soit un ensemble composé uniquement de deux évènements possibles : l’événement A
et l’événement B. Indiquer quelle(s) est(sont) la(les) proposition(s) vraie(s) si A et B sont deux
évènements indépendants.
A. P(B/A) = P(B)
B. P(A/B) = P(B)
C. P ( A З B) = 0
D. P ( A З B) = P(A).P(B)
E. P ( A З B) = P(A) + P(B)
QCM 15 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :
A. Pour que deux séries statistiques aient la même moyenne, il faut qu'elles aient la même médiane.
B. Quelle que soit la série statistique, la moyenne et la médiane sont égales.
C. Il existe une série statistique de moyenne et de médiane égales.
D. Quelle que soit la série statistique, la moyenne appartient à l'intervalle (Q1;Q3).
E. Il n’existe aucune série statistique de moyenne et de médiane égales.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
54
QCM 16 : Soient deux boules blanches et trois noires dans une urne (tirage avec remise) :
A. La probabilité de piocher une boule blanche est 3/4.
B. La probabilité de piocher une boule blanche est 3/1.
C. La probabilité de piocher une boule noire est 3/4.
D. La probabilité de piocher deux boules noires est 9/25.
E. La probabilité de piocher une boule blanche et une boule noire est 6/25.
QCM 17 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :
Voici les résultats du test d'alcoolémie de 11 élèves reçus en P2 :
0 / 0 / 0,25 / 0,3 / 0,45 / 0,5 / 0,85 / 1 / 1,3 / 1,5 / 5.
A. Moyenne = 0,5.
B. Médiane = 0,5.
C. Amplitude intervalle = 11,15.
D. Etendue de la distribution = 5.
E. Q2 représente la médiane.
QCM 18 : Une personne à 1 chance sur 50 d'être atteinte de la maladie de l'open bar (M). Une
personne malade aura 95% de chance que sont test soit positif (TP) pour cette maladie alors
qu'une personne non-malade 5%.
A. P(Personne malade avec test négatif)=0,001.
B. P(Test positif)=0,5.
C. P(M/TP)=P(M∪TP)/P(TP).
D. P(M/TP) peut être traduite par la phrase : on choisit une personne au hasard, le résultat du test est
positif. Quelle est la probabilité que cette personne soit atteinte de cette maladie ?
E. Annulé
QCM 19 : Voici les résultats de l'étude d'un groupe allergique au lactose :
Degré d'allergie
11 à 21
21 à 31
31 à 41
41 à 51
Effectifs
16
80
64
32
A. Calcul de la moyenne = 41,83.
B. La valeur centrale est un multiple de 15.
C. Changement de variable x'=x-26, la moyenne de x'=5,83.
D. Changement de variable x'=x-26, la moyenne de x=15+5,83.
E. Changement de variable x'=x-26, la moyenne de x=26+5,83.
QCM 20 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :
nσ 
A. L'écart type estimé s=
.
n – 1
B. Ecart type de la distribution des moyennes sem=σ /  n
C. L'étendu est utilisée pour déterminer les valeurs aberrantes.
D. Coefficient de variation = Rapport de l'écart type à la moyenne.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
55
E. CV=s/moyenne de x.
QCM 21 : Une machine à écrire comporte 42 touches dont 26 lettres et 8 chiffres. Une personne
tape au hasard sur les touches. On admet que la probabilité pour qu’elle frappe une touche
donnée est la même quelle que soit la touche.
A. La probabilité pour qu’elle frappe une lettre est 13/21.
B. La probabilité pour qu’elle frappe un chiffre est (26+8)/42.
C. La probabilité pour qu’en tapant sur 5 touches, elle frappe une suite de 5 lettres est 26 / 425 .
D. La probabilité qu’en tapant sur 3 touches elle frappe le mot « oui » ou le mot « non » est (1/42)².
E. On considère qu’il s’agit d’un « tirage avec remise ».
QCM 22 : Une première urne contient huit boules vertes. Une de ces boules porte le chiffre 1,
trois portent le chiffre 2 et quatre le chiffre 4. Une deuxième urne contient six boules rouges :
une de ces boules porte le chiffre 3, deux le chiffre 5 et trois le chiffre 6. On extrait au hasard
une boule de chaque urne. On désigne par X le chiffre porté par la boule verte et par Y le chiffre
porté par la boule rouge.
A. L’ensemble des éventualités est composé de 48 couples équiprobables.
B. P  X =2 et Y =6 =1/3.
C. P  X Y ≥ 8 =29/48.
D. P  X Y ≥ 8 =29/96.
On effectue 10 fois de suite le tirage précédent, en replaçant à chaque fois les boules extraites
dans leur urne respective avant chaque nouveau tirage.
E. Si Z désigne le nombre de réalisations de l’événement  X Y ≥ 8 à l’issu des dix tirages, alors
5
5
10!
29
29
.
P  Z =5=
×
× 1–
5!5!
48
48
    
QCM 23 : On a réalisé une étude sur un échantillon de 10 personnes. Voici les résultats
obtenus :
Nombre de
médicaments
0
1
2
3
4
Nombre de
personnes
2
4
0
3
1
A. La médiane est égale à 1.
B. La moyenne est égale à
0×21×42×03×34×1
.
10
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
56
C. La moyenne est égale à
0×21×42×03×34×1
.
11
D. La moyenne et la médiane sont égales.
E. La moyenne est supérieure à la médiane.
QCM 24 : Après la dernière colle de mathématiques les notes des étudiants en PACES à Purpan
ont été reporté dans le tableau suivant :
Notes
Nombres d'étudiants
0-4
200
5-9
258
10-14
322
15-20
20
A. Q1 = 4.
B. Q2 ≈ 8,1.
C. Q2 ≈ 9,65.
D. 75% des étudiants ont obtenu une note ≤ 11,76
E. 75% des étudiants ont obtenu une note ≤ 13,25.
QCM 25 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :
A. Le mode est une caractéristique intéressante si la distribution est asymétrique.
B. Les variables qualitatives nominales peuvent être dichotomiques.
C. La sensibilité d'un test diagnostic représente la probabilité qu'un individu malade est un test
négatif.
D. L'intervalle de pari est la valeur théorique vers une observation expérimentale.
E. L'erreur de première espèce est lorsque l'on rejette Ho alors que Ho est vrai.
QCM 26 : A propos de la mesure des phénomènes biologiques …
Une étude (mesure d'une variable biologique) est réalisée au sein d'un échantillon de 200
personnes représentatif de la population générale, le protocole est unique et correctement
appliqué, On obtient 200 valeurs différentes. Quelles sont les propositions inexactes ?
A. Le nombre important de valeurs différentes peut être du à la variabilité inter-individuelle.
B. Il est le fait d'une variabilité intégralement intra-individuelle.
C. Il est impossible qu'il soit du à une erreur analytique.
D. Une série de valeurs biaisée présente un manque de précision.
E. L'exactitude permet d'éviter les erreurs dues à l'aléa.
QCM 27 : Au sujet des statistiques descriptives …
Une série statistique est représentée par une courbe de Gauss moins étendue à droite qu'à
gauche.
A. Il s'agit d'une représentation particulièrement adaptée pour une variable qualitative continue.
B. La série présente un biais à droite.
C. La médiane est influencée par les valeurs extrêmes.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
57
D. La moyenne, la médiane et le mode sont confondus.
E. On peut affirmer que : Moyenne<Médiane<Mode.
QCM 28 : En ce qui concerne les probabilités conditionnelles …
Lancer d'un dé à six faces (équilibré) : On relève le nombre de sorties pour chaque face.
A. P(A) = P(A/B)*P(AUB).
B. P(AUB) = P(A)+P(B).
C. La probabilité de sortie du six est de 1/3.
D. Chaque face a une probabilité de sortie de 1/6.
E. P(six/six) = 0.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
58
Biostatistiques, ce qu’il fallait répondre :
1 : ABC
6 : BD
11 : AC
16 : DE
21 : ACE
26 : BDE
2 : CD
7 : BCD
12 : CD
17 : BDE
22 : ACE
27 : E
3 : ABDE
8 : BCDE
13 : ABD
18 : AD
23 : ABE
28 : D
4 : BE
9 : BD
14 : AD
19 : CE
24 : ABD
5 : AE
10 : ACD
15 : C
20 : ABCDE
25 : ABDE
Pourquoi certaines réponses sont fausses :
QCM 1 :
D. Chaque patient subit 2 prélèvements, il y a donc de la variabilité intraindividuelle.
E. Il y a toujours de la variabilité instrumentale et pré-instrumentale.
QCM 2 :
A. On n'aura jamais le même résultat à chaque mesures effectuées. Ceci étant
du aux différentes variabilités.
B. Il n'y a qu'un seul prélèvement sanguin, donc il n'y a pas de variabilité interindividuelle.
C. Vrai même si il n'y a eu qu'un seul prélèvement sanguin car il a été réalisé à
un instant t.
E. Il n'y a pas de variabilité inter-individuelle.
QCM 3 :
A. Vrai, mais il y aura une perte d'information.
C. Faux, c'est une variable quantitative discrète.
E. Vrai, la famille est l'unité statistique à laquelle on s'intéresse et qui est décrite
par des variables aléatoires.
QCM 4 :
On veut quoi? Le Quartile 3, 75 % de l'effectif.
Qui? C'est le 75 % de l'effectif total est 75x80/100 = 60ème souris.
Où? Dans l'intervalle [87,50 ; 92,50[.
Calcul de Q3 :
1. Etendue 92,50 – 87,50 = 5.
2. Partage par l'effectif concerné 5/31 = 0,163.
3. On multiplie par le nombre de souris manquant, on avais comme
précédent effectif cumulé : 31 pour l'intervalle [77,50 ; 87,50[, il nous
manque 62 – 31 = 31 souris pour atteindre la 60ème. Donc 0,163 x 31 =
4,68.
4. On ajoute le résultat obtenue à la borne inférieur de l'intervalle étudié,
soit 87,50 + 4,68 = Q3 = 92,18
On remarque que Q3 = 92,18 est inférieur à Q3' = 93,02 , donc le médicament
est dit candidat potentiel.
QCM 5 :
A. Calcul de la moyenne :
88,94.
 = (80x8 + 85x23 + 90x31 + 95x14 + 100x4)/80 =
X
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
59
B. Faux c'est s² = 2039,64/(n-1) = 2039,64/79 = 25,76 . Donc l'écart type estimé
est la racine carré, s = 5,075.
C. Faux c'est la Variance σ² = 2039,64/n = 2039,64/80 = 25,43.
D. Faux voir E.
 = 5,075/88,94 = 0,0571.
E. Annulé. (besoin de la calculatrice) . CV = s / X
QCM 6 :
A. Faux, c'est une variable quantitative continue puisque l'échelle est un sous
ensemble des nombres réels.
C. La moyenne HDL = 1,09.
E. La moyenne LDL = 1,284.
QCM 7 :
A. Elle est intéressante lorsque la distribution est asymétrique.
E. Les valeurs sont une échelle de chiffres qui a pour seule propriété des
nombres réels leur relation d'ordre. Les variables qualitatives nominales sont
elles dichotomiques.
QCM 8 :
A. C’est une variable qualitative nominale (variable dichotomique).
C. VRAI : cf définition de la médiane.
QCM 9 :
A. Le nombre d’observations est impair ( 97=2×481 ), la médiane est égale
à la 49ème mesure c’est-à-dire 16,5°.
C. La moyenne est égale a 16,8°.
E. C’est l’inverse.
QCM 10 :
A. VRAI : 25% des étudiants représentent 200 élèves.
B. Q2= 5/305 x15 +10 ≈ 10,25.
E. Q3= 5/305 x 215 + 10 ≈ 13,52.
QCM 11 :
B. Le mode est la valeur qui a le plus grand effectif. Ici il est égale à 1.
C. Ici pour calculer la médiane il faut par avance calculer les effectifs cumuler
croissants ; ce qui nous donne :
Nombre d'ordinateurs
Nombre de foyers
Effectifs cumulés croissants
0
2
2
1
3
5 (2+3)
2
2
7 (2+3+2)
3
2
9 (2+3+2+2)
4
1
10 (2+3+2+2+1)
Ainsi, on voit bien que la médiane est égale a 1,5.
D. (0x2 + 1x3 + 2x2 + 3x2 + 4x1)/10= 1,7
QCM 12 :
A. Si A et B exclusifs alors P(A et B) = Ø.
B. P(A/B) = P( A et B) / P(B) et P(B/A)= P(A et B)/ P(A)
E. Cela représente la probabilité qu'un individu sain ait un test négatif.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
60
QCM 13 :
C.
E.
lim f  x =1
x ∞
donc
p a X b= f b − f a
QCM 14 :
A. Propriété par définition de deux évènements indépendants.
B. cf A.
C. P ( A З B) = P(A).P(B).
E. cf C.
QCM 15 :
A. Faux, car peu importe le nombre de série statistique la médiane ne sera pas
toujours égale à la moyenne c’est même très rare.
Ex : voici 2 séries de notes : 1 8 8 9 10 11 12 13 17 -> moyenne = 89/9 = 9.89 et
médiane= 10
1 2 2 5 8 15 18 19 19 -> moyenne = 89/9 = 9.89 et médiane= 8
Les moyennes sont égales, mais les médianes ne le sont pas.
B. Faux, car par exemple pour cette série : 35 38 38 39 39 42 42 43 43 44
44 44 Total : 12
Ici, la médiane se trouve entre la 6ème et 7ème valeur car 12/2=6
Or la 6ème valeur = 42 et la 7ème également donc la médiane est 42.
Maintenant la moyenne : 35+38*2+39*2+42*2+43*2+44*3 = 40.9 ≠ 42.
12
C. Vrai, par exemple pour cette série : 10 10 10 10 10 → moyenne = 10 et
médiane = 10.
D. Contre-exemple : 2 8 10 10 11 15 15 15 20 20 30 700 Moyenne = 71,3.
Q1 = 10 et Q3 = 20 donc la moyenne 71,3 n'appartient pas à l'intervalle [10 ; 20].
QCM 16 :
A. P = 2/5.
B. P= 2/5.
C. P = 3/5.
D. Vrai, P = 3/5 x 3/5 = 9/25
E. Vrai, P = 2/5 x 3/5 = 6/25
QCM 17 :
A. 11,15/11.
C. 5.
QCM 18 :
B. P=0,068.
C. Ptp(M)=P(M∩TP)/P(TP).
QCM 19 :
A. Moyenne = 31,83.
C. Moyenne de x' = moyenne de x – 26 = 31,83 – 26 = 5,83
QCM 21 :
B. P=8/42.
D. P=2(1/42)3 car P(oui) = P(non) = (1/42)3 d'où P(oui ∪non)=2(1/42)3.
QCM 22 :
A. Vrai : 8x6 = 48 couples.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
61
B. P(X=2)= 3/8.
P(Y=6)= 3/6.
D’où P(X=2 et Y=6)= (3/8)x(3/6)= 3/16.
D. 3 couples sont possibles pour que X + Y soit > ou = à 8 : (2;6)/(4;5) / (4;6).
D'ou : P  X Y ≥ 8 = 3/8 x 3/6 + 4/2 x 2/6 + 4/8 x 3/6 = (9+8+12)/48 = 29/48
QCM 23 :
Formulons le tableau d’une autre manière, on obtient la liste suivante : 0 0 1 1 1
13334
La médiane se trouve entre la 5° et 6° valeur (entre 1 et 1) donc médiane = 1.
La moyenne = (0x2 + 1x4 + 3x3 + 4x1)/10 = 1.7.
Donc la moyenne est supérieure à la médiane.
QCM 24 :
C. cf B.
E. Faux
QCM 25 :
C. La sensibilité d'un test diagnostic représente la probabilité qu'un individu
malade ait un test positif.
QCM 26 :
B. Pas seulement !
C. Vrai donc faux... « protocole unique et correctement appliqué ».
D. et E. C'est l'inverse.
QCM 27 :
A. QUANTITATIVE !
B. Gauche... .
C. Moyenne... .
D. Cf E.
QCM 28 :
A. Formule fondamentale : P(A/B) = P(AinterB)/P(B).
B. Pas toujours, il faut que les événements A et B soient exclusifs, sinon :
P(AUB) = P(A)+P(B)-P(A B).
C. cf D, le dé est équilibré.
E. Si c'est possible, la probabilité ne sera pas nulle !
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
62
III - Lois de Probabilités - Synthèse
I. VARIABLES ALÉATOIRES (VA) DISCRÈTES
Qu'est ce qu'une VA discrète ?
C'est un ensemble de valeurs fini ou infini dénombrable x1, x2, … , xn tel que X(Ω) = {x1, x2, … ,
xn} ou x1 < x2
X suit une loi de probabilité qui est exposé par un tableau :
•
xi
x1
x2
...
xn
pi = P(X= xi) =
f(xi)
p1
p2
...
pn
Remarques :
◦ Σp =1.
i
◦ Σ p x = E(X).
i i
2
2
◦ Σ p x = E(X ).
i i
•
Quelques formules à connaître :
◦
◦
◦
◦
P(a ≤ X ≤ b) = Σ xi [a;b] f (xi)
Fonction de répartition : F(x) = Σxi ≤ x f(xi)
Espérance : E(X) = Σ pi xi et E(X2) = Σ pi xi2
Variance :
•
V(X) = E(X2) – (E(X))2 → pour une variable aléatoire X quelconque
→ pour une variable aléatoire discrète X
◦
Écart type : σ(X) =
√V ( X ) .
II. VA CONTINUES :
•
Qu'est ce qu'une VA continue ?
Pour les VA continues toutes les valeurs dans ℝ sont possibles !
Sa distribution est représentée par un histogramme.
•
A connaître :
X(Ω) = [a;b] = [xmin ; xmax] avec a < b
Pour les variables continues la probabilité en un point est nulle P[X = x0] = 0
◦ Fonction de répartition : .
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
63
x2
◦
P [ x 1 ≤ X ≤ x 2 ]=∫ f (x ) dx = F(x2) - F(x1)
Probabilité sur un intervalle :
x1
P [ x ≤ X ≤ x+dx ]∼ f ( x) dx
◦
Densité de probabilité : C'est une fonction g tel que :
▪ g est défnie, continue, positive sur [a,b].
b
▪
∫ g ( x)dx=1
→ l'aire totale sous la courbe = 1
a
b
◦
Espérance :
b
E ( X )=∫ x f (x ) dx
a
◦
E ( X )=∫ x 2 f ( x) dx .
2
a
Variance :
•
V(X) = E(X2) – (E(X))2 → pour une variable aléatoire X quelconque
→ pour une variable aléatoire continue X de loi f
◦
Écart type : σ(X) =
√V ( X )
.
III.PROPRIÉTÉS DES VA :
•
Espérance
◦
◦
◦
◦
◦
•
E(X+a) = E(X) + a.
E(aX) = a E(X).
E(aX+b) = a E(X) + b.
E(X+Y) = E(X) + E(Y).
E(aX + bY) = a E(X) + b E(Y).
▪ Avec X et Y deux VA.
Variance
◦
◦
◦
◦
V(X+a) = V(X).
V(aX) = a2V(X).
V(aX + b) = a2V(X).
Si on a X et Y deux variables aléatoires INDEPENDANTES on peut écrire :
▪ V(X+Y) = V(X) + V(Y) + 2cov (X,Y)
▪ V(X-Y) = V(X) + V(Y) - 2cov (X,Y)
2
2
▪ V(aX+bY) = a V(X) + b V(Y) + 2ab.cov(X,Y)
2
2
▪ V(aX-bY) = a V(X) + b V(Y) – 2ab.cov(X,Y)
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
64
→ Avec cov(X,Y) = E[(X – ux)(Y – uy)] = σx .σy.p
•
Inégalité de bienaymé-Tchebychev => HORS PROGRAMME
◦
◦
•
X étant une VA QUELCONQUE on peut démontrer qu'il est « très improbable »
d'observer des valeurs de x de X telles que ∣x−E ( X )∣ soit très supérieur à l'écart-type
σ.
Ex : la probabilité d'observer une VA X éloignée de E(X) de 5 σ est inférieur à 4/100.
VA centrée réduite :
◦ VA centrée : on pose Y une VA centrée, on « centre la VA grâce à l'espérance ».
Y = X – E(X) et E(Y) = 0 ; V(Y) = 0.
◦
VA réduite : on pose Y une VA réduite, on « réduit la VA grâce à l'écart-type »
X
1
Y=
;V (Y )= 2
∗V ( X )=1 => σ 2 ( X )=V ( X ) .
σ(X )
σ (X )
◦
VA centrée réduite : on pose Y une VA centrée réduite.
Y = (X – μ)/ σ → E(Y) = 1/σ [E(X) – E(μ)] = μ -μ = 0 et V (Y )=
1
∗V ( X )=1
σ (X)
2
IV. LOI DE PROBABILITÉ DES VA DISCRÈTES :
•
1. Loi de Bernoulli (VA discrètes)
On parle de loi de bernoulli quand X(Ω)={0,1} c'est a dire 2 possibilités soit succès, soit échec !
E(X) = Σ pi xi = 0 * P(X=0) + 1 * P(X = 1)
On note Π = P(X = 1) → c'est le paramètre de la loi de Bernoulli.
On a alors :
E(X) = Π.
V(X) = E(X2) – (E(X))2 = Π – Π² = Π ( 1 – Π ).
E(X2) = Σ pi xi2 = 0² * P(X=0) + 1² * P(X = 1) = Π et E(X)2= Π²
◦
Remarques : X ∼ B(Π) « X suit une loi de Bernoulli de paramètres Π ». Quand X(Ω)
est un ensemble quelconque de 2 éléments on parle toujours de loi de Bernoulli.
◦
Exemple : Prévalence d'une maladie.
X(ω) = 1 si l'individu est malade ; X(ω) = 0 si l'individu est sain.
On a donc X ∼ B(Π) avec Π = prévalence de la maladie
◦
◦
Comment connaître Π ?
▪ On réalise n tirage d'individus au sein de la population => ECHANTILLONAGE.
▪ On obtient n variables aléatoires X1, X2, … , Xn.
◦
Xi ~ B (Π) ; Hypothèse : les variables Xi sont indépendantes.
P(X1 = x1 et X2 = x2 et … et Xi = xi) = P(X1 = x1) * P(X2 = x2) * … * P(Xn = xn).
◦
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
65
=> Rappel : Si deux évènements A et B sont indépendants alors P(A et B) = P(A)*P(B)
◦
On utilise ensuite un estimateur de la moyenne Xn =
◦
Propriété de Xn : E(Xn) =
◦
◦
1
∗(E ( X 1 )+...+ E( X n )) = Π.
n
Comme l'espérance de notre estimateur de moyenne est égal à Π on dit que notre
estimateur est sans biais.
Quel est l'erreur standard (SD) de notre estimateur ?
SD = √ Var ( X n)
or
√Var ( X n )=
( X 1+...+ X n ) (Var ( X 1 )+...+Var ( X n )) (Π(1−Π)+...+Π(1−Π)) ( Π(1−Π))
=
=
=
n
n²
n²
n
√
On a alors SD= Var
◦
( Π(1−Π))
n est en dénominateur donc plus n est grand plus SD est petit.
n
Pour résumer :
▪ Les individus modélisés par X1, X2, … , Xn constituent un échantillon.
▪ Grâce à la valeur de X n observée dans l'échantillon on peut estimer le paramètre
dans la population c'est-à-dire Π.
▪
▪
▪
•
( X 1 +...+ X n)
.
n
X n = moyenne observée = moyenne empirique.
X n est soumis aux fluctuations d’échantillonnages et son erreur standard est
SD= σ avec var (X) = σ 2 = Π (1 - Π)
√n
+ n est grand + estimation est précise !
2. Loi Binomiale : (VA discrètes)
Construction de la loi binomiale :
C'est une répétition du schéma de bernoulli n fois de manière indépendante.
Soit X la VA qui correspond au nombre de succès au cours des n épreuves.
On a X(Ω) = {0;1 ;... ;n }
k
(n−k )
n
P(X=k) = pk = ( )∗ p ∗(1− p)
k
On dit que X suit une loi binomiale de paramètre n, p → B(n,p)
On a une loi binomiale quand :
➔ on a une suite d'événements indépendants et identiques
➔ ordre des réponses non imposé
Quand n=1, on dit que X suit une loi de Bernoulli B(1,p)
Formules associées :
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
66
P(X=n) = pn
P(X=0) = qn = (1-p)n
P(X≥1) = 1 – P(X=0)
P(X<n) = 1 – P(X=n) = 1 – pn
( n! )
( n )=
k ( k ! (n−k !))
Le point d'exclamation après le k du dénominateur a été ajouté il me semble que c'est aussi une
factorielle
5! = 5 * 4 * 3 * 2 * 1
6! = 6 * 5 * 4 * 3 * 2 * 1 = 6 * 5!
0! = 1
E(X) = np
V(X) = npq
σ(X) = √ Var ( X )=√ npq
•
Loi Binomiale de fréquence : PAS SUR LE POLY DE COURS DE L'ANNEE DERNIERE
Soit Y ~ B(n,p)
On pose G =
◦
◦
◦
◦
◦
•
Y
n
1 2
n
; ; ... ;
}.
n n
n
k
(n− k)
k
n
Probabilité P(G=
) = p k = ( )∗ p ∗(1− p)
.
k
n
(E (Y )) np
Y
E (G)=E ( )=
= =p .
n
n
n
(Var (Y )) npq pq
Y
Var (G)=Var ( )=
=
=
.
n
n²
n²
n
pq
.
σ (G)=√Var (G)=
n
On a alors G(Ω) = {0 ;
√
3. Loi de Poisson : (VA discrètes)
On l'utilise pour modéliser des situations de comptage non majorées.
On dit qu'une VA X tel que X(Ω) = ℕ suit une loi de Poisson de paramètre λ, noté P( λ) lorsque
λk
P(X=k) = exp(−λ)∗( )
k!
◦
Propriétés
X n , p∼ B(n , p) et que n est grand (≥50) et p petit (np≤5) on peut démontrer que, si on
λk
pose λ=E ( X n , p )=np alors P ( X n , p=k )∼exp(−λ)∗( )
k!
On dit que la loi binomiale converge vers la loi de Poisson lorsque n tend vers ∞.
•
Si
•
Si
X n , p∼ P ( λ)
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
67
alors E(X) = λ.
Var (X) = λ.
Donc si on a le paramètre λ on connaît l'espérance et la variance de X.
Astuce :
Dans certains exercices on ne donne pas λ mais P(X=0) = a or
0
λ
P ( X n , p=0)∼exp (−λ)∗( )=exp(−λ)=a donc
0!
exp(−λ)=a → ln(exp (−λ))=ln(a )→−λ=ln (a) → λ=−ln (a)
On retrouve donc λ !
•
4. Loi normale (VA continues)
▪
▪
▪
▪
▪
Elle est définie par une somme de variables indépendantes s'approchant de la loi
d'une variable continue.
Soit μ ∈ℝ et σ ∈ℝ+∗ , X suit une loi normale ( X ~ N(μ,σ)) si la fonction densité
−( x−μ) ²
1
∗exp
de probabilité est f (x )=
.
2σ²
σ √2 π
E(X) = μ.
V(X) = σ².
La fonction de densité est symétrique et centrée sur μ.
x2
▪
Probabilité sur un intervalle
P [ x 1 ≤ X ≤ x 2 ]=∫ f (x )dx
.
x1
▪
▪
▪
X −μ
Variable centrée réduite : on pose Y = σ
.
On a x → y = x1 −μ ; x → y = x 2−μ .
1
1
2
2
σ
σ
Et on a X ∼ N (μ , σ) et Y ∼ N (0,1) .
Conséquences :
•
Au risque α correspond sur la table de la loi normale une valeur εα.
•
Au risque α on doit avoir P(|Y|<εα) = 1 – α.
•
Valeur à connaître de α.
◦ α = 5 % → ε0,05 ~ 1,96 ~ 2 → P(|Y|<2) ~ 0,95 c'est à dire que 95% des valeurs ce
trouvent entre -2σ et 2σ.
◦ α = 10 % → ε0,10 ~ 1,645 ~ 1,6 → P(|Y|<1,6) ~ 0,90 c'est à dire que 90% des valeurs ce
trouvent entre -1,6σ et 1,6σ.
◦ α = 32 % → ε0,32 ~ 1→ P(|Y|<1) ~ 0,68 c'est à dire que 68% des valeurs ce trouvent
entre -1σ et 1σ.
•
5. Estimations
◦
Elle permet de définir les paramètres d’une population à partir de paramètres observés
sur un échantillon (le plus représentatif possible de la population).
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
68
Estimateur de la moyenne :
Lorsque l’on a n variables aléatoires Xi de loi quelconque (considérées comme une somme de
variables indépendantes, on utilise au final la loi normale)et d’espérance m inconnue (ce qui est le
cas fréquent dans une population puisque c’est en général ce que l’on cherche) on utilise un
estimateur de m qui s’appelle moyenne « empirique » (ou « de l’échantillon » ou « observée »…)
noté Mn.
M n1n X i
En calculant l’espérance de Mn on obtient la moyenne m tant cherchée (fastoche) : E(Mn)=m
Remarque : Dans le cas de la loi Binomiale, Mn est la fréquence empirique !
On distingue ainsi les valeurs vraies, fixes et uniques issues de la population générale et les
estimations des paramètres issus d'échantillons de taille n soit :
Estimateur m de μ
Estimateur s2 de σ2
Estimateur p d'une proportion л
2
m = Σ xi / n
s = (Σ xi – m)/n - 1
p = Σ xi / n
E(m) = μ
E (s2) = σ2
E (p) = л
V(m) = σ2 / n
•
V(p) = [л(1 – л)] / n
6. Théorème de la limite centrée :
▪
C’est tout un charabia pour dire que lorsqu’on a tout plein de variables qui suit une
loi quelconque, Zn obtenu par la formule magique : Zn = (Xn – μ) / (√ σ2 / n) se
rapproche d’une loi normale centrée réduite d’autant plus que l’échantillon est grand.
▪
Erreur standard :
M nV a r( X i )n On remarque que l’erreur est faible lorsque
l’échantillon est grand, cela permet de tester des hypothèses lorsque l’on a de grand
échantillons, c’est-à-dire de confronter la moyenne observée Mn avec une moyenne
hypothétique. Il suffit de calculer Zn et si on obtient une valeur de Zn probable (
−1,96<Z n <1,96 ), l’hypothèse de départ n’est donc pas absurde.
▪
Echantillon de taille suffisamment grande si :
→ pour une variable suivant une loi de Bernouilli
•
•
n > = 30 → pour une distribution quelconque de X
7. Loi de Student :
Elle s’utilise lorsque l’on a à faire à des variables Xi qui suivent une loi normale d’espérance m et
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
69
que l’on veut tester une hypothèse sur m avec une variance estimée.
Elle permet de ne pas faire d’hypothèse sur la taille de l’échantillon et s’utilise lorsque l’échantillon
est petit (car dans ce cas il n’est pas judicieux d’utiliser le théorème de la limite centrée car l’erreur
standard est trop importante).
Dans ce cas on utilise une variance empirique :
Ainsi on utilise : Tn = (Xn – μ) / (√ Sn2 / n) qui est distribué selon une loi de Student à n-1 degré de
liberté (…pas d’inquiétude cela sera bien développé à la fin du programme).
Remarque : la moyenne µ et la variance σ2 sont les valeurs théoriques, fixes et uniques, leurs
estimations, respectivement x et s2 sont des variables aléatoires.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
70
Lois de probabilités - QCMs
QCM 1 : Une urne contient 75 boules rouges et 25 noires. On effectue n tirages au hasard
successifs avec remise, n désignant un entier naturel au moins égal à 10. On désigne par X la
variable aléatoire prenant pour valeur le nombre de boules rouges obtenues à l'issue de ces n
tirages :
A. X suit une lui binomiale de paramètres B (n ; 1/4).
1
B. La probabilité que toutes les boules tirées soient noires est
2n .
2
C. L'espérance de X est 0,75 n.
D. La probabilité qu'exactement 2 des boules tirées soient rouges est 0,752∗0,25 n−2 .
E. X suit une loi binomiale de paramètres B (n ; 3/4).
QCM 2 : A propos des paramètres caractéristiques des lois de probabilités :
A. L'espérance mathématique de la variable X, notée E(X), est la somme de toutes les réalisations
possibles de X, pondérées par leurs probabilités respectives.
B. Pour une loi binomiale de paramètres n et p : E(X) = n.p.(1 – p) .
C. Pour une loi binomiale de paramètres n et p : E(X) = n.p .
D. L'écart-type est un indicateur de la dispersion de la variable aléatoire et il a l'avantage de
s'exprimer dans la même unité que la variable aléatoire.
E. V(X) = E(X²) – [E(X)]².
QCM 3 : A propos d'une variable centrée réduite :
A. Son espérance est 0 et son écart-type est 1.
B. Son espérance est 0 et sa variance est 1.
C. Son espérance est 1 et son écart-type est 0.
D. C'est une grandeur sans dimension qui permet de juger du caractère normal ou exceptionnel
d'une observation.
[ X − E  X ]
E. La variable centrée réduite est : Y =
.
σ
QCM 4 : On admet que 3 % des automobilistes contrôlés par un alcootest sont en état d'ébriété.
La police contrôle n personnes. Les résultats des différents contrôles sont supposés indépendants
les uns des autres. On considère la variable aléatoire X égale au nombre de personnes en état
d'ébriété au cours des n contrôles :
A. La loi de probabilité de X est une loi binomiale de paramètres n et 0,03.
k
n
. 0,03  . 0,07n−k .
B. Pour k appartenant aux entiers naturels, on a : P  X =k =
k
k
n
. 0,03  . 0,07n .
C. Pour k appartenant aux entiers naturels, on a : P  X =k =
k
D. La probabilité pour qu'au cours de ce contrôle il y ait au moins une personne en état d'ébriété est
(0,97)n.
E. En contrôlant 500 personnes, on peut « espérer » 15 contrôles positifs.


QCM 5 : A propos des probabilités et des statistiques :
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
71
A. La fonction de répartition est l'intégrale de la fonction de densité de probabilité; dans le cas d'une
variable continue.
B. Annulé.
C. Si on fait une étude pour déterminer si une personne est atteinte d'une maladie cardiaque ou non,
la variable statistique correspondante sera quantitative nominale.
D. La moyenne arithmétique d'une variable statistique est pondérée.
E. La moyenne d'une variable quantitative divise celle ci de telle sorte qu'il y ait 50 % des données
en dessous et 50 % au dessus.
QCM 6 : Sur une population de 200 personnes, 1% est malade. Soit X le nombre de personnes
malades obtenues.
A. La loi de probabilité de X est la loi B(200 ; 0,01).
B. E(X)= 2.
C. σ(X)= 1,98.
D. Dans le cas où X suit une loi de Poisson, la probabilité d’avoir deux personnes malades est :
P(X=2) = 2/e2.
E. Lorsque n est petit et p grand, selon une loi Binomiale, X suit aussi une loi de Poisson où np= λ.
QCM 7 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :
4
1
1
1
4
× .
A. Une loi binomiale 5 ,
peut être représentée par P  X =4= 5 ×
5
5
5
5
1
1
B. E  X =1 , V  X = et Ecart type=
.
5
5
C. La loi de Bernouilli est utilisée lorsque il y a seulement 2 évènements possibles.
D. La loi de Poisson est utilisée lorsque la variance est proche de l'écart type et est représentée par
2k
l'expression P  X =k =e−2×
.
k!
X – E X 
E. Une variable centré réduite est représentée par l'expression Y =
.
Ecart type

 

QCM 8 : A propos de la loi de Poisson, la (les)quelles(s) de ces propositions est (sont) exacte(s) :
A. Elle se note P (X=k) = exp(−λ)∗(λ k / k !) .
B. On peut dire que la loi de Poisson converge vers la loi binomiale quand n tend vers l'infini.
C. Si X n,p ~ P(λ) alors E(X)= σ (X) .
D. Si X n,p ~ P(λ) alors E(X)= λ .
E. Si X n,p ~ P(λ) alors E(X)= Var (X) .
QCM 9 : Un nouveau traitement est testé sur 500 patients, La probabilité que ce traitement
réussisse est de 0,6. Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :
A. Ce test suit une loi de Bernoulli.
B. Ce test suit une loi binomiale.
C. E(X)= 30.
D. V(X)= 300.
E. V(X) = 120.
QCM 10 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
72
A. La variance est égale à √σ(X).
B. Pour les variables aléatoires continues, toutes les valeurs de IR sont possibles.
C. La loi normale est une loi continue.
D. La loi binomiale modélise la répétition de n épreuves de Bernoulli.
E. 5 ! = 5+4+3+2+1.
QCM 11 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exactes :
A. Dans la loi de Poisson, l'écart type est suffisant pour représenter la loi de probabilité.
B. Une distribution asymétrique peut correspondre à une loi de Poisson.
C. Dans la loi binomiale, l'ordre des réponses est imposé.
D. Pour les variables aléatoires continues, la probabilité en un point est nulle.
E. Plus n est petit plus l'estimation est précise.
QCM 12 : Dans une population de 800 personnes, la probabilité d'avoir un accident de la route
est de 0,06. Parmi les propositions suivantes la(les)quelle(s) est(sont) exactes :
A. La loi de probabilité peut suivre une loi de Poisson.
B. La loi utilisée peut se noter B (800, 0,06).
C. P (X=0) = 0,94800 .
(800 !)
.0,06 2 . 0,94798 .
D. P (X=2) =
(2 !∗798! )
E. σ (X) = 800*0,06*0,94.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
73
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
74
Lois de probabilités, ce qu’il fallait répondre :
1 : BCE
6 : ABD
11 : ABD
2 : ACDE
7 : CE
12 : BCD
3 : ABDE
8 : ADE
4 : AE
9 : BE
5 : AD
10 : BCD
Pourquoi certaines réponses sont fausses :
QCM 1 :
A. c'est la E.
2
 n−2
  
D. P  X =2 = n . 3 . 1 
2 4
4
=
n n−1
∗0,752 .0,25n−2
2
QCM 4 :
B. 0,07 => 0,97
D. P (X ≥ 1) = 1 – P(X = 0) = 1 – 0,97n
QCM 5 :
B. La formule est correcte mais μ = E (X ) et σ² = var (X).
C. La variable sera qualitative ordinale, de toute façon une loi quantitative ne
peut pas être ordinale ou nominale.
E. C'est la médiane, la moyenne ne divise pas forcément un échantillon en deux
parties égales.
QCM 6 :
A. VRAI : C'est une loi binomiale de paramètres n= 200 et p= 0,01.
B. VRAI : E  X =np .
C. Var  X =np1− p=19,8 et σ= √var( X )=1,407 ... .
D. VRAI : P  X =2=e−2×2² /2 !=e −2×4 /2=e−2×2=2/e²
E. C'est l'inverse
4
QCM 7 :
  
1
4
A. P  X =4= 5 ×
× .
4
5
5
B. Ecart type = √ V(X) = √ n*p*(1 – p) = √ (5 * 1/5 * 4/5) = √4/5
D.Lorsque la variance est proche de l'espérance.
QCM 8 :
C.
B. C'est l'inverse.
C.Cf E.
QCM 9 :
C. E(X)=np=500*0,6=300
D. V(X)= np(1-p)= 500*0,6*0,4=120
QCM 10 :
A. C'est l'inverse.
E. 5! =5*4*3*2*1.
QCM 11:
C. Non imposé.
E. Plus n est grand.
QCM 12 :
A. np=800*0,06= 48 > 5 donc la loi de Poisson ne peut pas être appliquée.
E. Il s'agit de l'expression de la variance.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
75
IV - Tests Statistiques – Synthèse
Tests Statistiques
I. INTRODUCTION
•
Objectif d'un test statistique: Étendre ou non à la population les résultats obtenus sur un
échantillon issu de cette même population.
•
Procédure:
◦ Formuler une hypothèse pour la population.
◦ En considérant l'hypothèse vraie, prédire les observations sur un échantillon de la
population.
◦ Comparer la prédiction « théorique » à l'observation « pratique ».
◦ Conclure : rejet ou non-rejet de l'hypothèse.
▪ Prédiction = Observation → Non-rejet : les fluctuations d'échantillonnage expliquent
la différence que l'on peut observer.
▪ Prédiction ≠ Observation → Rejet : il y a une vraie différence entre l'échantillon et la
population dont il est issu.
II. PRINCIPE
1. Formuler une hypothèse.
L'hypothèse nulle H0
L’hypothèse alternative H1
Affirmation (pas interrogation!) à tester.
• SI rejet de H0
« Il n’existe pas de différence entre les
• « Il y a une vraie différence » ou « H0 est
paramètres comparés. » ou « La différence
fausse ».
observée n’est pas significative, elle est due aux • 3 formes possibles :
fluctuations d’échantillonnage (hasard). »
≠ : bilatérale (inégalité simple)
• En bref: toujours un signe =
< : unilatérale (sens de l'inégalité préfiguré)
• Rejetée ou non-rejetée mais JAMAIS
> : unilatérale (sens de l'inégalité préfiguré)
acceptée!
•
•
2. Décrire la situation à observer si H0 vraie : utilisation d'une statistique de test = variable
aléatoire dont on étudie la distribution (prédiction théorique). On peut ainsi connaître les valeurs
extrêmes.
3. Confronter l'observation à H0 : calcul de la probabilité de rencontrer dans la population la
valeur observée sur l'échantillon. En pratique, calcul de la probabilité d'observer sous H0 des valeurs
plus extrêmes que la valeur observée sur l'échantillon.
Plus la probabilité d'observer sous H0 des valeurs plus extrêmes que la valeur observée est
faible, plus H0 semble fausse.
Exemple sur un test unilatéral:
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
76
4. Conclure après choix d'un seuil influencé par le risque:
•
Proba > Seuil : NON-REJET de H0 → Différence NON-SIGNIFICATIVE.
•
Proba < Seuil : REJET de H0 (probabilité trop petite de retrouver dans la population
la valeur observée dans l'échantillon) → Différence SIGNIFICATIVE.
III. RISQUES D'ERREUR, PUISSANCE ET DEGRÉ DE SIGNIFICATION
L'état du monde réel nous est inconnu (on ne saura jamais à 100% si H0 est vraie ou fausse!). Il faut
alors accepter l'erreur éventuelle avec des risques connus et acceptés par tous.
Le risque α (de 1ère espèce)
Le risque β (de 2nde espèce)
Probabilité de rejeter H0 à tort
= Risque d'affirmer une différence qui n'existe
pas dans la réalité
Probabilité de ne pas rejeter H0 alors que H1
vraie (donc H0 fausse)
= Risque de ne pas affirmer une différence qui
pourtant existe
α est défini à priori, en général à 5%
β est défini si une hypothèse H1 est formulée
Risque (α ou β) ↓
quand
Taille de échantillon ↑
Variance et erreur de mesure ↓
La puissance (1-β) : Probabilité de rejeter H0 alors que H1 vraie
= Probabilité de conclure à une différence qui existe réellement (so good!)
(1-β) ↑ quand: α ↑
Taille de échantillon ↑
Écart entre H0 et H1 ↑ (écart + grand = différence + visible)
Variance ↑
Le degré de signification p : Probabilité d'obtenir dans la population une valeur au moins aussi
extrême que la valeur observée dans l'échantillon.
Petit p = Grand rejet de H0 (cf. schémas précédents)
• Si p < 5% : Rejet de H0 (au risque α près).
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
77
•
Si p > 5% : Non-rejet de H0 (au risque β près).
IV. TESTS PARAMÉTRIQUES ET NON-PARAMÉTRIQUES
•
•
•
Tests paramétriques → Hypothèses, Statistiques de tests et leurs distributions.
Tests non-paramétriques → Hypothèses.
Tests non-paramétriques = Tests de rattrapage
V. CHOIX D'UN TEST STATISTIQUE
En fonction de :
• La variable étudiée :
◦ Qualitative (Nominale, Ordinale).
◦ Quantitative (Discrète, Continue).
•
La taille de l'échantillon :
◦ n ≥ 30 permet d'utiliser une statistique fondée sur une distribution normale.
◦ n < 30 : normalité à vérifier, si pas de normalité recours au test non-paramétrique.
•
Des échantillons :
◦ Indépendants (mesures sur des individus différents).
◦ Appariés (différentes mesures chez les mêmes individus).
•
Des conditions d'applications.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
78
TESTS DE COMPARAISON DE MOYENNES
I. QUE COMPARER?
1
2
3
Une moyenne observée à une
moyenne théorique
2 moyennes observées dans 2
échantillons indépendants
2 moyennes observées sur 2
échantillons appariés
II. AVEC QUEL TEST?
Conditions
Test Z de l'écart réduit
•
n ≥ 30
Test T de Student
•
•
•
Égalité des variances des populations dont sont issus les échantillons
n < 30 avec normalité des distributions
n ≥ 30 (sans condition)
III.MÉTHODES
1.Z:
Test de l'écart réduit pour comparer une moyenne observée à une moyenne théorique
Hypothèses
Conditions
d'application
H0 : M = μ
n ≥ 30
Calcul
Résultats
H1 bilatéral : M ≠ μ
|Z| ≥ zα/2 : Rejet de H0
H1 unilatéral : M < μ
Z ≥ zα : Rejet de H0
H1 unilatéral : M > μ
Z ≤ (-zα): Rejet de H0
μ: moyenne connue de la population de référence
M: moyenne inconnue de la population d'où est issu l'échantillon
m: moyenne observée dans l'échantillon
s: écart type de l'échantillon
n: effectif de l'échantillon
zα: valeur seuil au risque α
2.Z:
Test de l'écart réduit pour comparer 2 moyennes observées dans 2 échantillons indépendants
Hypothèses
Conditions
d'application
H0: µ1 = µ2
n1 ET n2 >30
Calcul
Résultats
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
79
H1 bilatéral : µ1 ≠ µ2
|Z| ≥ zα/2 : Rejet de H0
H1 unilatéral : µ1 > µ2
Z ≥ zα : Rejet de H0
H1 unilatéral : µ1 < µ2
Z ≤ (-zα) : Rejet de H0
µ1 et µ2: moyennes inconnues des 2 populations d'où sont issues les échantillons
m1 et m2: moyennes observées des 2 échantillons
s21 et s22: variances des deux échantillons
n1 et n2: effectifs des 2 échantillons
zα: valeur seuil au risque α
3.Z:
Test de l'écart réduit pour comparer 2 moyennes observées dans 2 échantillons appariés
Il s'agit ici de comparer 2 séries d'une variable quantitative venant d'échantillons de même taille
(chaque observation d'un échantillon a une observation homologue sur l'autre échantillon
constituant une paire) ou de comparer 2 séries d'une variable quantitative venant d'un échantillon
mesuré à des temps différents.
Hypothèses
Conditions
d'application
H0: md = 0
n ≥ 30
Calcul
Résultats
H1 bilatéral : md ≠ 0
|Z| ≥ zα/2 : Rejet de H0
H1 unilatéral : md > 0
Z ≥ zα : Rejet de H0
H1 unilatéral : md < 0
Z ≤ zα : Rejet de H0
xi et yi: valeurs observées dans chaque série
di = xi-yi
s²d: variance des différences
md: moyenne des différences entre sujets appariés
n: nombre de couples appariés (pairs)
zα: valeur seuil au risque α
1.T:
Test de Student pour comparer une moyenne observée à une moyenne théorique
Hypothèses
Conditions
d'application
H0 : M = μ
Distribution normale de
la variable dans la
population !!!
H1 bilatéral : M ≠ μ
H1 unilatéral : M < μ
Calcul
Résultats
|t| > t(n-1);α/2 : Rejet de H0
t > t(n-1);α : Rejet de H0
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
80
H1 unilatéral : M > μ
ddl=(n-1)
t < (- t(n-1);α) : Rejet de H0
ddl: degré de liberté (voir avec la table de la loi T de Student)
t(n-1);α : valeur seuil au risque α de la loi de Student à n-1 degrés de liberté
2.T:
Test de Student pour comparer 2 moyennes observées dans 2 échantillons indépendants
Hypothèses
Conditions
d'application
H0: µ1 = µ2
• Si un des deux
échantillons trop petit
(ni < 30), distribution
normale de la variable
dans les deux pop.
• Egalité des variances.
H1 bilatéral : µ1 ≠ µ2
H1 unilatéral : µ1 > µ2
H1 unilatéral : µ1 < µ2
Calcul
Résultats
|t| ≥ t(n-1);α/2 : Rejet de H0
t ≥ t(n-1);α : Rejet de H0
t ≤ (- t(n-1);α) : Rejet de H0
ddl = n1 + n2 - 2
µ1 et µ2: moyennes inconnues des 2 populations d'où sont issues les échantillons
m1 et m2: moyennes observées des 2 échantillons
s21 et s22: variances des deux échantillons
n1 et n2: effectifs des 2 échantillons
3.T:
Test de Student pour comparer 2 moyennes observées dans 2 échantillons appariés
Il s'agit ici de comparer 2 séries d'une variable quantitative venant d'échantillons de même taille
(chaque observation d'un échantillon a une observation homologue sur l'autre échantillon
constituant une paire) ou de comparer 2 séries d'une variable quantitative venant d'un échantillon
mesuré à des temps différents.
Hypothèses
Conditions
d'application
H0: md = 0
Si un des deux
échantillons trop petit
(ni<30), les différences
di doivent être
distribuées de façon
normale!
H1 bilatéral : md ≠ 0
H1 unilatéral : md > 0
H1 unilatéral : md < 0
Calcul
Résultats
|t| ≥ t(n-1);α/2 : Rejet de H0
t ≥ t(n-1);α : Rejet de H0
t ≤ (- t(n-1);α) : Rejet de H0
ddl = (n-1)
xi et yi: valeurs observées dans chaque série
di = xi-yi
s²d: variance des différences
md: moyenne des différences entre sujets appariés
n: nombre de couples appariés (pairs)
Remarque: L'intérêt d'un test apparié (Z ou T) est multiple: ↓ la variabilité à la seule différence
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
81
entre paires, test + puissant.
TEST DU CHI-2
I. INTRODUCTION
Pour étudier deux variables qualitatives, 4 utilisations du test du chi-2 :
• Variables dichotomiques (2 modalités) :
◦ Comparaison de fréquences (fumeur/non fumeur).
◦ Comparaison d'une fréquence à une valeur théorique.
◦ Comparaison de deux fréquences.
◦
•
Variables à plus de deux modalités :
◦ Comparaison de distributions (groupes sanguins).
◦ Comparaison d'une distribution à une distribution théorique.
◦ Comparaison de plusieurs distributions.
II. PRINCIPE
1. Formuler H0 et H1.
2. Prédire sous H0 (considérée vraie) les effectifs attendus ou théoriques.
3. Comparer les effectifs observés aux effectifs attendus.
4. Conclure: rejet ou non-rejet de H0.
Utilisation de tableaux de contingence.
Tableau des effectifs observés (Oij)
B1
B2
Total
A1
O11
O12
a1
A2
O21
O22
a2
Total
b1
b2
N
Pour calculer les effectifs attendus:
E ij =
Tableau des effectifs attendus calculés (Eij)
B1
B2
Total
Avec A et
A1
E11
E12
a1
B deux
A2
E21
E22
a2
variables
qualitativ
Total
b1
b2
N
es
total de laligne×total de la colonne ai ×b j
=
effectif total
N
Sous H0 la différence entre les effectifs observés et théoriques est proche de 0. Le but du test du chi2 est de vérifier que la somme de ces différences (statistique de test) n’excède pas une certaine
valeur, auquel cas on rejetterait H0.
Sous H0 la statistique de test suit une loi du X ² à (ligne-1)(colonne-1) degrés de liberté:
X²
.
2
(O
−C
)
ij
= ∑ ij
C ij
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
82
On compare ensuite la valeur calculée X ² à la valeur correspondante sur la table du X ² au seuil
choisi:
• Valeur calculée > Valeur tablée → Rejet de H0.
• Valeur calculée < Valeur tablée → Non-rejet de H0.
!
Condition d'application:
Les effectifs théoriques calculés de chaque case doivent être supérieurs ou égaux à 5.
III.COMPARAISON DE DEUX FRÉQUENCES
1. Comparaison d'une fréquence observée sur un échantillon à une fréquence théorique.
En comparant une fréquence théorique f à la fréquence observée fo d'un échantillon de N personnes
issues d'une population donnée, on peut déterminer si la fréquence vraie de la population dont est
issu l'échantillon est égale à la fréquence théorique.
On utilise un test du chi-2:
• Si |X ²| ≥ X ²α/2 pour un test bilatéral, on rejette H0 : la fréquence vraie de la population diffère
de la fréquence théorique.
• Si X ² < X ²α ou X ² > X ²α pour un test unilatéral, on rejette H0 : la fréquence vraie de la
population est (selon H1) inférieure ou supérieure à la fréquence théorique.
2. Comparaison d'une fréquence observée sur un échantillon à une autre fréquence observée
À partir des fréquences observées sur plusieurs échantillons, on peut déterminer si ces échantillons
sont issus de la même population.
.
= ∑ (O ij −C ij )
C ij
2
On calcule de la même façon la valeur du X ².
Le résultat du test se détermine de la même manière que précédemment par rapport à un seuil
fonction du risque.
IV. COMPARAISON DE DISTRIBUTIONS
1. Comparaison d'une distribution observée à une distribution théorique
On veut déterminer si la distribution de la variable dans l'échantillon observé est identique à la
distribution de la population de référence.
On utilise aussi un test du chi-2.
2. Comparaison de plusieurs distributions
On veut déterminer si les distributions des populations d'où proviennent plusieurs échantillons
observés sont identiques entre elles.
Dans les 2 cas, on utilise un test du chi-2 comme précédemment.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
83
.
2
(O
−C
)
∑
ij
ij
=
C ij
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
84
QCM Tests statistiques
QCM 1 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :
A. Erreur de 1ère espèce = on rejette H0 alors que H0 est vraie.
B. Erreur de 1ère espèce = on accepte H0 alors H0 n’est pas vraie.
C. Erreur de 2ème espèce = on rejette H0 alors que H0 est vraie.
D. Lorsque l’on ne rejette pas H0, on en conclut l’absence de différences.
E. Il est souvent écrit que le test est significatif lorsque l’on rejette H0.
QCM 2 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :
A. Le seuil de 5% signifie que l’on a un risque d’erreur de 5% si on a rejeté l’hypothèse nulle.
B. Le seuil de 5% signifie que l’on a un risque d’erreur de 5% si on a accepté l’hypothèse nulle.
C. Dire que le test est non significatif au seuil de 5% veut dire que l’on a rejeté l’hypothèse nulle.
D. Dire que le test est non significatif au seuil de 5% veut dire que l'on a accepté l’hypothèse nulle.
E. Dire que le test est significatif au seuil de 5% veut dire que l’on a rejeté l’hypothèse nulle.
QCM 3 : A propos des tests d'hypothèses, indiquez si les propositions sont vraies ou fausses :
A. Lors d'un test statistique, l'hypothèse nulle peut être rejetée, même si elle est vraie.
B. Si l'on fait un test dans le but de comparer la rapidité de deux types d'interventions, en
choisissant un risque de première espèce de 5 %, le degré de signification ne varie pas en fonction
de l'échantillon choisi.
C. De façon générale, lorsque un test s'avère non-significatif, cela signifie que l'on peut attribuer les
différences observées aux fluctuations d’échantillonnage.
D. La p-value n'est pas calculable lorsque l'hypothèse nulle est rejetée.
E. Le choix de l'hypothèse alternative influe sur les seuils de décision de rejet ou non-rejet de
l'hypothèse nulle
QCM 4 : A propos des tests d'hypothèses, indiquez si les propositions sont vraies ou fausses :
A. Les fluctuations d’échantillonnage créent une variabilité de la moyenne observée sur les
échantillons issus de la population étudiée.
B. Si la probabilité d'observer sous H0 des valeurs de la statistique de test au moins aussi extrême
que celle observée est faible, alors l'hypothèse nulle est fausse.
C. Le risque de deuxième espèce ne dépend pas de H1.
D. Le risque de première espèce permet de fixer le taux de rejet d'H0, alors qu'H0 est vraie.
E. Lors d'un test statistique, la distribution de la statistique de test est connue sous H0.
QCM 5 : La répartition des groupes sanguins dans la population française est donnée comme
étant la suivante : groupe A : 30%, groupe B : 25%, groupe AB 40%, groupe O : 5%.
On souhaite vérifier ces données, sur la base d'un test statistique fait sur un échantillon
représentatif de la population française. Sur 100 personnes interrogées, les fréquences
suivantes apparaissent :
Groupe A : 22 personnes, Groupe B : 33 personnes, Groupe AB : 34 personnes, Groupe O : 11
personnes. Le risque alpha de première espèce choisi est de 1%. La valeur seuil du test choisi
est 5,6.
A. L'hypothèse nulle est que la répartition des groupes sanguins dans l'échantillon est conforme aux
fréquences données
B. L'hypothèse nulle est que la répartition des groupes sanguins dans la population est conforme
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
85
aux fréquences données
C. Il est possible d'utiliser un test de Student pour tester H0.
D. Il est possible d'utiliser un test de l'écart-réduit.
E. Le test utilisé est le chi-2
QCM 6 : Cf énoncé du QCM 5
A. Le nombre de degrés de liberté de la loi suivie par la statistique de test est 4.
B. Le nombre de degrés de liberté de la loi suivie par la statistique de test est 3.
C. Les conditions d'application pour effectuer le test approprié sont réunies car les effectifs observés
sont tous supérieurs à 5.
D. Si la valeur observée de la statistique de test est de 3,4, alors on peut rejeter H0.
E. Si la p-value est de 8,2, alors, il est possible de ne pas rejeter H0.
QCM 7 : On souhaite savoir si l'apparition d'une bronchite est liée à l'exposition à la
cigarette.
On choisit ainsi deux groupes de sujets : 80 personnes ayant une bronchite (groupe A) , 110
n'en ayant pas (groupe B). On détermine également trois niveaux d'exposition à la cigarette :
non fumeur, fumeur régulier et enfin, gros fumeur.
Dans le groupe A, 11 personnes sont non fumeur, 25 sont fumeurs occasionnels et 44 sont gros
fumeurs.
Dans le groupe B, 70 sont non fumeurs, 30 sont fumeurs occasionnels, 10 sont gros fumeurs.
A. L'hypothèse nulle est que la proportion de personnes ayant développé une bronchite est la même
dans le groupe A et B.
B. L'hypothèse nulle est que la répartition des différents « niveaux de fumeurs » est la même dans
les groupes A et B.
C. L'hypothèse nulle est que la répartition des différents niveaux d'exposition à la cigarette est la
même chez les gens ayant une bronchite et ceux n'en ayant pas.
D. Il est possible d'effectuer un test de Student pour répondre au problème, cependant il est
préférable d'utiliser un test de l'écart-réduit, ce dernier étant plus précis.
E. Le nombre de degrés de liberté suivi par la statistique de test est 2.
QCM 8 : A propos des tests statistiques :
A. α évolue dans le sens inverse de β
B. Si α augmente, alors la puissance se voit augmentée, toutes choses étant égales par ailleurs.
C. Si la variance augmente, alors la puissance diminue.
D. plus les échantillons sont grands, plus la puissance est grande.
E. Si l'écart entre H0 et H1 augmente, alors la puissance diminue.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
86
Tests Statistiques, ce qu’il fallait répondre :
1 : AE
6:B
2 : ADE
7 : CE
3 : ACE
8 : ABCD
4 : ADE
5 : BE
Pourquoi certaines réponses sont fausses :
B. Erreur de 1ère espèce = on rejette H0 alors que H0 est vraie.
C. Erreur de 2èmeespèce=on accepte H0 alors que H0 n’est pas vraie = H1 est vraie
mais on ne rejette pas H0.
D. Lorsque l'on ne rejette pas H0, on n’a pas décelé de différence mais on ne
peut pas affirmer une absence de différence.
QCM 1 :
QCM 2 :
B. Le seuil de 5% signifie que l’on a un risque d’erreur de 5% si on a rejeté
l’hypothèse nulle.
C. Dire que le test est non significatif au seuil de 5% veut dire que l’on a accepté
l’hypothèse nulle.
QCM 3 : rappel : p = p-value = degré de signification
A. VRAI, c'est la définition du risque alpha.
B. A chaque échantillon correspond une p-value qui lui est propre, la comparaison aux seuils permet
de rejetter ou non ensuite l'hypothèse.
D. C'est la p-value qui, une fois comparée aux seuils, permet de conclure au rejet ou non de H0.
QCM 4 :
B. Dans le cas décrit, le degré de signification est faible ce qui s'ignifie que H0 est peu crédible,
voire que l'on peut rejeter H0, cependant, il existe toujours le risque de rejeter H0 à tord (alpha).
E. VRAI, c'est cette distribution qui nous permettra de fixer un seuil, afin de conclure au rejet ou
non-rejet d'H0.
QCM 5 :
A. ATTENTION, l'hypothèse nulle concerne toujours la population, et jamais l'échantillon
#piège classique.
C. D. Ici, il s'agit de comparaison de fréquences, les tests de student de de l'écart réduit sont donc
inutiles car ne servent qu'à comparer des moyennes.
QCM 6 :
A. Non, 3.
C.Attention, la condition concernant le test chi-2 s'applique aux effectifs théoriques et non pas aux
effectifs observés.
D. 3,4 < 5,6, donc, on ne peut pas rejetter H0.
E. 8,2 > 5,6, donc on rejette H0, avec le risque alpha (ici 1%) de le faire à tort.
QCM 7 : La clé pour tout ce genre de problèmes est de bien analyser les données, pour identifier
H0, eventuellement H1,et, pour savoir quel test il est possible d'utiliser pour repondre au problème.
A. Doublement faux : premierement, H0 concerne les populations dont sont issus les groupes A
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
87
et B, de plus cette hypothèse n'as pas de sens car les groupes sont déja séléctionés en fonction de
leur exposition à la bronchite.
B. Non, dans les populations et non les groupes.
D. Ces deux tests sont inutiles car il s'agit d'une étude de répartition, seul le chi-2 est adapté ici.
QCM 8 : E. Faux, la puissance augmente.
QCM Tests de comparaison de moyennes
QCM 1 : A propos des tests d’hypothèses, indiquez les propositions :
A. Les tests d’hypothèses permettent d’extrapoler les résultats observés sur les échantillons aux
populations.
B. Pour comparer deux échantillons appariés, on peut utiliser un test de Student à condition que les
différences di soient normalement distribuées.
C. Le choix de la valeur seuil au-delà de laquelle on rejette l’hypothèse nulle H0 dépend du risque
d’erreur β et de l’hypothèse alternative.
D. L’erreur de première espèce consiste à rejeter l’hypothèse nulle alors qu’elle est vraie.
E. Le risque d’erreur de deuxième espèce et la puissance d’un test varient dans le même sens.
QCM 2 : Dans le cadre d’un test de comparaison de deux échantillons appariés, indiquez les
propositions suivantes vraies :
A. Il faut formuler l’hypothèse alternative avant avoir examiné les données.
B. Moins la p-value est faible, plus H0 est crédible.
C. On peut calculer la valeur seuil de la loi de Student avec (n1 +n2 -2) degrés de liberté.
D. Lorsque p>α, on ne rejette pas H0, on peut donc affirmer qu’H0 est vraie.
E. Pour utiliser un test de l’écart réduit, il faut que la variable n soit supérieure ou égale à 30.
QCM 3 : On souhaite comparer l'age moyen entre des patients ayant fait un scanner validant
une fracture de l'humérus et ceux pour lesquels la fracture n'est pas confirmée : les résultats
donnent le tableau suivant :
Fracture de l'humérus confirmée :
Oui :
Moyenne :
Age (années) : 26,2
Non :
Écart-type :
Moyenne :
Ecart-type :
P-value :
12,5
32,4
14,6
<0,04
A. Pour comparer les moyennes d'age, il est possible d'utiliser un test de l'écart-réduit.
B. Pour comparer ces moyennes, il est possible d'utiliser un test de Student, à conditions que les
conditions d'application sont bien vérifiées.
C. Le test du chi-2 est adapté pour faire la comparaison de ces moyennes d'âge.
D. On peut conclure que l'on rejette l'hypothèse alternative (au risque alpha = 0,05).
E. On peut conclure que l'on rejette l'hypothèse alternative (au risque alpha = 0,01).
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
88
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
89
Tests de comparaison de moyennes, ce qu’il fallait répondre :
1 : ABD
2 : ABE
3 : ABE
Pourquoi certaines réponses sont fausses :
QCM 1 :
C. Faux, car dépend du risque d’erreur α et non β.
E. Faux car Puissance = 1- β.
QCM 2 :
B. Vrai: Plus le degré de signification (p value) est grand, plus H0 est crédible.
C. Échantillons indépendants : (n1 +n2 -2) ddl.
Échantillons appariés : (n-1) ddl.
D. On ne peut pas affirmer que H0 est vraie, on conclut juste qu’on a pas mis en
évidence de différence significative.
C. Le test du chi-2 est inutile pour la comparaison de moyennes.
D. Non. 0,04 < 0,05, ainsi, on peut rejeter H0, est donc accepter H1 = hypothèse
alternative.
QCM 3 :
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
90
QCM: Tests du chi-2
QCM 1 : On souhaite « savoir » si la consommation d'alcool est identique chez les étudiants en
médecine en première et en deuxième année... Pour cela, on étudie chez deux échantillons de
100 personnes, notés P1 et P2, la fréquence de consommation d'alcool.
Jamais
Moins de 5 verres
par semaine
Entre 5 et 10
verres par semaine
Plus de 10
verres par
semaine
P1
75
20
4
1
P2
2
7
21
70
On cherche alors à déduire si la consommation d'alcool peut être considérée comme identique
chez les étudiants de première et de deuxième année :
A. L'hypothèse H0 du test est : « la consommation d'alcool est identique chez les deux
échantillons. »
B. Il est impossible de réaliser un test du X ² car les effectifs de chaque case ne respectent pas les
conditions d'application du test.
C. Il faut regrouper les effectifs des classes « entre 5 et 10 verres par semaine » et« plus de 10
verres par semaine » pour que les conditions d'application du test soient respectées.
D. Le test à réaliser est un test du X ² de degré de liberté égal à 4.
E. Le test à réaliser est un test du X ² de degré de liberté égal à 3.
QCM 2 : On s'interroge maintenant sur une éventuelle relation entre la consommation d'alcool
chez un étudiant en médecine et sa capacité à être présent aux cours dispensés en amphithéâtre.
On réalise une étude sur un échantillon de 200 étudiants en deuxième année de médecine.
Consommation
occasionnelle
Consommation
régulière
Consommation
excessive
Totaux
Toujours présent
18
27
3
48
Quelque fois
présent
3
10
51
64
Rarement présent
1
7
80
88
Totaux
23
43
134
200
On calcule les effectifs théoriques puis la statistique du test du X ²
La statistique du test donne le résultat : X ² = 35,95
On donne X ² 5% = 16,92 pour ddl= 9 et X ² 5% = 9,49 pour ddl =4.
A. L'hypothèse nulle est : « La présence en amphithéâtre d'un étudiant en médecine est liée à sa
consommation d'alcool ».
B. Le test réalisé est un test du X ² de degré de liberté égal à 9.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
91
C. Le test réalisé est un test du X ² de degré de liberté égal à 4.
D. Les résultats obtenus permettent de rejeter l'hypothèse nulle.
E. Cette étude montre que les deux variables étudiées ne sont pas liées.
QCM 3 : Avant des élections, on demande à trois échantillons de 500 personnes issues de la
population d'électeurs, de tranches d'âges différentes (18 à 30 ans, 30 à 60 ans, plus de 60 ans),
leur intention de vote. Les résultats ont été répertoriés dans le tableau ci-dessous :
Candidat
A
Candidat
B
Ni l'un ni l'autre
Total
18 – 30 ans
Effectif observé
Effectif théorique
175
175
175
225
150
100
500
30 – 60 ans
Effectif observé
Effectif théorique
200
175
200
225
100
100
500
Plus de 60 ans
Effectif observé
Effectif théorique
150
175
300
225
50
100
500
525
675
300
1500
Total
Statistique du test X ² = 19,4444
X ² 5% = 3,841 pour ddl= 1
X ² 5% = 5,991 pour ddl= 2
X ² 5% = 7,815 pour ddl= 3
X ² 5% = 9,448 pour ddl= 4
X ² 5% = 11,070 pour ddl= 5
A. On réalise un test du chi-2 de comparaison d'une distribution à une distribution théorique.
B. Les variables étudiées sont des variables quantitatives.
C. L'hypothèse nulle est : « les intentions de votes dans la population sont identiques selon les trois
classes d'âge étudiées ».
D. On réalise un test du chi-2 à 3 ddl.
E. On peut affirmer avec un risque de se tromper de 5% que les intentions de vote dans la
population sont différentes selon les trois classes d'âges étudiées.
QCM 4 : Une étude scientifique a été menée pour savoir si le fait porter des chaussettes pardessus ses chaussures en hiver permettait de réduire le nombre de chute en marchant sur le
verglas.
On a réparti un échantillon de 10 volontaires en 2 groupes égaux, un portant des chaussettes
par-dessus leur chaussures, l'autre portant seulement des chaussures. On a fait parcourir à
chaque individu un trajet de 500 m très verglacé au cours duquel on a compté le nombre de
chutes. On a recensé les résultats observés dans un tableau ainsi que les résultats théoriques sous
l'hypothèse nulle H0 : « Le nombre de chutes n'est pas lié au fait de porter ou pas des
chaussettes par-dessus ses chaussures ».
Aucune chute
1 seule chute
2 chutes ou plus
Chaussures seulement Effectif observé : 1
Effectif observé : 2
Effectif observé : 2
Effectif théorique : ?? Effectif théorique : ?? Effectif théorique : 1,5
Chaussures
Effectif observé : 4
Effectif observé : 0
Effectif observé : 1
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
92
recouvertes
chaussettes
par
les Effectif théorique : 2,5 Effectif théorique : ?? Effectif théorique : 1,5
A. On peut réaliser un test du Chi-2 à 2 ddl.
B. L'effectif théorique sous H 0 des personnes portant seulement des chaussures et n'ayant effectué
aucune chute est de 2,5.
C. L'effectif théorique sous H 0 des personnes portant seulement des chaussures et n'ayant effectué
aucune chute est de 0,5.
D. L'effectif théorique sous H0 des personnes portant seulement des chaussures et étant tombés une
seule fois est de 0.
E. L'effectif théorique sous H0 des personnes portant seulement des chaussures et étant tombés une
seule fois est de 1.
QCM 5 et 6 : Après une colle de mathématiques, les résultats de Purpan et de Rangueil sont
relevés et classés. On utilise un test bilatéral pour savoir si les résultats sont identiquement
répartis entre les étudiants de Rangueil et Purpan :
Rangueil
0à4
5à9
10 à 14
15 à 20
220
260
270
50
Purpan
240
230
300
La statistique de test donne le résultat X ² = 9,285.
On donne X ² 5% = 7,18 pour ddl= 3 et X ² 5% = 15,51 pour ddl= 8.
30
QCM 5 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :
A. On réalise un test du Chi 2 à 8 degrés de liberté.
B. On réalise un test du Chi 2 à 3 degrés de liberté.
C. Les conditions d'applications ne sont pas réunies car on compte moins de 5 degrés de liberté.
D. Les effectifs respectent les conditions d'applications du test.
E. L'hypothèse H1 est la suivante : « les étudiants de Rangueil sont moins fort en mathématique que
les étudiants de Purpan ».
QCM 6 : Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :
A. La statistique de test que l'on utilise est la suivante : [(220-230)²/230]+[(240-230)²/230]+
[(260-245)²/245]+[(230-245)²/245]+[(270-285)²/285]+[(300-285)²/285]+[(50-40)²/40]+[(3040)²/40].
B. On ne met pas en évidence de différence significative dans la répartition des notes entre les
étudiants de Rangueil et de Purpan.
C. On retient l'hypothèse H1 : « la répartition des notes est différente entre les étudiants de Rangueil
et Purpan ».
En utilisant les données précédentes, on calcule les effectifs théoriques puis la statistique du test.
D. En ajoutant une ligne concernant les étudiants de Maraîchers, on effectuerait un test du Chi 2 à 6
degrés de liberté.
E. En ajoutant une ligne concernant les étudiants de Maraîchers, on effectuerait un test du Chi 2 à 9
degrés de liberté.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
93
QCM 7 : On souhaite étudier la répartition de l'âge selon le sexe des individus, l'enquête
donne le tableau suivant :
Hommes (n = 236)
Femmes (n = 232)
20-39 ans
Effectif
Effectif théorique
143
177,5
124
174,5
40-59 ans
Effectif
Effectif théorique
80
56,2
101
53,6
>60
Effectif
13
7
Effectif théorique
2,3
3,9
A. On peut utiliser un test chi-2.
B. On peut utiliser un test de Student.
C. On peut utiliser un test chi-2 à 4 degrés de liberté.
D. Les conditions de validité du chi-2 ne sont pas remplies.
E. On peut utiliser un test de l'écart-réduit.
QCM 8 : Dans la population française, le pourcentage de rhésus négatif est de 15 %, on tire
au sort parmi l’amphithéâtre 200 PACES, on observe que 48 personnes sont rhésus négatif.
On veut savoir, (avec le risque α = 5%) si les PACES different de la population française vis-àvis du caractère rhésus. La valeur de la statistique de test est de 8,32 et le degré de
signification est de 0,007.
A. Il s'agit d'un test statistique de comparaison d'une moyenne à une valeur théorique.
B. L'hypothèse nulle est que la proportion de rhésus négatif observée chez les PACES est identique.
C. Le nombre de degrés de liberté suivi par la statistique de test est 2.
D. On rejette l'hypothèse nulle car 8,32 > 0,007.
E. On rejette l'hypothèse nulle car 0,007 < 0,05 (le risque α consenti).
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
94
Test du Chi-2, ce qu’il fallait répondre :
1:E
6 : ACD
2 : CD
7:D
3 : CE
8:E
4 : BE
5 : BD
Pourquoi certaines réponses sont fausses :
QCM 1 :
A.L'hypothèse H0 est une affirmation concernant des populations et non des
échantillons.
B. et C. Les conditions d'applications du test sont respectées, l'énoncé nous
donne les effectifs observés qui ne doivent pas forcément être supérieurs à 5, il
faut par contre que tous les effectifs théoriques de chaque case soient
supérieurs ou égal à 5, ce que l'on peut vérifier avec le tableau des effectifs
théoriques ci-dessous:
Jamais
Moins de 5 verres Entre 5 et 10
Plus de 10 verres
par semaine
verres par semaine par semaine
Totaux
P1
77×100
= 38,5
200
27×100
=13,5
200
25×100
=12,5
200
71×100
= 35,5
200
100
P2
77×100
= 38,5
200
27×100
=13,5
200
25×100
=12,5
200
71×100
= 35,5
200
100
Totaux
77
27
25
71
200
D. Le nombre de degré de liberté se calcule ainsi : ddl= (L-1)(C-1) =(2-1)(41)=3 .
QCM 2 :
A. L'hypothèse nulle est : les deux variables sont indépendantes, c'est à dire « la
présence en amphithéâtre d'un étudiant en médecine n'est pas liée à sa
consommation d'alcool. »
B. Le nombre de degré de liberté est égal à : ddl= (L-1)(C-1)=(3-1)(3-1)= 4
(Attention, dans le nombre de lignes et de colonnes, on ne prend pas en compte
les totaux.)
D. Vrai: ici le calcul de la statistique de test donne X
faut comparer cette valeur à
l'hypothèse nulle.
²
= 35,95 avec ddl =4 , il
X ² 5% = 9, 49. Comme 35,95 > 9,49 on rejette
E. On rejette l'hypothèse nulle, les deux variables sont donc liées. Dans cette
étude, on a mis en évidence une relation significative entre la consommation
d'alcool et la présence en amphithéâtre d'un étudiant de médecine de deuxième
année(résultat purement théorique...).
QCM 3 :
A. On compare deux distributions entre elles.
B. Le test du chi 2 sert à étudier le lien entre deux variables qualitatives, ici
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
95
tranche d'âge et intention de vote.
D. 4 ddl ( (2 – 1) x (2 – 1) ).
E. Vrai : la statistique de test est supérieure à 9,448.
QCM 4 :
A. Les conditions pour appliquer le test du Chi 2 ne sont pas réunies : les
effectifs théoriques sont inférieurs à 5.
C. Effectif théorique = (total de la ligne x total de la colonne) / effectif total =
(5x5) / 10 = 2,5.
D. (5x2) / 10 = 1.
QCM 5 :
A. On calcule les degrés de libertés de la manière suivante: ddl = (Ligne-1)
(Colonne-1) en ne prenant pas en compte les effectifs totaux. Ddl= (2-1)(4-1)= 3
ddl.
C. Les conditions d'applications concernent les effectifs théoriques qui doivent
être supérieurs à 5.
E. Un test bilatéral ne se préoccupe pas du sens de la différence.
QCM 6 :
B. D'après l'énoncé, on trouve que la statistique du test X
seuil
² est supérieure au
X ² 5%. On conclut donc qu'il y a une différence de notes entre les
étudiants
de Rangueil et Purpan.
E. Si on ajoute une ligne au tableau, on a alors 3 lignes et toujours 4 colonnes.
Ddl = (L-1)(C-1) = (3-1)(4-1) = 6 ddl.
QCM 7 :
A. Non, car les effectifs théoriques ne sont pas tous supérieurs à 5.
B. Ce test est inutile car on étudie ici des distributions.
C. Le test chi-2 n'est pas utilisable...
E. Ce test est inutile car on étudie ici des distributions.
QCM 8 :
A. Il s'agit d'un test de comparaison de fréquences.
B. L'hypothèse nulle ne concerne pas des effectifs observés (ce qui est un
synonyme de „échantillon“) mais au contraire la population dont ils sont issus.
C. Non, un seul degré de liberté.
D. ATTENTION, attention, 8,32 correspond à une valeur seuil prise par la
statistique de test, et non à une probabilité, ainsi la comparaison des deux
nombres n'a aucun sens mathématique.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
96
V - Epidémiologie - Synthèse
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
97
Étude expérimentale
Études d'observation (1ère partie )
Études descriptives
Types d'étude
Essai comparatif randomisé(ECR)
Étude de cohorte longitudinale
Étude transversale
Film
Photo
Démarche expérimentale : contrôle +++
Comparaison : 2 groupes :
● un groupe témoin
● un groupe avec le traitement à étudier
Caractéristiques
principales de
l'étude
Clause d'ambivalence indispensable
Comparabilité :
● Randomisation : répartition au hasard
des participants ( au moins 300 sujets )
● insu ou aveugle : simple, double ou
ouvert
Suivi prospectif d'une population à partir Enquête de durée courte et de faible coût
d'une caractéristique commune pendant
une durée longue
Capture d'un grand nombre
Pas de contrôle, pas de constitution de
d'informations sur une population à un
groupe (proche de la vraie vie)
instant donné
Signification statistique : utilisation des
tests d'hypothèse
Objectifs
Démontrer un lien de causalité
Calcul du taux d'incidence
Analyse en ITT
Calcul de la prévalence
P=
Résultats
nombre de malades
nombre de sujets moyens étudiés
DR= R1-R0
Atouts
Mise en évidence Causalité
Suivi de la population sur une longue
durée ( plusieurs paramètres à l'étude
simultanément)
Milieu Réel
Base de travail au début d'une démarche
de recherche
Biais d'information souvent important ( si
renseignements sur ancienne exposition )
Très sensible à l'échantillonage
Aucun
Défauts
Parfois milieu trop fictif (pas la réalité)
Pas de mise en évidence
d'association(nombreuses informations)
Coût élevé
Niveau de causalité
1
Aucun
Faible coût
Études d'observation (2ème partie)
Études analytiques
Types
d'étude
Caractéristiq
ues
principales
de l'étude
Enquêtes exposés-non exposés
Enquêtes cas témoins
Comparaison : 2 groupes de personnes
saines au départ
● exposés
● non exposés
Étude de la survenue ou non de la
maladie ( taux d'incidence)
Comparaison : 2 groupes
● cas : malades
● témoins : sains
Étude de l'exposition ultérieure à un
éventuel facteur de risque
Étude prospective
Étude rétrospective
Objectif
Démontrer une association entre un facteur (protecteur ou de risque) et une maladie
Collecte des
résultats
Intervalle de confiance :
Si < 1 : facteur protecteur
Si > 1 : facteur de risque
Si = 1 pas d'association significative
( en principe les résultats sont toujours donnés dans l'énoncé)
(nota :le RR est le rapport entre les incidences chez E+ et E-)
Calcul
possible
Odds ratio et Risque relatif
Uniquement Odds ratio ( = au RR pour
maladies rares)
Atout
Mise en évidence d'une association plus
facile
Utile pour les maladies rares ou à longue
durée d'apparition
Défaut
Pas de causalité directe ( on parle plutôt
d'association) Problème si maladies rares
ou longues à apparaître
Caractère très fictif de l'étude
Pas d'incidence
Niveau de
causalité
2
3
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
99
Erreur aléatoire
Problème
Solution
● Due aux fluctuations
d'échantillonage : problème de
représentativité de l'échantillon
● Problème de précision
● Calcul statistique, intervalle de
confiance
● Augmentation éventuelle de la taille
de l'échantillon si précision insuffisante
● Constituer des groupes comparables
● Avoir un échantillon le plus
représentatif possible (éviter les sujetsBiais de
types , volontaires ,etc ...) , avoir un
sélectio Problème de constitution des groupes groupe hétéroclite de sujets répondant
n
d'étude
aux critères d'inclusion
Erreurs
systémat ●Biais
iques ou d'inform
Biais
ation
ou de
classem
ent
●Biais
de
réalisati
on et
biais
d'évalua
tion
(ECR)
● Témoins (enquête cas/témoins)et non
exposés (enquête exposés/non exposés)
représentatifs notamment de la
population (car ils représentent en
quelque sorte les groupes contrôles des
études)
●Randomisation dans les ECR
Problème de mesure de
l'exposition(enquête exposés-non
exposés) ou de la maladie (enquête
cas-témoin)
●Améliorer la qualité de l'information
via la standardisation des outils utilisés
et l'uniformisation des formations des
médecins participant aux études
●Diminuer le nombre de personnes qui
arrêtent l'étude en cours de réalisation
( par exemple en facilitant l'observance)
La subjectivité du patient ou du
médecin fausse la mesure (facteur
interne)
● Pour les ECR , utilisation du double
insu ou double aveugle
Non prise en compte d'un facteur
Être attentif aux facteurs de confusion
Biais de externe qui a une activité à la fois sur
confusi le facteur de risque (ou protecteur) et
Réaliser une analyse rigoureuse en
on
sur la maladie ( ex typique: l'âge)
apportant aucune conclusion hâtive
d'où une Erreur dans les relations
d'associations entre un facteur et la
maladie
Biais
d'attritio
n
Analyse non objective et surtout
faussée des résultats ( du fait par
exemple d'un respect toujours
Analyse en ITT("comme on avait
l'intention de le traiter")
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
100
imparfait du protocole dans les ECR,
d'une déviance au protocole)
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
101
Épidémiologie QCMs
QCM 1 : Au cour d'une épidémie de grippe, on souhaite savoir si la fréquentation des transports
en commun favorise la propagation de la maladie. Pour cela, on définit 2 groupes de personnes,
l'une fréquentant les transports en commun plus de 3 jours par semaine, l'autre moins de 3 jour
par semaine. On suit ces groupes pendant 3 mois.
A. Il s'agit d'une étude cas-témoin.
B. Il s'agit d'une étude analytique.
C. La présence de sujets volontaires au sein d'un des groupes peut entraîner un biais de sélection.
D. Un biais d'information lié à un étalonnage et un contrôle qualité insuffisants peut être réduit en
augmentant le nombre de personnes inclues dans l'étude.
E. On peut estimer un risque relatif.
QCM 2: Suite à la commercialisation d'un médicament, on souhaite étudier la conséquence sur
le sommeil dans la population réelle. On réalise 2 groupes dans la population. L'un est exposé au
médicament. L'autre constitue le groupe témoin. On trouve au bout de 8 mois de suivi, le tableau
suivant :
Exposés
non-exposés
Insomnie
60
40
Absence d'insomnie
120
260
Parmi les propositions suivantes, la(les)quelle(s) est(sont) exacte(s) :
A. Cette étude nécessite une randomisation initiale.
B. On peut calculer un risque relatif égal à 2,5.
C. On peut calculer un risque relatif égal à 0,9.
D. On peut calculer un odd ratio.
E. L'indicateur de risque le plus adapté à ce test est le risque relatif.
QCM 3 : Concernant la méthodologie des essais cliniques randomisés, quelle(s) est(sont) la(les)
proposition(s) inexacte(s) :
A. La randomisation assure le maintien de la comparabilité entre les groupes tout au long de l'essai.
B. Le simple insu implique que seul le malade ignore quel traitement lui est administré.
C. Tout comme les études d'observation, on ne met pas en avant de lien de causalité.
D. Ces essais possèdent le plus fort niveau de preuve.
E. Une analyse en intention de traiter limite le biais d'attrition.
QCM 4 : Concernant les études d'observation, quelle(s) est(sont) la(les) proposition(s) exacte(s) :
A. Une étude cas-témoin a le plus faible niveau de preuve.
B. Un manque de précision peut être résolu en augmentant la taille de l'échantillon.
C. Les groupes sont composés à partir de la population cible.
D. Un biais de confusion est dû à un mauvais classement du sujet selon le statut exposé-non exposé.
E. Ces études ont un plus faible niveau de preuve que les essais cliniques randomisés.
QCM 5: On réalise une étude portant sur les facteurs de risque liés au développement des
dépressions. On suppose que le cannabis est un facteur de risque. Pour le prouver, on réunit 200
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
102
personnes pour lesquelles une dépression a été soupçonnée. Sur ces 200 personnes, on déclare
finalement que 20 d'entre elles ne sont pas atteintes. Sur les 20 personnes non-atteintes, 4
affirment qu'ils consommaient régulièrement du cannabis. Parmi les 180 personnes atteintes, 60
affirment qu'ils étaient des consommateurs réguliers.
Quelle(s) est(sont) la(les) proposition(s) exacte(s) :
A. Il s'agit d'une enquête analytique de type cas-témoin.
B. Concernant l'indicateur de risque le plus adapté,on peut calculer un risque relatif égal à 17.
C. Concernant l'indicateur de risque le plus adapté, on peut calculer un odd ratio égal à 2.
D. Le recueil des donnés est prospectif.
E. Cette enquête a un très faible niveau de preuve.
QCM 6 : A propos des études épidémiologiques observationnelles, indiquez si les propositions
suivantes sont vraies ou fausses :
A. Une étude cas-témoin permet d'étudier simultanément plusieurs facteurs de risque.
B. Une étude exposés-non exposés nécessite souvent un grand nombre de sujets.
C. Le temps de suivi dans une étude exposés – non exposés doit être identique pour tous les sujets.
D. Une étude cas-témoin a le plus souvent un cout moindre qu'une étude exposés-non exposés.
E. Une étude exposés-non exposés est appropriée quand la maladie est fréquente.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
103
Epidémiologie, ce qu'il fallait répondre :
1 : BCE
3 : AC
2 : BDE
4 : ABE
5 : ACE
6 : ABDE
Pourquoi certaines réponses sont fausses :
QCM 1 :
A. Il s'agit d'une enquête de type exposés-non exposés.
D. Un biais ne correspond pas à un manque de précision, mais à une erreur
systématique dans la mesure d'un paramètre. Augmenter la taille de
l'échantillon ne résout pas le problème.
QCM 2 :
A. La randomisation concerne les essais cliniques et pas les études
d'observation.
C. Le risque relatif se calcul de la façon suivante:
RR = (malades exposés / exposés) / (malades non-exposés / non-exposés) =
(60/180) / (40/300) = 2,5
QCM 3 :
(ATTENTION il fallait cocher les réponses INEXACTES !!!)
A. La randomisation assure la comparabilité initiale des groupes. C'est l'insu
qui la maintient tout au long de l'essai.
C. Contrairement aux études d'observation, on met en évidence un lien de
causalité.
QCM 4 :
C. L'échantillon est constitué à partir de la population source.
D. Il s'agit d'un biais d'information ou de classement.
QCM 5 :
Grâce à l'énoncé, on réalise le tableau suivant:
Exposés
non-exposés
Dépression
60
120
Absence de dépression
4
16
B.L'indicateur de risque le plus adapté est l'odds ratio qui se calcul ainsi:
Malades exposés x Non-malades non-exposés
Malades non-exposés x Non-malades exposés
odds ratio = (60 x16) / (4 x120) = 2
D. Le recueil des données est rétrospectif dans les enquêtes cas-témoin.
QCM 6 :
C. Cette condition n'est pas necessaire.
E. VRAI. Cette réponse est en lien avec l'item B : comme il faut un grand
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
104
nombre de sujets, la maladie doit être fréquente dans la population.
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
105
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
106
© Tous droits réservés au Tutorat Associatif Toulousain.
Sauf autorisation, la vente, la diffusion totale ou partielle de ce polycopié sont interdites.
107
Téléchargement