Student pour math

publicité
LA LOI DE STUDENT ET LES MESURES SCIENTIFIQUES
Jean François Kentzel – Lycée Pardailhan à Auch (32) – [email protected]
Soient x1, x2 ... xn les résultats de n mesures indépendantes et suivant le même
protocole d’une quantité, désignée par m, dont on sait qu’elle est fixée. Intuitivement on
estime m par la moyenne empirique x   xi / n . La LOI DES GRANDS NOMBRES permet
d’affirmer que cette estimation est d’autant meilleure que n est grand. On s’intéresse dans ce
qui suit (qui est la réponse à une question qui m’a été posée par une collègue de physique)
à la qualité de cette estimation lorsque l’entier n est fixé (n valant au moins 2).
Les calculs d’erreurs classiques, corrects mais parfois inopérants comme on va le voir plus
loin, sont à présent le plus souvent remplacés par des calculs probabilistes. Dans le cadre
probabiliste, effectuer une mesure c’est réaliser une expérience aléatoire, c’est à dire que le
résultat d’une mesure de la quantité m est donné par une variable aléatoire X. La définition
mathématique de ce qu’est une variable aléatoire importe peu ici, il suffit de penser que c’est
un nombre qui varie aléatoirement suivant une loi donnée. Le modèle courant est que X suit
une LOI NORMALE (dite aussi loi de Gauss ou plus familièrement « courbe en cloche »)
d’espérance (c’est à dire de moyenne) E ( X ) = m. On désigne par  l’écart-type de la loi de
X.  est une mesure de la dispersion des valeurs de X autour de sa moyenne m comme le
montre la définition de  2 ( la variance de X ) : Var ( X ) =  2 = E ( X – m )2, c’est la
moyenne des carrés des écarts avec la moyenne.
On dit que X suit la loi N ( m ,  2 ).
Sa densité, représentée ci-dessous, est f : x 

1
e
2 
( x  m)2
2 2
.
Si ce modèle semble fantaisiste, on peut adopter le point de vue,
strictement équivalent, suivant lequel ce n’est plus le résultat
d’une mesure mais l’erreur effectuée sur une mesure qui est
aléatoire :
soit E la variable aléatoire « erreur commise sur une mesure ».
On a : X = m + E donc E = X – m suit la loi N(0,
 2 ).
Les dessins ci-contre montrent
les deux valeurs concernant la
loi normale N ( m ,  2 ) qui
sont les plus utilisées.
Pour simplifier l’exposé, on
va, suivant l’usage, surtout
utiliser le dessin de droite. On
dira alors qu’on s’accorde une
marge d’erreur de 5 % .
1
On rappelle que ce dessin de droite signifie que si une variable aléatoire X suit N ( m ,  2 ),
alors P ( m  2  X  m  2 ) =

m  2
m  2
f (u ) du  0.95 : lorsqu’on effectue une mesure, on a
environ 95 % de chances pour que son résultat soit entre m  2 et m  2 1.
Brève justification du modèle de la loi normale pour une mesure
Ce modèle ne heurte pas l’intuition : il suppose qu’on ne commet pas d’erreur systématique (symétrie autour de
la « vraie valeur m », les physiciens les plus pointilleux évitant d’utiliser cette expression et préférant parler de
valeur standard ou de valeur de référence) et que les petites erreurs sont plus fréquentes que les grandes
(concentration autour de m). Il est surtout confirmé, approximativement , bien sur, par un grand nombre
d’expériences. Un autre argument reposant sur le théorème dit de limite centrale va être donné dans ce qui suit 2.
En cas de doute, on peut utiliser un test dit de normalité sur la série des mesures x1, x 2 ... x n . Un tel test,
indiquant si l’hypothèse que X suit une loi normale est raisonnable, est systématiquement effectué par un logiciel
évoqué plus loin.
La suite est une question de statistique tout à fait typique : que peut on
raisonnablement3 dire de m à la seule vue des observations x1, x2 ... xn ?
Le dessin ci-contre illustre les règles :
E (X+Y) = E (X) + E (Y) (toujours vraie)
Var (X+Y) = Var (X) + Var (Y)
X+Y est normale si X et Y le sont
(vraies si X et Y sont indépendantes).
on peut déduire de ces règles que si les nombres aléatoires4 x1, x2 ... xn suivent la loi N (m,
 2 ), alors le nombre (aléatoire)

n
x suit la loi N (n.m ; n  2 ).
i 1 i
Par ailleurs en divisant une variable par un nombre a, on divise son espérance par a et sa
variance par a2 .On en déduit que x   xi / n suit la loi N ( m,
a un écart-type  pour une mesure, on a alors un écart-type

n
2
). Ceci montre5 que si on
n
pour la moyenne de n
mesures.
On a donc une plus grande précision lorsqu’on calcule une moyenne de mesures.
C’est ici que les calculs d’erreurs classiques apparaissent comme inopérants. Ils donnent en effet, si on désigne
par e l’incertitude sur une mesure :
On dira plus loin que cette valeur 2 est en fait une valeur approchée de la valeur 1.96 mais pour l’instant ça n’a
aucune importance.
2
Ce théorème prouvant aussi qu’on peut s’affranchir de cette hypothèse de normalité dès qu’on prend un assez
grand nombre n de mesures, une borne courante étant n > 30.
3
en acceptant le modèle de la loi normale pour une mesure
4
Pour faciliter la communication avec les collègues de physique, on parle parfois de nombres aléatoires plutôt
que de variables aléatoires.
1
5
ça montre aussi à l’aide des règles rappelées que
xm
suit la loi N (0, 1). La forme de ce résultat incite à
/ n
noter ici un résultat difficile à prouver mais essentiel en calcul des probabilités : si X est une variable aléatoire
quelconque, de moyenne m et d’écart-type  , ayant donné lieu aux valeurs observées x1, x 2 ... x n , avec n assez
grand (n > 30) alors le nombre aléatoire
xm
suit approximativement la loi N (0, 1). C’est le THEOREME DE
/ n
justifie ce qui a été écrit à la note 2, on peut se passer de l’hypothèse de normalité si n est
assez grand, et par ailleurs il donne une interprétation de cette hypothèse : l’erreur sur le résultat d’une mesure
pouvant être considéré comme la résultante d’un grand nombre de petites erreurs, dont les détails nous
échappent, il est raisonnable de considérer comme légitime que cette erreur suit une loi normale.
LIMITE CENTRALE. Il
2
pour tout i, m – e
 xi  m + e d’où n(m – e)   xi  n(m + e) et m – e  x  m + e.
Avec ces calculs, calculer une moyenne de mesures n’apporte aucune précision supplémentaire.
2
Puisque x suit la loi N ( m,
), on peut affirmer que
n




P (2
) = P ( x 2
)  0.95 . (1)
 xm 2
m x2
n
n
n
n
Pour l’instant c’est seulement théorique puisque l’écart-type  est inconnu.
Pour pouvoir en tirer des conséquences pratiques, on effectue alors une démarche courante en
statistique : estimer un paramètre inconnu à l’aide des observations dont on dispose :
De même qu’on avait estimé m par x   xi / n qui est la moyenne de la série x1, x2 ... xn des
observations, il est tentant d’estimer  par s =
(x
i
 x) 2
n
puisque c’est l’écart-type de cette
série. Un petit calcul6 (voir le paragraphe 5 de l’annexe) montre que le nombre s’ =
(x
n
s
n 1
 x) 2
, parfois dit écart-type débiaisé, est une meilleure estimation de  .
n 1
Cependant la loi des grands nombres montre que cette estimation n’est correcte que si n est
assez grand; comme pour la borne n > 30 donnée précédemment (notes 2 et 3), suivant le
contexte et les auteurs on trouve aussi les bornes 20 ou 50.
=
i
On considère donc deux cas :
Premier cas : si n est assez grand, disons n > 30 : on remplace

n
par
s'
(ou par
n
s
)
n 1
s'
s'
)  0.95 .
(2)
m x2
n
n
Puisqu’on dispose des nombres x et s’, (2) donne un encadrement de m avec une probabilité
de 0.95.
2
Comme on l’a vu précédemment (début de la note 3), dire que X suit la loi N ( m ,  ) équivaut à dire
X m
que
suit la loi N (0, 1). Or cette loi N (0, 1) est si importante qu’elle est tabulée, on peut donc modifier

le « taux de confiance de 95 % » pris dans tout ce qui précède en modifiant l’intervalle autour de x (et bien sur
dans (1) : P ( x  2
plus le taux de confiance est grand, plus l’intervalle est grand). On peut par exemple affirmer avec la valeur 0.68
évoquée plus haut : P
(x 
s'
s'
)  0.68 .
m x
n
n
Deuxième cas : si n est entre 2 et 30
On dispose d’un résultat étonnant7 pour qui croit que la statistique ne peut être utilisée que
lorsqu’on dispose d’un grand nombre d’observations : si X suit la loi N ( m ,  2 ), alors,
On vérifie facilement que E (s’2) vaut  ce qui n’est pas le cas de E (s2).
7
résultat démontré au début du vingtième siècle, donc beaucoup plus récent que les autres qui sont évoqués dans
ce texte.
6
2
3
xm
suit une loi fixée8 et
s'/ n
connue, cette loi est appelée la loi de Student à (n-1) degrés de liberté9.
Désignant par Tn la loi de
Student à n degrés de
liberté, on donne ci-contre
la représentation graphique
des densités de T1, T2, T4 et
N (0 ; 1) sur [  4 ; 4].
Quand n grandit, s’ se
rapproche de  et, voir le
début de la note 3, Tn se
Au voisinage de 0, c’est la courbe normale qui est au dessus des autres.
rapproche de N (0 ; 1)10.
quelles que soient les valeurs de m et  , le nombre aléatoire t =
Les expressions des densités des lois de Student sont assez compliquées et il n’est pas
question de prouver ici ce qui précède. On se contentera de l’illustrer avec un exemple simple.
L’important pour nos questions de mesures est que, comme la loi normale, les lois de Student
sont tabulées. Le tableau suivant, relatif au « taux de confiance » 95 %, peut être obtenu avec
=LOI.STUDENT.INVERSE(0,05;A1) tapé sur un tableur :
n
t 0.95; n
1
2
12,71 4,30
3
4
5
6
7
8
9 10 16
20
30
50 100 500
3,18 2,78 2,57 2,45 2,36 2,31 2,26 2,23 2,12 2,09 2,04 2,01 1,98 1,96
La signification du coefficient t 0.95; n est donnée par P ( t < t 0.95; n )  0.95 pour t
suivant la loi de Student à n degrés de liberté, ce qui donne, puisqu’on dispose de n mesures :
P(
xm
< t 0.95; n-1 )  0.95 , soit :
s '/ n
s'
s'
t 0.95; n1 < m < x 
t 0.95; n1 )  0.95.
n
n
Comme en (2) ci-dessus, puisqu’on dispose des nombres x , s’ et t 0.95; n-1, on a un
encadrement de m avec une probabilité de 0.95.
Attention ! Dans tous les textes de physique figurant dans les références, le coefficient t 0.95; n-1
de ces formules est noté t 0.95; n et dans le tableau ci-dessus n désigne le nombre de mesures.
Cette notation, contraire à l’usage en statistique, est la cause d’au moins deux erreurs (voir
l’annexe) dont une, malheureusement, dans un programme de tableur par ailleurs bien
expliqué et très pratique.
P (x
Illustration :
On fait mesurer la longueur d’un objet (disons à un millimètre près et en utilisant seulement
un double-décimètre gradué en mm pour augmenter la variabilité des mesures) par un certain
nombre de personnes.
On peut simuler cette expérience : si l’objet mesure environ 10 mètres, chaque
personne va utiliser environ 50 fois la règle et un modèle de l’erreur (en mm) qu’elle va
.
8
notamment : cette loi ne dépend pas de m ni de
9
n-1 car il y a une relation de dépendance entre les n variables dont les carrés figurent dans s’ :
(x
i
 x) = 0.
10
par exemple la valeur 1.96 intervenant dans le tableau ci-dessous est celle qui a été évoquée pour la loi
normale à la note 1. Dès que n est assez grand la loi de Student à n degrés de liberté est très bien approximée par
la loi normale N (0 ;1). En pratique, c’est à dire sur le plan des calculs, le premier cas (n > 30) est un cas
particulier du deuxième (n < 30).
4
50
commettre est
X
i 1
i
où les X i sont 1[-0.5 ; 0.5] (nombre au hasard entre – 0.5 et 0.5, c’est la
formule =ALEA()  0.5 sur un tableur).
30
1 ) On vérifie d’abord en passant que l’hypothèse que les mesures
suivent une loi normale est raisonnable. On ne représente pas les
X
i 1
20
15
i
. Les
histogrammes obtenus (en simulant 200 fois l’expérience) grâce à un
bon logiciel de regroupement en classes (voir l’annexe) sont
effectivement approximativement gaussiens.
10
5
0
-6
_5,
-4
49
,9
7_
-4
,4
-3
6
,9
5_
-3
,4
-2
3
,9
2_
2,4
-1
,8
9_
-1
,3
-0
7
,8
6_
-0
,3
4
0,
17
_0
,6
9
1,
2_
1,7
2
2,
23
_2
,7
3,
5
26
_3
,7
4,
8
29
6,
_4
35
,8
_6
5,
1
,8
32
65
_5
62
,
75
84
75
98
06
3
mesures obtenues mais seulement les erreurs, c’est à dire
50
25
2 ) L’objectif est en réalité de vérifier la loi de Student. On
demande donc à chacune des 200 personnes d’effectuer trois
x
mesures et de calculer t =
(la moyenne m des erreurs
s'/ n
valant 0). Pour 3 mesures le coefficient intéressant est t 0.95; 2 qui
vaut environ 4.3. Des appuis répétés sur la touche F9 donnent
bien comme ci-contre une dizaine de valeurs, soit 5 % de ces
valeurs, à l’extérieur de l’intervalle [  4.3; 4.3 ].
On peut également vérifier l’allure de la densité de T2 avec
l’histogramme obtenu pour la variable t .
Voir l’annexe (lisible sur la page http://pedagogie.ac-toulouse.fr/lyc-pardailhan-auch/, cliquer
sur ENT puis sur Rubriques des disciplines/ Mathématiques/ Documents- enseignants) pour
plus de détails sur certains points, une bibliographie contenant une vingtaine d’adresses
Internet et des références de logiciels rendant aisée l’utilisation de la loi de Student.
5
Téléchargement