Universit´
e “Franc¸ois Rabelais” de Tours
UFR Sciences et Techniques
Licence de Physique 2010–2011
UE505P : Mod´
elisartion, Simulations et Outils Informatiques
TD3 : R´egression Lin´eaire
Dans cet exercice on dispose d’une suite de donn´ees, (xi, yi), i = 0,1,2,..., et l’on cherche
a calculer les param`etres d’une relation entre ces donn´ees, qui serait la pr´ediction d’un mod`ele.
La complication est que ces donn´ees sont sujettes `a des incertitudes, soit de notre appareil de
mesure (graduations finies, pr´ecision limit´ee) soit de notre proc´ed´e mˆeme. Alors les valeurs des
param`etres, aussi, seront sujettes `a des incertitudes. La m´ethode des moindres carr´es est une
approche, qui permet de calculer l’incertitude des param`etres `a partir de celles des donn´ees,
ainsi, bien entendu, que les “valeurs centrales” de ces param`etres.
1. L’exemple que l’on va employer pour illustrer la m´ethode est celui d’un fil conducteur, dont
on cherche la r´esistance et la tension du voltm`etre. On dispose des mesures (Vi, Ii), i =
0,1,2,...,N−1 et l’on fait l’hypoth`ese que l’incertitude exp´erimentale, σV, sur la mesure
de la tension est beaucoup plus grande que celle du courant, σI, de fa¸con `a pouvoir n´egliger
cette derni`ere.
Alors on construit la quantit´e suivante
S(R, V∗)≡
N−1
X
i=0 Vi−IiR−V∗
σV2
(1)
C’est une quantit´e positive, qui serait ´egale `a z´ero si les mesures ´etaient parfaites et
le fil id´eal et l’on cherche `a comprendre dans quelle mesure la loi d’Ohm est une bonne
description. Pour un ensemble donn´ee de mesures Sest une fonction des deux param`etres,
Rla r´esistance et V∗la tension r´esuduelle du voltm`etre. On cherche, alors, les valeurs qui
rendent Sminimale (on a fait la simplification que l’incertitude sur la tension, σV, est
constante) :
∂S
∂R = 0 ⇔
N−1
X
i=0
ViIi=R
N−1
X
i=0
I2
i+V∗
N−1
X
i=0
Ii
∂S
∂V∗
= 0 ⇔
N−1
X
i=0
Vi=R
N−1
X
i=0
Ii+V∗N
(2)
Puisque la relation est lin´eaire et l’incertitude ne d´epend pas de la r´esistance, les ´equations,
qui expriment la condition de l’extr´emum, sont lin´eaires dans les variables Ret V∗. On
peut les r´esoudre facilement et l’on trouve les expressions
R=
NPN−1
i=0 ViIi−PN−1
i=0 ViPN−1
i=0 Ii
NPN−1
i=0 I2
i−PN−1
i=0 Ii2
V∗=PN−1
i=0 ViIiPN−1
i=0 Ii−PN−1
i=0 I2
iPN−1
i=0 Vi
NPN−1
i=0 I2
i−PN−1
i=0 Ii2
(3)
Ces expressions nous donnent les “valeurs centrales” des param`etres Ret V∗. Mais l’on
veut, aussi, d´eterminer l’erreur, σR, induite par l’incertitude, σV, sur la tension. On em-
ploie la technique suivante : Par hypoth`ese, chaque valeur de la tension est tir´ee d’une
distribution gaussienne, avec valeur moyenne la valeur mesur´ee, hViiet ´ecart type σV,
ainsi hV2
ii − hVii2≡σ2
V. On note, maintenant, que, dans les expressions pour Ret V∗
les mesures Vise trouvent toujours aux d´enominateurs. Par cons´equent, il est facile de
calculer hR2i − hRi2et hV2
∗i − hV∗i2, d’y remplacer hV2
ii − hVii2par σ2
Vet utiliser que les
mesures sont ind´ependantes et non-corr´el´ees avec les mesures, Iidu courant pour trouver
les expressions pour σRet σV∗.
Ecrire un programme qui lit les donn´ees (Vi, Ii) et calcule R, σR, V∗, σV∗.
2. Pour tester cette approche il serait utile de disposer d’une suite possible de telles mesures.
A d´efaut de mesures “r´eelles” on peut employer l’astuce suivante : On fixe Ret V∗et l’on
engendre les paires (Vi, Ii) comme suit :
Vi=IiR+V∗+δVi
avec δViuniform´ement distribu´es entre δVmin et δVmax :
δVi=δVmin +r(δVmax −δVmin )
Dans cette approche on cherche, en fait, `a comprendre si la distribution uniforme est un
bon mod`ele pour le ph´enom`ene physique en question.
En utilisant les relations
hri ≡ Z1
0
rρ(r)dr =Z1
0
rdr =1
2et hr2i ≡ Z1
0
r2ρ(r)dr =Z1
0
r2dr =1
3
on peut montrer que
hδVii=1
2(δVmax +Vmin) et h(δVi)2i − hδVii2=1
12 (δVmax −δVmin)2≡σ2
V
On pose, maintenant,
S≡
N−1
X
i=0 Vi−IiR−V∗
σV2
et l’on cherche `a calculer R, σR, V∗, δV∗.