TD5 - Régression linéaire - Validation de mod`ele

Master Ing´enierie Math´ematique M1 Calcul de risques et pr´edictions
Universit´e Paris-Sud 11
2008-2009
TD5 - R´egression lin´eaire - Validation de mod`ele
Exercice 1: R´egression lin´eaire simple sur deux populations ou analyse de la covariance `a un
facteur sur deux populations.
On mesure le taux de leucocytes T4chez le chat xjours apr`es lui avoir inocul´e un virus. On
appelle Yle logarithme de ce taux. Le tableau ci-dessous donne les mesures faˆıtes sur 17 chats
et 15 chattes:
Chats : x1j44 317 292 179 39 257 354 349 195 245 270
Y1j4.66 3.08 1.28 3.17 5.59 2.88 1.60 3.48 3.39 3.47 3.20
166 57 198 20 187 270
2.90 4.83 2.96 5.17 3.44 3.18
Chattes : x2j84 47 20 209 106 343 325 346 151
Y2j3.45 3.89 3.79 3.79 3.81 0.61 2.04 0.41 2.67
267 80 249 341 189 50
0.89 4.39 2.56 0.28 2.43 3.85
1. On d´efinit le mod`ele M0comme celui o`u, pour chaque sexe, Yvarie lin´eairement en
fonction de x:
½Y1j=b1+a1x1j+ε1j,j∈ {1, . . . , n1= 17}avec ε1j N (0, σ2
1) i.i.d
Y2j=b2+a2x2j+ε2j,j∈ {1, . . . , n2= 15}avec ε2j N (0, σ2
2) i.i.d
Pour chaque groupe, ajuster la droite de r´egression. Tester l’´egalit´e des variances des
erreurs puis estimer les param`etres du mod`ele M0.
2. On d´efinit le mod`ele Macomme celui o`u a1=a2, le mod`ele Mbcomme celui o`u b1=b2
et le mod`ele M1comme celui o`u une droite de r´egression commune explique les mesures
des deux sexes (a1=a2et b1=b2).
(a) Tester s´epar´ement `a 5% Macontre M0et Mbcontre M0.
(b) Tester `a 5% Macontre M0et si on garde Ma, tester `a 5% M1contre Ma.
(c) Tester `a 5% Mbcontre M0et si on garde Mb, tester `a 5% M1contre Mb.
Montrer que nous disposons de cette fa¸con de 3 tests de niveau 10 %. Que dire de leurs
performances respectives ? Quel test optimal permet de tester M1contre M0?
3. Dans le mod`ele M0, construire
un intervalle de confiance `a 95% pour a1a2puis pour b1b2. En d´eduire un pae
de confiance au niveau de confiance sup´erieur ou ´egal `a 90% pour (a1a2, b1b2).
une ellipse de confiance `a 90% pour (a1a2, b1b2).
Quel est le lien entre les tests de la question 2 et les r´egions de confiance de la question 3?
1
Exercice 2: Validation de mod`ele.
Un test est men´e sur un processus de fabrication dans le but de d´eterminer l’effet d’une variable
x(la temp´erature) sur une propri´et´e caract´eristique Y(la densit´e) du produit de fabrication.
Quatre observations de Ysont relev´ees aux cinq temp´eratures x= 1,3,5,7,9.
1. On suppose qu’il n’est pas possible de faire toutes les mesures simultan´ement. Afin
d’´etudier au mieux le ph´enom`ene et de se pr´emunir contre les risques de d´erive, com-
ment planifiez vous les 20 mesures `a relever ?
2. Avant mˆeme d’effectuer les mesures, une interpr´etation physique du ph´enom`ene nous a
sugg´er´e d’utiliser un mod`ele de r´egression lin´eaire : Yi=β0+β1xi+²i. A l’issue des
mesures, on obtient :
¯x= 5 ,¯y= 3 ,
20
X
i=1
(xi¯x)2= 160 ,
20
X
i=1
(yi¯y)2= 83.2,
20
X
i=1
(xi¯x)(yi¯y) = 80
Estimez la droite de r´egression et la variance de Y.´
Etablissez l’expression formelle de
l’intervalle de confiance de E[Y].
3. On se pose le probl`eme de la validit´e du mod`ele de r´egression dans les deux cas de figures
suivants :
0 2 4 6 8 10
0
1
2
3
4
5
6
7
X
Y
0 2 4 6 8 10
−7
−6
−5
−4
−3
−2
−1
0
1
X
Y
Figure 1: Repr´esentation des donn´ees.
(a) En supposant que le graphe des observations soit celui de gauche, quel mod`ele plus
g´en´eral que celui du 2) proposeriez-vous ?
La somme des carr´es r´esiduels r´esultant de ce nouveau mod`ele est ´egale `a 42. Testez
si la droite de r´egression estim´ee en 2) ajuste correctement les donn´ees.
(b) En supposant que le graphe des observations soit celui de droite, quel mod`ele plus
g´en´eral que celui de 2) proposeriez-vous ?
La somme des carr´es r´esiduels r´esultant de ce nouveau mod`ele est ´egale `a 23.2. Testez
si la droite de r´egression estim´ee en 2) ajuste correctement les donn´ees.
L’intervalle de confiance du 2) est-il utilisable?
2
1 / 2 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !