
5
Exemple d’une surface de régression
pour deux variables explicatives
Y
*
***
X1
X2
*
***
***
**
**
*
*****
*
25
Exemple de régression multiple :
Évaluation immobilière
Un évaluateur immobilier désire développer un
modèle pour l’aider à prédire le prix du marché
de certaines propriétés
Trois variables explicatives seront retenues pour
estimer le
rix de vente d’une maison :
– Surface totale en pi.ca.
– Nombre de chambres à coucher
– Dimension du garage
Voir le fichier Fig9-17.xls
26
Sélectionner le modèle
Nous voulons identifier le modèle le plus simple
qui exprime bien la variation systématique de la
variable Y
Utiliser arbitrairement toutes les variables
explicatives pourrait induire un « surajustement »
Un échantillon contient plusieurs caractéristiques :
– Certaines représentant la population
– D’autres étant spécifiques à l’échantillon
Nous ne voulons pas ajuster les modèles aux
caractéristiques spécifiques des échantillons,
c’est-à-dire faire du surajustement 27
Modèles avec une variable explicative
De façon simpliste, supposons qu’on ajuste
trois modèles de régression simple :
YX
ibbi
=+
011
YX
ibb i
=+
022
YX
ibbi
=+
033
Faits saillants des résultats :
Variables R2 Estimations
incluses R2ajusté Sedes paramètres
X10.870 0.855 10.299
b
0=9.503,
b
1=56.394
X20.759 0.731 14.030
b
0=78.290,
b
2=28.382
X30.793 0.770 12.982
b
0=16.250,
b
3=27.607
Juste le modèle avec X1contient déjà 87% de
la variation de Y, laissant 13% pour le reste 28
Remarque informatique importante
En considérant plus d’une variable
explicative, il est important de les
maintenir en blocs adjacents afin de
pouvoir les sélectionner simultanément
La sélection de blocs non contigües est
interdite avec l’outil de régression
29
Modèles avec deux variables explicatives
Supposons maintenant que nous ajustions
les deux modèles suivants :
YXX
ibb b
ii
=+ +
011 22
YXX
ibb b
ii
=+ +
011 33
Faits saillants des résultats :
Variables R2 Estimations
incluses R2ajusté Sedes paramètres
X10.870 0.855 10.299
b
0=9.503,
b
1=56.394
X1& X20.939 0.924 7.471
b
0=27.684,
b
1=38.576
b
2=12.875
X1& X30.877 0.847 10.609
b
0=8.311,
b
1=44.313
b
3=6.743
Le modèle comprenant X1et X2explique 93.9%
de la variation de Y 30