Chapitre 3. Modèle de Régression Linéaire Multiple
Moad El kharrim
Dans L’esprit économiqueL’esprit économique 20222022, pages 113 à 221
Éditions L'HarmattanL'Harmattan
ISBN 9782140267031
Distribution électronique Cairn.info pour L'Harmattan.Distribution électronique Cairn.info pour L'Harmattan.
La reproduction ou représentation de cet article, notamment par photocopie, n'est autorisée que dans les limites des conditions générales d'utilisation du site ou, le
cas échéant, des conditions générales de la licence souscrite par votre établissement. Toute autre reproduction ou représentation, en tout ou partie, sous quelque
forme et de quelque manière que ce soit, est interdite sauf accord préalable et écrit de l'éditeur, en dehors des cas prévus par la législation en vigueur en France. Il est
précisé que son stockage dans une base de données est également interdit.
Article disponible en ligne à l’adresseArticle disponible en ligne à l’adresse
https://www.cairn.info/introduction-a-l-econometrie-appliquee--9782140267031-page-113.htm
Découvrir le sommaire de ce numéro, suivre la revue par email, s’abonner...
Flashez ce QR Code pour accéder à la page de ce numéro sur Cairn.info.
© L'Harmattan | Téléchargé le 30/11/2023 sur www.cairn.info via CERIST (IP: 193.194.76.5)
© L'Harmattan | Téléchargé le 30/11/2023 sur www.cairn.info via CERIST (IP: 193.194.76.5)
Chapitre 3
Modèle de Régression
Linéaire Multiple
Lorsque nous avons introduit l’analyse de régression dans le chapitre pré-
cédent, nous avons parlé de modèles de régression contenant un certain
nombre de variables prédictives.
Dans tous ces exemples, une seule variable prédictive du modèle aurait
fourni une description inadéquate puisqu’un certain nombre de variables
clés affectent la variable dépendante de manière importante et distincte.
De plus, dans des situations de ce type, nous trouvons fréquemment que
les prédictions de la variable dépendante basées sur un modèle ne conte-
nant qu’une seule variable prédictive sont trop imprécises. Un modèle
plus complexe, contenant des variables de prédiction supplémentaires
est généralement plus utile pour fournir des prédictions suffisamment
précises de la variable dépendante.
L’analyse de régression multiple est également très utile dans des situa-
tions expérimentales où l’expérimentateur peut contrôler les variables
de prédiction. Un expérimentateur souhaitera généralement étudier si-
multanément un certain nombre de variables prédictives car presque
toujours plus q’une variable prédictive clé influencent la variable dépen-
dante. Par exemple, dans une étude sur la productivité des équipes de
travail, l’expérimentateur peut souhaiter contrôler à la fois la taille de
l’équipe et le niveau de la prime.
Les modèles de régression multiple que nous décrivons maintenant peuvent
être utilisés soit pour des données d’observation, soit pour des données
expérimentales à partir d’un plan complètement aléatoire.
113
© L'Harmattan | Téléchargé le 30/11/2023 sur www.cairn.info via CERIST (IP: 193.194.76.5)
© L'Harmattan | Téléchargé le 30/11/2023 sur www.cairn.info via CERIST (IP: 193.194.76.5)
3 Modèle de Régression Linéaire Multiple
3.1 Présentation Formelle du Modèle
Nous considérons maintenant le cas où il y a mvariables explicatives
X1, ..., Xm. Le modèle de régression s’écrit :
Yi=β0+β1Xi1+β2Xi2+... +βmXi,m +εik=1, ..., m (3.1)
est appelé un modèle de premier ordre avec mvariables prédictives. On
peut aussi écrire :
Yi=β0+
m
k=1
βkXik +εi(3.2)
ou, si nous laissons Xi01, alors (3.2) peut être écrite ainsi :
Yi=
m
k=0
βkXik +εiXi01,k=0, ..., m (3.3)
ainsi l’equation (3.1) sera :
Yi=β0Xi0+β1Xi1+β2Xi2+... +βmXi,m +εik=1, ..., m (3.4)
En supposant que E(εi) = 0, la fonction du modèle de régression (3.1)
est la suivante :
E(Y)=β0+β1X1+β2X2+... +βmXm(3.5)
Cette fonction de régression est un hyperplan,quiestunplanàplusde
deux dimensions. Il n’est plus possible de visualiser la surface de cette
fonction, comme nous pouvons le faire pour le cas de deux variables
prédictives. Néanmoins, la signification des paramètres est analogue au
cas de deux variables prédictives. Le paramètre βmindique l’évolution
de E(Y) avec une augmentation unitaire de la variable prédictive Xm
lorsque toutes les autres variables de prédiction du modèle de régression
sont maintenues constantes.
3.2 Modèle de Régression Linéaire Général
Nous définissons le modèle général de régression linéaire, avec des termes
d’erreur normaux en termes de Xvariables :
Yi=β0+β1Xi1+β2Xi2+... +βmXi,m +εik=1, ..., m (3.6)
β0
1, ..., βmsont des paramètres
Xi1, ..., Xi,m sont des constantes connues
114
© L'Harmattan | Téléchargé le 30/11/2023 sur www.cairn.info via CERIST (IP: 193.194.76.5)
© L'Harmattan | Téléchargé le 30/11/2023 sur www.cairn.info via CERIST (IP: 193.194.76.5)
3 Modèle de Régression Linéaire Multiple
εisont indépendants et normalement distribués N0
2
Remarque :
Le modèle de régression généralisée (3.6) englobe non seulement des
variables prédictives quantitatives, mais également des variables quali-
tatives, telles que le sexe (homme, femme) ou le statut d’invalidité (non
handicapé, partiellement ou totalement handicapé). Nous utilisons des
variables indicatrices qui prennent les valeurs binaires 0 et 1 pour iden-
tifier les classes d’une variable qualitative.
Considérons une analyse de régression pour prédire la durée du séjour à
l’hôpital (Y) en fonction de l’âge (X1)etdusexe(X2) du patient. Nous
définissons (X2) comme suit :
X2=.1 si le patient est une femme
0 si le patient est un homme
3.2.1 Présentation Matricielle du Modèle de Régression Linéaire
Général
Nous présentons maintenant les principaux résultats de la régression
linéaire générale (3.6) en termes de matrice.
C’est une propriété remarquable de l’algèbre matricielle que les résultats
du modèle de régression linéaire général (3.6) en notation matricielle
apparaissent exactement comme ceux du modèle de régression linéaire
simple. Seuls les degrés de liberté et autres constantes liés au nombre de
variables Xet aux dimensions de certaines matrices qui sont différents.
Nous sommes donc en mesure de présenter les résultats de manière très
concise.
Certes, la notation matricielle peut masquer d’énormes complexités de
calcul. Pour trouver l’inverse d’une matrice Ad’ordre 10×10, celà néces-
site une énorme quantité de calcul, mais elle est simplement représentée
par A1. Notre raison de mettre l’accent sur l’algèbre matricielle est
qu’elle indique les étapes conceptuelles essentielles de la solution. Les
calculs réels, dans tous les cas sauf les plus simples, seront effectués par
ordinateur. peu importe pour nous que XX1représente l’inverse
d’une matrice d’ordre 2 ×2ou10×10. Le point important ici est de
savoir ce que représente l’inverse de la matrice.
Pour exprimer un modèle de régression linéaire général (3.6) sous forme
matricielle, nous devons définir les matrices suivantes :
Yi=β0+β1Xi1+β2Xi2+... +βmXi,m +εik=1, ..., m
115
© L'Harmattan | Téléchargé le 30/11/2023 sur www.cairn.info via CERIST (IP: 193.194.76.5)
© L'Harmattan | Téléchargé le 30/11/2023 sur www.cairn.info via CERIST (IP: 193.194.76.5)
3 Modèle de Régression Linéaire Multiple
Y
n×1=
Y1
Y2
.
.
.
Yn
X
n×(m+1) =
1X11 X12 ··· X1,m
1X21 X22 ··· X2,m
.
.
..
.
..
.
.
1Xn1Xn2··· Xn,m
ε
n×1=
ε1
ε2
.
.
.
εn
β
(m+1)×1
=
β0
β1
.
.
.
βk
(3.7)
En termes matriciels, le modèle de régression linéaire général (3.6) est
le suivant :
Y
n×1=X
n×(m+1) ×β
(m+1)×1
+ε
n×1(3.8)
Yest le vecteur de la variable dépendante
βest le vecteur des paramètres
Xest la matrice des constantes
εest le vecteur des variables indépendantes et normalement dis-
tribuées avec une moyenne E(ε) = 0 est une matrice variance-
covariance égale à :
Eεε=
Eε2
1E(ε1ε2)E(ε1ε3)··· E(ε1εn)
E(ε2ε1)Eε2
2E(ε2ε3)··· E(ε2εn)
E(ε3ε1)E(ε3ε2)Eε2
3··· E(ε3εn)
.
.
..
.
..
.
..
.
..
.
.
E(εnε1)E(εnε2)E(εnε3)··· Eε2
n
Puisque chaque terme d’erreur, εia une moyenne nulle, les éléments
diagonaux de cette matrice représenteront la variance des erreurs et les
termes non diagonaux seront les covariances entre les différentes erreurs.
Par conséquent, en utilisant les hypothèses 2 var (εi)=Eε2
i=σ2et
3(cov (εi
j)=E(εiεj) = 0), la matrice variance-covariance sera sous
la forme :
σ2(ε)
n×n
=Eεε=
σ20··· 0
0σ2··· 0
.
.
..
.
..
.
.
00··· σ2
=σ2I
Par conséquent, le vecteur aléatoire Ya une moyenne :
E(Y)
n×1
=(3.9)
116
© L'Harmattan | Téléchargé le 30/11/2023 sur www.cairn.info via CERIST (IP: 193.194.76.5)
© L'Harmattan | Téléchargé le 30/11/2023 sur www.cairn.info via CERIST (IP: 193.194.76.5)
1 / 110 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!