2 L’algorithme PLS1
La section 2.1 donne le principe de l’algorithme PLS1 sans données man-
quantes et permet d’introduire les écritures matricielles utilisées pour implé-
menter l’algorithme de la section 2.2.
2.1 Le principe de l’algorithme et passage à l’écriture
matricielle
On considère que les vecteurs xjdes variables explicatives et que le vecteur
yde la variable à expliquer sont centrés. Évidemment, les variables peuvent
être centrées-réduites, mais seul le centrage des variables est utilisé lors du
passage à l’écriture matricielle. On note Xla matrice individus ×variables
de dimensions n×p. On va donc chercher le vecteur ah= (ah1, ..., ahp)des
coefficients de régressions du modèle à h composantes.
Étape 1 : On construit la première composante t1comme une combinai-
son linéaire des pvariables explicatives xj. Les coefficients w0
1= (w11, ..., w1j, ..., w1p)
de cette combinaison linéaire cherchent à “résumer” au mieux les variables
explicatives xjet à “expliquer” au mieux la variable y:
t1=w11x1+.... +w1pxp
w1j=cov(xj,y)
qPp
j=1 cov2(xj,y)
On effectue ensuite une régression simple de ysur t1:
y=c1t1+y1
où y1est le vecteur des résidus et c1est le coefficient de régression :
c1=cov(y, t1)
σ2
t1
On en déduit une première équation de régression :
y=
a11
z }| {
c1w11 x1+... +
a1p
z }| {
c1w1pxp+y1
Passage à l’écriture matricielle sachant que les vecteurs xjet ysont centrés
:
cov(xj, y) = Pn
i=1 xij yi=x0
jy
cov(y, t1) = Pn
i=1 yit1i=y0t1
σ2
t1=Pn
i=1 t1it1i=t0
1t1
c
°Revue MODULAD, 2003 -2- Numéro 30