La modélisation par équations structurelles basée sur la méthode PLS :
une approche intéressante pour la recherche en marketing
Introduction
La modélisation par équations structurelles est désormais couramment utilisée par les
chercheurs en marketing car elle permet de mettre à jour des liens de causalité entre plusieurs
variables, y compris modératrices et médiatrices, tout en incorporant les erreurs de mesure
(Bagozzi, 1980). Mais, il arrive que les prérequis à son utilisation ne soient pas parfaitement
respectés ; ainsi en est-il de la normalité des données qui est une condition à respecter de la
méthode basée sur l’analyse de covariances et le maximum de vraisemblance (Bentler et
Chou, 1987, Barnes et al., 2001). La violation de la normalité peut conduire à des résultats
erronés ou aberrants (Chin et al., 2001). Or, il existe une méthode d’estimation des paramètres
qui est moins exigeante dans ses conditions d’utilisation (pas de normalité, petits échantillons
acceptés), et qui par ailleurs, se trouve être plus adaptée aux recherches exploratoires et
prédictives tout en étant rigoureuse d’un point de vue statistique (Fernandes, 2012, Hair,
Ringle et Sarstedt, 2011). Il s’agit de la méthode PLS basée sur l’analyse de variance et la
méthode des moindre carrées partiels. Le fait qu’elle soit plus récente (Wold, 1982) et
disponible sur moins de logiciels statistiques explique probablement sa moindre utilisation
alors qu’elle nous semble présenter un grand intérêt pour les chercheurs en marketing.
Sans entrer dans le détail des soubassements théoriques et mathématiques de cette méthode
,
nous en présenterons les grands principes, nous exposerons les prérequis à son utilisation, ses
avantages et inconvénients en nous appuyant sur la littérature existante. Nous présenterons
également une méthode d’analyse multi-groupe qui en est issue qui permet de traiter
l’hétérogénéité des données en identifiant des sous-modèles. Nous proposerons enfin une
application sur des données réelles à titre d’illustration.
1. Rappel sur les équations structurelles à variables latentes
Les modèles d’équations structurelles à variables latentes (SEM) sont des modèles multivariés
utilisés pour modéliser les structures de causalité dans les données. L’intérêt de la
modélisation par équations structurelles réside essentiellement dans sa capacité à tester de
manière simultanée l’existence de relations causales entre plusieurs variables latentes. Une
variable latente est une variable qui n’est pas observable et ne peut être mesurée directement.
Pour une discussion plus fouillée sur ces aspects, on pourra se reporter à Valette-Florence (1993, 1998)