La modélisation par équations structurelles basée sur la méthode PLS : une approche intéressante pour la recherche en marketing Marie-Laure Mourre * Doctorante Université Paris-Est Créteil Enseignant-chercheur Institut Supérieur de Gestion * 147 avenue Victor Hugo 75116 Paris, [email protected] 06 61 39 02 71 La modélisation par équations structurelles basée sur la méthode PLS : une approche intéressante pour la recherche en marketing Résumé La modélisation par équations structurelles basée sur la méthode PLS diffère des méthodes basées sur l’analyse de covariances telles que Lisrel par son caractère prédictif plutôt que confirmatoire et sa plus grande souplesse notamment en ce qui concerne les conditions préalables à son utilisation. Elle permet en outre de traiter l’hétérogénéité des données. Ainsi, elle s’avère particulièrement intéressante pour les chercheurs en marketing. Après une description de ses caractéristiques et avantages, nous proposons une illustration sur des données réelles. Mots-clés : équations structurelles, méthodologie, PLS Abstract Structural equation modeling based on the PLS method differs from covariance-based methods such as Lisrel by its predictive nature rather than confirmatory and its greater flexibility especially regarding the prerequisites to its use. In addition, it allows to address the heterogeneity of the data. Thus, it is particularly interesting for researchers in marketing. After a description of its features and benefits, we propose an illustration based on real data. Keywords : SEM, methodology, PLS La modélisation par équations structurelles basée sur la méthode PLS : une approche intéressante pour la recherche en marketing Introduction La modélisation par équations structurelles est désormais couramment utilisée par les chercheurs en marketing car elle permet de mettre à jour des liens de causalité entre plusieurs variables, y compris modératrices et médiatrices, tout en incorporant les erreurs de mesure (Bagozzi, 1980). Mais, il arrive que les prérequis à son utilisation ne soient pas parfaitement respectés ; ainsi en est-il de la normalité des données qui est une condition à respecter de la méthode basée sur l’analyse de covariances et le maximum de vraisemblance (Bentler et Chou, 1987, Barnes et al., 2001). La violation de la normalité peut conduire à des résultats erronés ou aberrants (Chin et al., 2001). Or, il existe une méthode d’estimation des paramètres qui est moins exigeante dans ses conditions d’utilisation (pas de normalité, petits échantillons acceptés), et qui par ailleurs, se trouve être plus adaptée aux recherches exploratoires et prédictives tout en étant rigoureuse d’un point de vue statistique (Fernandes, 2012, Hair, Ringle et Sarstedt, 2011). Il s’agit de la méthode PLS basée sur l’analyse de variance et la méthode des moindre carrées partiels. Le fait qu’elle soit plus récente (Wold, 1982) et disponible sur moins de logiciels statistiques explique probablement sa moindre utilisation alors qu’elle nous semble présenter un grand intérêt pour les chercheurs en marketing. Sans entrer dans le détail des soubassements théoriques et mathématiques de cette méthode1, nous en présenterons les grands principes, nous exposerons les prérequis à son utilisation, ses avantages et inconvénients en nous appuyant sur la littérature existante. Nous présenterons également une méthode d’analyse multi-groupe qui en est issue qui permet de traiter l’hétérogénéité des données en identifiant des sous-modèles. Nous proposerons enfin une application sur des données réelles à titre d’illustration. 1. Rappel sur les équations structurelles à variables latentes Les modèles d’équations structurelles à variables latentes (SEM) sont des modèles multivariés utilisés pour modéliser les structures de causalité dans les données. L’intérêt de la modélisation par équations structurelles réside essentiellement dans sa capacité à tester de manière simultanée l’existence de relations causales entre plusieurs variables latentes. Une variable latente est une variable qui n’est pas observable et ne peut être mesurée directement. 1 Pour une discussion plus fouillée sur ces aspects, on pourra se reporter à Valette-Florence (1993, 1998) A l’inverse, pour une variable manifeste, on pourra recueillir une mesure de manière directe. Les variables latentes peuvent être estimées à partir de variables manifestes en isolant leur part de variance commune. Les modèles à équations structurelles consistent en un système d’équations pouvant être représentées sous forme de graphe orienté, les nœuds représentent les variables sous forme de carré pour les variables manifestes et sous forme de rond pour les variables latentes, les arcs modélisent les liens de causalité. Chaque variable manifeste est associée à une seule variable latente et les variables latentes peuvent être liées entre elles. Une variable latente peut être de type réflexif : chaque variable manifeste reflète sa variable latente et lui est reliée par une régression plus un terme d’erreur (c’est le cas de ξ1 et η1 de la Figure 1, on notera par exemple x11 = π11.η1+ε11 avec π11 le loading liant la variable manifeste x11 à la variable latente 1). Elle peut être de type formatif : la variable latente est générée par ses propres variables manifestes, c’est alors une fonction linéaire des variables manifestes plus un terme résiduel (cas de η2 de la Figure 1, on notera par exemple η2 = π21x21+π22x22+π23x23+ π23x24+ ε avec πij le poids liant le variable manifeste xij à la variable latente η2). On parlera de mode MIMIC lorsqu’une variable latente est de type mixte : une partie de ses variables manifestes sont de type réflexif et les autres de type formatif. On qualifiera d’endogène une variable dont les valeurs sont déterminées par le modèle et peut à son tour déterminer les valeurs d’autres variables (η1 et η2 de la Figure 1). Une variable exogène pourra elle aussi déterminer les valeurs d’autres variables du modèle mais sera elle-même déterminée par des variables extérieures au modèle (ξ1 de la Figure 1). Enfin, on distinguera au sein du modèle deux sous-modèles : le modèle de mesure ou modèle externe (outer model) liant les variables manifestes aux variables latentes et le modèle structurel ou modèle interne (inner model) liant les variables latentes entre elles. Le modèle structurel sera dit récursif si les liens entre variables sont unidirectionnels. A l’inverse, un modèle non récursif pourra présenter des boucles où deux variables endogènes seront réciproquement cause et conséquence l’une de l’autre. La modélisation par équations structurelles comporte quatre étapes : - dans un premier temps, la spécification vise à développer un modèle conceptuel qui pourra être traité par les logiciels statistiques, - vient ensuite l’estimation des paramètres en fonction de l’algorithme choisi, - puis l’évaluation du modèle qui se fera par le biais de différents indicateurs, - et enfin, la modification du modèle en fonction des informations données par les indices d’évaluation afin d’obtenir le meilleur modèle possible. Nous ne rentrerons pas dans le détail des procédures d’estimation des paramètres mais nous en rappellerons les grands principes dans les lignes qui suivent. L’estimation des paramètres du modèle se fait aujourd’hui en recourant à différents types d’algorithme : - la méthode Lisrel (Linear Structural Relationships) qui repose sur l’analyse de la structure de covariance et utilise l’approche du maximum de vraisemblance ; elle requiert la multinormalité des données, - la méthode GLS (Generalized Least Squares) est moins sensible à la non normalité mais demeure très sensible à la complexité du modèle, - les méthodes ADF (Asymptotic Distribution Free) et WLS (Weighted Least Squares) ne requièrent pas la multinormalité mais exigent des échantillons de plus de 2 500 observations, - la méthode PLS (Partial Least Square) qui repose sur l’analyse de la variance et utilise l’approche des moindre carrés partiels. Nous aborderons uniquement Lisrel qui est la plus utilisée et PLS qui est le sujet de cette communication. Figure 1 : Exemple de modèle structurel à variables latentes 2. La méthode Lisrel Lisrel permet de spécifier, estimer comparer et évaluer des modèles afin de confirmer une théorie. Lisrel est donc une méthode confirmatoire (ou « a priori ») qui nécessite un fort substrat théorique afin de penser en terme de modèles et d’hypothèses. La spécification du modèle est donc une phase cruciale dans le travail de modélisation. A partir du modèle théorique construit a priori, on obtient une matrice de covariance théorique Σ comportant les coefficients de corrélation attendus. A partir des données réelles, on construit la matrice de covariance observée (ou empirique) S qui comporte les coefficients de corrélation de la relation entre deux variables. Les paramètres du modèle seront estimés de manière itérative de sorte à minimiser la différence entre les deux matrices S et Σ. Si on prend l’exemple du modèle de la figure 1, on a donc les deux équations structurelles suivantes : η2 = β1ξ1 + β2η1 + ε2 η1 = β3ξ1 + ε1 avec β le coefficient de régression et ε l’erreur résiduelle. La matrice de variance-covariance correspondant au modèle de la Figure 1 pourra s’écrire de la façon suivante : ( ( ( ) ) )=Σ=( ( ) ) Ainsi, la covariance entre η1 et η2 pourra s’écrire : σ23 = cov(β1ξ1 + β2η1 + ε2, η1) = β1σ12 + β2σ22 On peut donc exprimer la matrice Σ sous forme d’une série d’équations où apparaissent les paramètres du modèle. Il s’agit des coefficients de régression β, des variances des variables indépendantes σ2 y compris la variance des erreurs qu’on notera ψ et les covariances entre variables indépendantes σ. On notera les paramètres sous forme de vecteur nommé ϴ. Dans notre exemple : ϴ = (β1, β2, β3, σ12, ψ1, ψ2) Le principe de la modélisation par équations structurelles consiste à estimer ϴ en minimisant les résidus entre les matrices S et Σ (on écrira F(S, Σ(ϴ)) ou simplement F). La méthode Lisrel consiste à rendre la matrice de covariance théorique Σ la plus proche possible de la matrice empirique S en utilisant l’approche du maximum de vraisemblance (Maximum Likelihood ou plus simplement ML). Il s’agit de trouver le maximum de la fonction de vraisemblance, qui est une fonction de probabilités conditionnelles qui décrit les valeurs d’une loi statistique en fonction des paramètres supposés connus : FML () = log|)| + tr{S)–1} – log|S| – q avec tr la trace c’est-à-dire la somme des coefficients diagonaux de la matrice et q le nombre de variables observées. L’évaluation de la qualité d’ajustement du modèle aux données est faite au moyen de différents indicateurs2 dont les plus utilisés sont : - le test du χ2 : si le modèle étudié est exact alors (n-1)F= χ2(DF) avec DF le degré de liberté égal au nombre de covariances moins le nombre de paramètres. Le modèle est considéré comme bon si χ2/DF<=3 et p-valeur<=0.05, - GFI (Goodness of Fit Index) : cet indice donne la proportion d’information expliquée par la matrice S ; une valeur supérieure ou égale à 0.9 indique une bonne qualité du modèle, - RMSEA (Root Mean Square Error of Approximation) : cet indice calcule la différence entre la matrice de covariances obtenue et celle de la population globale. On acceptera le modèle pour un RMSEA inférieur ou égal à 0.08. - NNFI ou indice de Tucker-Lewis : il permet de mesurer l’augmentation de la qualité d’ajustement quand on passe du modèle de référence (null model) au modèle étudié. On acceptera le modèle pour une valeur supérieure ou égale à 0.95 - CFI (Comparative Fit Index) : cet indice permet de comparer le modèle étudié au modèle d’indépendance complète. On acceptera le modèle pour une valeur supérieure ou égale à 0.9. L’utilisation de cette méthode suppose : - la linéarité du modèle, - l’indépendance des observations, - la normalité multivariée des données, - l’unidimensionalité des blocs de variables, - un nombre d’observations minimum de 5 par paramètre à estimer ; en pratique, 200 observations minimum sont recommandées (Roussel et al., 2002). Les deux conditions les plus difficiles à respecter sont généralement la normalité des données et la taille de l’échantillon. En effet, dans le domaine des sciences sociales, plusieurs recherches ont mis en évidence que, dans la plupart des cas, les données ne suivent pas une distribution normale (Bentler et Chou, 1987, Barnes et al., 2001), ce qui conduisit Wold 2 Pour une présentation détaillée, on pourra se reporter à Hoyle (1995) (1982) à considérer les conditions requises par la méthode Lisrel peu réalistes pour les recherches empiriques. L’impact du non-respect de la normalité des données a été évalué dans un certain nombre d’approches. Dans le cas du maximum de vraisemblance, peu de changements ont été constatés (Diamantopoulos et al., 2000, Bollen, 1989, Reinartz et al., 2009). Par ailleurs, l’utilisation du ré-échantillonnage selon la méthode du bootstrap permet de contourner en partie les problèmes de normalité et du nombre d’observations (Preacher et Hayes, 2004). Ainsi, nombre de recherches utilisent des méthodes de modélisation basées sur la covariance bien que les données initiales s’y prêtent peu. Il n’en reste pas moins que la violation du prérequis de normalité reste un pis-aller car les résultats sont biaisés (Chin et Newsted, 1999) et ne peut s’envisager que pour des écarts modérés à la distribution normale. En effet, Lei et Lomax (2005) indiquent que la violation de la normalité : - biaise les estimations des paramètres surtout quand les échantillons sont de petite taille (100 observations) - a un effet significatif sur l’estimation des loadings et des coefficients structurels - a un rôle plus important que la taille de l’échantillon et la méthode d’estimation choisie - a un effet significatif sur le test du χ2. Ainsi, quand les données s’éloignent fortement de la normalité, l’utilisation de Lisrel est déconseillée et d’autres méthodes, telles que la méthode PLS, doivent être employées (Hair et al. 2012). 3. La méthode PLS Elle tire son nom de l’utilisation des techniques de régression en moindre carrés pour estimer les modèles. L’objectif de la modélisation PLS est de maximiser la variance expliquée de la variable latente dépendante alors que celui des méthodes basées sur la covariance est de reproduire la matrice théorique de covariances. L’estimation des paramètres est itérative, c’est-à-dire que l’on va estimer les variables latentes successivement par le modèle externe (via les variables manifestes) puis par le modèle interne (via les autres variables latentes auxquelles elle est liée) jusqu’à convergence. Plus précisément, il y a 4 étapes : 1) on commence par estimer la valeur des variables latentes sur la base des scores des variables manifestes et des poids du modèle externe (issu de l’étape 4 ou fixés arbitrairement pour initialiser l’itération), 2) puis, on estime les liens structurels entre variables latentes (modèle interne), 3) ensuite, on estime les variables latentes par le modèle interne, c’est-à-dire grâce aux valeurs des variables latentes calculées à l’étape 1 et aux liens calculés à l’étape 2, 4) et enfin, on estime les poids du modèle externe grâce aux valeurs des variables latentes issues de l’étape 3 et on revient à la première étape du processus. On répète cette boucle jusqu’à convergence de sorte que la différence entre les sommes des paramètres issus de deux boucles consécutives soit minime, en pratique inférieure à 10-5. Ensuite, on procède à l’estimation finale des paramètres (poids internes, poids externes et liens structurels) en utilisant la méthode des moindres carrés pour chacune des régressions du modèle. Notons qu’il existe deux modes d’estimation des poids externes selon que les variables sont de type réflexif ou formatif. De même, pour les poids internes, on pourra choisir entre 3 schémas d’estimation : centroïde (le plus utilisé), factoriel ou structurel3. L’algorithme PLS est donc très sensible à la qualité du modèle de mesure à la différence de la méthode Lisrel qui utilise les observations (matrice S) et le modèle théorique (matrice Σ). Il convient donc de s’assurer que les échelles choisies pour mesurer les variables latentes sont de bonne qualité en termes de validité et de fiabilité. A la différence de l’approche Lisrel, l’approche PLS ne nécessite pas la multinormalité des variables et peut convenir aux variables continues, métriques et nominales. Elle est également utilisable avec des variables réflexives et formatives. Elle nécessite moins d’observations. Enfin, PLS est plus appropriée dans le cadre du test de modèles non encore établis par la théorie. En effet, pour Jöreskog et Wold (1982), « la méthode du maximum de vraisemblance est orientée vers la théorie et met l’accent sur la transition entre l’analyse exploratoire et confirmatoire. PLS a comme premier objectif l’analyse causale et prédictive dans le cadre de modèles complexes mais développés sur une base théorique limitée4. » La méthode PLS apparaît plus souple que la méthode Lisrel. Néanmoins, les prérequis suivants doivent être respectés : 3 - le modèle doit être linéaire, - le modèle doit être récursif, - les observations doivent être indépendantes les unes des autres, - les variables réflexives doivent être unidimensionnelles, Pour une présentation de ces trois modes, on pourra se reporter Esposito-Vinzi, Trinchera et Amato (2010). 4 Traduction personnelle - le nombre d’observations minimum doit être égal à 10 fois le nombre de relations émanant du construit central du modèle (Chin, 1998). Autrement dit, on multipliera par 10 le nombre de variables manifestes liées à la variable latente qui est liée avec le plus de variables (exemple : si la variable latente qui est liée au plus de variables possède 5 variables manifestes, l’échantillon devra comporter au moins 50 observations). Dans le cadre d’équations structurelles selon la méthode PLS, il convient de suivre une procédure en quatre étapes pour évaluer le modèle de mesure (Esposito-Vinzi, Trinchera et Amato, 2010, Tenenhaus et Esposito-Vinzi, 2005) 1. Evaluation de la fiabilité : on utilise les alpha de Crombach et le rho de Dillon-Goldstein qui doivent être supérieurs ou égaux à 0.7 2. Vérification de l’unidimensionnalité : on utilise les valeurs propres issues de l’analyse en composantes principales, la première doit être supérieure à 1 et les suivantes inférieures à 1. On vérifie également que les variables manifestes sont davantage corrélées avec la variable latente qu’elles sont censés mesurer qu’avec les autres. 3. Evaluation de la validité convergente : examen des corrélations (loading factors) des items avec leur variable latente qui doivent être supérieures à 0.7 4. Evaluation de la validité discriminante : chaque variable latente doit être liée plus fortement à ses indicateurs qu’aux autres variables latentes du modèle. Cela est le cas lorsque la corrélation au carré entre 2 variables latentes est inférieure aux index AVE (variance extraite moyenne) de chaque variable latente aussi appelée communalité moyenne (Tenhenhaus et al., 2005). Chin (1998) préconise que l’AVE ait une valeur supérieure ou égale à 0.5 Puis on peut procéder à l’évaluation du modèle structurel : 1. Pertinence prédictive du modèle : elle est indiquée par les pourcentages de variance expliquée pour chaque régression du modèle. Croutsche (2002) indique que le modèle est significatif si le R2 est supérieur à 0.1. Chin (1998) précise que des R2 de 0.67, 0.33 et 0.19 peuvent être considérés respectivement comme substantiel, modéré et faible. La qualité de chaque équation structurelle peut aussi être évaluée par le coefficient Q2 de Stone-Geisser qui doit être supérieur à 0. « Il s’agit d’un test de R² en validation croisée entre les variables manifestes d’une variable latente endogène et toutes les variables manifestes associées aux variables latentes expliquant la variable latente endogène, en utilisant le modèle structurel estimé. » (Fernandes, 2012). 2. Test de la significativité des coefficients de régression : étant donné la nature non paramétrique de la modélisation PLS, cela est réalisé par le moyen de techniques de rééchantillonnage (bootstrap ou jacknife) qui donnent des intervalles de confiance. L’évaluation globale de la prédictivité du modèle est donnée par l’index de Goodness of Fit (GoF) qui est la moyenne géométrique entre la communalité moyenne (qui mesure la performance du modèle externe) et le R2 moyen (qui mesure la performance du modèle interne), ainsi il évalue la performance d’ensemble du modèle (Tenenhaus et al., 2005) . Les valeurs absolues et relatives du GoF sont comprises entre 0 et 1. La valeur absolue permet de comparer des modèles ou des groupes d’individus entre eux. La valeur relative est plus utile pour interpréter un modèle. Elle permet de mesurer la performance du modèle par rapport à sa meilleure performance possible (c'est-à-dire la performance de l’Analyse en composante principale sur chaque bloc et de l’analyse canonique pour chaque équation structurelle) en prenant en compte la spécification du modèle. Le GoF est un index descriptif, il n’existe pas de seuil empirique pour l’évaluer. On peut néanmoins considérer qu’un GoF supérieur ou égal à 0.9 atteste d’une bonne qualité d’ajustement du modèle aux données. 4. Avantages de PLS pour la recherche en marketing Les méthodes basées sur l’analyse de covariance restent prédominantes en recherche marketing. Une simple requête sur le moteur de recherche Ebsco dans les bases Academic Search Premier et Business Source Complete avec les 3 entrées « SEM », « marketing » et « Lisrel » donne un résultat de 1 332 occurrences entre 1979 et 2012 dans les revues académiques à comité de lecture contre 562 pour PLS. Mais la méthode PLS gagne en popularité. Selon Eggert (2007), une vingtaine de recherches utilisant la méthode PLS ont été publiées dans cinq des revues du premier tiers des revues scientifiques de marketing. Plus récemment, Fernandes (2012) compte 51 articles en management publiés de 1985 à 2008 dans des revues classées par le CNRS, l’AERES ou l’ESSEC avec 70% des articles publiés après l’année 2000. Hair et al. (2012) recensent pas moins de 204 articles de recherche en marketing s’appuyant sur cette méthode. Enfin, des articles récents tels que ceux de Hair, Ringle et Sarstedt (2011) ou Picot-Coupey (2009) viennent souligner l’intérêt de l’approche PLS en modélisation marketing. En pratique, l’utilisation de PLS sera recommandée dans les cas suivants (Chin et Newsted, 1999) : a) l’objectif de la recherche est de nature davantage exploratoire que confirmatoire, b) le modèle est nouveau ou changeant, le modèle de mesure et/ou structurel ne sont pas fermement établis, c) le modèle est complexe avec un grand nombre de variables, d) la distribution normale n’est pas respectée, e) le nombre d’observations est faible. Il n’est pas rare que les recherches en marketing présentent les quatre premières caractéristiques5. La méthode PLS permet donc de traiter des données peu propices à l’exploitation avec la méthode Lisrel. Certains inconvénients sont néanmoins à signaler. On citera notamment l’impossibilité de tester des modèles non récursifs qui sont quelquefois plus réalistes et rendent mieux compte de la réalité des influences entre variables que les modèles récursifs. Une comparaison des deux méthodes souligne le fait que PLS a tendance à surestimer les laodings alors que Lisrel les sous-estime et que PLS sous-estime les coefficients structurels alors que Lisrel les surestime (Vilares et al. 2007). L’absence d’indicateur global d’évaluation des modèles a également été vue comme un inconvénient de la méthode PLS mais la proposition de l’indice GoF par Tenenhaus et Esposito-Vinzi (2005) a partiellement résolu ce problème même si l’on peut regretter qu’aucun seuil ne puisse être fixé. PLS reste néanmoins très attractif pour la recherche en marketing d’autant plus qu’elle permet de mener des analyses multi-groupes afin d’isoler des sous-modèles, ce qui peut s’avérer particulièrement intéressant pour saisir la diversité des comportements de consommation. Tableau 1 : Comparaison entre Lisrel et PLS Objectif Méthode d’estimation Type de modèles Type de variables Nombre d’observations 5 PLS Analyses de modèles exploratoires ou tests de modèles en développement Analyse de variance Moindre carrés Modèles récursifs seulement Lisrel Analyses confirmatoires, tests de modèles complets fondés sur une théorie solidement établie Analyse de covariance Maximum de vraisemblance Modèles récursifs et non récursifs Variables formatives et réflexives Les modèles formatifs/réflexifs Variables nominales, métriques ne sont identifiables (et ou continues testables) que sous certaines conditions. Toutes les variables doivent être continues ou d’intervalle. 10 fois le nombre de relations 5 par paramètre à estimer émanant du construit central du Le nombre d’observations trop faible étant davantage un problème rencontré par les chercheurs en management/stratégie. Distribution Processus d’estimation Evaluation du modèle modèle Pas de normalité exigée Multinormalité exigée Modèle de mesure et modèle L’estimation et la validation du structurel sont estimés modèle de mesure sont simultanément. indépendantes de celle du modèle structurel. Modèle de mesure : communalité χ2 GFI RMSEA NNFI CFI Modèle structurel : R2, Q2 Modèle total : GoF 5. Le traitement de l’hétérogénéité des données La modélisation par équations structurelles suppose l’homogénéité des données. On entend par homogénéité le fait que toutes les observations sont bien représentées par un modèle unique. Or, il peut arriver qu’un certain nombre d’observations ne soient pas très bien reflétées par le modèle. Ainsi, des sous-modèles (ou modèles locaux) avec des coefficients différents du modèle initial (ou modèle global) - aussi bien dans le modèle structurel que dans le modèle de mesure - peuvent permettre de mieux rendre compte de la diversité des données. On parlera d’hétérogénéité observée lorsqu’on a connaît a priori le nombre de classes d’observations et leurs caractéristiques et d’hétérogénéité non observée quand on ne connaît ni le nombre de classes ni leurs compositions. Traditionnellement, on procédait par clustering en assignant les observations à différentes classes dont on estimait et évaluait les paramètres dans un second temps. Or, les techniques de clustering supposent l’indépendance des variables alors que, par définition, les variables sont liées entre elles dans un modèle structurel. Il y a donc un problème théorique à utiliser les techniques de clustering conjointement aux équations structurelles. Dans le cadre de la modélisation par la méthode PLS, on peut utiliser les techniques d’analyse multigroupe pour traiter l’hétérogénéité observée (Esposito-Vinzi et al., 2008). Pour ce qui est de l’hétérogénéité non observée, différentes techniques existent au nombre desquelles la technique REBUS (Trinchera, 2007) qui est désormais intégrée au logiciel xlstat PLS-PM). REBUS cherche à identifier les sources d’hétérogénéité au sein des variables observées, latentes, endogènes et exogènes. Pour cela, on calcule la distance entre chaque observation et le modèle en prenant en compte la performance du modèle quant aux résidus des modèles interne et externe pour toutes les variables latentes (Esposito-Vinzi et al., 2008). Cette mesure de proximité est définie par rapport à l’index GoF qui est la moyenne géométrique entre la communalité (performance du modèle externe) et le R2 (performance du modèle interne). L’algorithme REBUS est itératif. Il faut d’abord estimer le modèle global selon la procédure PLS décrite plus haut, puis calculer les résidus de toutes les observations par rapport au modèle global. Ensuite, on réalise une classification hiérarchique des résidus sous forme de dendrogramme, puis on réalise une partition en G classes. On assigne alors chaque observation à une classe en fonction de l’analyse en cluster, et on estime les G modèles locaux (un pour chaque classe). On calcule ensuite la mesure de proximité de chaque observation par rapport à son modèle local et on réassigne si nécessaire les observations en fonction de cette mesure aux différentes classes. Quand il n’y a plus de changement de classes et que la stabilité est atteinte, on peut procéder à la description des classes en fonction des différences entre les modèles locaux obtenus sinon, on reprend le processus au niveau de l’estimation des modèles locaux après réassignation des observations. 6. Application Si PLS n’est pas une méthode de modélisation confirmatoire, elle nécessite néanmoins la construction d’un modèle reposant sur des bases théoriques établies. Dans cette application, nous utiliserons une modélisation de la résistance à la persuasion établie dans le cadre d’une publicité de lutte contre le tabac. Dans un premier temps, nous décrirons les bases théoriques sur lesquelles nous avons construit le modèle ; puis, nous exposerons brièvement les conditions de l’expérimentation avant de faire part des résultats issus de l’analyse selon la méthode PLS. Grâce à l’analyse multigroupe permettant de gérer l’hétérogénéité des observations, nous avons pu faire émerger deux modèles locaux distincts. a. Présentation du modèle conceptuel Si l’étude des mécanismes de persuasion a fait l’objet d’une intense recherche au cours des soixante dernières années, la résistance à la persuasion a moins concentré l’attention du monde académique, même si des chercheurs de premier plan tel McGuire avec la théorie de l’inoculation s’y sont intéressés dès les années 1960. Pourtant, les appels à l’approfondissement de la compréhension de la résistance à la persuasion n’ont pas manqué (Eagly et Chaiken, 1993, Knowles et Linn, 2004). Néanmoins, l’ouvrage coordonné par Knowles et Linn (2004) rassemble des contributions qui ont permis des avancées significatives. Cependant, l’intégration des résultats de ces recherches en un modèle unifié n’a pas été réalisée. Constatant ce vide dans la littérature, nous avons entrepris avec cette recherche de proposer un modèle intégrateur de la résistance à la persuasion. Pour cela, nous nous sommes basée sur la littérature sur la persuasion et le changement comportemental et sur les résultats des recherches sur la résistance à la persuasion. Nous avons également utilisé des travaux sur la résistance du consommateur en général afin d’avoir un regard aussi large que possible sur la nature de la résistance à la persuasion. Ainsi, nous avons retenu plusieurs cadres théoriques pour modéliser la résistance à la persuasion. Tout d’abord, nous nous sommes appuyés sur le modèles duaux de la persuasion dont l’Elaboration Likelihood Model (Petty et Cacioppo, 1986) pour identifier les variables et mécanismes régissant le processus persuasif et notamment le changement d’attitudes suite à une communication persuasive. Nous avons également retenu du Persuasion Knowledge Model (Friestadt et Wright, 1994) que la connaissance des techniques persuasives permettait au consommateur de gérer les épisodes persuasifs en fonction de ses propres objectifs. Notre étude des facettes de la résistance à la persuasion ayant mis en évidence sa nature multidimensionnelle et notamment ses composantes attitudinales, intentionnelles et comportementales (Roux, 2007), nous avons souhaité élargir la perspective de notre recherche au niveau comportemental et non pas simplement attitudinal. Cela constitue un apport au regard des recherches qui se concentrent essentiellement sur la résistance attitudinale sans nécessairement investiguer les relations avec l’intention comportementale et le comportement effectif. Or, de nombreuses communications persuasives ont un objectif de changement comportemental. Ainsi, étudier la résistance à la persuasion en allant au-delà de l’attitude nous a paru essentiel pour contribuer à une meilleure connaissance de ce phénomène. Pour ce faire, les travaux de Fisbein et Ajzen et plus particulièrement la Théorie du comportement planifiée (Ajzen, 1985) nous ont permis de retenir des variables telles que les normes sociales subjectives ou le sentiment de contrôle comportemental pour expliquer la formation d’intentions comportementales et la réalisation de comportements effectifs. Nous nous sommes également intéressés aux travaux Higgins, Shah et Friedman (1997) qui introduisent avec l’orientation régulatrice une variable psychologique motivationnelle susceptible de rendre compte des choix comportementaux des individus. Notre intention étant de proposer une modélisation causale de la résistance à la persuasion, nous avons choisi de tester empiriquement notre modèle. Pour cela, nous avons dû choisir un terrain d’expérimentation. La faculté de résister à la persuasion étant une condition de la liberté individuelle, et à ce titre une qualité désirable à nos yeux, nous avons décidé d’étudier la résistance à la persuasion quand celle-ci peut s’avérer néfaste pour le sujet. Pour éviter de rentrer dans des considérations morales et de longs débats sur ce qui est bon ou mauvais pour les individus, nous avons pensé judicieux de choisir la santé comme thématique. En effet, la médecine se donne notamment pour objet de déterminer de manière objective et scientifique ce qui est bon ou mauvais pour la santé. Résister à une publicité de prévention de la santé peut donc s’avérer néfaste. Nous avons ensuite cherché des thématiques de communication susceptibles de rencontrer une résistance de la part du public ciblé. Parmi les sujets possibles (prévention des maladies sexuellement transmissibles, campagnes de vaccination contre la grippe, campagnes de dépistage des cancers du sein ou des cancers colorectaux etc…), la lutte contre le tabagisme a été retenue pour plusieurs raisons : - c’est un sujet qui provoque facilement de la résistance chez les fumeurs, - c’est un enjeu de santé publique puisqu’on considère que le tabagisme est responsable de 60 000 morts prématurées en France ; - c’est également un sujet d’actualité car la prévalence tabagique quotidienne en France a augmenté entre 2005 et 2010 malgré une réglementation de plus en plus restrictive ; - c’est ensuite un sujet de santé qui rentre de manière limitée dans la sphère de l’intime et se prête donc plus aisément à une expérimentation que des sujets gênants ou sensibles ; - enfin, le tabagisme est un phénomène complexe mêlant des facteurs psychologiques individuels et sociaux en plus de facteurs physico-chimiques qui devrait donc permettre d’explorer la richesse des mécanismes de résistance. Afin d’affiner notre modèle et de l’adapter au terrain de recherche, nous avons exploré la littérature en matière de communication persuasive dans le domaine de la santé. Nous avons donc mobilisé les recherches en marketing social portant sur les modèles de changement comportemental en matière de santé (Armirtage et Conner, 2000) et l’efficacité de techniques persuasives telles que la peur dans les publicités de prévention. Cela nous a conduits à confirmer la pertinence de la Théorie du comportement planifié et à introduire dans notre modèle la variable de peur ressentie face à la publicité (Girandola, 2000, Gallopel-Morvan, 2006). Les variables retenues au terme de cette exploration de la littérature sont présentées Tableau 2. Le modèle faisant apparaître les relations causales entre les variables apparaît en figure 2. Tableau 2 : Variables et instruments de mesures retenus Variable Attitude envers les négatifs de la cigarette effets Intention d’arrêter de fumer Voie de traitement empruntée Définition Degré d’accord avec les conséquences négatives de la consommation de Probabilité d’arrêter de fumer à semaines/à 6 mois Style de traitement de l’information en fonction du niveau d’élaboration cognitive. On distinguera les traitements systématique, heuristique et experiential (Meyers-Levy et Mesure Etter et al. (2000) Mesure directe Oculométrie Dépendance aux normes des pairs Contrôle comportemental perçu Orientation régulatrice Peur ressentie Connaissance de la persuasion Dépendance à la cigarette Malaviya, 1999). Degré de prise en considération par un individu de ce qu’il considère comme étant la règle aux yeux du groupe dont il fait partie ou souhaite faire partie. Sentiment de la capacité à réaliser ou non un comportement. Système d’autorégulation individuelle oscillant entre la prévention des risques et la promotion des résultats. Tension psychologique et physique désagréable ressentie face à une situation perçue comme dangereuse, qu’elle soit réelle ou évoquée. Croyances subjectives et connaissances réelles de l’individu portant sur : - les médiateurs psychologiques utilisés dans les communications persuasives, - les objectifs et les tactiques des marketers ainsi que leur pertinence et leur efficacité, ses propres objectifs et tactiques pour gérer la tentative persuasive Dépendance psychique et comportementale au tabac Sexe, âge, type d’habitat Bearden, Netemeyer et Teel (1989) Mesure directe Fellner et al. (2001) Codage des expressions non verbales et verbales issues de l’enregistrement video des sujets dimension objective : Boush, Friestad et Rose (1994) dimension subjective : Bearden, Hardesty et Rose (2001) Fagerström (1978) Figure 2 : Modèle structurel testé b. Méthodologie expérimentale Afin de tester note modèle, nous avons conçu un plan expérimental de type « avant-après exposition avec groupe de contrôle » afin de mesurer les effets de l’exposition à une publicité anti-tabac sur la résistance et le rôle des variables retenues. L’échantillon de départ était constitué de 450 étudiants en école de commerce (fumeurs et non-fumeurs), ce choix ayant été dicté à la fois par la prévalence tabagique élevée des 20-25 ans qui fait des jeunes une des cibles privilégiées des campagnes de prévention tabagique et par la facilité d’accès aux étudiants pour une expérimentation en deux temps. Nous avons choisi comme stimulus une publicité presse développée par l’Organisation Mondiale de la Santé ciblant les jeunes fumeurs et les incitant à arrêter de fumer. La publicité représente une jeune femme séduisante présentant une trachéotomie et n’a pas été utilisée en France. Au final, nous disposons de 74 observations exploitables provenant uniquement de fumeurs. c. Evaluation du modèle de mesure Comme indiqué précédemment, la méthode PLS repose sur le modèle de mesure, il faut donc s’assurer de la bonne validité et fiabilité des instruments de mesure. Pour cela, on a procédé au préalable à une épuration des échelles par analyse factorielle exploratoire en composantes principale suivie d’une analyse factorielle confirmatoire. Puis, on a procédé à l’examen des indicateurs concernant le modèle externe. Les échelles présentent des alpha de Cronbach et des rho supérieurs à la valeur seuil de 0.7, on en conclut la bonne validité des échelles de mesure. L’unidimensionnalité est également vérifiée : toutes les premières valeurs propres sont supérieures à 1 et les suivantes inférieures à 1. L’examen du tableau de cross-loadings permet de vérifier que les variables manifestes loadent plus sur leur variable latente associée que sur les autres variables latentes avec des loadings supérieurs à 0.7. On a donc une bonne validité convergente. La validité discriminante est également vérifiée : les AVE sont supérieures aux carrés des covariances. Le modèle de mesure présente donc une bonne qualité. d. Evaluation du modèle structurel L’analyse multi-groupe réalisée à partir du modèle structurel global a permis de dégager deux modèles locaux différents selon que les individus résistent ou non à la publicité anti-tabac du test (figures 3 et 4). Avec 0,811, l’indice GoF relatif du modèle résistant n’atteint pas le seuil préconisé de 0.9 mais reste satisfaisant. En outre, grâce à l’indice GoF relatif permettant de comparer des modèles locaux entre eux, on constate que le modèle résistant affiche une meilleure prédictivité globale que le modèle non résistant avec un GoF relatif de 0,811 contre 0,767 (tableau 3). Tableau 3 : Goodness of Fit Modèle « résistant » Modèle « non résistant GoF relative 0,811 0,767 Modèle externe 0,980 0,961 Modèle interne 0,827 0,799 Une évaluation de la force explicative de ces modèles basée sur le R2 de la variable intention finale d’arrêter de fumer est d’une pertinence limitée : si le R2 du modèle local non résistant (0.957) est beaucoup élevé que celui du modèle local résistant (0.625), ce dernier nous paraît néanmoins plus riche d’enseignements. En effet, le R2 du modèle local non résistant provient essentiellement de l’intention initiale d’arrêter de fumer et dans une moindre mesure de la peur suscitée par la publicité. Ainsi; peu de liens testés se sont révélés significatifs. En revanche, dans le cas du modèle local résistant, davantage de variables ont un impact sur l’intention finale d’arrêter de fumer : même si c’est encore une fois l’intention initiale d’arrêter de fumer qui a le plus fort impact (0,562), l’attitude initiale envers les effets négatifs de la cigarette (0,338), la connaissance de la persuasion (0,337) et le contrôle comportemental perçu (-0,218) jouent également un rôle significatif. Ainsi, nous avons mis en évidence des fonctionnements différents selon que les sujets résistent ou non au message de la publicité. Ces différences portent sur les trois variables suivantes : la connaissance de la persuasion, le contrôle comportemental perçu et l’orientation régulatrice. L’équation structurelle correspondante est la suivante : Intention finale d’arrêter de fumer = 0,562 * intention initiale d’arrêter de fumer + 0,338 * attitude initiale envers les effets négatifs de la cigarette + 0,337 * connaissance de la persuasion – 0,218 * contrôle comportemental perçu Figure 3: Modèle local “resistant” Figure 4 : Modèle local "non résistant" Conclusion L’utilisation de la méthode PLS pour la modélisation par équations structurelles est intéressante pour les chercheurs en marketing car elle peut être plus adaptée que les méthodes basées sur la covariance à la fois dans ses objectifs et ses contraintes d’utilisation. En effet, elle permet de tester des modèles en développement, de prendre en compte des données nonnormales, de fonctionner sur des échantillons comportant un nombre limité d’observations et d’identifier les sources d’hétérogénéité au sein des données afin de faire émerger d’éventuels modèles locaux. Dans notre application au modèle de résistance à la persuasion, l’analyse multi-groupe a permis de mettre au jour deux modèles locaux distincts selon que les individus résistent ou non à la publicité testée. Mais plutôt que d’opposer les méthodes Lisrel et PLS, à l’instar de Wold (1982) ou Vilares, Almeida et Coelho (2007), on peut les considérer complémentaires l’une de l’autre : PLS, par sa nature prédictive peut s’utiliser dans le cadre d’analyse visant à développer un modèle et Lisrel, plus orienté vers la confirmation basée sur la théorie, peut server à valider ce modèle. Bibliographie - Ajzen, I. (1985), From intentions to actions: A theory of planned behavior, in J. Kuhl & J. Beckman (Eds.), Action-control: From cognition to behavior, 11-39, Heidelberg: Springer. - Armitage C.J. et Conner M. (2000), Social Cognition Models and Health Behaviour: a Structured Review, Psychology and Health, 15, 173-189. - Bagozzi R. P. (1980), Causal Models in Marketing, New York: Wiley. - Barnes J., Cote J., Cudeck R. et Malthouse E. (2001), Checking Assumptions of Normality before Conducting Factor Analyses, Journal of Consumer Psychology, 10,1/2, 79-81. - Bearden W.O., Netemeyer R.G. et Teel J.E. (1989), Measurement of Susceptibility to Interpersonal Influence, Journal of Consumer Research, 15, 473-481. - Bentler P.M. et Chou C.-P. (1987), Practical issues in structural modeling, Sociological Methods & Research, 16, 78-117. - Bollen K. A. (1989), Structural equations with latent variables, Wiley New York. - Chin W.W. (1998), The partial least squares approach to structural equation modeling, in G. A. Marcoulides (Ed.), Modern Methods for Business Research, 295–358, Mahwah, NJ: Lawrence Erlbaum Associates. - Chin W.W. et Newsted P.R. (1999), Structural equation modeling analysis with small samples using partial least squares, in Statistical strategies for small sample research ed. R.H.Hoyle, 307–342 Thousand Oaks, CA: Sage. - Croutsche J.J. (2002), Etude des relations de causalité : utilisation des modèles d’équations structurelles, La revue des sciences de gestion, 198, 81-97. - Diamantopoulos A., Siguaw J. et Siguaw J. A. (2000), Introducing LISREL: A guide for the uninitiated, Sage Publications. - Eagly A.H. et Chaiken S. (1993), The psychology of attitudes, Fort Worth, Harcourt, Brace, Jovanovich. - Eggert A. (2007), Getting your PLS research published: A personal and interpersonal perspective, Proceedings of the academy of marketing science world marketing congress, Verona, Italy. - Esposito-Vinzi V., Trinchera L. et Amato S. (2010), PLS Path Modeling: From Foundations to Recent Developments and Open Issues for Model Assessment and Improvement, in: Handbook of Partial Least Squares: Concepts, Methods and Applications, Heidelberg (Germany) : Springer, 47-82. - Esposito-Vinzi V., Trinchera L., Squillacciotti S. et Tenenhaus M. (2008), REBUS-PLS: A response-based procedure for detecting unit segments in PLS path modeling, Applied Stochastic Models in Business and Industry, 24 (5), 439‑458. - Etter J.-F., Humair J.-P., Bergman M.M. et Perneger, T.V. (2000), Development and validation of the Attitude Towards Smoking Scale (ATS-18), Addiction, 95, 4, 613-625. - Fellner B., Holler M., Kirchler E. et Schabmann A. (2007), Regulatory focus scale (rfs): development of a scale to record dispositional regulatory focus, Swiss Journal of Psychology, 66, 2, 109-116. - Fernandes V. (2012), En quoi l’approche PLS est-elle une méthode à (re)-découvrir pour les chercheurs en management? M@n@gement, 15,1, 101-123. - Fishbein M.A. et Ajzen I. (1975), Belief, attitude, intention and behavior: an introduction to theory and research, Reading, MA, Addison Wesley. - Friestad M. et Wright P. (1994), The Persuasion Knowledge Model: How People Cope with Persuasion Attempts, Journal of Consumer Research, 21 ,1, 1-31. - Gallopel-Morvan K. (2006), L'utilisation de la peur dans un contexte de marketing social : état de l'art, limites et voies de recherche, Recherche et Applications en Marketing, 21, 4, 41-59. - Girandola F. (2000), Peur et persuasion : présentations des recherches (1953-1998) et d’une nouvelle lecture, L’année psychologique, 100, 333-376. - Hair J.F., Ringle C.M. et Sarstedt M. (2011), PLS-SEM: Indeed a Silver Bullet, Journal of Marketing Theory and Practice, 19, 2, 139–151. - Hair J.F., Sarstedt M., Ringle C.M. et Mena J.A. (2012), An assessment of the use of partial least squares structural equation modeling in marketing research, Journal of the Academy of Marketing Science, 40, 414–433. - Higgins E.T., Shah J. et Friedman R. (1997), Emotional Responses to Goal Attainment: Strength of Regulatory Focus as Moderator, Journal of Personality & Social Psychology, 72 (3) 515-525. - Hoyle R.H. (1995), Structural Equation Modeling: Concepts, Issues, and Applications, ed. Sage Publications. - Jöreskog K.G. et Wold H. (1982), The ML and PLS techniques for modeling with latent variables: Historical and comparative aspects, in K.G. Jöreskog et H. Wold (coord.), Systems under indirect observation: Part I, 263-270, Amsterdam: North-Holland. - E. S. Knowles E.S. et Linn J.A. (2004)), Resistance and Persuasion, Mahwah, Erlbaum. - Lei M. et Lomax R. G. (2005), The effect of varying degrees of nonnormality in structural equation modeling, Structural Equation Modeling, 12(1), 1-27. - Petty R.E. et Cacioppo J.T. (1986), The Elaboration Likelihood Model of Persuasion, Advances in Experimental Social Psychology, 19, 123-205. - Preacher K.J. et Hayes A.F. (2004), SPSS and SAS procedures for estimating indirect effects in simple mediation models, Behavior Research Methods, Instruments, & Computer, 36, 4, 717-731. - Reinartz W., Haenlein M. et Henseler J. (2009), An empirical comparison of the efficacy of covariance-based and variance-based SEM, International Journal of Research in Marketing, 26, 332-344. - Richmond R.L, Kehoe L.A. et Webster I.W. (1993), Multivariate models for predicting abstention following intervention to stop smoking by general practitioners, Addiction, 88, 1127-1135. - Roux D. (2007), La résistance du consommateur : proposition d’un cadre d’analyse, Recherche et Applications en Marketing, 22, 4, 59-80. - Sheppard B.H., Hartwick J. et Warshaw P.R. (1988), The theory of reasoned action: A meta-analysis of past research with recommendations for modifications and future research, Journal of Consumer Research, 15, 3, 325-343. - Tenenhaus M., Esposito-Vinzi V., Chatelin Y.M. et Lauro C. (2005), PLS path modeling, Computational Statistics and Data Analysis, 48, 1, 159–205. - Tenenhaus M. et Esposito-Vinzi V. (2005), PLS Regression, PLS Path Modeling and Generalized Procrustean Analysis: A Combined Approach for Multiblock Analysis, Journal of Chemometrics, 19, 145‑153. - Trinchera L. (2007), Unobserved Heterogeneity in Structural Equation Models: a new approach in latent class detection in PLS Path Modeling, Thèse de doctorat, Département de mathématiques et de statistiques, Université de Naples Federico II. - Valette-Florence P (1993), Dix Années de Modèles d'Equations Structurelles: un Etat de l'Art, Actes du 20ème Séminaire International de Recherche en Marketing, La Londe des maures, juin, 423-442. - Valette-Florence P. (1998), Apports des analyses hiérarchiques multiniveaux et des modèles de mélange aux techniques de modélisation selon les équation structurelles vers une troisième génération d'analyse multivariée, Actes du 14ème congrès de l'Association Française de Marketing, mai, Bordeaux, pp. 695-712. - Vilares M., Almeida M. et Coelho P. (2007), Sample size effect on the comparison of likelihood and PLS estimators for structural equation modeling: a simulation with customer satisfaction data, Proceedings of PLS’07 International Symposium, Aas, Norvège, 39-41. - Wold H. (1982), Soft Modeling: Intermediate between Traditional Model Building and Data Analysis, Mathematical Statistics, 6, 333-346.