
des répondants et réduisent les coûts de collecte et de
traitement des données. Le seul argument théorique
(vs empirique) en faveur de l’utilisation de mesures
mono-item a été proposé par Rossiter (2002) dans sa
procédure C-OAR-SE de développement d’échelle.
Rossiter avance qu’une mesure mono-item est suffi-
sante si le construit est, dans l’esprit des évaluateurs
(par exemple les répondants d’une enquête), tel que
(1) l’objet du construit est « singulier et concret », ce
qui signifie qu’il s’agit d’un objet pouvant être facile-
ment et uniformément imaginé, et (2) l’attribut du
construit est « concret », ce qui signifie également
qu’il peut être facilement et uniformément imaginé.
Dans les deux cas, « facilement et uniformément
imaginé » est un critère pris de la « théorie de
l’image » de Wittgenstein (1961). D’après des juge-
ments d’experts basés sur la procédure C-OAR-SE,
APub (ou APPub) et AMarq sont tous les deux de tels
construits.
Un argument empirique pour l’utilisation d’un
item unique peut être donné pour les mesures dans
lesquelles les multiples items représentant l’attribut
(dans la partie réponse de l’item) sont synonymes ou
ont pour but d’être synonymes (plus précisément,
quand ils sont des adjectifs synonymes). Un exemple
extrême est la mesure très connue de l’implication
personnelle de Zaichkowsky (1985) (qui, comme
construit, se réfère à l’implication personnelle envers
un objet, tel qu’une catégorie de produit ou une
publicité). Cette mesure utilise 20 paires bipolaires
d’adjectifs synonymes pour mesurer l’attribut de
« l’implication ». Deux autres exemples sont l’attri-
but « attitude » des construits APub et AMarq tels
qu’ils sont mesurés dans la recherche académique.
Sur la base d’une étude antérieure de Stuart, Shimp
et Engle (1987), Allen (2004) utilise huit paires d’ad-
jectifs synonymes pour mesurer APub. C’est un
nombre d’items exceptionnellement grand, il est plus
fréquent dans la recherche d’utiliser trois ou quatre
items synonymes pour mesurer APub ou AMarq car
c’est un nombre suffisant pour atteindre un coeffi-
cient alpha élevé. L’argument empirique en faveur de
l’utilisation d’un item unique dans de telles mesures
est apparu parce que Drolet et Morrison (2001) ont
trouvé que l’accroissement du nombre d’items syno-
nymes produit un problème fréquent : plus le nombre
d’items synonymes que le chercheur cherche à générer
est grand, plus il y a de chances d’inclure des items qui
ne sont pas de parfaits synonymes de l’attribut des-
criptif original. De plus, ceux qui ne sont pas syno-
nymes ont peu de chances d’être détectés. Drolet et
Morrison trouvent que, quand le nombre total
d’items augmente, les répondants sont plus enclins à
répondre de la même façon à un item qui ne serait
pas équivalent (non synonyme, et donc sans validité de
contenu) qu’aux autres items de l’échelle. Drolet et
Morrison incluent « non-familier/familier » comme
item non équivalent dans la batterie des items mesurant
APub et trouvent que la différence moyenne absolue
entre les notations des items équivalents et non-
équivalents diminue quand le nombre d’items est
augmenté de deux items à cinq puis à dix items (l’un
d’entre eux étant l’item non équivalent). La diffé-
rence moyenne entre le premier item et l’item non
équivalent diminue d’approximativement 20 % en
passant de deux items à cinq items et d’approximati-
vement 38 % en passant de deux items à dix items.
Ces résultats montrent que l’addition de nombreux
bons items cache la présence de mauvais items. Si les
mauvais items sont corrélés positivement aux bons
items, le coefficient alpha augmente, ce qui dissuade
généralement les chercheurs de rechercher les mau-
vais items. Paradoxalement, les mauvais items pour-
raient augmenter la validité prédictive d’une mesure
multi-items si la variation des scores des nouveaux
items est corrélée à la variation des scores de la
variable dépendante, ce qui est probable si le mau-
vais item est aussi une autre variable prédictive de la
variable dépendante. De plus, Drolet et Morrison
appliquent la technique de prévisions d’experts pour
estimer mathématiquement la valeur information-
nelle des items additionnels dans une échelle (voir
aussi Morrison et Schmittlein, 1991). En utilisant
l’hypothèse des erreurs modérément corrélées, ils
montrent que les items additionnels apportent peu
d’information ; deux items ayant une corrélation des
erreurs de 0,60 apportent l’équivalent de 1,25 item
indépendant, et une infinité d’items corrélés à 0,60
apportent autant d’information que 1,67 item indé-
pendant. Ils concluent qu’un ou deux bons items peu-
vent surpasser une échelle composée de multiples
items, si ces multiples items ont une corrélation
modérée ou forte de leurs erreurs, ce qui est probable
s’ils sont présentés ensemble. L’argument de Drolet
et Morrison est entièrement mathématique, ils ne tes-
tent pas empiriquement la valeur informationnelle
additionnelle des items d’un questionnaire. (Dans la
Lars Bergkvist, John R. Rossiter
84
05•Bergkvist-Rossiter 13/03/08 11:07 Page 84