2. L’interaction multimodale pour la communication alternative
Nous définissons un média comme étant un dispositif servant de support à l’information, et
une modalité comme une technique d’interaction (cf. [Nigay96]). L'interaction multimodale
se fonde sur l'utilisation simultanée de plusieurs modes de communication de l'usager et/ou du
système. Par exemple, une réponse verbale accompagné de l’affichage d’un pictogramme est
un message multimodal ayant nécessité en amont un travail d’interprétation intermodale
généralement nommée fission ou génération multimodale en sortie (resp. de fusion ou de
résolution intermodale en entrée). Il s’agit donc de prendre en compte les contraintes
spécifiques à la multimodalité : mise en relation des médias d’entrée et les autres composants
logiciels, fusion des médias en entrée, fission de l’information en sortie, etc. Dans notre cas,
la multimodalité se restreint en entrée à une interaction de type alternée (il y a fusion mais les
modalités doivent être utilisées en séquence) voire exclusive (absence de fusion et usage en
séquence des modalités) plutôt qu’une interaction multimodale synergique (implique fusion et
usage simultanés de plusieurs modalités).
Dans un système multimodal, une phase de décision concernant la présentation du message
rendu à l’utilisateur est nécessaire : dans le cas de notre plateforme une présentation sous
forme orale, visuelle ou combinée. Il s’agit alors de définir les combinaisons selon que le
contexte et/ou le profil de l’utilisateur nécessite une information complémentaire ou
redondante. Par exemple, la complémentarité est satisfaite lorsque pour un acte d'interaction,
chaque mode utilisé est strictement nécessaire à la constitution du message d’entrée. Il y a
équivalence pour un acte lorsque l'utilisateur choisit indifféremment tel ou tel mode. Le
système doit ainsi répondre à un certain nombre de contraintes :
Adaptabilité du système à l’utilisateur : En fonction du profil de l’utilisateur ou du
contexte d’utilisation, adaptabilité à plusieurs niveaux de granularité:
- choix des modes et de leurs combinaisons durant une tâche,
- paramétrage des périphériques utilisés en fonction du profil de l’utilisateur :
vitesse de sélection du clic automatique, vitesse de défilement visualisé à
l’écran, type de la voix de synthèse, taille des caractères, nombre de
propositions affichées
Cohérence entre les modes : La cohérence est un des éléments clef dans la conception
d’une interface multimodale, pour lesquelles le pouvoir de confusion est accru.
Comme le montrent [McNeill92] et [Oviatt97], le souci d’une interface multimodale
est la cohérence et la consistance à travers les modes. Les messages exprimés doivent
être cohérents d’un mode à l’autre. Par exemple, la génération redondante impose le
choix d’une phraséologie identique (la même réalisation lexicale entre texte écrit et
texte vocalisé).
3. Elaboration de la communication
L'aide à la communication exploite les possibilités de contrôle décrites précédemment et
s'appuie sur des techniques de prédiction permettant de minimiser le nombre d'interactions.
Par ailleurs, les situations de communication peuvent varier en fonction de leur objectif et de
leur contexte. Certaines situations sont en effet très stéréotypées et il n'est pas toujours
nécessaire de composer des phrases complètes (repas, toilettes, visites médicales, etc.). Si la
communication verbale écrite est indiquée voire préférable dans les situations où le temps de