Approches d’analyse des données issues des médias sociaux appliquées au domaine de la
santé
par
Ulrick Serge Mba Engonga
Essai présenté au CeFTI
en vue de l’obtention du grade de maître en technologies de l’information
(Maîtrise en génie logiciel incluant un cheminement de type cours en technologies de
l’information)
FACULTÉ DES SCIENCES
UNIVERSITÉ DE SHERBROOKE
Longueuil, Québec, Canada, octobre 2015
iii
Sommaire
En 2014, une étude, NETendances 2014, réalisée par le CEFRIO et intitulée « Les médias
sociaux, au cœur du quotidien des québécois Usage du Web, médias sociaux et mobilité
1
»
montre qu’au cours des dernières années, les médias sociaux se sont démocratisés pour prendre
aujourd’hui une place proéminente sur le Web; cette étude note que plus de huit internautes
québécois sur dix (85,0 %) utilisent les médias sociaux pour consulter du contenu, se connecter
à leur compte, relayer ou partager du contenu, interagir avec d’autres ou créer du contenu. Cette
proportion représente 71,7 % des adultes québécois. Cela montre un intérêt majeur des médias
sociaux dans notre société. En parallèle, plusieurs enquêtes alisées aux États-Unis et au
Canada signalent depuis quelques années que les médias sociaux, notamment les blogs,
forums, tels que Twitter et les sites de réseautage en ligne comme Facebook, sont de plus en
plus utilisés par les individus pour obtenir toute sorte d’information, notamment sur la santé.
Plusieurs organismes ont un site web et des comptes sur les principaux médias sociaux. Ils
démontrent par un intérêt pour les nouvelles technologies de l’information en général et les
médias sociaux en particulier. Leur objectif principal est de contrôler leur image, d’améliorer
leur communication en s’adressant directement à leur public cible. Toutefois, peu ont
véritablement compris et saisi l’énorme avantage que peut représenter l’analyse et le traitement
des données issus des conversations sur les médias sociaux pour atteindre, voire améliorer leurs
objectifs. Cela est d’autant plus vrai dans le domaine de la santé publique; plusieurs grands
hôpitaux et organismes en santé et soins médicaux ont une forte présence sur les médias sociaux
et sont suivis par beaucoup d’utilisateurs qui s’intéressent et commentent l’actualité et autres
sujets qui se réfèrent à ces grands hôpitaux. Il n’en demeure pas moins que les données générées
par ces personnes et l’opinion qu’elles expriment via les médias sociaux ne sont pas encore très
1
http://www.cefrio.qc.ca/netendances/medias-sociaux-coeur-quebecois/
iv
prises en compte, comme cela se fait déjà dans les domaines comme le commerce électronique
ou la politique. Or, avec les médias sociaux, les patients sont de plus en plus informés et engagés
dans leur choix sur les organismes qui prendront en charge de leurs soins de santé. Étant donné
que les patients sont des acteurs au cœur même de la prestation des soins de santé, leurs
conversations et les données qu’ils produisent sont un indicateur important pour mesurer
l’opinion sur la qualité des soins; les données générées sont aussi une mine d’or pouvant aider
à améliorer leur image et obtenir des précieuses informations décisionnelles.
Jusqu’à présent, les systèmes d’information développés pour les organismes répondaient au
besoin de traitement des données internes. En ouvrant leurs portes aux plates-formes de médias
sociaux, des questions se lèvent sur comment les organismes en santé peuvent traiter ces
données externes pour en tirer de la valeur. Cette essai a donc pour objectif de voir quelles sont
les « approches d’analyse et de traitement des de données issues des médias sociaux dans le
domaine de la santé ».
Cet essai se concentre sur les méthodes et techniques pour extraire, analyser et classifier les
données issues médias sociaux. Ces données sont générées par des personnes qui s’expriment
au sujet des principaux établissements en santé au Québec. La méthodologie de recherche
appliquée cherche à collecter les données issues du réseau social Twitter, pour trois grands
hôpitaux : Le CHUM, le CHU Ste-Justine et l’Hôpital Montréal pour enfants. Une fois
collectées, ces données sont analysées à l’aide trois types d’analyses : l’analyse de sentiments,
l’analyse de l’influence et l’analyse du volume. Les résultats ont permis de démontrer que les
non seulement les réseaux sociaux sont utilisés comme source d’information, mais aussi que les
données issues de ces réseaux peuvent être exploitées pour obtenir des indicateurs clés pouvant
être utiles à une meilleure prise de décision de la part des exécutifs au sein des organismes en
soins de santé au Québec.
v
Remerciements
Dans le cadre de cet essai, je tiens à remercier mon directeur académique M. Pierre-Martin
Tardif et Mme Lynn Legault de m’avoir guidé et conseillé dans les choix à faire pour mener à
bien ce travail.
Je veux aussi remercier M. Claude Cardinal, Directeur adjoint au Centre de formation en
technologies de l’information (CeFTI). Merci pour votre dévouement et votre disponibilité tout
au long de ce cursus de Maîtrise en génie logiciel à l’Université Sherbrooke.
Enfin, je veux remercier spécialement, ma femme Rita que j’aime tant, mon fils David ainsi que
tous mes proches. Merci pour votre soutien et vos prières durant ces moments d’absences et de
dur labeur.
1 / 107 100%