rapport du projet - Laboratoire d`Informatique Fondamentale de Lille

2010/2011
Génie Logiciel des Interactions
Homme-Machine
Germain Costenobel – Pierre Barois
[
PROJET TEXT TO
SPEECH]
Visualisation des possibilités et des applications existantes pour l’API Text
-
To
-
Speech
disponible sous Google Android.
Génie Logiciel des Interactions Homme-Machine | Projet TTS
Germain Costenobel – Pierre Barois 2010/2011 1
Génie Logiciel des Interactions Homme-Machine | Projet TTS
Germain Costenobel – Pierre Barois 2010/2011 2
Table des matières
Introduction ................................................................................................................................ 3
I.
Contexte d’analyse ............................................................................................................. 4
1.
Périmètre et méthodes de recherche ................................................................................ 4
2.
Particularités de Développement ..................................................................................... 4
a)
Présentation d’Android ............................................................................................ 4
b)
Le SDK Android ...................................................................................................... 5
c)
Modèle de développement d’une application .......................................................... 6
3.
Etude préalable ................................................................................................................ 7
a)
API TTS pour Android ............................................................................................ 7
b)
La reconnaissance vocale ....................................................................................... 14
c)
Les synthétiseurs vocaux ....................................................................................... 15
II.
Mise en œuvre .................................................................................................................. 18
1.
Entrée en matière ........................................................................................................... 18
a)
Elaboration de l’application ................................................................................... 18
b)
Apports de ce test ................................................................................................... 22
2.
Reconnaissance vocale personnalisée ........................................................................... 23
a)
Résolution créative du problème............................................................................ 23
b)
Etude de faisabilité technique ................................................................................ 23
3.
Application en contexte réel .......................................................................................... 24
a)
Principe .................................................................................................................. 25
b)
Elaboration de l’application ................................................................................... 26
c)
Actions possibles ................................................................................................... 27
III.
Bilan .............................................................................................................................. 28
1.
Extensions possibles ...................................................................................................... 28
2.
Limites des interactions vocales sur mobile .................................................................. 29
3.
Avis personnels ............................................................................................................. 30
Annexes .................................................................................................................................... 33
Références ................................................................................................................................ 64
Génie Logiciel des Interactions Homme-Machine | Projet TTS
Germain Costenobel – Pierre Barois 2010/2011 3
Introduction
Nos téléphones mobiles sont aujourd’hui bien plus que des appareils nous permettant
d’effectuer des appels. En effet, les mobiles d’aujourd’hui sont désormais devenus de
véritables outils multimédia permettant d’accéder à tous les modes de la communication.
Agenda, calendrier, navigation Web, consultation de courriers électroniques,
messagerie instantanée, GPS, connexion aux réseaux sans fil … sont autant de fonctionnalités
disponibles sur nos téléphones qui les ont ainsi transformés en assistants personnels (PDA)
puis, aujourd’hui, en Smartphones.
Nous sommes donc désormais entrés dans le monde du tout connecté mobiles,
ordinateurs, voitures, et autres objets de la vie courante savent échanger et s’organiser pour
faciliter la vie de leur utilisateur.
L’informatique ubiquitaire est un terme qui acquiert de plus en plus de sens chaque
jour mais il reste de nombreuses améliorations à mettre en œuvre, notamment au niveau de
l’interaction.
Le Smartphone représente à nos yeux un point d’entrée prépondérant pour accéder à
cet univers. C’est pourquoi nous avons décidé d’étudier les moyens disponibles pour
améliorer l’échange d’informations entre l’homme et son mobile et plus précisément les outils
existants permettant une interaction vocale, l’une des méthodes de communication les plus
naturelles (ou tout au moins culturelles) pour l’homme.
Pour mener cette analyse, nous avons choisi de nous baser sur l’un des systèmes
d’exploitation les plus répandus sur nos mobiles, Google Android dans sa version 2.2,
disposant nativement de fonctionnalités permettant l’interaction vocale.
Génie Logiciel des Interactions Homme-Machine | Projet TTS
Germain Costenobel – Pierre Barois 2010/2011 4
I. Contexte d’analyse
1. Périmètre et méthodes de recherche
Notre sujet, nommé TTS, a donc pour but d’explorer les possibilités offertes en
matière de synthèse vocale sur le système Android 2.2 pour Smartphone.
Plus que la simple analyse de la librairie TTS fournie par Google qui permet de mettre
en œuvre la synthèse vocale, notre étude porte, comme nous l’avons exprimé précédemment,
sur l’amélioration des Interactions Homme-Machine à travers la voix.
Le concept même d’interaction implique la possibilité pour deux parties d’échanger. Il fallait
donc ajouter à notre analyse celle de la reconnaissance vocale.
Les termes de notre étude étant définis, nous avons décidé de commencer par le
recensement des outils déjà existants pour Smartphone Android. Ceci constitue d’ailleurs
notre partie intitulée étude préalable. Dans un second temps, nous avons élaboré une première
application afin de mettre en œuvre certains des outils recensés, ceux nous paraissant les plus
aboutis. Ainsi, cette mise en pratique nous a permis d’en relever les limites et de nous tourner
vers des outils moins restreints, notamment dans la tentative d’élaboration d’une
reconnaissance vocale personnalisée. Enfin, nous avons choisi de créer une application
permettant de tirer parti de tous les aspects de l’interaction vocale et ce, dans un contexte réel.
2. Particularités de Développement
Même si le fonctionnement d’Android et sa mise en œuvre ne sont pas les sujets
principaux de notre étude, il est cependant nécessaire d’aborder quelques-unes de leurs
spécificités, notamment celles ayant trait à l’utilisation des librairies de synthèse et de
reconnaissance vocale ainsi qu’à l’élaboration d’une application compatible Android.
a) Présentation d’Android
Android est un système d’exploitation open Source, il est donc gratuit et librement
modifiable, ce qui explique d’ailleurs le nombre de mobiles qui l’utilise et ce
indépendamment de leur fabricant. Cet aspect lui permet également d’être présent sur d’autres
supports comme les tablettes et même bientôt sur certains téléviseurs. Ceci peut d’ailleurs
constituer une opportunité de se détacher du seul cadre du téléphone mobile…
1 / 66 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !