UNIVERSITE DE DROIT, D’ECONOMIE ET DES SCIENCES D’AIX-MARSEILLE
(AIX-MARSEILLE III)
N° attribué par la bibliothèque
00AIX30046
MISE EN PLACE DUNE METHODOLOGIE DANALYSE
AUTOMATIQUE DE LINFORMATION TEXTUELLE
SANS DEPENDANCE DE LA LANGUE
POUR LA VEILLE TECHNOLOGIQUE
THESE
pour obtenir le grade de :
DOCTEUR EN SCIENCES
Discipline : Sciences de l’information et de la Communication
présentée et soutenue publiquement
par
Badreddine ROUDANI
le 23 juin 2000
Membre du Jury :
M. C.PAOLI (professeur) rapporteur.
M. J. GINESTIE (maître de conférence) rapporteur
M. M. BENJELLOUN (professeur) examinateur
M. L. QUONIAM (professeur) directeur de thèse
M. E. GIRAUD (maître de conférence) codirecteur de thèse
Remerciements
Je voudrais remercier profondément mon directeur de thèse
Monsieur Luc Quoniam pour son aide, ses conseils et ses
orientations fondamentales tout au long l’avancement de cette
thèse.
Je tiens aussi à remercier Monsieur Henri Dou, Directeur du Centre
de Recherches Rétrospectives de Marseille (CRRM) pour son
accueil dans son laboratoire, son enseignement et ses conseils.
Mes remerciements s’adressent également à tous ceux qui, au sein
du CRRM, ont participé d’une façon ou d’une autre à la
concrétisation de ce mémoire.
J’exprime ma plus profonde gratitude à mes parents pour le soutien
qu’ils m’ont apporté durant de nombreuses années.
Enfin, pour avoir vécu avec moi cette aventure et m’avoir soutenu
moralement et matériellement, je remercie mon épouse Zahra.
à mes enfants alaedine et Anass…
RESUME : Cette thèse aborde le thème d’exploitation automatique de l’information textuelle
dans un processus de veille technologique.
La première partie de ce mémoire présente les diverses facettes de la veille technologique, à
savoir sa matière première et ses caractéristiques, son schéma méthodologique ainsi que les
outils sur lesquels elle s’appuie.
La seconde partie constitue l’état de l’art, sur lequel est fondée notre étude, pour la mise en
place d’une méthodologie d’analyse automatique de l’information textuelle, sans dépendance
de la langue. Dans cette partie, nous exposerons, dans un premier temps, les différentes
techniques d’analyse de données bibliographiques (bibliométrie, scientométrie, infométrie).
Ensuite, nous décrivons les différentes approches de lemmatisation et d’extraction
terminologique.
La troisième partie présente notre contribution à la mise en place d’un système informatique
modulaire d’analyse automatique de l’information textuelle sans dépendance de la langue. Les
modules conçus puis développés concernent les opérations de lemmatisation, d’extraction
terminologique et de classement automatique des documents. Les approches employées
dispensent surtout de la construction de grammaires génériques et spécifiques pour être
indépendantes de la langue, et des référentiels de base pour éviter le problème de la non-
exhaustivité des dictionnaires dans un domaine précis.
Mots Clés : Veille technologique / information scientifique et technique / Méthodes d’analyse
/ Lemmatisation / Extraction terminologique / Classement automatique des documents /
reconnaissance du vocabulaire spécifique
Abstract : This Thesis broaches the theme of automatic exploitation of the textual
information in Competitive Technical Intelligence.
The first part of this thesis presents the various facets of Competitive Technical Intelligence,
to know its first matter and its characteristics, its methodological diagram as well as the tools
on which it leans.
The second part constitutes the state of the art, on which is founded our study, for the
implementation of an automatic analysis methodology of the textual information, without
dependence of the language. In this part, we will expose, in a first time, the different
techniques of bibliographic data analysis (bibliométrie, scientométrie, infométrie). Then, we
describe the different approaches of lemmatisation and terminological extraction.
The third part presents our contribution to the implementation of a modular computer system
of automatic analyse of the textual information without dependence of the language. The
modules conceived then developed concern the operations of lemmatisation, terminological
extraction and automatic classification of documents. The used approaches especially
dispense the generic and specific grammar construction to be independent of the language,
and of the referential of basis to avoid the problem of the dictionary no-exhaustiveness in a
precise domain.
Key words: Competitive Technical Intelligence / Scientific and Technique Information /
Methods of Analysis / Lemmatisation / Terminological Extraction / Automatic Classification
of Documents / Recognition of The Specific Vocabulary
SOMMAIRE
INTRODUCTION……………………………………………………………………………..6
CHAPITRE I.............................................................................................................................9
I. 1. Introduction....................................................................................................................................................................10
I. 2. Le concept de la veille technologique............................................................................................................11
I. 2.1. Définition de la veille technologique......................................................................................................11
I. 2.2. Evolution de la veille technologique......................................................................................................13
I. 3. Nécessité de la veille technologique...............................................................................................................16
I. 3.1. L’innovation................................................................................................................................................16
I. 3.2. La propriété industrielle ..............................................................................................................................1
I. 3.3. L’évolution technologique.........................................................................................................................2
I. 3.4. Les clients......................................................................................................................................................3
I. 3.5. La concurrence..............................................................................................................................................3
I. 3.6. La croissance de l’information...................................................................................................................3
I. 4. L’information industrielle et ses caractéristiques.......................................................................................5
I. 4.1. Définition de l’information.........................................................................................................................5
I. 4.2. La typologie de l’information....................................................................................................................5
I. 4.3. La circulation de l’information................................................................................................................11
I. 4.4. Le rôle de l’information............................................................................................................................12
I. 4.5. Les sources d’information........................................................................................................................12
I. 4. methodologie de la veille technologique.......................................................................................................21
I. 4.1. Schéma structurel de la veille technologique........................................................................................21
I. 4.2. Schéma fonctionnel de la veille technologique....................................................................................24
I. 6. conclusion.............................................................................................................................................................30
I. 7. Références bibliographiques...........................................................................................................................31
CHAPITRE II :........................................................................................................................35
II. 1. Introduction.......................................................................................................................................................36
II. 2. analyse de données bibliographiques..........................................................................................................37
II. 2.1. Définitions......................................................................................................................................................37
II. 2.2. Méthodologie générale.................................................................................................................................38
II. 3. analyse statistique des données textuelles .................................................................................................45
II. 3.1. Définitions......................................................................................................................................................45
II. 3.2. Méthodologie générale.................................................................................................................................45
II. 4. Conclusion..........................................................................................................................................................60
II. 5. Références bibliographiques.........................................................................................................................62
1 / 178 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !