X - on the Quoniam.info website

Téléchargement

UNIVERSITE DE DROIT, D’ECONOMIE ET DES SCIENCES D’AIX-MARSEILLE

(AIX-MARSEILLE III)

N° attribué par la bibliothèque

00AIX30046

MISE EN PLACE D’UNE METHODOLOGIE D’ANALYSE

AUTOMATIQUE DE L’INFORMATION TEXTUELLE

SANS DEPENDANCE DE LA LANGUE

POUR LA VEILLE TECHNOLOGIQUE

THESE

pour obtenir le grade de :

DOCTEUR EN SCIENCES

Discipline : Sciences de l’information et de la Communication

présentée et soutenue publiquement

par

Badreddine ROUDANI

le 23 juin 2000

Membre du Jury :

M. C.PAOLI (professeur) rapporteur.

M. J. GINESTIE (maître de conférence) rapporteur

M. M. BENJELLOUN (professeur) examinateur

M. L. QUONIAM (professeur) directeur de thèse

M. E. GIRAUD (maître de conférence) codirecteur de thèse

Remerciements

Je voudrais remercier profondément mon directeur de thèse

Monsieur Luc Quoniam pour son aide, ses conseils et ses

orientations fondamentales tout au long l’avancement de cette

thèse.

Je tiens aussi à remercier Monsieur Henri Dou, Directeur du Centre

de Recherches Rétrospectives de Marseille (CRRM) pour son

accueil dans son laboratoire, son enseignement et ses conseils.

Mes remerciements s’adressent également à tous ceux qui, au sein

du CRRM, ont participé d’une façon ou d’une autre à la

concrétisation de ce mémoire.

J’exprime ma plus profonde gratitude à mes parents pour le soutien

qu’ils m’ont apporté durant de nombreuses années.

Enfin, pour avoir vécu avec moi cette aventure et m’avoir soutenu

moralement et matériellement, je remercie mon épouse Zahra.

à mes enfants alaedine et Anass…

RESUME : Cette thèse aborde le thème d’exploitation automatique de l’information textuelle

dans un processus de veille technologique.

La première partie de ce mémoire présente les diverses facettes de la veille technologique, à

savoir sa matière première et ses caractéristiques, son schéma méthodologique ainsi que les

outils sur lesquels elle s’appuie.

La seconde partie constitue l’état de l’art, sur lequel est fondée notre étude, pour la mise en

place d’une méthodologie d’analyse automatique de l’information textuelle, sans dépendance

de la langue. Dans cette partie, nous exposerons, dans un premier temps, les différentes

techniques d’analyse de données bibliographiques (bibliométrie, scientométrie, infométrie).

Ensuite, nous décrivons les différentes approches de lemmatisation et d’extraction

terminologique.

La troisième partie présente notre contribution à la mise en place d’un système informatique

modulaire d’analyse automatique de l’information textuelle sans dépendance de la langue. Les

modules conçus puis développés concernent les opérations de lemmatisation, d’extraction

terminologique et de classement automatique des documents. Les approches employées

dispensent surtout de la construction de grammaires génériques et spécifiques pour être

indépendantes de la langue, et des référentiels de base pour éviter le problème de la non-

exhaustivité des dictionnaires dans un domaine précis.

Mots Clés : Veille technologique / information scientifique et technique / Méthodes d’analyse

/ Lemmatisation / Extraction terminologique / Classement automatique des documents /

reconnaissance du vocabulaire spécifique

Abstract : This Thesis broaches the theme of automatic exploitation of the textual

information in Competitive Technical Intelligence.

The first part of this thesis presents the various facets of Competitive Technical Intelligence,

to know its first matter and its characteristics, its methodological diagram as well as the tools

on which it leans.

The second part constitutes the state of the art, on which is founded our study, for the

implementation of an automatic analysis methodology of the textual information, without

dependence of the language. In this part, we will expose, in a first time, the different

techniques of bibliographic data analysis (bibliométrie, scientométrie, infométrie). Then, we

describe the different approaches of lemmatisation and terminological extraction.

The third part presents our contribution to the implementation of a modular computer system

of automatic analyse of the textual information without dependence of the language. The

modules conceived then developed concern the operations of lemmatisation, terminological

extraction and automatic classification of documents. The used approaches especially

dispense the generic and specific grammar construction to be independent of the language,

and of the referential of basis to avoid the problem of the dictionary no-exhaustiveness in a

precise domain.

Key words: Competitive Technical Intelligence / Scientific and Technique Information /

Methods of Analysis / Lemmatisation / Terminological Extraction / Automatic Classification

of Documents / Recognition of The Specific Vocabulary

SOMMAIRE

INTRODUCTION……………………………………………………………………………..6

CHAPITRE I.............................................................................................................................9

I. 1. Introduction....................................................................................................................................................................10

I. 2. Le concept de la veille technologique............................................................................................................11

I. 2.1. Définition de la veille technologique......................................................................................................11

I. 2.2. Evolution de la veille technologique......................................................................................................13

I. 3. Nécessité de la veille technologique...............................................................................................................16

I. 3.1. L’innovation................................................................................................................................................16

I. 3.2. La propriété industrielle ..............................................................................................................................1

I. 3.3. L’évolution technologique.........................................................................................................................2

I. 3.4. Les clients......................................................................................................................................................3

I. 3.5. La concurrence..............................................................................................................................................3

I. 3.6. La croissance de l’information...................................................................................................................3

I. 4. L’information industrielle et ses caractéristiques.......................................................................................5

I. 4.1. Définition de l’information.........................................................................................................................5

I. 4.2. La typologie de l’information....................................................................................................................5

I. 4.3. La circulation de l’information................................................................................................................11

I. 4.4. Le rôle de l’information............................................................................................................................12

I. 4.5. Les sources d’information........................................................................................................................12

I. 4. methodologie de la veille technologique.......................................................................................................21

I. 4.1. Schéma structurel de la veille technologique........................................................................................21

I. 4.2. Schéma fonctionnel de la veille technologique....................................................................................24

I. 6. conclusion.............................................................................................................................................................30

I. 7. Références bibliographiques...........................................................................................................................31

CHAPITRE II :........................................................................................................................35

II. 1. Introduction.......................................................................................................................................................36

II. 2. analyse de données bibliographiques..........................................................................................................37

II. 2.1. Définitions......................................................................................................................................................37

II. 2.2. Méthodologie générale.................................................................................................................................38

II. 3. analyse statistique des données textuelles .................................................................................................45

II. 3.1. Définitions......................................................................................................................................................45

II. 3.2. Méthodologie générale.................................................................................................................................45

II. 4. Conclusion..........................................................................................................................................................60

II. 5. Références bibliographiques.........................................................................................................................62

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

1 / 178 100%

Documents connexes

Le système d`information

Fais approuver cette feuille par ton enseignant avant d`entreprendre

NOURRlR SA VIE / L`IMMUNITE COM::PRENDREPOUR AGIR

Réferences et examples de transmission sans fil de signaux

Dissection du rat

Semaine

Roch CASSANAS: ”Reduction quantique et symetries”

synthese du poste a pourvoir

Document - Roger Durand

télécharger

Fra_3 le 13 octobre 2015 Nous avons traduit en finnois le texte de l

Devoirs de la semaine classe 8pp22

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

X - on the Quoniam.info website

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

X - on the Quoniam.info website

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib