Chapitre IV – Réglage du σ à l'aide des variances des données ................................................... 49
IV.1. Introduction .......................................................................................................................... 49
IV.2. Implémentation .................................................................................................................... 49
IV.3. Résultats ............................................................................................................................... 50
IV.4. Discussion ............................................................................................................................ 52
Chapitre V – Réglage du σ à l'aide d'une méthode de régression ............................................... 53
V.1. Introduction ........................................................................................................................... 53
V.2. Implémentation ...................................................................................................................... 53
V.3. Résultats ................................................................................................................................ 59
V.4. Discussion .............................................................................................................................. 64
Chapitre VI - Interprétation des résultats .................................................................................... 65
Conclusion ........................................................................................................................................ 67
Annexe : Développement du projet sous Matlab .......................................................................... 68
Annexe : Structure des résultats .................................................................................................... 98
Annexe : Mode d'emploi ................................................................................................................. 99
Références Bibliographiques ........................................................................................................ 101
Introduction
Les expériences et les enseignements de ce stage appartiennent au domaine de la statistique
décisionnelle ou apprentissage statistique. C'est une partie de la statistique dont la finalité est de
prendre des décisions. A partir de bases de données, on prédit la valeur de variables non observées.
On parle plutôt 'd'apprentissage' statistique. En effet, la statistique décisionnelle est d'un intérêt
majeur pour les recherches et développements en intelligence artificielle. Elle permet la
reproduction d'un apprentissage humain par un apprentissage artificiel. L'apprentissage statistique
comporte de nombreux algorithmes et voies d'apprentissage dont certaines seront vues dans ce
rapport.
Il est important d'introduire également le 'data mining' (fouille de données) qui serait l'un des
dix grands enjeux du XXIe siècle selon la revue scientifique MIT Technological. Il s'agit d'une
application de l'apprentissage statistique. Sa vocation est d'exploiter des bases de données afin d'en
extraire des connaissances à usages professionnels. Les bases de données des entreprises
comportent un général un très grand nombre de données. A la différence de l'apprentissage
statistique, aucune hypothèse n'est faite sur les données. Ainsi, le logiciel de data mining doit
déterminer lui même les corrélations et caractéristiques intéressantes des données qu'il explore.
Le stage, et ses objectifs se situent à la fois dans ces deux domaines. En effet, il concerne
l'apprentissage actif, une voie d'apprentissage statistique que l'on veut munir d'algorithmes
d'apprentissages en les évaluant sur un grand nombre de données. L'apprentissage actif a été
formalisé en 1992 par des chercheurs américains. Il consiste à déterminer les données les plus
instructives pour l'apprentissage. Dans un premier temps, nous verrons l'apprentissage actif, le