Estimation par combinaison d`estimateurs

publicité
sujet proposé par Fréderic Lavancier et Paul Rochet
Laboratoire de mathématiques Jean-Leray, Nantes
"Estimation par combinaison d'estimateurs"
Ce projet de thèse concerne le mélange d'estimateurs d'une densité dans un modèle
d'échantillonnage.
L'objectif sur trois ans est de développer un cadre théorique pour le mélange d'estimateurs sans
"sample splitting" et une méthode automatique d'estimation la plus performante possible en
pratique. L'efficacité des méthodes à noyaux pour estimer une densité repose essentiellement
sur le calibrage de la fenêtre, qui est est une question difficile, toujours d'actualité dans la
recherche en Statistique.
Plusieurs méthodes pour choisir la fenêtre existent dans la littérature sans qu'aucune ne soit
objectivement meilleure que les autres. Une alternative consiste à mélanger linéairement
plusieurs estimateurs obtenus à partir de différentes fenêtres. La performance de cet estimateur
dépend alors des poids attribués à chaque estimateur initial. Les poids optimaux théoriques ont
une expression simple en fonction de la matrice d'erreur quadratique intégrée (MISE en anglais)
des estimateurs, qui est inconnue en pratique mais peut être estimée. Deux approches
principales sont possibles pour estimer la MISE: le bootstrap ou une approximation asymptotique.
Dans chaque cas, les propriétés de l'estimateur (vitesse de convergence, erreur quadratique) ne
sont pas connues en théorie mais ont donné des résultats très encourageants en simulation,
faisant beaucoup mieux que chacun des estimateurs initiaux et que les méthodes existantes
d'agrégation. La confirmation et la justification théorique de ces observations occuperont une
première partie de la thèse, tandis que la suite pourra être consacrée au cas particulier où le
nombre d'estimateurs initiaux est grand, nécessitant de nouvelles méthodes d'agrégation
privilégiant la parcimonie.
Téléchargement