Réservé aux investisseurs professionnels au sens de la directive MIF.
LETTRE DE RECHERCHE
Quelle DLC des données d’estimation ?
2
Le statisticien qui veut estimer à partir d’un échantillon un paramètre (dans notre cas, une volatilité ou une
corrélation) susceptible de varier dans le temps est confronté à un dilemme classique entre volume et pertinence
des données. S’il ne sélectionne que les données récentes, il est très probable que le paramètre qu’il veut
estimer soit constant dans son échantillon, ce qui est cohérent avec sa volonté d’estimer un paramètre unique
pour le futur proche. En revanche, cet échantillon risque d’être de taille modeste, et l’incertitude d’estimation liée
à cette taille réduite sera élevée. A l’inverse, il peut privilégier le volume de données en prenant des échantillons
historiques longs, dont la taille est telle que l’erreur d’estimation est faible. Mais il risque alors d’inclure des
données anciennes pour lesquelles le paramètre n’avait pas la même valeur.
Prenons deux exemples :
1. Supposons qu’un institut de sondages veuille estimer le résultat d’un Oui à un référendum. Il ne peut
interroger chaque semaine qu’un seul échantillon représentatif de mille personnes. Quel est la meilleure
estimation ? Est-ce qu’il s’agit du résultat du dernier sondage avant l’élection ou d’une moyenne des 12
sondages des trois derniers mois ? De manière évidente, l’institut va choisir le dernier sondage. En effet, la
variation au cours de la campagne électorale des opinions des votants est beaucoup plus importante que
l’incertitude d’estimation entre un échantillon de 1000 personnes et celui constitué des 12 000 personnes
interrogées en 3 mois : priorité à la pertinence et aux données récentes.
2. Supposons maintenant qu’un statisticien veuille évaluer la probabilité qu’une pièce de monnaie tombe sur
pile sachant qu’il ne peut faire que 10 lancers par semaine pendant 3 mois. Est-ce qu’il doit choisir le résultat
des dix tirages de la dernière semaine ou la moyenne des 120 lancers effectués en trois mois ? Cette fois, il
va évidemment privilégier le maximum de lancers ; la pièce de monnaie étant inchangée au cours du temps,
sa probabilité de tomber sur pile était la même il y a trois mois que maintenant. L’accumulation de tirages
permet de réduire l’incertitude liée à la taille de l’échantillon : priorité au volume et au nombre de
données.
Revenons à notre problème pratique d’estimation de la variance (carré de la volatilité) par la formule classique :
LE DILEMME PERTINENCE VERSUS VOLUME
Où :
•
est l’estimation de la variance ;
• est la variation relative observée de l’action le i éme jour ;
•
est la moyenne des variations relatives observées de l’action entre le premier et le n ème jour.