Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/StatPC
Chapitre 5
ESTIMATION
La statistique inférentielle regroupe un ensemble de méthodes consistant à prendre en
compte le hasard dans l’analyse des données. Elle est fondée sur l’hypothèse que les
observations proviennent de tirages aléatoires dans une population statistique, constituant ce
que l’on appelle couramment un échantillon, et que la proportion dans laquelle un événement
est réalisé se rapproche de sa probabilité lorsque le nombre d’observations augmente
indéfiniment. La démarche est inversée par rapport à celle des probabilités : les paramètres
des lois de probabilités sont inconnus, et leur estimation consiste à en donner une
approximation la meilleure possible sous la forme d’une valeur précise ou d'un intervalle.
Nous suivrons l’habitude de plus en plus fréquente d’utiliser des caractères grecs pour
les paramètres théoriques, majuscules latins pour les variables aléatoires et minuscules latins
pour les valeurs observées.
1. DES PROBABILITÉS À LA STATISTIQUE.
La statistique inférentielle repose sur une hypothèse intuitive élaborée à partir
d’expériences diverses : celle de la convergence de la proportion dans laquelle un événement
est réalisé au cours d’expériences répétées vers sa probabilité telle que nous l’avons définie
dans le chapitre précédent.
Chapitre 5 2 Estimation
1.1 Simulation.
Les expériences montrant cette convergence sont nombreuses : les jeux de hasard
(jeux de casino, loto, etc.) en produisent un grand nombre, et le calcul des gains est fondé sur
cette convergence. Certains jeux de stratégie sont fondés aussi sur le calcul des probabilités,
comme le bridge.
Nous utilisons dans cet ouvrage des expériences virtuelles, effectuées à l’aide d’un
ordinateur1 et de logiciels spécifiques2 : ces expériences relèvent ce que l’on appelle la
simulation. Cette démarche, qui consiste à générer des nombres « pseudo-aléatoires »3, est
fréquemment utilisée dans le cas il est difficile ou impossible d’effectuer un calcul
numérique (ce sont « les méthodes de Monte Carlo », appliquées par exemple au calcul
d’intégrales).
Ces nombres pseudo-aléatoires peuvent être considérés comme des observations d’une
v.a. suivant la loi uniforme, et, à l’aide de transformations mathématiques (données dans les
exercices 1 et 2), on peut en déduire des observations d’une v.a. suivant une loi quelconque.
Ce qui nous intéresse particulièrement ici, c’est la facilité avec laquelle on peut
observer une variable aléatoire autant de fois que l’on veut sans problème matériel. On crée
ainsi des données vérifiant les propriétés que l’on a choisies et que l’analyse statistique
permet de détecter. Inversement, lorsqu’une méthode n’est efficace que si les données
possèdent des propriétés particulières, on pourra vérifier qu’elle ne donne pas de bon résultat
dans le cas où les données ne les possèdent pas.
Exemple de tableau de données simulées (ou table de nombres au hasard) :
1 2 3 4 5 6 7 8
1 0.833 0.275 0.972 0.004 0.978 0.532 0.376 0.516
2 0.518 0.936 0.341 0.333 0.177 0.879 0.010 0.090
3 0.863 0.195 0.187 0.439 0.436 0.870 0.226 0.374
Tableau 1.5 : nombres pseudo-aléatoires
1 Une calculatrice munie de la touche Rnd (ou Random) peut suffire pour des expériences simples.
2 Nous avons aussi utilisé des logiciels publiés dans Introduction aux tests statistiques, Enseignement
Assisté par Ordinateur, de T. Foucart, édité par Technip, Paris, 1991.
3 Ces nombres ne sont pas tirés au hasard au sens strict du terme, d’où le préfixe pseudo.
Chapitre 5 3 Estimation
On déduit facilement de ces nombres compris entre 0 et 1 (exclus) des nombres
pseudo-aléatoires variant entre deux valeurs a et b fixées, ou des nombres entiers.
Par exemple, on obtiendra des nombres compris entre –1 et 2 en effectuant la
transformation suivante, pour toute valeur x du tableau précédent :
y = 3 x
1
Pour obtenir des nombres entiers compris entre 1 et 6, on pose :
y = Int(6 x +1)
Int(z) désignant le plus grand entier inférieur ou égal à z : Int(5.456) = 5, Int(4) = 4.
1.2 Loi des grands nombres.
Considérons le cas d’un à 6 faces, que l’on suppose parfaitement équilibré : la
population est
P
= {1, 2, 3, 4, 5, 6}. L’équilibre parfait de ce signifie qu’il n’y a aucune
raison physique d’observer une face plus qu’une autre dans une série de lancers.
En jetant le n fois, on obtient bien sûr n faces : à chaque jet, la probabilité d’obtenir
{1} est égale à 1/6, et la face obtenue au ie jet n’a aucune incidence sur les autres faces
obtenues : il y a équiprobabilité, et les lancers sont indépendants.
Dans ces conditions, l’expérience montre que, pour n suffisamment grand, la
proportion de faces {1} va tourner autour de 1/6. De même la proportion de faces {2}, de
faces {3} etc.
Considérons les faces 1 à 4 du dé. On définit ainsi un événement A = {1, 2, 3, 4}dont
la probabilité est égale à 4/6 = 2/3. L’événement A se produit dans une proportion égale à la
somme des proportions de chaque face et est donc de l’ordre de 4 x 1/6 soit 2/3. Cette
proportion est là aussi de l’ordre de la probabilité.
Exemple : nous avons effectué n = 600 lancers d’un dé parfaitement équilibré.
Les numéros ont tous été observés dans une proportion voisine de 1/6.
L’événement A = {1,2,3,4} et l’événement B = {5,6} ont été observés dans des
proportions proches de 2/3 et de 1/3 de l’effectif total : P(A) = 2/3, P(B) = 1/3.
numéros événements
n° 1 n° 2
n° 3
n° 4
n° 5
n° 6 A B
102 103 99 92 102 102 396 204
Chapitre 5 4 Estimation
L’expérience du peut être schématisée à l’aide d’une urne contenant six boules
numérotées de 1 à 6. Pour que les tirages soient indépendants, il suffit de remettre chaque
boule tirée dans l’urne : les tirages sont donc effectués « avec remise ». On peut généraliser
l’expérience en tirant dans une urne contenant un nombre quelconque de boules numérotées à
partir de 1.
Axiome de la loi des grands nombres : On considère une population contenant N
unités statistiques. On y effectue n tirages avec remise et on compte le nombre nA de
réalisations d’un événement A donné d’effectif NA. La proportion observée nA / n converge
vers la probabilité NA / N de l’événement A lorsque le nombre de tirages augmente
indéfiniment.
Dans la pratique des sondages, on évite d’interroger deux fois une même personne.
Les tirages d’unités statistiques sont donc effectués sans remise, et, par suite, ne sont pas
indépendants. Mais on montre que si la taille de la population dans laquelle on effectue les
tirages est grande par rapport au nombre d’unités statistiques que l’on tire au hasard, on peut
considérer les tirages comme indépendants.
Comme nous supposerons toujours cette condition réalisée, il n’est pas gênant de
supposer que les tirages sont effectués avec remise.
1.3 Notion de convergence.
La loi des grands nombres utilise une notion de convergence particulière qui demande
des explications.
Considérons l’ensemble des 6 faces du dé. La loi de probabilité de la v.a. X définie par
le numéro de la face obtenue est la loi uniforme sur {1, 2, 3, 4, 5, 6} :
Pour tout i de 1 à 6 P(X=i) = 1/6
Les proportions dans lesquelles les faces ont été observées en jetant le dé plusieurs fois
est une approximation de cette loi, chacune étant plus ou moins proche de 1/6.
Nous avons réalisé cette expérience en lançant 100 fois le dé. On constate (figure 1.5)
une proximité entre ces proportions et ces probabilités. Les proportions observées des faces 1,
4, 5 et 6 sont inférieures aux probabilités.
Chapitre 5 5 Estimation
Ces écarts sont compensés par des écarts opposés concernant les faces 2 et 3. Cela
s’explique par le fait que la somme des proportions comme la somme des probabilités est
toujours égale à 1.
Effectuons la même expérience, mais en lançant le 1000 fois : il est clair que les
proportions sont plus proches des probabilités que précédemment (figure 2.5).
1 / 28 100%
Study collections
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !