Introduction à la statistique : Chapitre 1

Telechargé par Momo Faye
Chapitre 1
Prologue
La statistique est une discipline qui concerne la quantification des phenomenes
et I'elaboration de procedures inferentielles. Elle a trait, en particulier, aux
problemes de mise en oeuvre et d'analyse des experiences et des echantillons, a
I'examen de la nature des erreurs d'observations et les sources de variabilite, et
a la representation sommaire des grands ensembles de donnees. Get ouvrage a
pour but de guider le lecteur dans son apprentissage de la statistique et de ses
methodes.
La statistique ne se comprend que comme partie integrante du processus de
recherche. L'outil statistique est choisi en fonction de la nature et de la structure
de la recherche. II est au service de la recherche, meme si cette derniere doit
en general etre pensee en tenant compte des outils statistiques dont on dispose
et de leurs conditions d'application. C'est la raison pour laquelle, tout au long
de ce texte, on se referera a des problemes de recherche, simples en general,
mais suffisamment riches pour illustrer le processus global de reflexion qui doit
presider a I'utilisation d'outils statistiques.
Dans ce chapitre, les etapes fondamentales de la recherche (pure ou ap-
pliquee) sont brievement decrites pour tenter de clarifier la position de la metho-
dologie statistique dans la demarche scientifique.
2 Chapitre 1
1.1 Recherche et statistique
La recherche, au sens general, est une investigation ou une experimentation
critique ayant pour objectif la decouverte et 1'interpretation correcte de nou-
veaux faits ou de nouvelles relations entre differents phenomenes. EUe a egale-
ment pour fonction la verification de lois, conclusions ou theories acceptees, et
a la lumiere de faits nouveaux, le developpement de nouvelles lois, de nouvelles
conclusions ou de nouvelles theories.
L'observation et le raisonnement sont les deux bases de la recherche.
Si l'observation permet d'obtenir des donnees, c'est le raisonnement qui nous
conduit a donner une signification a ces donnees, a examiner leurs relations
et a les situer dans I'ensemble des connaissances acquises dans un domaine
particulier.
Le processus se deroule par etapes. Une hypothese conduit, par I'inter-
mediaire d'un processus deduct if, a certaines consequences qui peuvent etre
comparees avec des faits empiriques. Quand les consequences deduites de I'hy-
pothese et les donnees recueillies sur le terrain ne correspondent pas, les ecarts
et leur analyse peuvent conduire, par un processus appele induction, a la mod-
ification de I'hypothese initiale. Un second cycle debute alors qui, a son tour,
pent conduire a une troisieme version de I'hypothese, cette derniere pouvant
etre reexaminee ou en revanche globalement confirmee.
Comme I'ideal de la science (pure ou appliquee) est de mettre systemati-
quement en evidence les relations entre des faits et des donnees, la statistique,
pour atteindre cet ideal, fournit des methodes scientifiques d'observation, d'ex-
perimentation et d'argumentation. Ces methodes sont derivees de la theorie
statistique qui constitue le cadre formel pour I'etude des procedures permettant
le lien entre les observations et I'inference. Cette inference pent etre une esti-
mation, une decision ou n'importe quel but final pour autant qu'il se situe dans
un contexte empirique.
En
bref,
la statistique est une discipline relative a la quantification des
phenomenes ainsi qu'au comportement des donnees empiriques et des hypotheses
scientifiques. La theorie statistique est le cadre qui fournit un certain nombre
de procedures que Ton appelle "methodes statistiques".
Le terme "statistique" est parfois utilise dans plusieurs sens, par exemple,
pour se referer non pas a une disciphne globale comme decrite ici mais, plus
precisement, a un ensemble d'outils statistiques comprenant les for mules et les
tableaux.
Dans un sens encore plus etroit, le terme "statistique" est aussi employe pour
se referer a un ensemble de donnees numeriques, par exemple, les statistiques
du chomage de 1988 en Suisse. Le mot "statistique" au singulier est aussi par-
fois utilise pour denoter un parametre numerique, par exemple, une estimation
calculee a partir des observations de base.
Prologue 3
1.2 Statistique descriptive et inferentielle
Les methodes statistiques disponibles actuellement constituent un ensemble de
procedures et de regies aidant I'analyse numerique. EUes concernent entre
autres :
1.
le recueil et I'agregation des donnees ;
2.
la structuration des plans d'experiences et des enquetes statistiques ;
3.
I'estimation des parametres d'un univers et diverses estimations (mesures)
de la precision de ces estimations ;
4.
le test d'hypotheses a propos d'ensembles ou de populations divers ;
5.
I'etude des relations entre diverses variables ;
6. la reduction d'un grand nombre de variables en dimension significative.
Et bien d'autres. On pent faire une distinction entre ces difFerentes me-
thodes : celle relative a la statistique descriptive et celle relative a la statistique
inferentielle.
Le but principal de la statistique descriptive est de presenter I'infor-
mation d'une fagon comprehensible et utilisable, par exemple en calculant des
moyennes, en construisant des histogrammes, en etablissant des tableaux croises,
en representant graphiquement les donnees, etc.
La statistique inferentielle, de son cote, a pour fonction d'aider a la
generalisation de cette information ou, plus specifiquement, de faire des in-
ferences - estimation, decision, test d'hypotheses, etc - basees sur des echantil-
lons tires d'un ou plusieurs univers a etudier.
1.3 Exemples
Tout au long de ce texte, nous apprendrons a examiner des donnees statistiques
et a en tirer des conclusions, a resumer une serie numerique et a la rapprocher
d'un modele theorique, a etudier un tableau de chiffres et a y detecter des aspects
significatifs, a analyser un ensemble de donnees et a etablir des relations. Ainsi,
a la fin de ce livre, le lecteur attentif devrait disposer d'un bon choix d'outils
statistiques lui permettant de faire face a diverses questions numeriques. Voici
quelques exemples.
Feninies et discrimination. Aux Etats-Unis, toute une branche de la sta-
tistique, appelee Jurimetrics^ se developpe pour aider a resoudre certains prob-
lemes juridiques qui se posent aux magistrats et aux juges. Une grande par-
tie d'entre eux concerne des cas de discrimination professionnelle affect ant les
femmes ou d'autres minorites sociales. Le juge est souvent appele a se prononcer,
a partir d'analyses statistiques, sur les pratiques d'embauche ou de promotion
4 Chapitre 1
du personnel de la compagnie accusee de discriminer les femmes ou une autre
minorite.
Tableau 1.1 : Femmes et discrimination
Grade
7
8
9
10
Total
Femme
Employees
19
39
87
143
288
Promues
3
7
17
34
61
Homme
Employes
238
147
235
242
862
Promus
35
45
54
77
211
A partir des chiffres du tableau 1.1, peut-on conclure avec une certaine con-
fiance qu'il y a en eff'et discrimination a I'encontre des femmes en matiere de
promotions ?
La loi d'Engel. Celebre en sciences economiques, la loi d'Engel (formulee
en 1857 par Ernst Engel, Directeur du Bureau de statistique de Prusse) etablit
que,
a faits egaux, la part du revenu depense pour I'alimentation diminue au fur
et a mesure que le revenu augmente. On dit alors que I'elasticite de I'alimenta-
tion par rapport aux variations du revenu est inferieure a I'unite. Ceci signifie
qu'une augmentation de 1% du revenu entrainerait un pourcentage plus faible
d'augmentation des depenses consacrees a la nourriture. La loi d'Engel et, de
fagon plus generale, la notion d'elasticite est fondamentale dans la formulation
des politiques de salaires et de prix. Dans le tableau 1.2, on trouve des don-
nees concernant la Suisse permettant de tester la loi d'Engel et de calculer le
coefficient d'elasticite de I'alimentation par rapport au revenu.
Tableau 1.2 : Depenses aliment aires en Suisse en 1964
Classe de revenu
(revenu annuel en Fr.)
moins de 15 000
15 000 - 17 000
17 000 - 19 000
19 000 - 21 000
Nombre de
menages
35
74
60
40
Depense moyenne pour la
nourriture et la boisson
4 638
4 591
5 099
5 246
La bourse. Tons les jours des milliers ou des millions de personnes etudient
le developpement des valeurs boursieres, essay ant de detecter des regular ites et
d'etablir des previsions. Consciemment ou non, tons ces "specialistes" partent
de I'idee que derriere les mouvements qui semblent aleatoires se cachent des
tendances solides qui, une fois detectees, pourront servir de signaux aidant a
prevoir le futur.
Voici quelques autres questions relevant de la methodologie statistique :
Prologue 5
1.
Comment peut-on, a des milliers de km de distance, distinguer I'explosion
d'une bombe atomique d'un tremblement de terre ?
2.
Comment peut-on decider, a I'occasion d'une petite augmentation de Tin-
dice des prix a la consommation, s'il
s'agit
d'une variation saisonniere ou
d'une petite deviation aleatoire ?
3.
Dans quelle mesure le fait de fumer des cigarettes augmente-t-il les risques
d'avoir un cancer des poumons ?
4.
Comment construire une experimentation permettant de mesurer les efFets
d'un nouveau traitement medical ?
5.
Pour quelle raison le joueur au casino est-il perdant a la longue ?
6. Comment decrire de maniere synthetique les nombreuses donnees recueil-
lies sur les attitudes du public par rapport a I'energie ?
7.
Comment estimer le nombre des poissons du lac de Neuchatel sans vider
I'eau du lac ?
8. Comment definir le chomage de sorte qu'il soit mesurable a travers les
enquetes specialisees ?
9. Comment elaborer une nomenclature et un systeme de codage afin d'obtenir
des statistiques sur les personnes occupees dans les differentes professions ?
1.4 Historique
Le terme statistique semble apparaitre pour la premiere fois a la fin du 16^ si^
cle en Italic. II est alors lie aux notions de denombrement, d'inventaire. Mais
la veritable origine de la statistique moderne est fixee selon Kendall (1960) a
1660 avec I'utilisation de donnees recueillies a des fins economiques ou demo-
graphiques (les recensements).
La statistique descriptive (informations sur un echantillon donne) commence
alors a se developper. Mais ce n'est qu'au 19^ siecle que les methodes statistiques
ainsi que les lois statistiques prennent leur essor, et ce par la prise en compte de
I'importance de la statistique dans les domaines des sciences experimentales et
humaines. Puis, le 20^ siecle assoit la statistique en tant que discipline a part
entiere par la richesse et la diversite des methodes qu'elle renferme.
Des le debut du 18^ siecle, A. de Moivre (1718) puis T.. Bayes (1763), C. F.
Gauss (1809) et P. S. Laplace (1812) cherchent a estimer un certain nombre de
parametres caracterisant la population associee a I'echantillon traite : c'est le
debut de la statistique inferentielle complement desormais indispensable de la
statistique descriptive. La encore, la fin du 19^ siecle et le 20^ siecle marquent le
developpement non seulement de cette notion de la statistique avec F. Galton,
E. S. Pearson ou R. A. Fisher, mais aussi celui de I'analyse de donnees.
1 / 109 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!