NOTES DE COURS
STT1700
Introduction à la statistique
David Haziza
Automne 2008
2
Qu’est ce que la statistique?
La statistique est la science dont le but est de donner un
sens aux données. L’étude statistique comporte
généralement 4 étapes :
(1) la collecte des données ;
(2) le traitement des données recueillies, aussi appelé
la statistique descriptive.
(3) l’analyse et l’interprétation des données aussi
appelée l'inférence statistique, qui s'appuie sur la
statistique mathématique.
(4) la diffusion des résultats d’analyse.
Dans ce cours, l’emphase est mise sur l’étape 2 (chapitre
1) mais surtout sur l’étape 3 (chapitre 2-10).
Applications de la statistique : pharmacologie,
psychologie, médecine, environnement, cour de
justice, sondages, physique, chimie, sciences sociales,
marketing, finance, économétrie, etc.
3
Chapitre 1
Statistiques descriptives
1.1 Introduction: variables et distributions
Unité statistique (ou unité) : objet pour lequel nous
sommes intéressés à recueillir de l’information. Peut être
un individu, une compagnie, etc.
Population : ensemble d’unités que l’on cherche à étudier
(la population des personnes atteintes du VIH au Canada,
la population des électeurs au Québec, la population de
voitures fabriquées dans une chaîne de production
donnée, la population des accidents observés à une
certaine intersection dans la ville de Montréal, etc.)
Échantillon : n’importe quel sous-ensemble de la
population sur lequel nous prendrons des mesures qui
serviront à produire des estimations sur l’ensemble de la
population.
4
Variable : caractéristique d’une unité qui peut prendre
différentes valeurs (modalités) pour différentes unités.
Variable qualitative : classe les individus dans un groupe
ou une catégorie. Par exemple, le sexe d’un individu
(homme, femme) ou le niveau de scolarité d’un individu
(primaire, secondaire, collégial, universitaire).
Variable quantitative : variable dont les valeurs sont
numériques. Les valeurs prises par une telle variable
peuvent être continues (température, poids d’un individu)
ou discrète (années de scolarité, nombre d’enfants dans
un ménage).
Distribution d’une variable : correspondance entre les
valeurs de la variable et leurs fréquences ou leurs
fréquences relatives. La fréquence représente le nombre
d’observations appartenant à une catégorie et la
fréquence relative est la fréquence divisée par le nombre
total d’observations. La fréquence relative est parfois
multipliée par 100, de façon à représenter un pour-
centage.
5
Exemple 1.1 Le tableau 1.1 présente le salaire annuel
(en millions de dollars américains) des 40 CEO (Chief
Executive Officers) les mieux payés en 2006 ainsi que
leur âge et leur plus haut diplôme obtenu. Ces données
ont été publiées dans le magazine Forbes, édition du 8
mai 2006.
Ce jeu de données comprend 3 variables qualitatives
(Nom, Compagnie et Diplôme) ainsi qu’une variable
quantitative discrète (Rang) et 2 variables quantitatives
continues (Salaire et Âge).
1 / 311 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !