Telechargé par Spenson Noel

MODULE I du cours Statistique descriptive

publicité
CENTRE DE FORMATION TECHNIQUE
ET PROFESSIONNELLE
D’OLAVE ST CLAIRE/ KEK DE HINCHE
Option : SECRETARIAT
Cours de Statistique
Module I
Niveau : 2
eme
Année
Professeur : Spenson NOEL
Licencié en Sces Economiques et en Sces de l’Education (Mathématiques)
Email : [email protected]
Tel : (509) 3284 9155
Novembre 2018
CHAPITRE INTRODUCTIF
Préparé et présenté par Spenson NOEL
Licencié en Sces Economiques et en Sces de l’Education (Mathématiques)
La statistique a pour objet l’étude, à l’aide de traitements mathématiques, de nombreux faits
correspondant à l’observation d’un phénomène, dans le but de rendre compte de la réalité,
d’essayer de l’expliquer et d’aider à la prise de décision » (J. Hubler, 1996)
Exemple : Le RGPH est un gisement de connaissances sur les aspects démographiques,
économiques et sociaux de la population.
Ses résultats doivent permettent d’orienter les décisions de l’Etat en recherchant des
solutions aux problèmes de la pauvreté, de l’habitat insalubre, etc.
L’étude statistique comporte généralement 4 étapes :
1)
la collecte des données ;
2)
le traitement des données recueillies, aussi appelé la statistique descriptive.
3)
l’analyse et l’interprétation des données aussi appelée l'inférence statistique, qui
s'appuie sur la statistique mathématique.
4)
la diffusion des résultats d’analyse.
Ne pas confondre « La statistique » et « Les statistiques »
-
La statistique : C’est l'étude rationnelle des données
-
Les statistiques : Ce qui sont les résultats d'observations recueillies lors de l'étude d'un
phénomène.
La collecte des données statistiques
Deux principales sources de données statistiques : les recensements et les enquêtes
a) Recensement
Les recensements sont des opérations, issues du dénombrement, qui consistent à étudier de
façon exhaustive et en fonction de plusieurs critères tous les élémentsd’une population.
Ne pas confondre « dénombrement » et « recensement »
 Le dénombrement : comptage des individus d’une population
 Le recensement : chiffrer les données selon plusieurs aspects (âge, sexe, chiffre
Préparé et présenté par Spenson NOEL
Licencié en Sces Economiques et en Sces de l’Education (Mathématiques)
d’affaires, etc.)
Exemple :
Dénombrement : Au Recensement Général de la Population et de l’Habitat de 2003, Haïti
compte une population de 8 373 750 habitants.
Recensement : Moins de 2/5 de cette population (37 %) habitent l’Ouest, département où se
trouve la capitale du pays. L’Artibonite (16 %) et le Nord (10 %) représentent après l’Ouest les
départements les plus peuplés de l’ensemble du pays. Le poids de chacun des autres
départements se situe entre 4% et 7% de l’ensemble. Près de soixante pour cent de la population
de l’ensemble du pays (59,2 %) vivent en milieu rural. Moins de 2/3 de la population urbaine de
l’ensemble du pays (évaluée à 40,8%) résident dans le département de l’Ouest
b) Les enquêtes
Les enquêtes Portent sur un sous-ensemble d’une population appelé échantillon. Elles Ne sont
pas exhaustives : n’interrogent pas tous les éléments d’une population. La qualité de l’enquête et
doncdes résultats dépendduchoixde l’échantillon
I.
Approches de la statistique: Statistique descriptive ou déductive et Statistique
mathématique ou inductive
a) La statistique descriptive ou déductive.
C'est l'ensemble des méthodes à partir desquelles on recueille, ordonne, réduit, et
condense les données.
A cette fin, la statistique descriptive utilise des paramètres, ou synthétiseurs, des graphiques et
des méthodes dites d'analyse des données (l'ordinateur a facilité le développement de ces
méthodes).
b) La statistique mathématique ou inductive
C'est l'ensemble des méthodes qui permettent de faire des prévisions, des interpolations
sur une population à partir des résultats recueillis sur un échantillon.
Nous utilisons des raisonnements inductifs c'est-à-dire des raisonnements de passage du
particulier au général. Cette statistique utilise des repères de référence qui sont les modèles
théoriques (lois de probabilités).
Préparé et présenté par Spenson NOEL
Licencié en Sces Economiques et en Sces de l’Education (Mathématiques)
Cette statistique nécessite la recherche d'échantillons qui représentent le mieux possible la
diversité de la population entière ; il est nécessaire qu'ils soient constitués au hasard ; on dit
qu'ils résultent d'un tirage non exhaustif.
L'étude sur échantillon se justifie pour réduire le coût élevé et limiter la destruction
d'individus pour obtenir la réponse statistique.
Applications de la statistique : pharmacologie, psychologie, médecine, environnement, cour
de justice, sondages, physique, chimie, sciences économiques et sociales, marketing, finance,
économétrie, etc.
VOCABULAIRE STATISTIQUE
Préparé et présenté par Spenson NOEL
Licencié en Sces Economiques et en Sces de l’Education (Mathématiques)
 Population : ensemble d’unités que l’on cherche à étudier (la population des personnes
atteintes du VIH au Canada, la population des électeurs en Haïti, la population de
voitures fabriquées dans une chaîne de production donnée, la population des accidents
observés sur la route nationale numéro 3, etc.)
 Unité statistique (ou unité) : objet pour lequel nous sommes intéressés à recueillir de
l’information. Peut être un individu, une compagnie, etc.
 Échantillon : n’importe quel sous-ensemble de la population sur lequel nous prendrons
des mesures qui serviront à produire des estimations sur l’ensemble de la population.
 Caractère (critère): permet de décrire et de classer la population
Ex : classification des étudiants selon « l’âge » ou « le sexe »; « couleur » ou « milieu de
résidence
Répartition de la population de 15 ans et plus,
ayant fréquenté un centre d'alphabétisation,
par sexe et par milieu de résidence
Ensemble
Hommes
Femmes
Milieu de
Résidence
Eff.
%
Eff.
%
Eff.
%
Urbain
11858
24.99%
2936
6.19%
8922
18.81%
Rural
35586
75.01%
13615
28.70%
21971
46.31%
Total
47444
100.00%
16551
34.89%
30893
65.11%
Source : RGPH – 2003
Population statistique : population de 15 ans et plus ayant fréquentée un centre d’alphabétisation
Unité statistique : population de 15 ans et plus
Caractère : sexe et milieu de résidence
Types de critères, de caractères ou de variables
A- Caractères quantitatifs
Préparé et présenté par Spenson NOEL
Licencié en Sces Economiques et en Sces de l’Education (Mathématiques)
B- Caractères qualitatifs
 Un caractère est dit quantitatif s'il est mesurable.
Exemples de caractères quantitatifs.
-
La puissance fiscale d'un véhicule
automobile. Le chiffre d'affaire
d'une P.M.E.

-
L'âge, le salaire des salariés d'une entreprise.
-
Le taux de chomage d’un pays
-
Le PIB d’un pays
Un caractère est dit qualitatif s'il est repérable sans être mesurable.
Exemples de caractères qualitatifs.
-
La couleur de la carrosserie d'un
véhicule automobile Le lieu de travail
des habitants d'un quartier
-
Le sexe et la situation matrimoniale des salariés d'une entreprise
-
Niveau de scolarité d’un individu
A- Les variables quantitatives peuvent être classées en :
a.
Variables quantitatives discrètes ou discontinues
b.
Variables quantitatives continues
Modalités
Ce sont les différentes situationsi M possibles du caractère.
Les modalités d'un caractère doivent être incompatibles et exhaustives ; tout individu
doit présenter une et une seule modalité.
Les modalités d'un caractère qualitatif sont les différentes rubriques d'une nomenclature
; celles d'un caractère quantitatif sont les mesures de ce caractère. L'ensemble des
modalités est noté E.
Exemple de modalités :
-
Le sexe, de modalités : H ou F (codé par 1 ou 2)
-
L'âge, de modalités : 18, 19, 20, ... ou [16, 20], [21, 25], ...
Préparé et présenté par Spenson NOEL
Licencié en Sces Economiques et en Sces de l’Education (Mathématiques)
-
Le salaire mensuel, de modalités : 6000, 6500, 7000, ... ou [6000, 6500[, [6500,
7500[, ...
-
La situation matrimoniale, de modalités : marié, célibataire, veuf,
divorcé, vivant maritalement.
Variable quantitative discrète (discontinue)
Elle est représentée par un nombre fini de valeurs
Ex : nombre d’enfant par ménage; nombre d’hospitalisation par patient, etc.)
Les modalités de la variable peuvent être traitées mathématiquement (par des opérations
mathématiques de base)
Variable quantitative continue
Elle peut prendre un nombre infini de valeurs dans son intervalle de définition
Ex : taille, revenus, CA, poids, etc.)
Il s’agit de grandeurs liées à l’espace (longueur, surface), au temps (âge, durée, vitesse), à la
masse (poids, teneur), à la monnaie (salaire, CA)
Les variables continues peuvent être regroupées en classe : un individu qui pèse 76,5 Kg
sera repéré dans une classe de poids de [76-77]
Exemple :
Enquête réalisée auprès de 20 femmes casablancaises nées en 1970 sur le nombre d’enfants
qu’elles ont eus
Préparé et présenté par Spenson NOEL
Licencié en Sces Economiques et en Sces de l’Education (Mathématiques)
Nombre d’enfants/femmes
Nombre d’enfants
Effectif de femmes
0
1
1
3
2
5
3
5
4
4
5
2
Total
20
On peut choisir de regrouper les différentes valeurs (modalités) de la variable « enfant » en
classes
Nombre d’enfants/femmes
Nombre d’enfants
Effectif de femmes
[0-2[
4
[2-4[
10
[4-6[
6
Total
20
Lorsque les données sont regroupées en classe, il faut :
-
définir les extrémités de classe
-
préciser la « borne inférieure » et la « borne supérieure » des classes
-
préciser sans ambiguïté si les valeurs des extrémités sont inclues ou non dans les
classes
Préparé et présenté par Spenson NOEL
Licencié en Sces Economiques et en Sces de l’Education (Mathématiques)
Exemple 1 : nombre d’enfants par femme.


Classe [2 – 4[

[2 – » signifie que la valeur « 2 » est inclue dans la classe

« – 4 [» signifie que la valeur « 4 » est exclue de la classe
Tous les éléments de la population étudiée (femmes) doivent se retrouver dans une et
une seule classe
Exemple 2 : Salaires mensuels des employés d’une entreprise « X » en Gdes au 31/12/2006
3 classes de salaires :
a) De 6000 à moins de 7000 DH: [6000 – 7000[
Cette classe comprendra un employé dont le salaire = 6999 tandis qu’un salarié dont le
revenu = 7000 s’en trouvera exclu
b) De 7000 à moins de 9000 DH: [7000 – 9000[
c) De 9000 à moins de 12 000 DH: [9000 – 12 000[
Pour des raisons pratiques, on retient généralement comme extrémités de classes des valeurs «
rondes »
Effectuer aisément des calculs sur les extrémités de classes comme pour le calcul de l’amplitude
des classes et du centre des classes
L’amplitude de classe = la différence entre la valeur de l’extrémité supérieure et la valeur
de l’extrémité inférieure.
L’amplitude a d’une classe i sera donnée par la formule suivante :
a i = e i sup – e i inf
L’amplitude de classe = la différence entre la valeur de l’extrémité supérieure et la valeur
de l’extrémité inférieure.
Préparé et présenté par Spenson NOEL
Licencié en Sces Economiques et en Sces de l’Education (Mathématiques)
L’amplitude a d’une classe i sera donnée par la formule suivante :
a i = e i sup – e i inf
Exemple 1 : L’amplitude ai de la classe [6000 – 7000[
a i = e i sup – e i inf= 7000 - 6000 = 1000
Exemple 2 : Nombre d’enfants par femme
Nombre d’enfants
Effectifs
Amplitudes ai
[0 – 2 [
4
2
[2 – 4 [
10
2
[4 – 6 [
6
2
Exemple 3 : Salaires des employés de l’entreprise « X »en gourdes
Amplitudes ai
Salaires
[6000 – 7000[
1000
[7000 – 9000[
2000
[9000 – 12 000[
3000
L’amplitude de la deuxième classe est 2 fois plus grande que celle de la première classe
L’amplitude de la troisième classe est 3 fois plus grande que celle de la première classe
Centre des classes
Le centre des classes c’est la moyenne des extrémités de classe. Le centre C d’une classe i est
𝒔𝒖𝒑
noté par Ci et est donné par : 𝑪𝒊
=
𝒆𝒊
𝒊𝒏𝒇
+ 𝒆𝒊
𝟐
Préparé et présenté par Spenson NOEL
Licencié en Sces Economiques et en Sces de l’Education (Mathématiques)
Exemple 1 : Cas où les amplitudes sont égales (Nombre d’enfants par femme)
Nombre d’enfants
Amplitudes
Centres
ci
[0 – 2 [
2
1
[2 – 4 [
2
3
[4 – 6 [
2
5
Exemple 2 : Cas de classes d’amplitudes inégales (Salaires des employés de l’entreprise «
X » en gourdes)
Salaires
Amplitudes
Centres
ci
[6000 – 7000[
1000
6500
[7000 – 9000[
2000
8000
[9000 – 12 000[
3000
10 00
Préparé et présenté par Spenson NOEL
Licencié en Sces Economiques et en Sces de l’Education (Mathématiques)
Application : Répartition des Salaires des employés de l’entreprise « Y » en gourdes,
compléter le tableau
Salaires
Effectifs
Amplitudes
Centres ci
[6000 – 7000[
10
1000
6500
[7000 – 9000[
50
2000
8000
[9000 – 10 000[
200
1000
9500
[10 000 – 13 000[
20
3000
11 500
[13 000 – 17 000[
10
4000
15 000
[17 000 – 30 000[
5
13 000
23 500
295
-
-
Total
 Les classes sont d’amplitudes inégales
 La troisième classe est mal choisie car l’effectif correspondant est très important par
rapport auxautres classes: on aurait pu choisir de la diviser en 2 classes d’amplitudes
égales à 500 pour faire apparaître plus d’informations
Caractère qualitatif : ne peut faire l’objet d’une mesure car il ne se présente pas sous forme
numérique. (Ex : couleur de peau; section du bac; catégorie socio-professionnelle; etc.)
On ne peut pas effectuer d’opérations arithmétiques sur les caractères qualitatifs (on ne
peut additionner les couleurs de peau des êtres humains)
Les caractères qualitatifs se déclinent en plusieurs modalités
Modalités : les différentes valeurs prises par un caractère qualitatif
Exemple 1 : la variable « sexe » à deux modalités « Masculin » « Féminin »
Préparé et présenté par Spenson NOEL
Licencié en Sces Economiques et en Sces de l’Education (Mathématiques)
Exemple 2: la variable «couleurs des yeux» peut prendre comme modalités « Noir » « Brun »
« Bleu » « Vert » « Gris »
Exemple 3 : si la population est décrite selon le caractère « CSP agrégées », les différentes
modalités seront :
Catégories Socio-Professionnelles (CSP) Agrégées
Agriculteurs, exploitants
Artisans, commerçants et chef d’entreprises
Cadres et professions intelectuelles supérieures
Professions intermédiaires
Employés
Ouvriers
Retraités
Autres personnes sans activité professionnelle
Les modalités d’un caractère qualitatif sont exhaustives et mutuellement incompatibles
Exhaustives : à chaque individu doit correspondre une modalité du caractère
Exemple : enquête sur l’état matrimonial d’un groupe d’individu
Pour satisfaire la condition d’exhaustivité, on doit avoir quatre modalités du caractère « Etat
matrimonial » : Célibataire, Marié, Veuf, Divorcé
Incompatibles : Chaque individu doit pouvoir être classé dans une seule modalité du caractère
Ex : Un individu ne peut être à la fois « célibataire » et « marié »
Les modalités d’un caractère qualitatif peuvent être ordinales ou nominales
Les modalités ordinales : peuvent être classées ou hiérarchisées
Préparé et présenté par Spenson NOEL
Licencié en Sces Economiques et en Sces de l’Education (Mathématiques)
Ex : Enquête réalisée en 2006 par l’association « Des Entrepreneurs de Hinche » sur le
degré de satisfaction des Hinchois ayant vécu à l’étranger et franchi le cap du retour à
Hinche.
Le Caractère : « Degré de satisfaction »
Les modalités du caractère : « Satisfait », « Assez Satisfait », « Peu Satisfait », « Pas
Satisfait »
Modalités
%
Satisfait
28,06%
Assez Satisfait
33,73%
Peu Satisfait
23,28%
Pas Satisfait
14,93%
Les modalités sont ordinales car on peut les classer
-
Le classement effectué va de l’opinion « Satisfait » à l’opinion « Pas Satisfait »
-
On passe d’une préférence positive à une préférence de plus en plus négative
Les modalités ordinales ne peuvent faire l’objet d’aucune opération arithmétique
Les modalités nominales : ne peuvent pas être classées (hiérarchisées)
Exemple : Classement d’un groupe de 15 étudiants selon leur ville de naissance
Modalités
Effectif
Hinche
9
Thomonde
4
Cerca-la-source
1
Mirbalais
1
Les 4 modalités du caractère « Ville de naissance » sont nominales et nepeuventfairel’objet
d’aucunclassement hiérarchique
Préparé et présenté par Spenson NOEL
Licencié en Sces Economiques et en Sces de l’Education (Mathématiques)
Exercice application
1- Un restaurant de classe désire de faire une enquête auprès de sa clientèle. On décide donc
qu’a chaque client qui viendra la semaine suivante, on lui demandera de remplir une
petite carte ou celui-ci indiquera son sexe, son degré de satisfaction, son heure d’arrivée,
le nombre de personne qui l’accompagnent et le montant de l’addition, indiquer quelle est
la population concernée et l’échantillon choisi, quelles sont les variables statistiques
étudiées et quelles seraient les modalités de celles-ci.
2- Dans un sondage réalisé auprès d’un échantillon de 450 personnes âgées de 18 ans et plus
demeurant dans la région du plateau central, on a demandé si on croyait qu’il y a
beaucoup de gens marries ou en union libre qui ne se séparent pas à cause des enfants.
Indiquer la population statistique, la variable concernée et le type d’échelle de mesure
utilisé.
3- Une compagnie d’assurance désirant faire une proposition aux étudiantes en secrétariat
du CFTPOSC/KEK décide au préalable de faire une étude sur les étudiantes concernées
pour connaitre le sexe, l’âge au premier janvier, la taille, la masse et le nombre
d’hospitalisation déjà subies. Déterminer la population, l’unité, les variables statistiques
et les modalités de ces variables.
Préparé et présenté par Spenson NOEL
Licencié en Sces Economiques et en Sces de l’Education (Mathématiques)
Téléchargement