CENTRE DE FORMATION TECHNIQUE ET PROFESSIONNELLE D’OLAVE ST CLAIRE/ KEK DE HINCHE Option : SECRETARIAT Cours de Statistique Module I Niveau : 2 eme Année Professeur : Spenson NOEL Licencié en Sces Economiques et en Sces de l’Education (Mathématiques) Email : [email protected] Tel : (509) 3284 9155 Novembre 2018 CHAPITRE INTRODUCTIF Préparé et présenté par Spenson NOEL Licencié en Sces Economiques et en Sces de l’Education (Mathématiques) La statistique a pour objet l’étude, à l’aide de traitements mathématiques, de nombreux faits correspondant à l’observation d’un phénomène, dans le but de rendre compte de la réalité, d’essayer de l’expliquer et d’aider à la prise de décision » (J. Hubler, 1996) Exemple : Le RGPH est un gisement de connaissances sur les aspects démographiques, économiques et sociaux de la population. Ses résultats doivent permettent d’orienter les décisions de l’Etat en recherchant des solutions aux problèmes de la pauvreté, de l’habitat insalubre, etc. L’étude statistique comporte généralement 4 étapes : 1) la collecte des données ; 2) le traitement des données recueillies, aussi appelé la statistique descriptive. 3) l’analyse et l’interprétation des données aussi appelée l'inférence statistique, qui s'appuie sur la statistique mathématique. 4) la diffusion des résultats d’analyse. Ne pas confondre « La statistique » et « Les statistiques » - La statistique : C’est l'étude rationnelle des données - Les statistiques : Ce qui sont les résultats d'observations recueillies lors de l'étude d'un phénomène. La collecte des données statistiques Deux principales sources de données statistiques : les recensements et les enquêtes a) Recensement Les recensements sont des opérations, issues du dénombrement, qui consistent à étudier de façon exhaustive et en fonction de plusieurs critères tous les élémentsd’une population. Ne pas confondre « dénombrement » et « recensement » Le dénombrement : comptage des individus d’une population Le recensement : chiffrer les données selon plusieurs aspects (âge, sexe, chiffre Préparé et présenté par Spenson NOEL Licencié en Sces Economiques et en Sces de l’Education (Mathématiques) d’affaires, etc.) Exemple : Dénombrement : Au Recensement Général de la Population et de l’Habitat de 2003, Haïti compte une population de 8 373 750 habitants. Recensement : Moins de 2/5 de cette population (37 %) habitent l’Ouest, département où se trouve la capitale du pays. L’Artibonite (16 %) et le Nord (10 %) représentent après l’Ouest les départements les plus peuplés de l’ensemble du pays. Le poids de chacun des autres départements se situe entre 4% et 7% de l’ensemble. Près de soixante pour cent de la population de l’ensemble du pays (59,2 %) vivent en milieu rural. Moins de 2/3 de la population urbaine de l’ensemble du pays (évaluée à 40,8%) résident dans le département de l’Ouest b) Les enquêtes Les enquêtes Portent sur un sous-ensemble d’une population appelé échantillon. Elles Ne sont pas exhaustives : n’interrogent pas tous les éléments d’une population. La qualité de l’enquête et doncdes résultats dépendduchoixde l’échantillon I. Approches de la statistique: Statistique descriptive ou déductive et Statistique mathématique ou inductive a) La statistique descriptive ou déductive. C'est l'ensemble des méthodes à partir desquelles on recueille, ordonne, réduit, et condense les données. A cette fin, la statistique descriptive utilise des paramètres, ou synthétiseurs, des graphiques et des méthodes dites d'analyse des données (l'ordinateur a facilité le développement de ces méthodes). b) La statistique mathématique ou inductive C'est l'ensemble des méthodes qui permettent de faire des prévisions, des interpolations sur une population à partir des résultats recueillis sur un échantillon. Nous utilisons des raisonnements inductifs c'est-à-dire des raisonnements de passage du particulier au général. Cette statistique utilise des repères de référence qui sont les modèles théoriques (lois de probabilités). Préparé et présenté par Spenson NOEL Licencié en Sces Economiques et en Sces de l’Education (Mathématiques) Cette statistique nécessite la recherche d'échantillons qui représentent le mieux possible la diversité de la population entière ; il est nécessaire qu'ils soient constitués au hasard ; on dit qu'ils résultent d'un tirage non exhaustif. L'étude sur échantillon se justifie pour réduire le coût élevé et limiter la destruction d'individus pour obtenir la réponse statistique. Applications de la statistique : pharmacologie, psychologie, médecine, environnement, cour de justice, sondages, physique, chimie, sciences économiques et sociales, marketing, finance, économétrie, etc. VOCABULAIRE STATISTIQUE Préparé et présenté par Spenson NOEL Licencié en Sces Economiques et en Sces de l’Education (Mathématiques) Population : ensemble d’unités que l’on cherche à étudier (la population des personnes atteintes du VIH au Canada, la population des électeurs en Haïti, la population de voitures fabriquées dans une chaîne de production donnée, la population des accidents observés sur la route nationale numéro 3, etc.) Unité statistique (ou unité) : objet pour lequel nous sommes intéressés à recueillir de l’information. Peut être un individu, une compagnie, etc. Échantillon : n’importe quel sous-ensemble de la population sur lequel nous prendrons des mesures qui serviront à produire des estimations sur l’ensemble de la population. Caractère (critère): permet de décrire et de classer la population Ex : classification des étudiants selon « l’âge » ou « le sexe »; « couleur » ou « milieu de résidence Répartition de la population de 15 ans et plus, ayant fréquenté un centre d'alphabétisation, par sexe et par milieu de résidence Ensemble Hommes Femmes Milieu de Résidence Eff. % Eff. % Eff. % Urbain 11858 24.99% 2936 6.19% 8922 18.81% Rural 35586 75.01% 13615 28.70% 21971 46.31% Total 47444 100.00% 16551 34.89% 30893 65.11% Source : RGPH – 2003 Population statistique : population de 15 ans et plus ayant fréquentée un centre d’alphabétisation Unité statistique : population de 15 ans et plus Caractère : sexe et milieu de résidence Types de critères, de caractères ou de variables A- Caractères quantitatifs Préparé et présenté par Spenson NOEL Licencié en Sces Economiques et en Sces de l’Education (Mathématiques) B- Caractères qualitatifs Un caractère est dit quantitatif s'il est mesurable. Exemples de caractères quantitatifs. - La puissance fiscale d'un véhicule automobile. Le chiffre d'affaire d'une P.M.E. - L'âge, le salaire des salariés d'une entreprise. - Le taux de chomage d’un pays - Le PIB d’un pays Un caractère est dit qualitatif s'il est repérable sans être mesurable. Exemples de caractères qualitatifs. - La couleur de la carrosserie d'un véhicule automobile Le lieu de travail des habitants d'un quartier - Le sexe et la situation matrimoniale des salariés d'une entreprise - Niveau de scolarité d’un individu A- Les variables quantitatives peuvent être classées en : a. Variables quantitatives discrètes ou discontinues b. Variables quantitatives continues Modalités Ce sont les différentes situationsi M possibles du caractère. Les modalités d'un caractère doivent être incompatibles et exhaustives ; tout individu doit présenter une et une seule modalité. Les modalités d'un caractère qualitatif sont les différentes rubriques d'une nomenclature ; celles d'un caractère quantitatif sont les mesures de ce caractère. L'ensemble des modalités est noté E. Exemple de modalités : - Le sexe, de modalités : H ou F (codé par 1 ou 2) - L'âge, de modalités : 18, 19, 20, ... ou [16, 20], [21, 25], ... Préparé et présenté par Spenson NOEL Licencié en Sces Economiques et en Sces de l’Education (Mathématiques) - Le salaire mensuel, de modalités : 6000, 6500, 7000, ... ou [6000, 6500[, [6500, 7500[, ... - La situation matrimoniale, de modalités : marié, célibataire, veuf, divorcé, vivant maritalement. Variable quantitative discrète (discontinue) Elle est représentée par un nombre fini de valeurs Ex : nombre d’enfant par ménage; nombre d’hospitalisation par patient, etc.) Les modalités de la variable peuvent être traitées mathématiquement (par des opérations mathématiques de base) Variable quantitative continue Elle peut prendre un nombre infini de valeurs dans son intervalle de définition Ex : taille, revenus, CA, poids, etc.) Il s’agit de grandeurs liées à l’espace (longueur, surface), au temps (âge, durée, vitesse), à la masse (poids, teneur), à la monnaie (salaire, CA) Les variables continues peuvent être regroupées en classe : un individu qui pèse 76,5 Kg sera repéré dans une classe de poids de [76-77] Exemple : Enquête réalisée auprès de 20 femmes casablancaises nées en 1970 sur le nombre d’enfants qu’elles ont eus Préparé et présenté par Spenson NOEL Licencié en Sces Economiques et en Sces de l’Education (Mathématiques) Nombre d’enfants/femmes Nombre d’enfants Effectif de femmes 0 1 1 3 2 5 3 5 4 4 5 2 Total 20 On peut choisir de regrouper les différentes valeurs (modalités) de la variable « enfant » en classes Nombre d’enfants/femmes Nombre d’enfants Effectif de femmes [0-2[ 4 [2-4[ 10 [4-6[ 6 Total 20 Lorsque les données sont regroupées en classe, il faut : - définir les extrémités de classe - préciser la « borne inférieure » et la « borne supérieure » des classes - préciser sans ambiguïté si les valeurs des extrémités sont inclues ou non dans les classes Préparé et présenté par Spenson NOEL Licencié en Sces Economiques et en Sces de l’Education (Mathématiques) Exemple 1 : nombre d’enfants par femme. Classe [2 – 4[ [2 – » signifie que la valeur « 2 » est inclue dans la classe « – 4 [» signifie que la valeur « 4 » est exclue de la classe Tous les éléments de la population étudiée (femmes) doivent se retrouver dans une et une seule classe Exemple 2 : Salaires mensuels des employés d’une entreprise « X » en Gdes au 31/12/2006 3 classes de salaires : a) De 6000 à moins de 7000 DH: [6000 – 7000[ Cette classe comprendra un employé dont le salaire = 6999 tandis qu’un salarié dont le revenu = 7000 s’en trouvera exclu b) De 7000 à moins de 9000 DH: [7000 – 9000[ c) De 9000 à moins de 12 000 DH: [9000 – 12 000[ Pour des raisons pratiques, on retient généralement comme extrémités de classes des valeurs « rondes » Effectuer aisément des calculs sur les extrémités de classes comme pour le calcul de l’amplitude des classes et du centre des classes L’amplitude de classe = la différence entre la valeur de l’extrémité supérieure et la valeur de l’extrémité inférieure. L’amplitude a d’une classe i sera donnée par la formule suivante : a i = e i sup – e i inf L’amplitude de classe = la différence entre la valeur de l’extrémité supérieure et la valeur de l’extrémité inférieure. Préparé et présenté par Spenson NOEL Licencié en Sces Economiques et en Sces de l’Education (Mathématiques) L’amplitude a d’une classe i sera donnée par la formule suivante : a i = e i sup – e i inf Exemple 1 : L’amplitude ai de la classe [6000 – 7000[ a i = e i sup – e i inf= 7000 - 6000 = 1000 Exemple 2 : Nombre d’enfants par femme Nombre d’enfants Effectifs Amplitudes ai [0 – 2 [ 4 2 [2 – 4 [ 10 2 [4 – 6 [ 6 2 Exemple 3 : Salaires des employés de l’entreprise « X »en gourdes Amplitudes ai Salaires [6000 – 7000[ 1000 [7000 – 9000[ 2000 [9000 – 12 000[ 3000 L’amplitude de la deuxième classe est 2 fois plus grande que celle de la première classe L’amplitude de la troisième classe est 3 fois plus grande que celle de la première classe Centre des classes Le centre des classes c’est la moyenne des extrémités de classe. Le centre C d’une classe i est 𝒔𝒖𝒑 noté par Ci et est donné par : 𝑪𝒊 = 𝒆𝒊 𝒊𝒏𝒇 + 𝒆𝒊 𝟐 Préparé et présenté par Spenson NOEL Licencié en Sces Economiques et en Sces de l’Education (Mathématiques) Exemple 1 : Cas où les amplitudes sont égales (Nombre d’enfants par femme) Nombre d’enfants Amplitudes Centres ci [0 – 2 [ 2 1 [2 – 4 [ 2 3 [4 – 6 [ 2 5 Exemple 2 : Cas de classes d’amplitudes inégales (Salaires des employés de l’entreprise « X » en gourdes) Salaires Amplitudes Centres ci [6000 – 7000[ 1000 6500 [7000 – 9000[ 2000 8000 [9000 – 12 000[ 3000 10 00 Préparé et présenté par Spenson NOEL Licencié en Sces Economiques et en Sces de l’Education (Mathématiques) Application : Répartition des Salaires des employés de l’entreprise « Y » en gourdes, compléter le tableau Salaires Effectifs Amplitudes Centres ci [6000 – 7000[ 10 1000 6500 [7000 – 9000[ 50 2000 8000 [9000 – 10 000[ 200 1000 9500 [10 000 – 13 000[ 20 3000 11 500 [13 000 – 17 000[ 10 4000 15 000 [17 000 – 30 000[ 5 13 000 23 500 295 - - Total Les classes sont d’amplitudes inégales La troisième classe est mal choisie car l’effectif correspondant est très important par rapport auxautres classes: on aurait pu choisir de la diviser en 2 classes d’amplitudes égales à 500 pour faire apparaître plus d’informations Caractère qualitatif : ne peut faire l’objet d’une mesure car il ne se présente pas sous forme numérique. (Ex : couleur de peau; section du bac; catégorie socio-professionnelle; etc.) On ne peut pas effectuer d’opérations arithmétiques sur les caractères qualitatifs (on ne peut additionner les couleurs de peau des êtres humains) Les caractères qualitatifs se déclinent en plusieurs modalités Modalités : les différentes valeurs prises par un caractère qualitatif Exemple 1 : la variable « sexe » à deux modalités « Masculin » « Féminin » Préparé et présenté par Spenson NOEL Licencié en Sces Economiques et en Sces de l’Education (Mathématiques) Exemple 2: la variable «couleurs des yeux» peut prendre comme modalités « Noir » « Brun » « Bleu » « Vert » « Gris » Exemple 3 : si la population est décrite selon le caractère « CSP agrégées », les différentes modalités seront : Catégories Socio-Professionnelles (CSP) Agrégées Agriculteurs, exploitants Artisans, commerçants et chef d’entreprises Cadres et professions intelectuelles supérieures Professions intermédiaires Employés Ouvriers Retraités Autres personnes sans activité professionnelle Les modalités d’un caractère qualitatif sont exhaustives et mutuellement incompatibles Exhaustives : à chaque individu doit correspondre une modalité du caractère Exemple : enquête sur l’état matrimonial d’un groupe d’individu Pour satisfaire la condition d’exhaustivité, on doit avoir quatre modalités du caractère « Etat matrimonial » : Célibataire, Marié, Veuf, Divorcé Incompatibles : Chaque individu doit pouvoir être classé dans une seule modalité du caractère Ex : Un individu ne peut être à la fois « célibataire » et « marié » Les modalités d’un caractère qualitatif peuvent être ordinales ou nominales Les modalités ordinales : peuvent être classées ou hiérarchisées Préparé et présenté par Spenson NOEL Licencié en Sces Economiques et en Sces de l’Education (Mathématiques) Ex : Enquête réalisée en 2006 par l’association « Des Entrepreneurs de Hinche » sur le degré de satisfaction des Hinchois ayant vécu à l’étranger et franchi le cap du retour à Hinche. Le Caractère : « Degré de satisfaction » Les modalités du caractère : « Satisfait », « Assez Satisfait », « Peu Satisfait », « Pas Satisfait » Modalités % Satisfait 28,06% Assez Satisfait 33,73% Peu Satisfait 23,28% Pas Satisfait 14,93% Les modalités sont ordinales car on peut les classer - Le classement effectué va de l’opinion « Satisfait » à l’opinion « Pas Satisfait » - On passe d’une préférence positive à une préférence de plus en plus négative Les modalités ordinales ne peuvent faire l’objet d’aucune opération arithmétique Les modalités nominales : ne peuvent pas être classées (hiérarchisées) Exemple : Classement d’un groupe de 15 étudiants selon leur ville de naissance Modalités Effectif Hinche 9 Thomonde 4 Cerca-la-source 1 Mirbalais 1 Les 4 modalités du caractère « Ville de naissance » sont nominales et nepeuventfairel’objet d’aucunclassement hiérarchique Préparé et présenté par Spenson NOEL Licencié en Sces Economiques et en Sces de l’Education (Mathématiques) Exercice application 1- Un restaurant de classe désire de faire une enquête auprès de sa clientèle. On décide donc qu’a chaque client qui viendra la semaine suivante, on lui demandera de remplir une petite carte ou celui-ci indiquera son sexe, son degré de satisfaction, son heure d’arrivée, le nombre de personne qui l’accompagnent et le montant de l’addition, indiquer quelle est la population concernée et l’échantillon choisi, quelles sont les variables statistiques étudiées et quelles seraient les modalités de celles-ci. 2- Dans un sondage réalisé auprès d’un échantillon de 450 personnes âgées de 18 ans et plus demeurant dans la région du plateau central, on a demandé si on croyait qu’il y a beaucoup de gens marries ou en union libre qui ne se séparent pas à cause des enfants. Indiquer la population statistique, la variable concernée et le type d’échelle de mesure utilisé. 3- Une compagnie d’assurance désirant faire une proposition aux étudiantes en secrétariat du CFTPOSC/KEK décide au préalable de faire une étude sur les étudiantes concernées pour connaitre le sexe, l’âge au premier janvier, la taille, la masse et le nombre d’hospitalisation déjà subies. Déterminer la population, l’unité, les variables statistiques et les modalités de ces variables. Préparé et présenté par Spenson NOEL Licencié en Sces Economiques et en Sces de l’Education (Mathématiques)