Statistique & Probabilité INTRODUTION Cours Statistiques 1 Utilité de la statistique pour l’ingénieur Les méthodes statistiques sont utilisées dans de très nombreux domaines : • ingénierie : contrôle de qualité des procédés de fabrication, sûreté de fonctionnement (fiabilité, sécurité,…) • médecine : expérimentation de nouveaux traitements ou médicaments • économie : prévisions économétriques, études quantitatives de marchés • prévisions de tous ordres : météorologiques, démographiques, sociologiques,… • politique : sondages d’opinion Cours Statistiques 2 Étapes d’une étude statistique Une étude statistique comporte essentiellement quatre (4) étapes: 1. 2. 3. 4. Collecte des données Statistique descriptive Statistique inférentielle (inférence statistique) Décision statistique Cours Statistiques 3 Collecte des données Consiste à rassembler de l’information qui est déjà disponible dans des documents préétablis ou encore à recueillir des données originales. Sources de données Primaire Collecte des données Secondaire Compilation de données Observation Imprimées ou Électroniques Sondage Expérimentation Cours Statistiques 4 Collecte des données: Terminologie Une population (P) se définit comme un ensemble d’unités statistiques (individus, entreprises, dossiers, projets, …) qui ont des caractéristiques communes. On note par N la taille de la population. Card(P)=N (l’effectif total) Une unité statistique : un être humain, un objet concret ou un objet abstrait. Un échantillon est tout sous-ensemble de la population. On note par n la taille de l’échantillon. Un caractère ou une variable statistique c’est l’aspect que l’on désire étudier chez un individu. On note : X,Y, Z,…. Cours Statistiques 5 Collecte des données: Terminologie Caractère ou variable statistique – C’est l’aspect particulier que l’on désire étudier chez un individu. Des caractéristiques physiques (taille, poids, couleurs des cheveux ou des yeux,…) Des caractéristiques du personnel d’une entreprise (sexe, âge, état matrimonial, nombre d’enfants à charge, qualification, salaire, …) … Modalité : – Ce sont les différentes possibilités que peut présenter un caractère. Sexe : masculin ou féminin Salaire : 1000 D, 1200 D, … État matrimonial : célibataire, marié, veuf et divorcé. Âge : 1, 2, 3, …, 99, … … On note : Le caractère X présentent k modalités Xi (i=1,…,k) Cours Statistiques 6 Terminologie Un caractère peut être : – Qualitatif : si ses modalités ne s’expriment pas par un nombre (non quantifiable) Sexe, état matrimonial, … – Quantitatif : si ses modalités sont numériques (quantifiable) Salaire, âge, poids, … Il y a deux types de caractères quantitatifs : Discret : lorsque les modalités de ce caractère ne peuvent prendre que des valeurs isolées (le plus souvent entières) (nombre d’enfants, nombre de chambres, …) Continue : lorsque les modalités de ce caractère sont susceptibles de prendre n’importe quelle valeur dans un intervalle donné (salaire, taille, poids, …) généralement dans R Cours Statistiques 7 Terminologie Série statistique (données brutes) C’est l’ensemble des données associées aux individus d’un échantillon ou d’une population, c’est des données brutes Exemple de série statistique (Tableau illisible difficile à interpréter) Cours Statistiques 8 Collecte des données Procéder par recensement : Observer la totalité de la population statistique (on a une information complète sur le phénomène étudié) Procéder par Échantillonnage ou sondage : Observer une partie de la population statistique appelé un échantillon (on a une information incomplète sur le phénomène étudié ) Cours Statistiques 9 Statistique Descriptive C’est un traitement des données qui a pour but : Présenter les données collectées sous une forme exploitable (Tableau statistique et graphique) Résumer et décrire les principales caractéristiques des données collectées par des paramètres (exp: moyenne, variance, proportion) essentielles qui se dissimulent dans une masse de données. 90 80 70 60 50 40 30 20 10 0 East Xi Exp de paramètre : Moyenne : i N 1st Qtr 2nd Qtr3rd Qtr 4th Qtr Cours Statistiques 10 Statistique Inférentielle Regroupe l’ensemble des méthodes (Estimation de paramètres, Tests d’hypothèses, Régression linéaire, …) qui permettent de tirer des conclusions sur une population à partir d’une information partielle provenant d’un échantillon. Échantillon population Information sur la population Information sur l’échantillon Inférence statistique Cours Statistiques 11 Décision statistique Regroupe un ensemble de techniques permettant de déterminer la meilleure action parmi un ensemble d’actions envisageables dans un contexte d’incertitude. Cours Statistiques 12