Concepts de base en probabilité et statistiques

publicité
Statistique & Probabilité
INTRODUTION
Cours Statistiques
1
Utilité de la statistique pour l’ingénieur
Les méthodes statistiques sont utilisées dans de très
nombreux domaines :
• ingénierie : contrôle de qualité des procédés de
fabrication, sûreté de fonctionnement (fiabilité,
sécurité,…)
• médecine : expérimentation de nouveaux traitements
ou médicaments
• économie : prévisions économétriques, études
quantitatives de marchés
• prévisions de tous ordres : météorologiques,
démographiques, sociologiques,…
• politique : sondages d’opinion
Cours Statistiques
2
Étapes d’une étude statistique
 Une étude statistique comporte essentiellement
quatre (4) étapes:
1.
2.
3.
4.
Collecte des données
Statistique descriptive
Statistique inférentielle (inférence statistique)
Décision statistique
Cours Statistiques
3
Collecte des données
 Consiste à rassembler de l’information qui est déjà disponible
dans des documents préétablis ou encore à recueillir des
données originales.
Sources de données
Primaire
Collecte des données
Secondaire
Compilation de données
Observation
Imprimées ou
Électroniques
Sondage
Expérimentation
Cours Statistiques
4
Collecte des données: Terminologie
 Une population (P) se définit comme un ensemble d’unités
statistiques (individus, entreprises, dossiers, projets, …) qui
ont des caractéristiques communes. On note par N la taille
de la population. Card(P)=N (l’effectif total)
 Une unité statistique : un être humain, un objet concret ou
un objet abstrait.
 Un échantillon est tout sous-ensemble de la population. On
note par n la taille de l’échantillon.
 Un caractère ou une variable statistique c’est l’aspect que
l’on désire étudier chez un individu. On note : X,Y, Z,….
Cours Statistiques
5
Collecte des données: Terminologie
 Caractère ou variable statistique
– C’est l’aspect particulier que l’on désire étudier chez un individu.
 Des caractéristiques physiques (taille, poids, couleurs des cheveux ou des yeux,…)
 Des caractéristiques du personnel d’une entreprise (sexe, âge, état matrimonial,
nombre d’enfants à charge, qualification, salaire, …)
 …
 Modalité :
– Ce sont les différentes possibilités que peut présenter un caractère.






Sexe : masculin ou féminin
Salaire : 1000 D, 1200 D, …
État matrimonial : célibataire, marié, veuf et divorcé.
Âge : 1, 2, 3, …, 99, …
…
On note : Le caractère X présentent k modalités Xi (i=1,…,k)
Cours Statistiques
6
Terminologie

Un caractère peut être :
– Qualitatif : si ses modalités ne s’expriment pas par un nombre (non quantifiable)
 Sexe, état matrimonial, …
– Quantitatif : si ses modalités sont numériques (quantifiable)
 Salaire, âge, poids, …
 Il y a deux types de caractères quantitatifs :
 Discret : lorsque les modalités de ce caractère ne peuvent prendre que des
valeurs isolées (le plus souvent entières) (nombre d’enfants, nombre de
chambres, …)
 Continue : lorsque les modalités de ce caractère sont susceptibles de prendre
n’importe quelle valeur dans un intervalle donné (salaire, taille, poids, …)
généralement dans R
Cours Statistiques
7
Terminologie
 Série statistique (données brutes)
 C’est l’ensemble des données associées aux individus d’un
échantillon ou d’une population, c’est des données brutes
 Exemple de série statistique (Tableau illisible difficile à
interpréter)
Cours Statistiques
8
Collecte des données
 Procéder par recensement : Observer la totalité de la
population statistique (on a une information complète sur le
phénomène étudié)
 Procéder par Échantillonnage ou sondage : Observer une
partie de la population statistique appelé un échantillon (on a
une information incomplète sur le phénomène étudié )
Cours Statistiques
9
Statistique Descriptive
C’est un traitement des données qui a pour but :
 Présenter les données collectées sous une forme exploitable
(Tableau statistique et graphique)
 Résumer et décrire les principales caractéristiques des
données collectées par des paramètres (exp: moyenne,
variance, proportion) essentielles qui se dissimulent dans une
masse de données.
90
80
70
60
50
40
30
20
10
0
East
Xi
Exp de paramètre : Moyenne : 
i N
1st Qtr 2nd Qtr3rd Qtr 4th Qtr
Cours Statistiques
10
Statistique Inférentielle
 Regroupe l’ensemble des méthodes (Estimation de paramètres, Tests
d’hypothèses, Régression linéaire, …) qui permettent de tirer des
conclusions sur une population à partir d’une information
partielle provenant d’un échantillon.
Échantillon
population
Information sur la
population
Information sur
l’échantillon
Inférence statistique
Cours Statistiques
11
Décision statistique
 Regroupe un ensemble de techniques permettant de
déterminer la meilleure action parmi un ensemble d’actions
envisageables dans un contexte d’incertitude.
Cours Statistiques
12
Téléchargement