Summer School CEA-EDF-INRIA 2011 of Numerical Analysis 1
INTRODUCTION
A
LA STATISTIQUE
Summer School CEA-EDF-INRIA 2011 of Numerical Analysis 2
Statistique pour l’ingénieur
Prendre en compte l’aléatoire dans le processus décisionnel
Comment prévoir en présence du hasard ?
Objectifs
Ambiguïté du terme
Ensemble de méthodes permettant
d’analyser (de traiter) des ensembles
d’observations (des données)
Donnée statistique (ex. : statistique du
commerce extérieur français)
Les données
Enquêtes socio-économiques
Observations de phénomènes naturels
Résultats d’expériences scientifiques
Résultats de simulations numériques
La Statistique
Une statistique
Summer School CEA-EDF-INRIA 2011 of Numerical Analysis 3
Démarche statistique
Statistique
Descriptive
(Exploratoire)
Description synthétique des données :
Représentations graphiques,
Tableaux,
Indicateurs numériques (moyenne, écart-type …).
Analyse de données
classification, analyse factorielle, …
Pas de modèles probabilistes dans cette étape
Statistique
Inférentielle
(Décisionnelle)
Étendre les propriétés constatées sur un échantillon
à toute une population (inférence statistique) :
Estimation d’une moyenne, variance,
Tests d’hypothèse,
Proposer des modèles probabilistes pour gérer des
risques d’erreurs.
Les probabilités jouent un rôle fondamental dans
cette étape
Summer School CEA-EDF-INRIA 2011 of Numerical Analysis 4
SOMMAIRE
1. Définitions et rappels de probabilités
1.1 Terminologie
1.2 Variables aléatoires
1.3 Lois de probabilité
2. Analyse descriptive unidimensionnelle
3. Estimations paramétriques et non paramétriques
4. Tests d’hypothèse
5. Plan d’expériences
6. Régression linéaire
Summer School CEA-EDF-INRIA 2011 of Numerical Analysis 5
Terminologie de base
Population
(limitée ou de très grande taille)
Individu ω
ωω
ω:tout élément de la population
Échantillon :sous-ensemble (de taille
n
) de la population sur lequel sont
réalisées les observations
Recensement : observation (ou interrogation) de toute la population
Enquête ou sondage : observation d’un échantillon
Variable X :’ (caractéristique définie sur la population) ;
Quantitative (
’=
)
discrète
(ex : âge)
ou continue
(ex : poids)
Qualitative (
’=V)
nominale
(ex : sexe)
ou ordinale
(ex : mention)
Données : ensemble des individus observés, des variables considérées et
des observations de ces variables sur ces individus.
1 / 86 100%