Résumé:
Statistique: Tirer des conclusions sur des données sur base d’un échantillon => Inférer à
la population.
Statistique descriptive : Méthodes de présentation des données de l’échantillon
(graphiques ou par calcul)
Inférence statistique : Tirer des conclusions sur la population à partir de l’échantillon
pour ce faire on va utiliser un outil d’aide que sont les probabilités.
Echantillon :Contient des valeurs observées (empiriques), il s’agit d’un sous ensemble de
la population que l’on peut mesurer. L’échantillon devra être représentatif de ma
population (chaque élément de l’échantillon devra avoir la même probabilité que
n’importe quel autre de la population d’être tiré => tirage ALEATOIRE)
L’échantillon contient la liste des données observées{y1,y2,y3, …, yn}
A partir de cette liste on peut définir la distribution empirique des fréquences relatives
des valeurs observées.
On peut observer cette liste via des moyens graphiques :
Tableaux- graphiques, diagrammes, ..
Ou via des valeurs numériques (autre façon de résumer une distribution empirique de
fréquence)
Au moyen de paramètres de dispersion
, localisation
(où se trouve le gros de la distribution
), indicateur de symétrie.
Population :quand on passe au niveau de la population il y a plein de choses
inobservables, car la population est en général trop grande.
Comme on ne sait pas trop ce qui se passe en détail, on va définir un modèle. Pour
construire le modèle on va utiliser l’échantillon. Le modèle nous permettra de tirer des
conclusions sur la population. Ce qui nous amène à la distribution théorique de
probabilités : il s’agit d’un modèle théorique qui me dit avec quelle fréquence, chacune
de mes observations va apparaître. Ce modèle théorique décrit ce que l’on devrait
observer (pas ce que l’on observe, ou ce que l’on a observé)
Il faut toujours décrire le modèle dont on parle, pour pouvoir se comprendre.
Pour spécifier le modèle, il faut d’abord décrire l’espace d’échantillonnage
, il s’agit de
l’ensemble des valeurs que peut prendre la variable aléatoire, ainsi que les probabilités pi
associées à ces valeurs.
On dit aussi que les valeurs que peut prendre la variable sont les évènements simples (à
vérifier ???)
Il existe différent type de variables aléatoires et différents types de distribution de
probabilité associées.
Les variables aléatoires discrètes :
L’espace d’échantillonnage est composé de valeurs énumérables
On peut donc pour chaque valeur définir la probabilité
={x0,x1,x2, …
p={p0,p1,p2,…