LINF2275
Probabilités et Statistiques:
Quelques petits rappels
Christine Decaestecker & Marco Saerens
ULB & UCL
Introduction 2LINF2275
Probabilités et Statistiques: Introduction
marche statistique:
Etude d’un ensemble dobjets (cas, individus, ...) sur lesquels on observe des
caractéristiques appelées «!variables!».
population = ensemble, collection d!’objets équivalents sensés partager des
propriétés communes.
Statistique = étude des propriétés générales des populations plutôt que des
propriétés particulières des individus.
Ex: contrôle de qualité de pièces usinées:
Pour un certain type (une population) de pièces (fabriquées dans des conditions
terminées): proportion de pièces défectueuses?
Echantillonage:
Etude exhaustive d!’une population trop vaste (peut être infinie), difficile et/ou
coûteuse;
étude d’une partie (représentative) ou échantillon
Introduction 3LINF2275
Types de variable: (caractéristique, descripteur, attribut)
qualitative: valeurs = labels dappartenance à une catégorie
nominale (sans notion dordre, ex: sexe, type de traitement, ...);
ordinale (ordre sur les labels, ex : faible, moyen, fort);
quantitative: à valeurs numériques
entière (nombre fini ou dénombrable de valeurs, ex: nombre d’accidents de la
route par an);
continue (toutes les valeurs dun intervalle réel sont observables,
ex: température, pression sanguine, ...).
Variables quantitatives: les opérations arithmétiques (somme, moyenne, ...)
ont un sens;
Variables qualitatives: seules les opérations de comptage ont un sens!
Introduction 4LINF2275
Analyse statistique
= étude de la variabilité des caractéristiques des individus.
Des individus apparemment semblables ont géralement des valeurs
différentes pour les différentes variables qui les caractérisent.
Utilités de l’analyse statistique:
prévoir (de façon probabiliste) le comportement dindividus non encore
observés;
réduire ou expliquer la variabilité à l’aide dautres variables;
utiliser la variabilité pour distinguer au mieux les individus (ou groupes
d’individus) entre eux.
Introduction 5LINF2275
Tableaux de données:
échantillon de n individus sur lesquels on observe p variables:
Variables
X1X2XjXp
1
2
i xij
I
n
d
i
v
i
d
u
sn
notations vectorielles:
ième observation = vecteur xi!=![xi1, xi2, ..., xip]T
ou x(i) = [x1(i), x2(i),..., xp(i)]T : ième réalisation du vecteur aléatoire x
Le tableau de données = une matrice (xij) avec i = 1, ..., n et j = 1, ..., p
(utilisation d'outils du calcul matriciel)
1 / 32 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !