2016-2017 Sciences Analytiques
III) NOTION DE DISTRIBUTION D'UNE VARIABLE
La distribution de la variable est une notion qui va être exhaustive en terme de caractérisation de la
variable.
Si on reprend l'exemple du titrage, et que l'on trouve une moyenne des variables observées de 8 mL, on
ne sait pas si nos valeurs sont systématiquement entre 7,95 et 8,05 ou entre 7 et 9.
La moyenne et l'écart-type ne suffisent pas à décrire l'ensemble des données.
Nous avons besoin de décrire la distribution pour être complet.
A) Dispersion et densité de probabilité
Avec ces 2 séries d'observations :
À travers ce dessin est-ce que le fait de donner la moyenne, l'écart-type suffit à avoir une vue d'ensemble
des observations ?
Echantillon 1 : la moyenne et le point d équilibre c'est x1.
Echantillon 2 : si on regarde les 5 observation, dans les 3, il y en a 2 qui sont très grandes. La moyenne
peut être placé au même endroit.
-Dans les 2 séries on a la même moyenne. Mais une moyenne identique ne signifie pas pour que l'on ait
le même genre de valeurs.
Dans le premier échantillon nos valeurs sont uniformes, alors que dans le deuxième échantillon, on voit
que beaucoup d'observations sont très éloignées.
-De même au niveau de l'écart-type. Si on calcul l'écart type on aurait a peu près la même valeur dans les
deux échantillons.
Ce qui montre bien que la moyenne et de l'écart-type ne nous donne pas une connaissance complète des
observations.
Rappel : la moyenne donne la tendance centrale (au niveau de quelle valeur je me trouve) : l'écart-type
donne la dispersion (de combien je me dispersion, mais on ne sait pas de comment je me disperse, c'est à
dire plus/moins à gauche ou à droite).
B) Détermination de la forme de la distribution
Pour être complet en terme d'informations de l'échantillon, il faut prendre l'ensemble des données et
utiliser une représentation graphique qui rend compte de la répartition et distribution des données.
On utilisera un histogramme.
L'histogramme décrit parfaitement la densité au niveau de l'échantillon.
Exemple : 50 déterminations à deux décimales près du pH d'une solution tampon ont fourni les résultats suivants
4/11