
Traitement et évaluation des données statistiques
3.1 Intervalles de confiance
Dans la plupart des analyses chimiques quantitatives, la valeur vraie de la moyenne µ
ne peut pas être déterminée car un grand nombre de mesures (se rapprochant de l’infini)
seraient nécessaires. Avec les statistiques, cependant, nous pouvons établir un intervalle
autour de la moyenne ¯xexpérimentalement déterminée à l’intérieur de laquelle la moyenne
de la population µdevrait se situer avec un certain degré de probabilité. Cet intervalle
est reconnu comme l’intervalle de confiance. Parfois, les limites de l’intervalle sont
appelées limites de confiance. Par exemple, on pourrait dire qu’il est 99% probable
que la vraie moyenne de la population pour un ensemble de mesures de potassium se
trouve dans l’intervalle 7,25 ±0,15% K. Ainsi, la probabilité que la moyenne se situe
dans l’intervalle de 7,10 à7,40% Kest de 99%.
La taille de l’intervalle de confiance, qui est calculée à partir de l’écart-type de l’échan-
tillon, dépend de la mesure avec laquelle l’écart type de l’échantillon sestime l’écart type
de la population σ. Si sest une bonne estimation de σ, l’intervalle de confiance peut être
significativement plus étroit que si l’estimation de σest basée sur seulement quelques
valeurs de mesure.
3.1.1 Détermination de l’intervalle de confiance lorsque σest
connu ou sest une bonne estimation de σ
La Figure 3.1 montre une série de cinq courbes d’erreur normales. Dans chacun,
la fréquence relative est représentée en fonction de la quantité z(voir équation 2.7),
qui est l’écart par rapport à la moyenne, divisé par l’écart-type de la population. Les
zones ombrées dans chaque diagramme se situent entre les valeurs de −zet +zqui sont
indiquées à gauche et à droite des courbes. Les nombres sur les zones ombrées sont les
pourcentages des surfaces totales sous la courbe qui est incluse dans ces valeurs de z. Par
exemple, comme le montre la courbe (a), 50% de la surface sous n’importe quelle courbe
gaussienne est située entre −0,67σet +0,67σ. En passant aux courbes (b) et (c), nous
voyons que 80% de la superficie totale se situe entre −1,28σet +1,28σet 90% entre
−1,64σet +1,64σ.
Des relations comme celles-ci nous permettent de définir une gamme de valeurs autour
d’un résultat de mesure à l’intérieur duquel la vraie moyenne est susceptible de se situer
avec une certaine probabilité à condition d’avoir une estimation raisonnable de σ. Par
exemple, si nous avons un résultat xd’un ensemble de données avec un écart-type de σ,
nous pouvons supposer que 90 fois sur 100, la vraie moyenne µtombera dans l’intervalle
x±1,64σ(voir Figure 3.1c). La probabilité est appelée le niveau de confiance (NC).
Dans l’exemple de la Figure 3.1c, le niveau de confiance est de 90% et l’intervalle de
confiance est de −1,64σà+1,64σ. La probabilité qu’un résultat se situe en dehors de
l’intervalle de confiance est souvent appelée le niveau de signification.
Prof. A. Makan 26