X i

publicité
Analyse statistique des données
expérimentales
Incertitudes et analyse des erreurs
dans les mesures physiques
John Taylor
Plan
•
•
•
•
•
Introduction : incertitudes sur les données
Probabilités
Distributions de probabilités
Incertitudes, propagation des incertitudes
Ajustement de courbes
Mesure et incertitude
• Toutes les quantités mesurées le sont à une
précision finie
• La science de la mesure consiste à
– mesurer à la meilleure précision possible
– d’évaluer l’incertitude sur la mesure
Erreur vs incertitude
• Erreur : écart entre la mesure et la valeur vraie (en
général inconnue)
• Incertitude : écart probable
• Les barres d’incertitude contiennent probablement
la valeur vraie
• Attention de ne pas sous-évaluer l’incertitude
• Mieux vaut une mesure présentant une grande
incertitude mais qui contienne la valeur vraie que
l’inverse
Mesure et incertitude
• Chiffres significatifs et mesure
• Quelle est la signification de :
–
–
–
–
–
Albert a 22 ans
J’ai parcouru 100 kilomètres à vélo
Le LEP mesure 26,66 km de circonférence
Ce pointeur laser éclaire à 50 m
This laser pointer shines to 54,68 yards
Mesure et incertitude
• Quelle est la signification de:
– G = (6,67428 ± 0,00067) × 10-11 m3 kg-1s-2
– me = (9,10938215 × 10-31 kg) ± 50 ppb
– www.physics.nist.gov/constants
Chiffres significatifs
a = 7,35678 ± 0,345 (utilisation incorrecte)
a = 7,3 ± 0,3
a = 7,356 ± 0,04
a = 7,3568 ± 0,005
a = 7,35678 ± 0,0007
On arrondit l’incertitude à 1 chiffre significatif
On arrondit la valeur au dernier chiffre significatif
Chiffres significatifs (exemple)
• Soit a = 3 m et b = 7 m
• a/b = 0,428571 ... ?
• a/b = 0,4
Incertitude
•
•
•
•
•
•
Erreur de mesure
Erreur systématique
Incertitude aléatoire
Incertitude sur une quantité dérivée
Propagation des incertitudes
Distribution de probabilité
Erreur de mesure
• Mesure de distance avec une règle graduée
en millimètres:
– La précision ~ ½ mm
• Mesure de tension avec un multimètre:
– La précision dépend de l’appareil
– L’appareil est très précis mais la tension varie
Erreur systématique
• Vous avez mesuré une longueur à ± ½ mm
– Mais la règle est fausse de 10% !
• Vous avez mesuré une tension à 0,01%
– Mais l’appareil est décalibré de 5%
• Vous avez fait une mesure avec grand soin
– Mais un des appareils était débranché
Incertitude aléatoire (statistique)
• Vous répétez une
mesure 100 fois
• Les résultats se
ressemblent mais ...
Incertitude
• L’ensemble des valeurs possibles sont décrites
par une distribution de probabilité
• L’incertitude représente un intervalle à l’intérieur
duquel la vraie valeur se trouve probablement
• L’incertitude = 1 déviation standard
Incertitude
Quelle est la signification de:
– G = (6,67428 ± 0,00067) × 10-11 m3 kg-1s-2
– me = (9,10938215 × 10-31 kg) ± 50 ppb
– L’incertitude = une déviation standard
– La probabilité que la vraie valeur soit dans cet
intervalle est de 68%
Exemple de mesures
• Fréquence d’un pendule (~ 1 s)
• Chronomètre très précis (~ 1s par an)
• À quelle précision puis-je mesurer la
période ?
– quelques dixièmes de seconde
• L’histogramme présente une fluctuation
• Je peux moyenner sur plusieurs périodes
Exemple de mesures
• Fréquence de ma respiration
• Même précision de mesure que
précédemment
• L’histogramme est plus large
• Le phénomène présente plus de variabilité
que la précision de la mesure
• Je peux moyenner
Incertitude relative ou fractionnaire
–
–
–
–
G = (6,67428 ± 0,00067) × 10-11 m3 kg-1s-2
G = 6,67428 × 10-11 m3 kg-1s-2
dG = 0,00067 × 10-11 m3 kg-1s-2
dG/G = 0,00067/ 6,67428 = 10-4 = 0,01 %
– me = (9,10938215 × 10-31 kg) ± 50 ppb
– d me / me = 5 × 10-8
– d me = 4,6 × 10-38 kg
Propagation des incertitudes
Additions et soustractions
• a=9±3
• b=7±2
a entre 6 et 12
b entre 5 et 9
• s = a + b = 16 ± 5 car s entre 11 et 21
• d = a - b = 2 ± 5 car d entre -3 et 7
Propagation des incertitudes
Produits et quotients
• a = 29 ± 3
• b = 37 ± 2
a entre 26 et 32
b entre 35 et 39
• ab = 1073 et est entre 910 et 1248
Probabilités
et
Statistiques
Probabilité
• Probabilité qu’un événement X se produise
lim nombre de succès
P
N 
N
Où N = nombre d’essais
Probabilité
• On lance un dé
• 6 résultats possibles
• Chaque résultat a un pi = 1/6
0  pi  1
 pi  1
Normalisation
Complément
• p = la probabilité que X se produise
• 1 - p = la probabilité que X ne se produise pas
• q = 1 - p est le complément de p
Calcul de la probabilité
• 1) Calculez le nombre total de
combinaisons N, supposées équiprobables
• 2) Calculez le nombre de ces combinaisons
qui représentent un succès S
• 3) p = S/N
Calcul de probabilité
• Probabilité de tirer 3 avec 1 dé
• 1) N = 6 possibilités
• 2) S = 1 seule bonne combinaison
• 3) p = 1/6
Calcul de probabilité
• Probabilité de tirer une somme de 4 avec 2
dés
• 1) N = 6 x 6 = 36 possibilités
• 2) S = 3
(1,3) (2,2) (3,1)
• 3) p = 3/36 = 1/12
Calcul de probabilité
• Probabilité de tirer une somme de 7 avec 2
dés
• 1) N = 36
• 2) S = 6
(énumérez les)
• 3) p = 6/36 = 1/6
Distribution de probabilité
• Indique la probabilité de succès pour
chaque type d’événement
• Se présente sous forme graphique
Distribution pour 1 dé
Somme de 2 dés
Distributions
• Propriétés des distributions
– Moyenne, mode, médiane
– Valeur attendue
– Moments
• Distributions de probabilité particulières
– Binôme, Gauss, Poisson, ...
2 types de distributions
• Distributions discrètes
• Distributions continues
Distributions discrètes
(comme on a déjà vu)
– P(xi) > 0 pour des xi discrets
– P(xi) = 0 partout ailleurs
 pi  1
Somme de 2 dés
Distributions continues
• Le nombre de résultats permis est 
• Chaque résultat a une probabilité = 0
• On définit la densité de probabilité
f(x) dx = probabilité de trouver le résultat entre
x et x + dx

Normalisation:
 f ( x)dx  1
-
Distribution continue
Mode
• Valeur la plus probable
= 7 pour la somme de 2 dés
Non défini pour un dé
Non défini pour pile ou face
Médiane
• Point qui sépare la distribution en 2 moitiés
égales
• = 7 pour la somme de 2 dés
• = 3,5 pour un dé
(ou toute valeur entre 3 et 4)
Moyenne
• Ou valeur attendue
• Discrète :
   xi p( xi )

• Continue :
   xp ( x)dx
-
Pour une distribution symétrique
• Moyenne = Mode = Médiane
Valeur estimée
• Moyenne =
 xi p( xi )
ou
 xp( x)dx
– est la valeur attendue (ou estimée) de x
– Notée
x
• La moyenne de x est la valeur estimée de x
• La valeur attendue de toute fonction f(x) est
f   f ( xi ) p( xi ) ou
 f ( x) p( x)dx
Normalisation
 p( xi ) 1 p( xi )  1
 p( x)dx  1 p( x)dx 1
La normalisation représente la valeur attendue de 1
qui est bien sûr égale à 1
Propriétés de la valeur attendue
af ( x)  bg ( x)  a f ( x)  b g ( x)
x
n
 x
n
Ex: N lettres au hasard dans N enveloppes
Combien y a-t-il de lettres dans la bonne enveloppe?
Xi= 0 ou 1 selon que la lettre i est dans la bonne enveloppe ou non
Ex: N lettres au hasard dans N enveloppes
Combien y a-t-il de lettres dans la bonne enveloppe?
Xi= 0 ou 1 selon que la lettre i est dans la bonne enveloppe ou non
Xi  1
N
X   Xi
X 
 Xi
  X i  1 / N  N *1 / N  1
Quel que soit N, il y a en moyenne 1 lettre dans la bonne enveloppe
Moments
• Différentes
distributions
peuvent avoir la
même moyenne
mais être
différentes
Moments
• On peut représenter une distribution par
l’ensemble de ses moments
mi  x
i
m0  1
Normalisation
m1  µ
Moyenne
m2  x
2
...
Moments centrés
• On soustrait la moyenne pour recentrer
µi   x - µ 
i
µ0  1
Normalisation
µ1  0
Moyenne recentrée = 0
µ2   x - µ 
...
2
Variance = s
Écart-type
• Représente la largeur
de la distribution
s = Écart quadratique
moyen
= Déviation
moyenne
s  ( x - µ) 2  x 2 - 2 µx  µ2
 x 2 - 2 µx  µ2
 x 2 - 2µ x  µ2
 x 2 - 2 µµ  µ2
 x
2
-µ  x
s s
2
x
2
2
- x
- x
2
2
Mesure et incertitude
• Je mesure une quantité 5 fois
• x = 17, 16, 18, 17, 18
• Quelle est la valeur probable de x et son
incertitude ?
1

µ  x   xi  17,2 
5

 x  17,2  0,7
1
2
2
s
x
µ
 0,7 

i

5
Probabilité de N événements
• Obtenir 25 piles en 35 lancers
• Obtenir 30 fois 6 en 100 lancers
• Que 10 noyaux de radium se désintègrent en
5 minutes
• Que la bactérie se divise 20 fois en 1 heure
• Que 8 de vos 10 mesures soient dans un
certain intervalle
Distribution binômiale
• On lance un dé 100 fois
• La valeur attendue du nombre de 6 est ~17
• Quelle est la probabilité de tirer r fois 6 ?
• Toutes les séries (a1, a2,..., a100) sont
équiprobables
• La probabilité de 6 à chaque case est p = 1/6
• Chaque combinaison de r succès et n- r
échecs a une probabilité p r (1 - p) n-r
•Il y a  n 
n!
  
 r  r!(n - r )!
combinaisons de r
succès
Probabilité pour r succès et n- r échecs =
n!
r
n-r
PB (r; n; p) 
p (1 - p)
r!(n - r )!
µ  np  20 / 6  3,33
s  np(1 - p)  1,67
µ  np  100 / 6  16,66
s  np(1 - p)  3,727
Désintégration radioactive
• 1 g de radium = 2,7*1021 atomes
= 1 Ci = 1,7*1010 désintégrations/s
• Demi-vie = 5,26 *108 min ~ 1000 ans
• Probabilité qu’un atome donné se désintègre
dans les 5 minutes est faible p ~ 10-8
• µ = np = 5*1012 désintégrations en 5
minutes
• Probabilité de r désintégrations =
n!
r
n-r
PB (r; n; p) 
p (1 - p)
r!(n - r )!
Mais n! est impossible à calculer
n est très grand
p est très petit
np = µ est fini
On remplace p par µ/n
r
n!  µ 
µ n-r
PB (r ; n; p ) 
  (1 - )
r!(n - r )!  n 
n
µ n
r (1 - )
n!
µ
n

r!(n - r )! n r (1 - µ ) r
n
µ n
µ (1 - )
n(n - 1)...( n - r  1)
n

µ r
n r r!
(1 - )
n
r
µ n
µ (1 - )
n(n - 1)...(n - r  1)
n
PB (r ; n; p ) 
r
µ r
n r!
(1 - )
n
n
lim  µ 
-µ
1 -   e
n   n 
r
r
lim  µ 
1 -   1
n   n 
lim n(n - 1)...(n - r  1)
1
r
n
n
Distribution de Poisson
µ n
µ (1 - )
n(n - 1)...(n - r  1)
n
PB (r; n; p) 
r
µ r
n r!
(1 - )
n
-µ r
lim
e µ
PB (r; n; p) 
 PP (r , µ)
n
r!
r
n = 10, p = 0,5
µ=5
n = 100, p = 0,05
µ=5
Propriétés de la distribution de
Poisson
• Normalisation
e- µ µ x
 PP ( x, µ)   x! 
x 0


x
µ
e - µ   e - µe µ  1
x 0 x!
• Écart-type
s  np(1 - p)  np  µ
Rayons cosmiques
•
•
•
•
180 rayons cosmiques / (m2 min)
Combien en passe-t-il en 10 secondes ?
µ = 180*10/60 = 30
On peut prédire qu’il passera 30  30
rayons cosmiques en 10 secondes
10 secondes
  30
s  30  5,5
1 seconde
 3
s  3  1,7
Distributions de Poisson
•
•
•
•
•
Nombre de fautes de frappe dans une page
Nombre d’individus vivant plus de 100 ans
Nombre de a émis par une source
Nombre d’incendies à Montréal par semaine
Nombre de gens tirant le numéro gagnant
Additivité
• x obéit à PB ( x, m, p )
• y obéit à PB ( y, n, p)
• Alors, z = x + y obéit à
PB ( z , m  n, p )
z  x  y
sz  sx s y
2
2
Additivité
• x obéit à PP ( x, µ1 )
• y obéit à PP ( y, µ2 )
• Alors, z = x + y obéit à PP ( z , µ1  µ2 )
z  x  y
sz  sx s y
2
2
Distribution gaussienne
• La distribution de Poisson est asymétrique
• Mais devient plus symétrique pour µ grand
• Pour µ>30, la distribution est symétrique
10 secondes
  30
s  30  5,5
1 seconde
 3
s  3  1,7
Distribution gaussienne
•
•
•
•
•
Abraham de Moivre 1733
Distribution continue de -  à  
Maximum en x = µ
Forme en cloche
D’application très générale
– Théorème de la limite centrale
• Approximation de PP ( x, µ) pour µ grand
Distribution gaussienne
•
•
•
•
Taille des individus
QI
Incertitudes
Vitesse des molécules

x-µ 
-
2
1
PG ( x) 
e
2 s
2s 2
Distribution gaussienne
• 2 paramètres : µ et s
• Symétrique autour de µ
Additivité
• x obéit à PG ( x, µx , s x )
• y obéit à PG ( y, µy ,s y )
• Alors, z = x + y obéit à
PG ( z, µz , s z )
z  x  y
sz  sx s y
2
2
Distribution normale
• Distribution gaussienne
• µ=0
s=1
PN ( x) 
Fonction tabulée
Fonction standard
1
2
x2
2
e
Distribution normale
1
 PN ( x)dx  0,68269  68%
-1
0, 68
 PN ( x)dx  0,5
-0, 68
P.E.  0,68s
Largeur à mi-hauteur
  2,35s
Distribution gaussienne
s
 PG ( x)dx  0,68269  68%
-s
 0, 68s
1
 PG ( x)dx  2
-0, 68s
P.E.  0,68s
  2,35s
Fonction erreur erf(x)
erf (a) 
a
1
a
e

 -a
- x2
dx
a
1
 PN ( x)dx   
-a
-a
2
e
2
- x2


a
dx  erf 

2

Fonction erreur
erf (0)  0
erf ()  1
erf (s 2 )  0,68
erf (0,68s / 2 )  0,5
Théorème de la limite centrale
• Sans démonstration
• Indique pourquoi tant de phénomènes
obéissent à une distribution gaussienne
Théorème de la limite centrale
• Soit xi i = 1, ..., n n variables indépendantes
• Les xi obéissent à des distributions
caractérisées
par
des
µ
et
des
s
i
i
n
• Alors,  xi est distribuée selon une
i 1
•
gaussienne avec
n
µ   µi
i 1
et
n
s  s i
2
i 1
2
  30
s  30  5,5
 3
s  3  1,7
Lorentz
• Pas de lien avec les autres distributions
• Phénomènes de résonance
• Circuits RLC
Lorentz
PL 
• s est infini
• On utilise 
1

2
 x - µ  
2


2
2
Lorentz
Téléchargement