Résumé:
Statistique: Tirer des conclusions sur des données sur base d’un échantillon => Inférer à
la population.
Statistique descriptive : Méthodes de présentation des données de l’échantillon
(graphiques ou par calcul)
Inférence statistique : Tirer des conclusions sur la population à partir de l’échantillon
pour ce faire on va utiliser un outil d’aide que sont les probabilités.
Echantillon :Contient des valeurs observées (empiriques), il s’agit d’un sous ensemble de
la population que l’on peut mesurer. L’échantillon devra être représentatif de ma
population (chaque élément de l’échantillon devra avoir la même probabilité que
n’importe quel autre de la population d’être tiré => tirage ALEATOIRE)
L’échantillon contient la liste des données observées{y1,y2,y3, …, yn}
A partir de cette liste on peut définir la distribution empirique des fréquences relatives
des valeurs observées.
On peut observer cette liste via des moyens graphiques :
Tableaux- graphiques, diagrammes, ..
Ou via des valeurs numériques (autre façon de résumer une distribution empirique de
fréquence)
Au moyen de paramètres de dispersion
22
2
21
)( Yy
nn
Yy
si
i
y
, localisation
(où se trouve le gros de la distribution
i
y
n
Y1
), indicateur de symétrie.
Population :quand on passe au niveau de la population il y a plein de choses
inobservables, car la population est en général trop grande.
Comme on ne sait pas trop ce qui se passe en détail, on va définir un modèle. Pour
construire le modèle on va utiliser l’échantillon. Le modèle nous permettra de tirer des
conclusions sur la population. Ce qui nous amène à la distribution théorique de
probabilités : il s’agit d’un modèle théorique qui me dit avec quelle fréquence, chacune
de mes observations va apparaître. Ce modèle théorique décrit ce que l’on devrait
observer (pas ce que l’on observe, ou ce que l’on a observé)
Il faut toujours décrire le modèle dont on parle, pour pouvoir se comprendre.
Pour spécifier le modèle, il faut d’abord décrire l’espace d’échantillonnage
, il s’agit de
l’ensemble des valeurs que peut prendre la variable aléatoire, ainsi que les probabilités pi
associées à ces valeurs.
On dit aussi que les valeurs que peut prendre la variable sont les évènements simples (à
vérifier ???)
Il existe différent type de variables aléatoires et différents types de distribution de
probabilité associées.
Les variables aléatoires discrètes :
L’espace d’échantillonnage est composé de valeurs énumérables
On peut donc pour chaque valeur définir la probabilité
={x0,x1,x2, …
p={p0,p1,p2,…
L’idée est donc de trouver une formule mathématique qui va associer la probabilité pi à
xi.
Ex : Distribution binomiale :
xnx pp
xxn n
xXP
)1(
!)!(!
)(
Distribution de Poisson :
!
)( xue
xXP xu
Les variables aléatoires continues :
L’espace d’échantillonnage est un intervalle dans R.
Comme cet intervalle est indénombrable, il est impossible de spécifier toutes les
probabilités de ces valeurs, c’est pourquoi on utilise le concept de densité de probabilité.
On généralise le discret au continu.
Il existe différentes distribution continue : La normale, la t Student, la khi carré.
On utilise de valeurs numérique pour résumer ces distributions, ces valeurs ne se basent
plus sur des observations mais sur le modèle théorique.
Ex :
Moyenne au niveau de la population (localisation) :
)(XEux
Variance au niveau de la population (dispersion):
))(( 22 xix uxE
222 )( xx uxE
E(X) est l’espérance : càd une valeur que l’on s’attend à observer.
Pour une variable discrète
n
iiix pxXEu 1
)(
équivallent à la moyenne de l’échantillon.
Semblable à sx mais sx s’applique à l’échantillon pas à la population.
Pour une variable continue :
dxxux
dxxxu
xx
x
)()(
)(
22
Il faut toujours vérifier que le modèle théorique choisi soit cohérent par rapport à
l’échantillon. Si ça ne colle pas avec les données observées dans l’échantillon alors il faut
changer de modèle.
Distribution continue
On part de la distribution binomiale, et on fait tendre n vers l’infini, toutefois on
considère que p n’est pas nul.
Il est évident que si n tends vers l’infini la probabilité d’avoir un nombre de valeur xi est
nulle, toutefois obtenir un nombre compris entre xi et xi+ quelque chose n’est pas tout à
fait nulle.
Toutefois si n tends vers l’infini :
n
iiinx
n
iiin
pXxs
pxXE
1
2
1
)(lim
lim)(
Graphiquement cela n’a pas beaucoup de sens, on va donc tenter de recentrer cette
distribution sur sa moyenne et tenter de réduire son écart type à 1.
Pour ce faire on procède à un changement de variable :
x
sXEX
Z)(
Rappel :
2
22 )()(
)()(
x
sbXVarbbXaVar
XbEabXaE
En remplaçant, a par -E(X)/sx et b par 1/sx
Je peux calculer :
1
1
)(
1
)(
0
)()(
)
)(
()(
2
22
x
xx
xxxx
s
s
XVar
s
ZVar
sXE
sXE
s
X
sXE
EZE
Ce changement de variable produit donc une distribution centrée en 0 et d’écart type égal
à 1. Nettement plus lisible graphiquement.
Les valeurs de X étant des valeurs entières, cela implique que
1X
En différenciant Z, je trouve que
xx ssX
Z1
0
Or si n tends vers l’infini et bien sx tends vers l’infini aussi, cela signifie que
0Z
.
La variable aléatoire Z n’est plus une variable aléatoire discrète comme X mais devient
une variable aléatoire continue.
Si on s’intéresse à la distribution binomiale de X, parler de P(X=x), si n tends vers
l’infini n’a pas de sens, cette probabilité est nulle, par contre parler de
 
),( XxxXP
n’est pas nul et peut à nouveau avoir du sens, toutefois on n’est plus
dans une probabilité, mais dans une répartition de probabilité ou une densité de
probabilité.
Si l’on fait cette analogie avec Z variable continue, on va parler de
)(z
.
Tentons de déterminer le
)(XP
afin de voir comment va évoluer le
)(z
)()1()()()( XPXPXPXXPXP
On sait que X ~ Bin(n,p)
)1( )(
)()1(
)1( )(
)( )1(
)1( )(
1)...1)()(1.(1)...2))(1( 1)...2)(1(.1)...1)((
)!1())!1( !)!(
)!()!(!)!1())!1( !
)1(
)1(
)( )1(
)1(1)1(1
)1(1
)1(1
111
xq pxn
XPXP
xq pxn
XPXP
qpx qpxn
qpxxxxnxn qpxxxxnxn
qpxxn qpxxn
qpxxn n
qp
xxn n
ppC
ppC
XPXP
xnx
xnx
xnx
xnx
xnx
xnx
xnx
xnx
xnxx
n
xnxx
n
Astuce : je soustrais P(X) de chaque côté pour obtenir :
)(XP
)1(
)(
)1( )(
)(
)1(
)(
)(
)1( )(
)()()1(
xq qxnp
XP
xq qqpxnp
XP
xq qqxxpnp
XP
XP
xq pxn
XPXPXP
Dans la définition des variables aléatoires nous avions vu
que :
n
idzzXXP
11)()(
De plus
1X
Or nous avons vu que
x
s
Z1
Je vais donc pouvoir remplacer par analogie mon
x
sz
zzparXXP )(
)()(
Or,
x
x
sz
XP
et
sz
XP
X
)(
)(
)(
)(
1
Rappelons que
x
sXX
Z
Or nous sommes dans une distribution binomiale qui a pour paramètres :
)1(
2
pq
npqs
npX
x
Ecrivons donc l’équivalence entre la répartition binomiale et la densité de probabilité
trouvée pour z :
qqX qXnp
s
z
s
z
qqx qXnp
XPXP
xx
1
)(
1
)(
)()(
Tâchons de remplacer X par Z
)()( npzsXzsXxx
On remplace dans l’équation et nous obtenons
qqzss
qzs
qnpqqzs qnpzsnp
zz
xx
x
x
x
2
)()(
On divise les deux membres par
x
s
z1
ce qui ne change rien à l’égalité :
qqzss
qszs
z
qqzss
qzs
z
z
zz
x
é
x
xx
x
é
x
x
2
)(
)()(
Si n tends vers l’infini =>
0z
et sx tend vers l’infini
Je calcule cette limite
)).((
1
)(
)()(
lim
2
2
2zz
s
q
s
qz sx
q
z
s
s
z
dzzd
zz
x
x
x
x
n
sJe résous l’équation différentielle :
222
2
222
)(
2
))(ln(
.
)( )(
))((
)(
z
k
z
k
zCeeeez
k
z
z
dzz
zzd
zz
dzzd
Il nous reste à déterminer C, la constante, comme cette fonction est une fonction de
densité de probabilité, je peux écrire l’égalité suivante :
1
2
2
dzeC z
Cette intégrale est appelée l’intégrale de Poisson, et le calcul intégrale nous apprend que
sa valeur vaut :
2
2
2
dzez
. Il est possible de le démontrer en passant à l’intégrale
1 / 15 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !