Inférence statistique

Téléchargement

Résumé:

Statistique: Tirer des conclusions sur des données sur base d’un échantillon => Inférer à

la population.

Statistique descriptive : Méthodes de présentation des données de l’échantillon

(graphiques ou par calcul)

Inférence statistique : Tirer des conclusions sur la population à partir de l’échantillon

pour ce faire on va utiliser un outil d’aide que sont les probabilités.

Echantillon :Contient des valeurs observées (empiriques), il s’agit d’un sous ensemble de

la population que l’on peut mesurer. L’échantillon devra être représentatif de ma

population (chaque élément de l’échantillon devra avoir la même probabilité que

n’importe quel autre de la population d’être tiré => tirage ALEATOIRE)

L’échantillon contient la liste des données observées{y1,y2,y3, …, yn}

A partir de cette liste on peut définir la distribution empirique des fréquences relatives

des valeurs observées.

On peut observer cette liste via des moyens graphiques :

Tableaux- graphiques, diagrammes, ..

Ou via des valeurs numériques (autre façon de résumer une distribution empirique de

fréquence)

Au moyen de paramètres de dispersion

)( Yy

y







, localisation

(où se trouve le gros de la distribution



i

), indicateur de symétrie.

Population :quand on passe au niveau de la population il y a plein de choses

inobservables, car la population est en général trop grande.

Comme on ne sait pas trop ce qui se passe en détail, on va définir un modèle. Pour

construire le modèle on va utiliser l’échantillon. Le modèle nous permettra de tirer des

conclusions sur la population. Ce qui nous amène à la distribution théorique de

probabilités : il s’agit d’un modèle théorique qui me dit avec quelle fréquence, chacune

de mes observations va apparaître. Ce modèle théorique décrit ce que l’on devrait

observer (pas ce que l’on observe, ou ce que l’on a observé)

Il faut toujours décrire le modèle dont on parle, pour pouvoir se comprendre.

Pour spécifier le modèle, il faut d’abord décrire l’espace d’échantillonnage



, il s’agit de

l’ensemble des valeurs que peut prendre la variable aléatoire, ainsi que les probabilités pi

associées à ces valeurs.

On dit aussi que les valeurs que peut prendre la variable sont les évènements simples (à

vérifier ???)

Il existe différent type de variables aléatoires et différents types de distribution de

probabilité associées.

Les variables aléatoires discrètes :

L’espace d’échantillonnage est composé de valeurs énumérables

On peut donc pour chaque valeur définir la probabilité

={x0,x1,x2, …

p={p0,p1,p2,…

L’idée est donc de trouver une formule mathématique qui va associer la probabilité pi à

xi.

Ex : Distribution binomiale :

xnx pp

xxn n

xXP 



 )1(

!)!(!

)(

Distribution de Poisson :

)( xue

xXP xu



Les variables aléatoires continues :

L’espace d’échantillonnage est un intervalle dans R.

Comme cet intervalle est indénombrable, il est impossible de spécifier toutes les

probabilités de ces valeurs, c’est pourquoi on utilise le concept de densité de probabilité.

On généralise le discret au continu.

Il existe différentes distribution continue : La normale, la t Student, la khi carré.

On utilise de valeurs numérique pour résumer ces distributions, ces valeurs ne se basent

plus sur des observations mais sur le modèle théorique.

Ex :

Moyenne au niveau de la population (localisation) :

)(XEux

Variance au niveau de la population (dispersion):

))(( 22 xix uxE 



222 )( xx uxE 



E(X) est l’espérance : càd une valeur que l’on s’attend à observer.

Pour une variable discrète





 n

iiix pxXEu 1

)(

équivallent à la moyenne de l’échantillon.





 n

iixix pux

22 )(



Semblable à sx mais sx s’applique à l’échantillon pas à la population.

Pour une variable continue :













dxxux

dxxxu

)()(

)(

Il faut toujours vérifier que le modèle théorique choisi soit cohérent par rapport à

l’échantillon. Si ça ne colle pas avec les données observées dans l’échantillon alors il faut

changer de modèle.

Distribution continue

On part de la distribution binomiale, et on fait tendre n vers l’infini, toutefois on

considère que p n’est pas nul.

Il est évident que si n tends vers l’infini la probabilité d’avoir un nombre de valeur xi est

nulle, toutefois obtenir un nombre compris entre xi et xi+ quelque chose n’est pas tout à

fait nulle.

Toutefois si n tends vers l’infini :















iiinx

iiin

pXxs

pxXE

)(lim

lim)(

Graphiquement cela n’a pas beaucoup de sens, on va donc tenter de recentrer cette

distribution sur sa moyenne et tenter de réduire son écart type à 1.

Pour ce faire on procède à un changement de variable :

sXEX

Z)(



Rappel :

22 )()(

)()(

sbXVarbbXaVar

XbEabXaE





En remplaçant, a par -E(X)/sx et b par 1/sx

Je peux calculer :

)(

)()(

)

)(

()(

22 







xxxx

XVar

ZVar

sXE

EZE

Ce changement de variable produit donc une distribution centrée en 0 et d’écart type égal

à 1. Nettement plus lisible graphiquement.

Les valeurs de X étant des valeurs entières, cela implique que

1X

En différenciant Z, je trouve que

xx ssX

0





Or si n tends vers l’infini et bien sx tends vers l’infini aussi, cela signifie que

0Z

La variable aléatoire Z n’est plus une variable aléatoire discrète comme X mais devient

une variable aléatoire continue.

Si on s’intéresse à la distribution binomiale de X, parler de P(X=x), si n tends vers

l’infini n’a pas de sens, cette probabilité est nulle, par contre parler de

 

),( XxxXP 

n’est pas nul et peut à nouveau avoir du sens, toutefois on n’est plus

dans une probabilité, mais dans une répartition de probabilité ou une densité de

probabilité.

Si l’on fait cette analogie avec Z variable continue, on va parler de

)(z



Tentons de déterminer le

)(XP

afin de voir comment va évoluer le

)(z





)()1()()()( XPXPXPXXPXP 

On sait que X ~ Bin(n,p)

)1( )(

)()1(

)1( )(

)( )1(

)1( )(

1)...1)()(1.(1)...2))(1( 1)...2)(1(.1)...1)((

)!1())!1( !)!(

)!()!(!)!1())!1( !

)1(

)( )1(

)1(1)1(1

)1(1

111



































































xq pxn

XPXP

xq pxn

XPXP

qpx qpxn

qpxxxxnxn qpxxxxnxn

qpxxn qpxxn

qpxxn n

xxn n

ppC

XPXP

xnx

xnxx

Astuce : je soustrais P(X) de chaque côté pour obtenir :

)(XP

)1(

)(

)1( )(

)(

)1(

)(

)1( )(

)()()1(



















































xq qxnp

xq qqpxnp

xq qqxxpnp

xq pxn

XPXPXP

Dans la définition des variables aléatoires nous avions vu

que :







idzzXXP

11)()(



De plus

1X

Or nous avons vu que



Je vais donc pouvoir remplacer par analogie mon

zzparXXP )(

)()(





Or,

)(











Rappelons que

sXX

Z



Or nous sommes dans une distribution binomiale qui a pour paramètres :

)1(

npqs

npX





Ecrivons donc l’équivalence entre la répartition binomiale et la densité de probabilité

trouvée pour z :

qqX qXnp

qqx qXnp

XPXP

xx 











)(

)()(



Tâchons de remplacer X par Z

)()( npzsXzsXxx 

On remplace dans l’équation et nous obtenons

qqzss

qzs

qnpqqzs qnpzsnp











 2

)()(



On divise les deux membres par



ce qui ne change rien à l’égalité :

qqzss

qszs

qqzss

qzs

















2

)(

)()(





Si n tends vers l’infini =>

0z

et sx tend vers l’infini

Je calcule cette limite

)).((

)(

)()(

lim

2zz

qz sx

dzzd

n













sJe résous l’équation différentielle :

222

)(

))(ln(

)( )(

))((

)(

zCeeeez

dzz

zzd

dzzd



















Il nous reste à déterminer C, la constante, comme cette fonction est une fonction de

densité de probabilité, je peux écrire l’égalité suivante :







dzeC z

Cette intégrale est appelée l’intégrale de Poisson, et le calcul intégrale nous apprend que

sa valeur vaut :









dzez

. Il est possible de le démontrer en passant à l’intégrale

1 / 15 100%

Documents connexes

Math 9 – Numerical Methods Assessment Record

Statistiques de gestion CHAPITRE I RAPPELS: LOI

Chap 7 Le recueil et l`analyse des informations

Une loi (8 points) 1 Variables Gaussiennes (12 points)

Méthodologie de l`enquête statistique

Programme - Moodle Lille 2

Chapitre 9

Solutions du chapitre I

TP2 COMMENT SE DEROULE LA DIVISION CELLULAIRE

Spé B - St Joseph/ICAM Toulouse ⋆ - Math. - CB

IUT GB - Fiche de TD – Variables aléatoires discrètes

Série 2 - Faculté des Sciences Juridiques, Economiques et Sociales

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d'utilisation

Inférence statistique

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Inférence statistique

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib