Mesure d’asymétrie
Si ce qui se passe à droite de la moyenne, est le même que ce qui se passe à gauche, la
distribution est symétrique.
0
1
2
3
4
5
6
1 2 3 4 5
Distribution disymétrique (ou asymétrique)
0
1
2
3
4
5
6
7
1 2 3 4 5
Asymétrie à droite (il semble y avoir plus de valeur à droite qu’à gauche)
Si on prend notre pression sanguine à tous on va systématiquement trouver des valeurs
différentes, toutefois, plus ou moins le même mode, la même moyenne et la même
diane.
Si la moyenne est très grande on a généralement une asymétrie à droite (ex : Salaire dans
les grandes Entreprises, les salaires des cadres supérieurs sont beaucoup plus élevés que
ceux des employés), si la moyenne est très petite on a généralement une asymétrie à
gauche.
En anglais on appelle l’asymétrie skewness :
0
2
4
6
8
10
12
1 2 3 4 5
Negatively skewed : asymétrie à gauche.
0
1
2
3
4
5
6
7
1 2 3 4 5
Positively skewed : asymétrie à droite
Ex : climat très humides mais quelques jours de sécheresses, vont tirer les valeurs vers la
gauche.
On peut donc utiliser la moyenne comme moyen de mesure d’asymétrie en géral on
utilisera toutefois le coefficient de Fisher gamma1
Coefficient de kurtosis (applatissement)
Trop compliqué pas vu.
Je crois qu’il s’agit du coef de Fisher gamma2.
Mesures d’associations
On reprend l’exemple des pélicans (2/17)
Est-ce que l’épaisseur de la coquille des œufs pondus par les pélicans contaminés sont
corellées. (relation directe)
Pour définir cela on va utiliser une mesure d’association appelée le coefficient de
corrélation linéaire r, dit de Pearson
Il existe d’autres coefficients de corrélations dit de Spearmann par ex : utlisé dans la
corrélation des rangs (d).
sysx YXCOV
sysxn
YyXx
r
n
iii
*),(
**
))((
1
Se retrouve lorsque l’on utilise la méthode dites des moindres carrés pour trouver des
corrélations entre les variables.
Propriétés :
-1<=r<=1
Y
X
r=-1
r=1
Si r est proche de 1 on parle de corrélation linéaire FORTE
En général si r est assez fortement positif, on dit que les deux grandeurs grandissent
ensembles
Si r est proche de -1 plus X augmente plus Y diminue, ex : Plus une voiture est chère
moins elle pollue.
Si r=0 il n’y a pas de corrélation, dispersion, nuage de points diffus.
Ex : Variables X,Y mesurées sur des animaux :
Animal
X
1
4
2
6
3
7
4
3
5
12
6
15
7
20
0
5
10
15
20
25
30
35
40
0 5 10 15 20 25
MEAN(X) : 10.43
MEAN(Y) : 26.29
Sx=5.62
Sy=6.16
r=0.968
Corrélation positive forte.
Autre exemple :
Animal
X
1
4
2
6
3
7
4
3
5
12
6
15
7
20
0
5
10
15
20
25
30
35
40
0 5 10 15 20 25
MEAN(X)=10.13 ; MEAN(Y)=25.43
Sx=5.62 ; Sy=6.94
r=-0.91
Corrélation négative assez FORTE
Animal
X
1
9
2
3
3
6
4
4
5
4
6
2
7
8
0
5
10
15
20
25
30
35
0 2 4 6 8 10
r=0.11 pas de corrélation.
Pour le tableau 2/17 (pélican)
Le coefiscient de corrélation donne r=-0.253, pas de corrélation significative.
Toutefois légère corrélation négative.
CHAPITRE III Calcul des probabilités
Maintenant que l’on sait voir l’échantillon, on aimerait tirer des conclusions sur la
population entière.
Ceci n’est pas évident, on par toutefois de l’HYPOTHESE que l’échantillon est
représentatif.
78.12'
78.12
forcemmentpasestnx
x
p
e
On a besoin d’un outil qui va faire le lien entre l’échantillon et la population.
But quantifier l’information dont on dispose sur l’échantillon par rapport à la population.
Il faut aussi pouvoir quantifier la certitude ou l’incertitude par rapport aux conclusions
que l’on a tirée.
Ex : avec les poulets 2/7, la moyenne de l’échantillon vaut : 3.5kg, toutefois si l’on faisait
ce calcul à toute la population, ça ne serait certainement pas 3.5 kg.
Cet outil ce sont les probabilités : permet de quantifier la confiance qu’on a dans les
conclusions que l’on a tirées.
Ex : Le résultat des sondages avec une marge d’erreur de x %. Les probabilités
permettent de tirer des conclusions de l’échantillon sur la population mais toujours avec
une erreur.
Définition d’une probabilité
(notes personnelles)
Définissons tout d’abord l’Expérience :
L’expérience aléatoire peut-être une expérience quelconque elle a plusieurs issues
possibles (ou plusieurs cas possibles)
Ex : Lancer un dé, tirer une carte, effectuer une mesure quelconque…
L’évènement est une issue (un cas) particulière de l’expérience
Ex : tirer un 4, tirer un cœur, obtenir sqrt(3)/2.
La probabilité est en général définie comme étant une fréquence idéale du nombre d’issue
favorable divisé par l’ensemble des issues possibles de l’expérience.
Ex : K. Pearson a joué 24000 fois à pile ou face
1
(ndlr :y en a vraiment qui n’ont que ça à
foutre…) et il obtint 12012 « face ». Si vous jouez 4 fois à pile ou face, vous obtiendrez
rarement une probabilité aussi proche de 1/2 . On voit donc que plus le nombre
d’expérience augmente plus on se rapproche de la probabilité réelle.
Définition « fréquentiste » : considérons un évènement qui est le résultat d’une
expérience.
Expérience : lancer un dé
Evènement : obtenir un 4
1
« Calcul Statistique et Calcul des probabilités ». A. Boigelot.
1 / 13 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !