Statistique Les distributions à deux caractères

publicité
Statistique
Les distributions à deux caractères
1) Définition
Lorsqu’on étudie simultanément deux caractères, on obtient deux valeurs pour
chaque unité statistique d’une population ou d’un échantillon. Ces valeurs peuvent
s’exprimer sous la forme d’un couple (X,Y). L’ensemble des couples (X,Y) constitue
une distribution à deux caractères, ou distribution à deux variables.
Exemple : On considère la note en maths et en français de 12 élèves d’une classe à
la fin de la première étape de sec 4.
Élève
Note en
Maths %
1
2
3
4
32
50
70
88
Note en
français
%
48
61
74
76
Élève
Note en
Maths %
Note en
français %
Élève
Note en
Maths %
5
6
7
8
65
92
75
38
63
95
80
52
9
10
11
12
65
72
55
77
Note en
français
%
66
60
83
80
2) Représentation d’une distribution à deux caractères
2.1 Nuage de points
SN4 Statistique
Emmanuel Duran p1
2.2 Nuage de points avec calculatrice
Insérer une page « Tableur & Listes »
Nommer les colonnes
Insérer une page « Données et Statistiques »
Cliquer sur l’axe des abscisses pour ajouter la
variable « maths »
Cliquer sur l’axe des ordonnées pour
ajouter la variable « français »
SN4 Statistique
Emmanuel Duran p2
2.3 Tableau à double entrée
Valeur en y
Valeur en x
Note en
Note
français
en maths
%
%
[30,45[
[45,60[
[60,75[
[75,90[
[90,105[
[45,60[
[60,75[
[75,90[ [90,105[
II
I
IIII
I
III
I
3) La corrélation linéaire
3.1 Appréciation qualitative d’une corrélation
•
•
•
•
•
Parfaite
Forte
Moyenne
Faible
Nulle
3.2 Sens de la corrélation
positive
SN4 Statistique
négative
Emmanuel Duran p3
4) Le coefficient de corrélation linéaire
Il se note r.
Sa valeur est comprise entre [ −1,1]
Intensité de la corrélation en fonction de la valeur de r
Parfaite
Forte
Moyenne
Faible
Nulle
Faible
Moyenne
Forte
Parfaite
4.1 Comment trouver le coefficient de corrélation linéaire
4.1.1 Estimation avec la méthode du rectangle
Après avoir tracé votre nuage de points, encadrer tous les points dans le plus petit
rectangle possible et mesurer sa longueur et sa largeur.
L’utilisation d’une règle et d’une équerre est recommandée!
SN4 Statistique
Emmanuel Duran p4

largeur 
r =
± 1−

 longueur 
C’est à toi de choisir le signe en fonction du sens de la corrélation
4.1.2 Estimation du coefficient de corrélation avec la calculatrice
Se placer dans une case vide de la colonne C
Cliquer sur Menu 4 (statistiques),1 (Calcul
statistique), 3 (Ajustement linéaire mx+b)
Sélectionner les variables
On obtient le coefficient « r » de la corrélation
SN4 Statistique
Emmanuel Duran p5
5 La droite de régression linéaire
5.1 La méthode des points moyens ou la double moyenne ou la méthode de
Mayer
Pour estimer la droite de régression à l’aide de la méthode de Mayer, il suffit de suivre les
étapes suivantes :
•
•
•
•
Placer les coordonnées en ordre croissant des abscisses. (Pour deux valeurs de X
égales, ordonner les valeurs de Y en ordre croissant).
Partager la distribution en deux groupes équipotents. (Si le nombre de données est
impair, la donnée du centre est placée dans chacun des deux groupes).
Pour chacun des deux groupes, trouver la moyenne des abscisses et la moyenne
des ordonnées que l’on notera P1(x1,y1 ) et P2 (x 2 ,y 2 ) .
Trouver l’équation de la droite de régression passant par ces deux points.
Exemple #1
x
y
6
5
3
2
14
6
14
10
27
17
22
21
X1
x
y
3
2
6
5
3+6+9+14
=8
4
2+5+7+6
y1 =
=5
4
9
7
22
21
27
17
X2
9
7
14
6
Y1
x1 =
19
14
14+19+22+27
=20,5
4
10+14+21+17
y2 =
=15,5
4
14
10
19
14
Y2
x2 =
⇔ P1(8,5) et P2 (20,5 , 15,5)
Pour tracer la droite de Mayer dans le nuage de points, on place P1 et P2 dans le graphique
et on trace la droite passant par ces deux points.
SN4 Statistique
Emmanuel Duran p6
L’équation de la droite de régression, passant par P1 et P2 est de la forme y=ax+b
=
a
∆y y 2 − y1 15,5 − 5
=
=
= 0,84
∆x x2 − x1 20,5 − 8
⇔=
y 0,84 x + b
En remplaçant les coordonnées de P1 ou P2 on trouve:
15,5=0,84 × 20,5+b
15,5=17,22+b
15,5-17,22=b
b=-1,72
L'équation de la droite de Mayer est y=0,84x-1,72
Exemple #2
Si les données sont impaires!
On double la donnée du centre après les avoir classées
x
y
x
y
0
1
0
1
2
3
2
3
4
5
4
5
6
7
6
7
8
9
6
7
12
13
8
9
12
13
14
16
14
16
Par la suite le processus est le même que dans l’exemple #1
5.2 Avec la calculatrice
Les étapes sont les mêmes que dans la section 4.1.2 cependant l’équation est donnée
sous la forme y=mx+b
À noter que dans la calculatrice il n’est pas nécessaire d’ordonner les valeurs ou de
doubler une valeur si le nombre est impair.
SN4 Statistique
Emmanuel Duran p7
On peut aussi tracer la droite et obtenir son équation dans une page « Données &
Statistiques »
Après avoir tracé le nuage de points faire Menu 4 (Analyser) 6 (Régression) 1 (Afficher
droite mx+b)
SN4 Statistique
Emmanuel Duran p8
Téléchargement