Les notes de cours

publicité
1ière Partie: Distributions à 1 variable
Par: Allan Birkett
• Une distribution à une variable est typiquement une liste
ordonnée de données
Ex: Des notes d’étapes : {61, 61, 66, 74, 80, 81, 82, 86, 91}
• Il y a plusieurs valeurs qu’on peut interpréter à partir d’une
telle liste:
La moyenne
 symbole est 𝑥
 est égale à la somme des données divisée par le nombre de
données
𝑥𝑖 est utilisée pour représenter les données
𝑒𝑠𝑡 𝑙𝑒 𝑠𝑦𝑚𝑏𝑜𝑙𝑒
𝑑 ′ 𝑢𝑛𝑒 𝑠𝑜𝑚𝑚𝑒
Ex: 𝑥 =
𝒙=
𝒙𝒊
𝒏
de la première: 𝑥1 à la dernière 𝑥𝑛
La lettre « n » représente typiquement le
nombre de quelque chose
61+61+66+74+80+81+82+86+91
9
=
682
9
≈ 75.78
La médiane
 n‘a pas de symbole
 est la séparation numérique dans le milieu de la distribution
Si le nombre de données est impair, la médiane correspond à la
valeur dans le centre de la distribution. On peut calculer la
position de la médiane avec:
𝑛+1
𝑃𝑜𝑠𝑖𝑡𝑖𝑜𝑛𝑀é𝑑𝑖𝑎𝑛𝑒 =
2
Ex: Des notes d’étapes : {61, 61, 66, 74, 80, 81, 82, 86, 91}
𝑃𝑜𝑠𝑖𝑡𝑖𝑜𝑛𝑀é𝑑𝑖𝑎𝑛𝑒
9 + 1 10
=
=
= 5𝑖è𝑚𝑒
2
2
Alors, la médiane est la cinquième valeur: 80
La médiane
Si le nombre de données est pair, la médiane sera la moyenne
des deux données au centre de la distribution.
Ex: Des populations de villes québécoises (en milliers): {82, 92,
106, 131, 139, 146, 165, 231, 235, 402, 517, 1650}
𝑃𝑜𝑠𝑖𝑡𝑖𝑜𝑛𝑀é𝑑𝑖𝑎𝑛𝑒
12 + 1 13
=
=
= 6.5
2
2
La position me dit quelles deux valeurs utilisées pour faire la
moyenne. Dans cet exemple, il faut prendre la 6ième et la 7ième
données.
146 + 165
311
𝑀é𝑑𝑖𝑎𝑛𝑒 =
=
= 155.5
2
2
Le mode
 n‘a pas de symbole
 est la donnée la plus fréquente de la distribution
Le maximum / minimum
 correspond aux données extrêmes de la distribution
L’étendue
 est la valeur obtenue lorsqu’on soustrait le minimum du
maximum
Ex: Des notes d’étapes : {61, 61, 66, 74, 80, 81, 82, 86, 91}
Le mode est 61.
Le maximum est 91 et le minimum est 61.
L’étendue est 91 – 61 = 30
Exemple
Voici les 16 meilleurs pointeurs de la NHL selon Wikipédia 20
février 2015: {1425, 1457, 1467, 1531, 1533, 1579, 1590,
1641, 1723, 1755, 1755, 1771, 1798, 1850, 1887, 2857}
Minimum: 1425
Maximum: 2857
Étendue: 2857 – 1425 = 1432
Mode: 1755
𝑃𝑜𝑠𝑖𝑡𝑖𝑜𝑛𝑀é𝑑𝑖𝑎𝑛𝑒
16 + 1
=
= 8.5
2
Alors,
𝑥=
𝑥1 + 𝑥2 … + 𝑥16
27619
=
16
16
𝑥 ≈ 1726.19
1641 + 1723
𝑀é𝑑𝑖𝑎𝑛𝑒 =
= 1682
2
Les diagrammes de quartiles
 sont utilisés afin de visualiser la dispersion de la distribution
 les quartiles les plus courts sont les plus denses tandis que les
quartiles les plus longs sont les moins denses
 un tel diagramme ne donne pas d’information sur la moyenne
 une nouvelle quantité peut être calculée:
l’écart interquartile = Q3 – Q1
Comment les faire?
 Il faut calculer la médiane (Q2)
 Ensuite, il faut calculer la médiane dans la partie sous Q2 afin de
trouver Q1. Il faut faire de même avec les données au dessus de Q2
afin de trouver Q3.
 Il faut ensuite mettre ces trois valeurs ainsi que le minimum et le
maximum sur un axe gradué.
 Finalement, il faut construire la boîte et les moustaches.
Exemple: Les dix quart-arrières de la NFL avec le plus de
touchés: {273, 275, 290, 300, 342, 392, 396, 420, 508, 530}
Q3
Q1
Q2 = 367
IlDernièrement,
faut trouveril faut
la
médiane,
Qces
, entrois
premier:
Maintenant,
il faut
trouver
mettrela
valeurs
inférieure,
supérieure,
ainsi Q
que
Q13: : le minimum
2médiane
1
++1gradué.
et le maximum sur un510
axe
Il faut terminer le graphique
𝑖è𝑚𝑒
𝑖è𝑚𝑒
𝑃𝑜𝑠𝑖𝑡𝑖𝑜𝑛𝑀é𝑑𝑖𝑎𝑛𝑒 =
=
5.5
=3
2 moustaches.
en ajoutant la boite et 2les
342 + 392
𝑀é𝑑𝑖𝑎𝑛𝑒
=
290
420
𝑀é𝑑𝑖𝑎𝑛𝑒 =
= 367
2
260
300
400
500
L’écart moyen (ÉM)
 est une valeur qui entre dans l’analyse de la dispersion
 est la moyenne des distances entre chaque donnée et la
moyenne
 plus l’écart moyen est petit, plus les données sont concentrées
 long à faire…
Donc, nous pouvons comparer deux listes de données et
déterminer laquelle est la plus homogène (concentrée) avec l’écart
moyen.
Nouvelle sorte de parenthèse: | |
Le calcul est É𝑀
=
𝑥𝑖 −𝑥
𝑛
est la parenthèse « valeur
absolue ». Elle transforme les
valeurs négatives en positives.
L’écart moyen (ÉM)
Exemple: Quel est l’écart moyen des notes d’étapes : {61, 61, 66,
74, 80, 81, 82, 86, 91}. On a déjà calculé que 𝑥 = 75.78
É𝑀 =
𝑥𝑖 − 𝑥
𝑛
= 61 − 75.78 + 61 − 75.78 + 66 − 75.78 + 74 − 75.78 +
80 − 75.78 + 81 − 75.78 + 82 − 75.78 + 86 − 75.78 + 91 − 75.78
9
= −14.78 + −14.78 + −9.78 + −1.78 + 4.22 + 5.22
+ 6.22 + 10.22 + 15.22
9
= 14.78 + 14.78 + 9.78 + 1.78 + 4.22 + 5.22 + 6.22 + 10.22 + 15.22
9
≈ 10.93
L’écart moyen (ÉM)
Quelle des deux distributions suivantes est la plus concentrées?
442
441 : {54, 59, 61, 65, 67, 70, 71, 72, 73, 77, 83, 88}
5 6
6 4–6
442 : {56, 64, 66, 71, 72, 76, 77, 81, 85, 87}
7 1–2–6–7
8 1–5–7
Il faut calculer les moyennes en premier:
𝑥441
54 + 59 + 61 + 65 + 67 + 70 + 71 + 72 + 73 + 77 + 83 + 88 840
=
=
= 70
12
12
𝑥442 =
56 + 64 + 66 + 71 + 72 + 76 + 77 + 81 + 85 + 87 735
=
= 73.5
10
10
L’écart moyen du 441:
ÉM = |54 – 70|+|59 – 70|+|61 – 70|+|65 – 70|+|67 – 70|+|70 – 70|
+|71 – 70|+|72 – 70|+|73 – 70|+|77 – 70|+|83 – 70|+|88 – 70|
12
ÉM = |-16|+|-11|+|-9|+|-5|+|-3|+|0|+|1|+|2|+|3|
+|7|+|13|+|18|
12
ÉM = 16+11+9+5+3+0+1+2+3+7+13+18 = 88 ≈ 7.33
12
12
L’écart moyen du 442:
ÉM = |56 – 73.5|+|64 – 73.5|+|66 – 73.5|+|71 – 73.5|+|72 – 73.5|
+|76 – 73.5|+|77 – 73.5|+|81 – 73.5|+|85 – 73.5|+|87 – 73.5|
10
ÉM = |-17.5|+|-9.5|+|-7.5|+|-2.5|+|-1.5|+|2.5|
+|3.5|+|7.5|+|11.5|+|13.5|
10
ÉM = 17.5+9.5+7.5+2.5+1.5+2.5+3.5+7.5+11.5+13.5 = 77 = 7.7
10
10
Alors, le groupe 441 est plus condensé.
Quel est l’écart moyen de la distribution suivante:
Notes d’élèves au
devoir 4.1
Résultat
Nombre
d’élèves
18
2
19
3
20
8
21
3
22
4
23
6
24
7
Premièrement, il faut calculer le nombre
d’élèves:
2 + 3 + 8 + 3 + 4 + 6 + 7 = 33
Deuxièmement, il faut calculer la moyenne:
2 ∙ 18 + 3 ∙ 19 + 8 ∙ 20 + 3 ∙ 21 + 4 ∙ 22 + 6 ∙ 23 + 7 ∙ 24
𝑥=
33
36 + 57 + 160 + 63 + 88 + 138 + 168
𝑥=
33
710
𝑥=
≈ 21.51
33
Quel est l’écart moyen de la distribution suivante:
Notes d’élèves au
devoir 4.1
Résultat
Nombre
d’élèves
18
2
19
3
20
8
21
3
22
4
23
6
24
7
Alors, n = 33 et
𝑥 ≈ 21.51
On peut maintenant calculer l’écart moyen:
ÉM = 2|18–21.51| + 3|19–21.51| + 8|20–21.51|
+ 3|21–21.51| + 4|22–21.51| + 6|23–21.51|
+ 7|24–21.51|
33
ÉM = 2|-3,51| + 3|-2.51| + 8|-1.51| + 3|-0.51|
+ 4|0.49| + 6|1.49| + 7|2.49|
33
ÉM = 2(3,51) + 3(2.51) + 8(1.51) + 3(0.51) + 4(0.49)
+ 6(1.49) + 7(2.49)
33
ÉM = 7.02 + 7.53 + 12.08 + 1.53 + 1.96 + 8.94 +17.43
33
ÉM = 56.49 ÷ 33 ≈ 1.71
Rang centile
 est une méthode de mesure de position
 le rang centile d’une donnée spécifique donne le pourcentage
de données inférieures ou égales à celle-ci
 notation: le rang centile d’une donnée X est R100(X)
Alors, une donnée avec R100(X) = 77 est égale ou supérieure à
77% des données de la distribution.
On peut calculer le rang centile d’une donnée spécifique à partir
d’une liste de données ou, avec le rang centile, déterminer à
quelle donnée il est associé.
Comment trouver le rang centile
 Il faut compter le nombre de données inférieures ou égales à la
données en question et utiliser l’équation suivante:
𝑅100
𝑁𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑑𝑜𝑛𝑛é𝑒𝑠 ≤ 𝑋 ∙ 100
𝑋 =
𝑛
Il faut toujours arrondir le rang centile à l’unité supérieure.
Comment trouver la position
 Il faut utiliser le rang centile pour déterminer combien il y a de
données inférieures ou égales à X:
𝑅100 (𝑋)
𝑃𝑜𝑠𝑖𝑡𝑖𝑜𝑛 𝑑𝑒 𝑋 =
∙𝑛
100
Il faut toujours arrondir la position à l’unité inférieure.
Les notes suivantes sont les résultats en pourcentage de deux groups différents de
CST – IV:
Groupe 01 : {40, 55, 56, 56, 58, 59, 60, 64, 66, 69, 70, 71, 72, 72, 73, 73, 74,
75, 75, 76, 78, 78, 80, 89, 89}
Groupe 02 : {39, 47, 51, 54, 55, 56, 56, 61, 63, 65, 66, 67, 68, 69, 69, 69, 70,
71, 72, 72, 73, 75, 77, 78, 83, 85}
Dans quel groupe un résultat de 78% aurait un meilleur placement?
Groupe 1:
Il y a 22 données égales ou inférieures à 78%:
22 ∙ 100
𝑅100 78 =
= 88
25
Groupe 2:
Il y a 24 données égales ou inférieures à 78%:
24 ∙ 100
𝑅100 78 =
= 92.31 → 93
26



Dans le 2ième groupe, le rang centile de 78% est plus haut. Cette note a donc un
meilleur placement dans ce groupe.
Voici les résultats de 32 élèves lors d’une évaluation:
{34, 48, 51, 53, 54, 54, 58, 58, 58, 62, 63, 63, 64, 64, 66, 66, 68, 70, 71, 72,
72, 73, 73, 75, 78, 78, 81, 82, 82, 84, 90, 98}
Quelle est la note associée à un rang centile de 44?
𝑅100 𝑋 ∙ 𝑛
44 ∙ 32
𝑃𝑜𝑠𝑖𝑡𝑖𝑜𝑛 𝑑𝑒 𝑋 =
=
= 14.08 → 14𝑖è𝑚𝑒
100
100
La 14ième donnée est 64.
Quelle est la note associée à un rang centile de 81?
𝑅100 𝑋 ∙ 𝑛
81 ∙ 32
𝑃𝑜𝑠𝑖𝑡𝑖𝑜𝑛 𝑑𝑒 𝑋 =
=
= 25,92 → 25𝑖è𝑚𝑒
100
100

La 25ième donnée est 78.


Téléchargement