1ière Partie: Distributions à 1 variable Par: Allan Birkett • Une distribution à une variable est typiquement une liste ordonnée de données Ex: Des notes d’étapes : {61, 61, 66, 74, 80, 81, 82, 86, 91} • Il y a plusieurs valeurs qu’on peut interpréter à partir d’une telle liste: La moyenne symbole est 𝑥 est égale à la somme des données divisée par le nombre de données 𝑥𝑖 est utilisée pour représenter les données 𝑒𝑠𝑡 𝑙𝑒 𝑠𝑦𝑚𝑏𝑜𝑙𝑒 𝑑 ′ 𝑢𝑛𝑒 𝑠𝑜𝑚𝑚𝑒 Ex: 𝑥 = 𝒙= 𝒙𝒊 𝒏 de la première: 𝑥1 à la dernière 𝑥𝑛 La lettre « n » représente typiquement le nombre de quelque chose 61+61+66+74+80+81+82+86+91 9 = 682 9 ≈ 75.78 La médiane n‘a pas de symbole est la séparation numérique dans le milieu de la distribution Si le nombre de données est impair, la médiane correspond à la valeur dans le centre de la distribution. On peut calculer la position de la médiane avec: 𝑛+1 𝑃𝑜𝑠𝑖𝑡𝑖𝑜𝑛𝑀é𝑑𝑖𝑎𝑛𝑒 = 2 Ex: Des notes d’étapes : {61, 61, 66, 74, 80, 81, 82, 86, 91} 𝑃𝑜𝑠𝑖𝑡𝑖𝑜𝑛𝑀é𝑑𝑖𝑎𝑛𝑒 9 + 1 10 = = = 5𝑖è𝑚𝑒 2 2 Alors, la médiane est la cinquième valeur: 80 La médiane Si le nombre de données est pair, la médiane sera la moyenne des deux données au centre de la distribution. Ex: Des populations de villes québécoises (en milliers): {82, 92, 106, 131, 139, 146, 165, 231, 235, 402, 517, 1650} 𝑃𝑜𝑠𝑖𝑡𝑖𝑜𝑛𝑀é𝑑𝑖𝑎𝑛𝑒 12 + 1 13 = = = 6.5 2 2 La position me dit quelles deux valeurs utilisées pour faire la moyenne. Dans cet exemple, il faut prendre la 6ième et la 7ième données. 146 + 165 311 𝑀é𝑑𝑖𝑎𝑛𝑒 = = = 155.5 2 2 Le mode n‘a pas de symbole est la donnée la plus fréquente de la distribution Le maximum / minimum correspond aux données extrêmes de la distribution L’étendue est la valeur obtenue lorsqu’on soustrait le minimum du maximum Ex: Des notes d’étapes : {61, 61, 66, 74, 80, 81, 82, 86, 91} Le mode est 61. Le maximum est 91 et le minimum est 61. L’étendue est 91 – 61 = 30 Exemple Voici les 16 meilleurs pointeurs de la NHL selon Wikipédia 20 février 2015: {1425, 1457, 1467, 1531, 1533, 1579, 1590, 1641, 1723, 1755, 1755, 1771, 1798, 1850, 1887, 2857} Minimum: 1425 Maximum: 2857 Étendue: 2857 – 1425 = 1432 Mode: 1755 𝑃𝑜𝑠𝑖𝑡𝑖𝑜𝑛𝑀é𝑑𝑖𝑎𝑛𝑒 16 + 1 = = 8.5 2 Alors, 𝑥= 𝑥1 + 𝑥2 … + 𝑥16 27619 = 16 16 𝑥 ≈ 1726.19 1641 + 1723 𝑀é𝑑𝑖𝑎𝑛𝑒 = = 1682 2 Les diagrammes de quartiles sont utilisés afin de visualiser la dispersion de la distribution les quartiles les plus courts sont les plus denses tandis que les quartiles les plus longs sont les moins denses un tel diagramme ne donne pas d’information sur la moyenne une nouvelle quantité peut être calculée: l’écart interquartile = Q3 – Q1 Comment les faire? Il faut calculer la médiane (Q2) Ensuite, il faut calculer la médiane dans la partie sous Q2 afin de trouver Q1. Il faut faire de même avec les données au dessus de Q2 afin de trouver Q3. Il faut ensuite mettre ces trois valeurs ainsi que le minimum et le maximum sur un axe gradué. Finalement, il faut construire la boîte et les moustaches. Exemple: Les dix quart-arrières de la NFL avec le plus de touchés: {273, 275, 290, 300, 342, 392, 396, 420, 508, 530} Q3 Q1 Q2 = 367 IlDernièrement, faut trouveril faut la médiane, Qces , entrois premier: Maintenant, il faut trouver mettrela valeurs inférieure, supérieure, ainsi Q que Q13: : le minimum 2médiane 1 ++1gradué. et le maximum sur un510 axe Il faut terminer le graphique 𝑖è𝑚𝑒 𝑖è𝑚𝑒 𝑃𝑜𝑠𝑖𝑡𝑖𝑜𝑛𝑀é𝑑𝑖𝑎𝑛𝑒 = = 5.5 =3 2 moustaches. en ajoutant la boite et 2les 342 + 392 𝑀é𝑑𝑖𝑎𝑛𝑒 = 290 420 𝑀é𝑑𝑖𝑎𝑛𝑒 = = 367 2 260 300 400 500 L’écart moyen (ÉM) est une valeur qui entre dans l’analyse de la dispersion est la moyenne des distances entre chaque donnée et la moyenne plus l’écart moyen est petit, plus les données sont concentrées long à faire… Donc, nous pouvons comparer deux listes de données et déterminer laquelle est la plus homogène (concentrée) avec l’écart moyen. Nouvelle sorte de parenthèse: | | Le calcul est É𝑀 = 𝑥𝑖 −𝑥 𝑛 est la parenthèse « valeur absolue ». Elle transforme les valeurs négatives en positives. L’écart moyen (ÉM) Exemple: Quel est l’écart moyen des notes d’étapes : {61, 61, 66, 74, 80, 81, 82, 86, 91}. On a déjà calculé que 𝑥 = 75.78 É𝑀 = 𝑥𝑖 − 𝑥 𝑛 = 61 − 75.78 + 61 − 75.78 + 66 − 75.78 + 74 − 75.78 + 80 − 75.78 + 81 − 75.78 + 82 − 75.78 + 86 − 75.78 + 91 − 75.78 9 = −14.78 + −14.78 + −9.78 + −1.78 + 4.22 + 5.22 + 6.22 + 10.22 + 15.22 9 = 14.78 + 14.78 + 9.78 + 1.78 + 4.22 + 5.22 + 6.22 + 10.22 + 15.22 9 ≈ 10.93 L’écart moyen (ÉM) Quelle des deux distributions suivantes est la plus concentrées? 442 441 : {54, 59, 61, 65, 67, 70, 71, 72, 73, 77, 83, 88} 5 6 6 4–6 442 : {56, 64, 66, 71, 72, 76, 77, 81, 85, 87} 7 1–2–6–7 8 1–5–7 Il faut calculer les moyennes en premier: 𝑥441 54 + 59 + 61 + 65 + 67 + 70 + 71 + 72 + 73 + 77 + 83 + 88 840 = = = 70 12 12 𝑥442 = 56 + 64 + 66 + 71 + 72 + 76 + 77 + 81 + 85 + 87 735 = = 73.5 10 10 L’écart moyen du 441: ÉM = |54 – 70|+|59 – 70|+|61 – 70|+|65 – 70|+|67 – 70|+|70 – 70| +|71 – 70|+|72 – 70|+|73 – 70|+|77 – 70|+|83 – 70|+|88 – 70| 12 ÉM = |-16|+|-11|+|-9|+|-5|+|-3|+|0|+|1|+|2|+|3| +|7|+|13|+|18| 12 ÉM = 16+11+9+5+3+0+1+2+3+7+13+18 = 88 ≈ 7.33 12 12 L’écart moyen du 442: ÉM = |56 – 73.5|+|64 – 73.5|+|66 – 73.5|+|71 – 73.5|+|72 – 73.5| +|76 – 73.5|+|77 – 73.5|+|81 – 73.5|+|85 – 73.5|+|87 – 73.5| 10 ÉM = |-17.5|+|-9.5|+|-7.5|+|-2.5|+|-1.5|+|2.5| +|3.5|+|7.5|+|11.5|+|13.5| 10 ÉM = 17.5+9.5+7.5+2.5+1.5+2.5+3.5+7.5+11.5+13.5 = 77 = 7.7 10 10 Alors, le groupe 441 est plus condensé. Quel est l’écart moyen de la distribution suivante: Notes d’élèves au devoir 4.1 Résultat Nombre d’élèves 18 2 19 3 20 8 21 3 22 4 23 6 24 7 Premièrement, il faut calculer le nombre d’élèves: 2 + 3 + 8 + 3 + 4 + 6 + 7 = 33 Deuxièmement, il faut calculer la moyenne: 2 ∙ 18 + 3 ∙ 19 + 8 ∙ 20 + 3 ∙ 21 + 4 ∙ 22 + 6 ∙ 23 + 7 ∙ 24 𝑥= 33 36 + 57 + 160 + 63 + 88 + 138 + 168 𝑥= 33 710 𝑥= ≈ 21.51 33 Quel est l’écart moyen de la distribution suivante: Notes d’élèves au devoir 4.1 Résultat Nombre d’élèves 18 2 19 3 20 8 21 3 22 4 23 6 24 7 Alors, n = 33 et 𝑥 ≈ 21.51 On peut maintenant calculer l’écart moyen: ÉM = 2|18–21.51| + 3|19–21.51| + 8|20–21.51| + 3|21–21.51| + 4|22–21.51| + 6|23–21.51| + 7|24–21.51| 33 ÉM = 2|-3,51| + 3|-2.51| + 8|-1.51| + 3|-0.51| + 4|0.49| + 6|1.49| + 7|2.49| 33 ÉM = 2(3,51) + 3(2.51) + 8(1.51) + 3(0.51) + 4(0.49) + 6(1.49) + 7(2.49) 33 ÉM = 7.02 + 7.53 + 12.08 + 1.53 + 1.96 + 8.94 +17.43 33 ÉM = 56.49 ÷ 33 ≈ 1.71 Rang centile est une méthode de mesure de position le rang centile d’une donnée spécifique donne le pourcentage de données inférieures ou égales à celle-ci notation: le rang centile d’une donnée X est R100(X) Alors, une donnée avec R100(X) = 77 est égale ou supérieure à 77% des données de la distribution. On peut calculer le rang centile d’une donnée spécifique à partir d’une liste de données ou, avec le rang centile, déterminer à quelle donnée il est associé. Comment trouver le rang centile Il faut compter le nombre de données inférieures ou égales à la données en question et utiliser l’équation suivante: 𝑅100 𝑁𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑑𝑜𝑛𝑛é𝑒𝑠 ≤ 𝑋 ∙ 100 𝑋 = 𝑛 Il faut toujours arrondir le rang centile à l’unité supérieure. Comment trouver la position Il faut utiliser le rang centile pour déterminer combien il y a de données inférieures ou égales à X: 𝑅100 (𝑋) 𝑃𝑜𝑠𝑖𝑡𝑖𝑜𝑛 𝑑𝑒 𝑋 = ∙𝑛 100 Il faut toujours arrondir la position à l’unité inférieure. Les notes suivantes sont les résultats en pourcentage de deux groups différents de CST – IV: Groupe 01 : {40, 55, 56, 56, 58, 59, 60, 64, 66, 69, 70, 71, 72, 72, 73, 73, 74, 75, 75, 76, 78, 78, 80, 89, 89} Groupe 02 : {39, 47, 51, 54, 55, 56, 56, 61, 63, 65, 66, 67, 68, 69, 69, 69, 70, 71, 72, 72, 73, 75, 77, 78, 83, 85} Dans quel groupe un résultat de 78% aurait un meilleur placement? Groupe 1: Il y a 22 données égales ou inférieures à 78%: 22 ∙ 100 𝑅100 78 = = 88 25 Groupe 2: Il y a 24 données égales ou inférieures à 78%: 24 ∙ 100 𝑅100 78 = = 92.31 → 93 26 Dans le 2ième groupe, le rang centile de 78% est plus haut. Cette note a donc un meilleur placement dans ce groupe. Voici les résultats de 32 élèves lors d’une évaluation: {34, 48, 51, 53, 54, 54, 58, 58, 58, 62, 63, 63, 64, 64, 66, 66, 68, 70, 71, 72, 72, 73, 73, 75, 78, 78, 81, 82, 82, 84, 90, 98} Quelle est la note associée à un rang centile de 44? 𝑅100 𝑋 ∙ 𝑛 44 ∙ 32 𝑃𝑜𝑠𝑖𝑡𝑖𝑜𝑛 𝑑𝑒 𝑋 = = = 14.08 → 14𝑖è𝑚𝑒 100 100 La 14ième donnée est 64. Quelle est la note associée à un rang centile de 81? 𝑅100 𝑋 ∙ 𝑛 81 ∙ 32 𝑃𝑜𝑠𝑖𝑡𝑖𝑜𝑛 𝑑𝑒 𝑋 = = = 25,92 → 25𝑖è𝑚𝑒 100 100 La 25ième donnée est 78.