Statistique Les distributions à deux caractères 1) Définition Lorsqu’on étudie simultanément deux caractères, on obtient deux valeurs pour chaque unité statistique d’une population ou d’un échantillon. Ces valeurs peuvent s’exprimer sous la forme d’un couple (X,Y). L’ensemble des couples (X,Y) constitue une distribution à deux caractères, ou distribution à deux variables. Exemple : On considère la note en maths et en français de 12 élèves d’une classe à la fin de la première étape de sec 4. Élève Note en Maths % 1 2 3 4 32 50 70 88 Note en français % 48 61 74 76 Élève Note en Maths % Note en français % Élève Note en Maths % 5 6 7 8 65 92 75 38 63 95 80 52 9 10 11 12 65 72 55 77 Note en français % 66 60 83 80 2) Représentation d’une distribution à deux caractères 2.1 Nuage de points SN4 Statistique Emmanuel Duran p1 2.2 Nuage de points avec calculatrice Insérer une page « Tableur & Listes » Nommer les colonnes Insérer une page « Données et Statistiques » Cliquer sur l’axe des abscisses pour ajouter la variable « maths » Cliquer sur l’axe des ordonnées pour ajouter la variable « français » SN4 Statistique Emmanuel Duran p2 2.3 Tableau à double entrée Valeur en y Valeur en x Note en Note français en maths % % [30,45[ [45,60[ [60,75[ [75,90[ [90,105[ [45,60[ [60,75[ [75,90[ [90,105[ II I IIII I III I 3) La corrélation linéaire 3.1 Appréciation qualitative d’une corrélation • • • • • Parfaite Forte Moyenne Faible Nulle 3.2 Sens de la corrélation positive SN4 Statistique négative Emmanuel Duran p3 4) Le coefficient de corrélation linéaire Il se note r. Sa valeur est comprise entre [ −1,1] Intensité de la corrélation en fonction de la valeur de r Parfaite Forte Moyenne Faible Nulle Faible Moyenne Forte Parfaite 4.1 Comment trouver le coefficient de corrélation linéaire 4.1.1 Estimation avec la méthode du rectangle Après avoir tracé votre nuage de points, encadrer tous les points dans le plus petit rectangle possible et mesurer sa longueur et sa largeur. L’utilisation d’une règle et d’une équerre est recommandée! SN4 Statistique Emmanuel Duran p4 largeur r = ± 1− longueur C’est à toi de choisir le signe en fonction du sens de la corrélation 4.1.2 Estimation du coefficient de corrélation avec la calculatrice Se placer dans une case vide de la colonne C Cliquer sur Menu 4 (statistiques),1 (Calcul statistique), 3 (Ajustement linéaire mx+b) Sélectionner les variables On obtient le coefficient « r » de la corrélation SN4 Statistique Emmanuel Duran p5 5 La droite de régression linéaire 5.1 La méthode des points moyens ou la double moyenne ou la méthode de Mayer Pour estimer la droite de régression à l’aide de la méthode de Mayer, il suffit de suivre les étapes suivantes : • • • • Placer les coordonnées en ordre croissant des abscisses. (Pour deux valeurs de X égales, ordonner les valeurs de Y en ordre croissant). Partager la distribution en deux groupes équipotents. (Si le nombre de données est impair, la donnée du centre est placée dans chacun des deux groupes). Pour chacun des deux groupes, trouver la moyenne des abscisses et la moyenne des ordonnées que l’on notera P1(x1,y1 ) et P2 (x 2 ,y 2 ) . Trouver l’équation de la droite de régression passant par ces deux points. Exemple #1 x y 6 5 3 2 14 6 14 10 27 17 22 21 X1 x y 3 2 6 5 3+6+9+14 =8 4 2+5+7+6 y1 = =5 4 9 7 22 21 27 17 X2 9 7 14 6 Y1 x1 = 19 14 14+19+22+27 =20,5 4 10+14+21+17 y2 = =15,5 4 14 10 19 14 Y2 x2 = ⇔ P1(8,5) et P2 (20,5 , 15,5) Pour tracer la droite de Mayer dans le nuage de points, on place P1 et P2 dans le graphique et on trace la droite passant par ces deux points. SN4 Statistique Emmanuel Duran p6 L’équation de la droite de régression, passant par P1 et P2 est de la forme y=ax+b = a ∆y y 2 − y1 15,5 − 5 = = = 0,84 ∆x x2 − x1 20,5 − 8 ⇔= y 0,84 x + b En remplaçant les coordonnées de P1 ou P2 on trouve: 15,5=0,84 × 20,5+b 15,5=17,22+b 15,5-17,22=b b=-1,72 L'équation de la droite de Mayer est y=0,84x-1,72 Exemple #2 Si les données sont impaires! On double la donnée du centre après les avoir classées x y x y 0 1 0 1 2 3 2 3 4 5 4 5 6 7 6 7 8 9 6 7 12 13 8 9 12 13 14 16 14 16 Par la suite le processus est le même que dans l’exemple #1 5.2 Avec la calculatrice Les étapes sont les mêmes que dans la section 4.1.2 cependant l’équation est donnée sous la forme y=mx+b À noter que dans la calculatrice il n’est pas nécessaire d’ordonner les valeurs ou de doubler une valeur si le nombre est impair. SN4 Statistique Emmanuel Duran p7 On peut aussi tracer la droite et obtenir son équation dans une page « Données & Statistiques » Après avoir tracé le nuage de points faire Menu 4 (Analyser) 6 (Régression) 1 (Afficher droite mx+b) SN4 Statistique Emmanuel Duran p8