Université Paris Est Créteil, ESIPE Statistiques descriptives et probabilités B. de Tilière Licence première année Année 2016-2017 13 décembre 2016 Évaluation : Statistique et Probabilités (2 heures) Énoncé et corrigé. Le barème est donné à titre indicatif. Exercice 1. [Probabilités] (4 points) 1) Soit Ω un univers et A l’ensemble des événements de Ω. Une probabilité sur (Ω, A) est une application de A dans [0, 1] qui satisfait à deux axiomes. Énoncer ces deux axiomes. 2) Soient A et B deux évènements de A tels que P(A) = 4 5 et P(B) = 14 . Montrer que 1 1 ≤ P(A ∩ B) ≤ . 20 4 Solution de l’exercice 1. 1) Voir définition cours p. 57. 2) Montrons l’inégalité de gauche. Comme conséquence de la définition d’une probabilité, on a : P(A ∪ B) = P(A) + P(B) − P(A ∩ B). Or P(A ∪ B) ≤ 1, ce qui implique P(A ∩ B) ≥ P(A) + P(B) − 1. Dans notre cas cela donne 4 1 1 P(A ∩ B) ≥ + − 1 = , 5 4 20 et montre la première inégalité. Pour la deuxième, on utilise que A ∩ B ⊂ B, ce qui implique 1 P(A ∩ B) ≤ P(B) = . 4 Exercice 2. [Dénombrement] (4 points) 1) Combien y a-t-il d’anagrammes — du mot PROBA ? — du mot STAT ? 2) Huit nouveaux professeurs vont être envoyés dans quatre écoles. 1 — Combien y a-t-il d’affectations possibles ? (sans contrainte sur le nombre de professeurs par école). — Qu’en est-il si chaque école recevra exactement deux professeurs ? Solution de l’exercice 2. 1) Il y a 5! = 120 anagrammes du mot PROBA. Il y a STAT. 4! 2! = 12 anagrammes du mot 2) Réponse à la première question : 48 = 65536 (chaque professeur entre a le choix 8 6 4 2 8! quatre école). Réponse à la deuxième question : 2!2!2!2 = 2 2 2 2 = 2520 (nombre de choix pour les deux professeurs de la première école, puis pour ceux de la deuxième école parmi ceux restants, etc.). Exercice 3. [Dénombrement et probabilités] (4 points) Une forêt abrite vingt cerfs. Cinq sont capturés, marqués et relâchés. Un peu plus tard, quatre cerfs sont de nouveau capturés. Quelle est la probabilité que deux d’entre eux soient marqués ? N.B. : Ne pas oublier de déterminer un univers Ω adapté à cette problématique, puis de dire quel est l’ensemble des événements A considérés sur Ω, et finalement de préciser la probabilité choisie sur (Ω, A) ainsi que les conséquences de ce choix sur les calculs que vous êtes amenés à faire. Solution de l’exercice 3. On choisit comme univers Ω “l’ensemble des manières de capturer 4 cerfs parmi 20”. Ainsi, card(Ω) = 20 (tirage sans remise non ordonné). Étant donné 4 que Ω est de cardinal fini, on le munit de la tribu A = P(Ω) des parties de Ω. On suppose que les cerfs sont capturés au hasard, de sorte que l’on munit (Ω, A) de la probabilité uniforme, notée P. Ainsi, pour tout événement A de A, on a : P(A) = card(A) card(A) . = 20 card(Ω) 4 On s’intéresse à l’événement A : “parmi les 4 cerfs capturés, 2 sont marqués”, alors 5 card(A) = 52 15 . En effet, il y a manières 2 2 de choisir 2 cerfs parmi les 5 qui sont 15 marqués et, pour chacun de ces choix, il a 2 manières de choisir 2 cerfs parmi les 15 qui ne sont pas marqués. La réponse cherchée est donc : 5 2 15 2 20 4 P(A) = = 2 70 ' 0.217. 323 Exercice 4. [Statistique à deux variables] (2 points) Soient X et Y deux variables. Démontrer que : Var(X + Y ) = Var(X) + Var(Y ) + 2 Cov(X, Y ). Solution de l’exercice 4. Voir démonstration du point 3) Proposition 4.3 dans le cas particulier où a = b = 1. Exercice 5. [Statistique à deux variables] (6 points) On s’intéresse à une petite partie des données fournies par la dernière enquête PISA, 2015. Source : Synthèse des convictions, de l’engagement et de la motivation des élèves en sciences, OCDE 2016. La variable X représente le score moyen en sciences, la variable Y représente le pourcentage d’élèves envisageant d’exercer une profession scientifique. On restreint les données aux 27 premiers pays du classement (sur 70 pays). A titre informatif uniquement, le score moyen sur tous les pays (aussi ceux qui ne sont pas considérés ici) est de 493 et le pourcentage moyen sur tous les pays est de 24.5%. Numéro Pays Score moyen en sciences (X) 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. Singapore Japan Estonia Chinese Taipei Finland Macao (China) Canada Viet Nam Hong Kong (China) B-S-J-G (China) Korea New Zealand Slovenia Australia United Kingdom Germany Netherlands Switzerland Ireland Belgium Denmark Poland Portugal Norway United States Austria France 556 538 534 532 531 529 528 525 523 518 516 513 513 510 509 509 509 506 503 502 502 501 501 498 496 495 495 3 Élèves envisageant d’exercer une profession scientifique (Y ) (en %) 28.0 18.0 24.7 20.9 17.0 20.8 33.9 19.6 23.6 16.8 19.3 24.8 30.8 29.2 29.1 15.3 16.3 19.5 27.3 24.5 14.8 21.0 27.5 28.6 38.0 22.3 21.2 On a calculé les quantités suivantes : 27 X u=1 27 X u=1 27 X X(u) = 13 891, 27 X Y (u) = 632.9, u=1 27 X 2 X(u) = 7 153 142, Y (u)2 = 15 740.8, u=1 X(u)Y (u) = 325 405. u=1 1) Calculer la moyenne arithmétique de chacune des variables X et Y . 2) Calculer la variance et l’écart-type de chacune des variables X et Y . 3) Calculer la covariance de X et Y . 4) Calculer le coefficient de corrélation de X et Y . Quelle conclusion pouvez-vous en tirer ? 5) Donner l’équation de la droite de régression au sens des moindres carrés. Solution de l’exercice 5. 1) Les moyennes arithmétiques sont égales à 27 x̄ = 1 X 13891 X(u) = ' 514.48, 27 u=1 27 27 1 X 632.9 ȳ = Y (u) = ' 23.44. 27 u=1 27 2) Les variances sont égales à 27 1 X 7153142 2 Var(X) = X(u) − x̄2 = − 514.482 ' 241.51, 27 u=1 27 27 1 X 15740.8 2 Var(Y ) = Y (u) − ȳ 2 = − 23.442 ' 33.56, 27 u=1 27 Les écarts-types sont égaux à : σX = p Var(X) ' 15.54, σY = p Var(Y ) ' 5.79. 3) La covariance de X et Y est égale à Cov(X, Y ) = 27 1 X 325405 X(u)Y (u) − x̄ȳ = − 514.48 × 23.44 ' −7.37, 27 u=1 27 4 4) Le coefficient de corrélation entre X et Y est égal à, r(X, Y ) = Cov(X, Y ) −7.37 = ' −0.08. σX σY 15.54 × 5.79 On peut en conclure qu’il n’y pas de corrélation linéaire manifeste entre les données. Un ajustement linéaire peut être fait pour essayer de dégager un tendance, mais il ne serait pas souhaitable de l’utiliser pour prévoir des comportements. 5) Équation de la droite de régression par la méthode des moindres carrés. D’après le cours, on a : σY 5.79 = −0.08 ' −0.03, σX 15.54 ordonnée à l’origine = ȳ − pente × x̄ = 23.44 + 0.03 × 514.48 ' 39.15. pente = r(X, Y ) L’équation de la droite de régression par la méthode des moindres carrés est : y = −0.03 x + 39.15. 5