Évaluation : Statistique et Probabilités (2 heures) Énoncé et corrigé.

publicité
Université Paris Est Créteil, ESIPE
Statistiques descriptives et probabilités
B. de Tilière
Licence première année
Année 2016-2017
13 décembre 2016
Évaluation : Statistique et Probabilités (2 heures)
Énoncé et corrigé.
Le barème est donné à titre indicatif.
Exercice 1. [Probabilités] (4 points)
1) Soit Ω un univers et A l’ensemble des événements de Ω. Une probabilité sur (Ω, A)
est une application de A dans [0, 1] qui satisfait à deux axiomes. Énoncer ces deux
axiomes.
2) Soient A et B deux évènements de A tels que P(A) =
4
5
et P(B) = 14 . Montrer que
1
1
≤ P(A ∩ B) ≤ .
20
4
Solution de l’exercice 1.
1) Voir définition cours p. 57.
2) Montrons l’inégalité de gauche. Comme conséquence de la définition d’une probabilité, on a :
P(A ∪ B) = P(A) + P(B) − P(A ∩ B).
Or P(A ∪ B) ≤ 1, ce qui implique P(A ∩ B) ≥ P(A) + P(B) − 1. Dans notre cas
cela donne
4 1
1
P(A ∩ B) ≥ + − 1 = ,
5 4
20
et montre la première inégalité. Pour la deuxième, on utilise que A ∩ B ⊂ B, ce
qui implique
1
P(A ∩ B) ≤ P(B) = .
4
Exercice 2. [Dénombrement] (4 points)
1) Combien y a-t-il d’anagrammes
— du mot PROBA ?
— du mot STAT ?
2) Huit nouveaux professeurs vont être envoyés dans quatre écoles.
1
— Combien y a-t-il d’affectations possibles ? (sans contrainte sur le nombre de
professeurs par école).
— Qu’en est-il si chaque école recevra exactement deux professeurs ?
Solution de l’exercice 2.
1) Il y a 5! = 120 anagrammes du mot PROBA. Il y a
STAT.
4!
2!
= 12 anagrammes du mot
2) Réponse à la première question : 48 = 65536 (chaque professeur
entre
a le choix
8 6 4 2
8!
quatre école). Réponse à la deuxième question : 2!2!2!2 = 2 2 2 2 = 2520
(nombre de choix pour les deux professeurs de la première école, puis pour ceux de
la deuxième école parmi ceux restants, etc.).
Exercice 3. [Dénombrement et probabilités] (4 points)
Une forêt abrite vingt cerfs. Cinq sont capturés, marqués et relâchés. Un peu plus tard,
quatre cerfs sont de nouveau capturés. Quelle est la probabilité que deux d’entre eux
soient marqués ?
N.B. : Ne pas oublier de déterminer un univers Ω adapté à cette problématique, puis de
dire quel est l’ensemble des événements A considérés sur Ω, et finalement de préciser la
probabilité choisie sur (Ω, A) ainsi que les conséquences de ce choix sur les calculs que
vous êtes amenés à faire.
Solution de l’exercice 3. On choisit comme
univers Ω “l’ensemble des manières de capturer
4 cerfs parmi 20”. Ainsi, card(Ω) = 20
(tirage sans remise non ordonné). Étant donné
4
que Ω est de cardinal fini, on le munit de la tribu A = P(Ω) des parties de Ω. On suppose
que les cerfs sont capturés au hasard, de sorte que l’on munit (Ω, A) de la probabilité
uniforme, notée P. Ainsi, pour tout événement A de A, on a :
P(A) =
card(A)
card(A)
.
=
20
card(Ω)
4
On s’intéresse à l’événement A : “parmi
les 4 cerfs capturés, 2 sont marqués”, alors
5
card(A) = 52 15
.
En
effet,
il
y
a
manières
2
2
de choisir 2 cerfs parmi les 5 qui sont
15
marqués et, pour chacun de ces choix, il a 2 manières de choisir 2 cerfs parmi les 15
qui ne sont pas marqués.
La réponse cherchée est donc :
5
2
15
2
20
4
P(A) =
=
2
70
' 0.217.
323
Exercice 4. [Statistique à deux variables] (2 points)
Soient X et Y deux variables. Démontrer que :
Var(X + Y ) = Var(X) + Var(Y ) + 2 Cov(X, Y ).
Solution de l’exercice 4. Voir démonstration du point 3) Proposition 4.3 dans le cas particulier où a = b = 1.
Exercice 5. [Statistique à deux variables] (6 points)
On s’intéresse à une petite partie des données fournies par la dernière enquête PISA,
2015. Source : Synthèse des convictions, de l’engagement et de la motivation des élèves
en sciences, OCDE 2016.
La variable X représente le score moyen en sciences, la variable Y représente le pourcentage d’élèves envisageant d’exercer une profession scientifique. On restreint les données
aux 27 premiers pays du classement (sur 70 pays).
A titre informatif uniquement, le score moyen sur tous les pays (aussi ceux qui ne sont
pas considérés ici) est de 493 et le pourcentage moyen sur tous les pays est de 24.5%.
Numéro
Pays
Score moyen en sciences (X)
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
Singapore
Japan
Estonia
Chinese Taipei
Finland
Macao (China)
Canada
Viet Nam
Hong Kong (China)
B-S-J-G (China)
Korea
New Zealand
Slovenia
Australia
United Kingdom
Germany
Netherlands
Switzerland
Ireland
Belgium
Denmark
Poland
Portugal
Norway
United States
Austria
France
556
538
534
532
531
529
528
525
523
518
516
513
513
510
509
509
509
506
503
502
502
501
501
498
496
495
495
3
Élèves envisageant d’exercer
une profession scientifique (Y ) (en %)
28.0
18.0
24.7
20.9
17.0
20.8
33.9
19.6
23.6
16.8
19.3
24.8
30.8
29.2
29.1
15.3
16.3
19.5
27.3
24.5
14.8
21.0
27.5
28.6
38.0
22.3
21.2
On a calculé les quantités suivantes :
27
X
u=1
27
X
u=1
27
X
X(u) = 13 891,
27
X
Y (u) = 632.9,
u=1
27
X
2
X(u) = 7 153 142,
Y (u)2 = 15 740.8,
u=1
X(u)Y (u) = 325 405.
u=1
1) Calculer la moyenne arithmétique de chacune des variables X et Y .
2) Calculer la variance et l’écart-type de chacune des variables X et Y .
3) Calculer la covariance de X et Y .
4) Calculer le coefficient de corrélation de X et Y . Quelle conclusion pouvez-vous en
tirer ?
5) Donner l’équation de la droite de régression au sens des moindres carrés.
Solution de l’exercice 5.
1) Les moyennes arithmétiques sont égales à
27
x̄ =
1 X
13891
X(u) =
' 514.48,
27 u=1
27
27
1 X
632.9
ȳ =
Y (u) =
' 23.44.
27 u=1
27
2) Les variances sont égales à
27
1 X
7153142
2
Var(X) =
X(u) − x̄2 =
− 514.482 ' 241.51,
27 u=1
27
27
1 X
15740.8
2
Var(Y ) =
Y (u) − ȳ 2 =
− 23.442 ' 33.56,
27 u=1
27
Les écarts-types sont égaux à : σX =
p
Var(X) ' 15.54, σY =
p
Var(Y ) ' 5.79.
3) La covariance de X et Y est égale à
Cov(X, Y ) =
27
1 X
325405
X(u)Y (u) − x̄ȳ =
− 514.48 × 23.44 ' −7.37,
27 u=1
27
4
4) Le coefficient de corrélation entre X et Y est égal à,
r(X, Y ) =
Cov(X, Y )
−7.37
=
' −0.08.
σX σY
15.54 × 5.79
On peut en conclure qu’il n’y pas de corrélation linéaire manifeste entre les données.
Un ajustement linéaire peut être fait pour essayer de dégager un tendance, mais il
ne serait pas souhaitable de l’utiliser pour prévoir des comportements.
5) Équation de la droite de régression par la méthode des moindres carrés. D’après le
cours, on a :
σY
5.79
= −0.08
' −0.03,
σX
15.54
ordonnée à l’origine = ȳ − pente × x̄ = 23.44 + 0.03 × 514.48 ' 39.15.
pente = r(X, Y )
L’équation de la droite de régression par la méthode des moindres carrés est :
y = −0.03 x + 39.15.
5
Téléchargement