1. STATISTIQUE DESCRIPTIVE A.Mizrahi
Travaux dirigés de statistiques S4-SV SVN
1 Statistique descriptive
Exercice 1 : On considère la série suivante (1, 0, 2, 1, 1, 0, 1, 0, 0) .
1. Calculer sa moyenne et sa variance empiriques.
2. Représenter la courbe des fréquences cumulées.
3. Déterminer médiane, premier et troisième quartile, ainsi que le mode.
4. Représenter la boite à moustache de la série.
5. Calculer le coefficient de Fischer.
6. Même question avec la série :(1, 2, 3, 4, 5, 5, 5, 5, 10 ).
Exercice 2 :
1. Déterminer une série de cinq entiers dont la moyenne vaut 10 et la médiane 12.
2. Déterminer une série de cinq entiers dont la moyenne vaut 10 et la médiane 8.
3. Déterminer une série de cinq entiers dont la moyenne vaut 10 et l’écart type vaut 2.
Exercice 3 :
Lors d’une étude sur le grand corègone on a mesuré la longueur
totale du corps en mm de 756 poissons.
1. Représenter la courbe des fréquences cumulées.
2. Représenter les données sous forme d’un histogramme.
3. Proposer deux histogrammes dont les classes ont au moins 50
membres.
taille [270;290[ [290;310[ [310;330[ [330;350[ [350;370[ [370;390[ [390;410[
effectif 2 6 7 13 28 38 110
taille [410;430[ [430;450[ [450;470[ [470;490[ [490;510[ [510;530[ [530;600[
effectif 242 184 86 25 10 2 3
Exercice 4 : Montrer que si une série de réels est symétrique par rapport à un réel s, alors sa moyenne est égale à
s, de plus c’est une médiane de la série.
Exercice 5 :
Les mesures journalières de la température à Rennes du premier juin 2001 au 30 septembre 2001, relevée à
midi donne la boite à moustache suivante, la moyenne de ces températures est égale à 21,5 degré. :
Université de Cergy Pontoise 12009-2010
1. STATISTIQUE DESCRIPTIVE A.Mizrahi
1. La médiane et la moyenne sont-elles différentes?
2. La distribution est-elle symétrique?
3. Quelle a été la valeur la plus basse observée? et la plus haute?
Exercice 6 : En utilisant le diagramme en bâtons ci dessous représentant le nombre d’enfants de 400 familles de
Susurre, répondre aux questions :
1. Calculer le nombre moyen d’enfants par famille.
2. Calculer la nombre médian d’enfants par famille.
3. Calculer la variance du nombre d’enfants par famille.
Exercice 7 : En utilisant le diagramme en bâtons ci dessus représentant la Cholestérolémie en g/l dans un échan-
tillon de 113 patients:
1. Calculer le taux moyen de cholestérol dans l’échantillon.
2. Représenter la courbe cumulative des fréquence.
3. Déterminer médiane, quartile, écart inter-quartile.
4. Représenter la boite à moustache correspondante.
Exercice 8 : La Fréquence Cardiaque Maximum , notée FCM, est un paramètre essentiel pour permettre au coureur
de fond d’élaborer des plans d’entraînement efficaces. Cette fréquence peut se mesurer, soit en laboratoire sur tapis
roulant, soit sur le terrain à l’aide d’un cardio-fréquencemètre.
Une étude a été faite auprès de 13 hommes s’entraînant régulièrement (2 à 4 fois par semaine), et participant à de
petites compétitions. On a mesuré leur fréquence cardiaque maximum. On souhaite étudier une relation éventuelle
entre l’âge d’un individu et sa fréquence cardiaque maximum. Voici pour chaque individu son âge et sa fréquence
cardiaque maximum.
Age 40 36 51 49 47 51 32 55 55 23 49 52 35
FCM 187 195 180 190 185 183 195 185 189 201 189 185 195
1. Tracer le nuage de points, avec l’âge en abscisse et la FCM en ordonnée.
2. Calculer le coefficient de corrélation linéaire entre la variable âge et la variable FCM. Que constatez-vous?
Peut-on dire que la fréquence cardiaque est fortement corrélée à l’âge des sportifs?
3. Calculer l’équation de la droite de régression linéaire. Tracer cette droite sur le même graphe que le nuage
de points.
4. Utiliser cette relation pour donner une estimation de votre FCM.
5. Peter Snell (Nouvelle-Zelande) a été 6 fois recordman du monde en demi- fond, du 800m au mile (1609m),
à l’âge de 26 ans. A l’époque, sa FCM était de 192. Placer ce point sur le graphique. D’après la droite de
régression, quelle FCM "devrait-il" avoir à son âge? Commenter.
Université de Cergy Pontoise 22009-2010
2. CONVERGENCE DES SUITES DE VARIABLES ALÉATOIRES A.Mizrahi
Exercice 9 : On a relevé la production de bière alsacienne et le nombre de licences sportives des fédérations
françaises entre 1960 et 1995.
Années Nombre de licences Production de bière en Belgique
(en milliers) (en millions d’hectolitres)
1960 1640 3,3
1960 1640 3,3
1965 2220 4
1970 3240 5,6
1975 4620 8
1980 6300 9,6
1985 8340 10,2
1990 8980 11,3
1995 9210 11,2
Calculer la corrélation entre les variables Licences et Bières.
Peut-on en déduire que la pratique du sport conduit à boire de la bière?
2 Convergence des suites de variables aléatoires
Exercice 10 : Soit Xune V.A. Gaussienne de paramètres (3; 4)
1. Calculer P(X < 4);P(X < 2,5);P(X > 2);P(|X|<4).
2. Déterminer αle plus grand possible tel que P(X2> α)>102.
Exercice 11 : Soit X1,X2,X3,X4des variables aléatoires normales centrées indépendantes de loi N(0; 9). Calculer
en fonction de la fonction de répartition F4d’une loi de χ2à 4 degrés de liberté, la probabilité
p=P(X2
1+X2
2+X2
3+X2
4>2)
Exercice 12 :
Soit Tune variable aléatoire qui suit une loi de
Student à 7 degrés de liberté : En utilisant le graphe
de la fonction de répartition d’une loi de Student à 7
degrés de liberté, ci contre à droite.
1. Déterminer des valeurs approchées de P(X <
1);P(X > 1
2);P(|X|<1,5).
2. Déterminer αtel que P(X < α) = 1
4. Détermi-
ner βtel que P(X > β) = 1
4.
Exercice 13 : On modélise la taille des pins d’une plantation par des variables aléatoires iid (Xi)inormales
N(30; 4), calculer PP10
i=1(Xi30)2144. On mesure 10 arbres et l’on obtient les longueurs suivantes :
31,39,27,28,29,24,29,29,31,33
qui donne P10
i=1 xi= 300 et P10
i=1(xi30)2= 144. Que peut-on dire de la modélisation? Même question pour
la loi N(30; 9).
Exercice 14 : Soit (Xn)une suite de variables aléatoires exponentielles de paramètre n, montrer que cette suite
converge en probabilité vers la variable aléatoire nulle.
Exercice 15 : On modélise la taille des hommes de 18 ans en France par une variable aléatoire normale N(175,36),
et la taille des femmes de 18 ans par une loi normale N(162,30).
1. Selon ce modèle quelle est la proportion d’homme de plus de 180 cm.
Université de Cergy Pontoise 32009-2010
2. CONVERGENCE DES SUITES DE VARIABLES ALÉATOIRES A.Mizrahi
2. Selon ce modèle dans l’ensemble des couples hétérosexuels de jeunes de 18 ans possible, quelle est la pro-
portion de couples ou l’homme est plus petit que la femme?
Exercice 16 : On note pla probabilité qu’une personne en âge d’être vaccinée contre la grippe demande effec-
tivement à l’être. Sur une population de 10 000 personnes en âge d’être vaccinées, on modélise par une variable
aléatoire Nle nombre de personnes demandant à se faire vacciner.
1. Quelle loi proposez-vous de prendre pour N?
2. On suppose que p= 0,1, si l’on achète 1100 vaccins, quelle est la probabilité qu’il n’y en ait pas suffisam-
ment? La difficulté semble d’évaluer p
3. Toujours dans le cas où p= 0,1, déterminer le nombre mde vaccins qu’il faudrait prévoir pour que la
probabilité d’en manquer soit égale à 1%.
Exercice 17 :
On sait par expérience qu’une certaine opération chirurgicale réussi dans 90% des cas. Cette opération est
réalisée dans une clinique 400 fois chaque année. On modélise par une variable aléatoire Nle nombre de réussites
dans une année.
1. Quelle loi proposez vous de prendre pour N, on précisera bien les hypothèses faites? Calculer l’espérance et
la variance de N.
2. Calculer la probabilité que la clinique réussisse 350 ou plus opérations dans l’année.
3. Calculer la probabilité que la clinique rate 28 opérations ou plus dans l’année.
4. La clinique prend une assurance, le prix de l’assurance est fixé par le nombre maximum d’opérations indem-
nisée sur une année, le directeur veut fixer ce nombre de tel sorte que la probabilité de ne pas être indemnisé
soit inférieure à 1%, quel nombre maximum d’opérations ratées doit-il déclarer.
Exercice 18 : Soient Bet Ndeux variables aléatoires, Bde loi B(n;p)et Nde loi N(0,1).
1. Rappeler l’espérance et la variance de B. Déterminer aet bpour que e
N=aN +bait même espérance et
même variance que B.
2. Déterminer αet βpour que e
B=αB +βsoit centrée, réduite.
3. Trouver un lien entre les fonctions de répartition de Net de e
N.
Voici 3 graphiques, le premier représente les fonctions de répartition de Net de e
Bpour n= 30 et p= 0,5. Les
2 suivants représentent l’écart maximum qu’il y a entre la fonction de répartition de Net de e
B, pour p= 0,5et
p= 0,1,nvariant.
(c) N=30 (d) p= 0,5(e) p= 0,1
4. Pour p= 0,5et n= 50 quelle est l’erreur maximale que l’on fait lorsqu’on approche une loi B(50,1
2)par
une loi normale.
5. Quelle valeur de nfaut-il prendre pour être sur que l’on peut approcher une variable aléatoire binomiale
B(n,1
2)par une loi normale avec une erreur inférieur à 5%?
6. Même question avec B(n, 1
10 )
Université de Cergy Pontoise 42009-2010
2. CONVERGENCE DES SUITES DE VARIABLES ALÉATOIRES A.Mizrahi
On représente maintenant sur le premier graphique, pour n= 50 et p=1
2, la différence entre les fonctions de
répartition de Bet de e
N. Sur le second un zoom du premier graphique, enfin sur le troisième on représente le
logarithme de l’erreur maximale commise en fonction du logarithme de n.
(f) N=50 (g) N=50, Zoom (h) Des logarithmes
7. A l’aide de la figure (g). Déterminer l’erreur commise maximale que l’on peut commettre si l’on calcule
P(c < e
N < D)pour approcher P(c < B < d).
8. En utilisant la graphique (h), qui représente le logarithme néperien de l’erreur maximale en fonction de ln(n),
comment décroît cette erreur en fonction de n.
Jusqu’à présent ce que l’on cherche c’est la différence maximum qui existe entre la fonction de répartition de la loi
normale et celle de la loi binômiale centrée réduite, mais dans la pratique ce que l’on cherche c’est à approcher les
quantités P(Bm), où mest un entier, par une loi normale, dans le premier graphique on a représenté la suite de
points n, max
m
P(Bnm)P(f
Nnm)
n.
Dans les deux derniers on a représenté
n, max
m
P(Bnm)P(f
Nnm+ 0,5)
n
pour p= 0,5et pour p= 0,1, ceci est guidé par le fait que P(Bm) = P(B < m + 1).
(i) Aux points entiers (j) Correction de Yates, p= 0,5(k) Correction de Yates, p= 0,1
9. Pour p= 0,5et n= 50 quelle est l’erreur maximale que l’on fait lorsqu’on approche P(Nm)à l’aide
d’une loi normale, sans utiliser la correction de yates, puis en utilisant la correction de Yates.
10. Quelle valeur de nfaut-il prendre pour être sur que l’on peut approcher P(Nm)par une loi normale en
utilisant la correction de Yates, avec une erreur inférieur à 1%?
11. On trouve parfois dans les livres que l’on peut approcher une loi binomiale B(N,p)par une loi normale
lorsque Np > 5et N(1 p)>5. A quelle erreur cela correspond pour p= 0,5et pour p= 0,1.
Université de Cergy Pontoise 52009-2010
1 / 11 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !