TD3
1. Calcul de probabilités
RAPPEL : d donne les valeurs P(X=j) (loi de probabilité )
p donne les valeurs P(X<=x) ( fonction de répartition)
Il existe des formules similaires pour les autres lois:
binom, dnbinom, norm, unif, chisq, t, exp, f, gamma, beta,...
a) calcul de la probabilité qu'une variable aléatoire X suivant une loi binomiale de
paramètres n=10 et p=1/3, B(10,1/3), soit égale à 1 ? dbinom()
b) calcul de la probabilité qu'une variable aléatoire X suivant une loi B(10,1/3) soit égale
à 0,1,2,...10
c) calcul de la probabilité qu'une variable aléatoire X suivant une loi B(10,1/3) soit
inférieure ou égale à 0,1,2,...10 pbinom()
d) calcul de la probabilité qu'une variable aléatoire X suivant une loi B(10,1/3) soit
supérieure à 5 ?
e) calcul de la probabilité qu'une variable aléatoire X suivant une loi de Poisson P(2.5)
soit égale à 0,1,2,...8 ?
f) calcul de la probabilité qu'une variable aléatoire X suivant une loi de Poisson P(2.5)
soit inférieure ou égale à 0,1,2,...8 ?
g) calcul de la probabilité qu'une variable aléatoire X suivant une loi de Poisson P(2.5)
soit supérieure à 20 ?
2. Les quantiles
RAPPEL : q donne pour y la valeur x telle que P(X=x)=y
a) calcul de la valeur x, de la loi normale centrée réduite telle que P(X<=x)=0.97:
qnorm()
b) calcul du quantile 2% pour une loi T de Student à 5 ddl qt()
Charger le jeu de données mtcars, et regarder ce qu'il contient.
3.Pour les données continues, on peut calculer moyenne variance quantile, coefficients
de corrélation.
a) faire quelques essais sur les colonnes de mtcars correspondant à des variables
continues.
On regardera en détails les représentations de ce type de données obtenues à l'aide de
hist(), boxplot()
Pour les données discrètes, on peut utiliser la fonction table(). Que fait-elle?
Une représentation sera donnée par (barplot(table())
4.Charger le jeu de données stackloss
calculer les moyennes, variances et résumés statistiques des variables de stackloss
créer l'histogramme, le boxplot et tracer la loi de distribution empirique pour la
variable stack.loss (fonction ecdf()et plot() pour tracer)
Est-ce que l'hypothèse de normalité parait raisonnable pour cette variable?
on utilisera les fonctions qqnorm() et qqline()