ENSM.SE 20 novembre 06
Axe MSA
Fonctions utiles dans l'environnement R
ls.str(pat="msa") donne la structure de l'objet msa.
summary fournit un résumé de ce que contient la variable auquel il s'applique.
Evidemment, summary donne des résultats qui dépendent de la structure de la variable
considérée (en fait de sa classe).
read.table permet de lire un tableau de données.
hist (resp. density) donne une estimation de la densité d'un jeu de données par
histogramme (resp. par lissage par noyau).
pairs permet d'obtenir la matrice des graphiques de tous les couples de variables
contenues dans le tableau considéré.
plot, boxplot…
lm qui effectue l'ajustement d'un modèle de régression linéaire. Le résultat est un objet
de la classe "lm" qui est composée de modèles linéaires ajustés sur des données. Cet
objet a beaucoup de propriétés et on peut lui appliquer des fonctions générales
(summary, anova, plot…).
cov donne la matrice de covariance d'un vecteur ou d'un objet (notamment de type lm).
cov2cor (lire "cov to cor") donne la matrice de corrélation associée à une matrice de
covariance donnée.
Les formules dans l'environnement R
Les formules sont des objets centraux dans R et sont basées sur le caractère ~ qui
signifie "en fonction de". Elles sont utilisées dans de nombreuses fonctions. Par exemple :
plot(taille~age,data=tailles)
coplot(taille~t.mère|age,data=tailles) (| signifie "conditionnellement à")
etc…
Mais leur utilisation est cruciale lorsque l'on cherche à ajuster des modèles à des
données. Pour ce qui nous concerne, la fonction lm s'applique à une formule et à des données.
Sous leur forme la plus simple, les formules ressemblent aux expressions qui suivent :
y~x1+x2 (qui considère un modèle y a + b x1 + c x2)
y~x1+x2-1 (qui considère un modèle y b x1 + c x2)
y~x1+x2+x1:x2 (qui considère un modèle y a + b x1 + c x2 + d x1 x2)
Noter que les deux formules y~x1+x2+x1:x2 et y~x1*x2 sont équivalentes.
Pour toutes les précisions nécessaires concernant les formules, voir l'aide sur formula.