Conditions d‘appliation pour le test de corrélation R de Pearson
1. Deux variables continues
2. Les observations dans une même variable doivent être indépendantes : question d’ordre
méthodologique, qui ne peut donc pas être verifée statistiquement on ne peut que
supposer que l’échantillonage a été fait correctement
(exemple tp 3 ex.2)
3. Réalisation du nuage de points : ANALYSE DE SCATTERPLOT
3.1. Détection visuelle des outliers bivariés
3.2. Relation linéaire ?
3.3. Homogénéité de la relation : est-ce que les points se repartissement + ou – en forme
de tube autour de la droite de régression
4. Verification de la condition de normalité : ANALYSE DU TEST DE NORMALITE ET DU Q-Q
PLOT
4.1. Test de Shapiro-Wilk
H0= la distribution des données ne s’écarte pas significativement d’une distribution
normale Condition de normalité respectée
H1= la distribution des données s’écarte significativement d’une distribution normale
Condition de normalité non respectée
Si Shapiro-Wilk p > 0,05 Rejet de H0 Condition de normalité non respectée
Si Shapiro-Wilk p ≤ 0,05 Rejet de H0 Condition de normalité respectée
4.2. Q-Q plot
Il s’agit d’une représentation graphique qui compare les quantiles des résidus
standardisés (sur l’ordonnée) à ceux d’une distribution normale standardisée (sur
l’axe des abscisses)
Si les quantiles des résidus standardisés sont exactement répartis sur la
diagonale, cela signifie qu’ils sont identiques à deux de la distribution normale
standardisée. Au contraire, plus ils s’eloignent de la diagonale, plus cela traduit un
écart à la normalité.
MAIS, malgré tout qu’à condition que les échantillons soient suffisamment
grands, les tests paramétriques peuvent rester valide, même lorsque la
condition de normalité est fortement compromise