2006-2007 - Contrôle Continu

publicité
LSV3 recherche – Statistiques – Contrôle continu novembre 2006 - Correction
Exercice 1. Des biomasses de l’algue Cystoseira amentacea var. stricta ont été collectées, au mois de mai, juin
et juillet 2005, à Saint-Jean Cap-Ferrat (Tableau 1). On cherche à déterminer si la biomasse moyenne du début
de l’été est plus importante que celles de la fin du printemps, à un seuil de 0,05.
Tableau 1. Biomasses de Cystoseira amentacea var. stricta (g poids sec.m-2) récoltées à Saint-Jean Cap-Ferrat en
mai, juin et juillet 2005.
Mai
Juin
Juillet
20,5
14,3
26,2
37,9
18,6
18,6
29
32,1
13,6
21,6
23,3
24,1
27,8
16,4
17,2
18,8
24,2
23,4
Σx
155,6
128,9
123,1
n
6
6
6
Σx²
4290,5
2978,35
2641,57
K2
2,22
3,17
3,22
2
K représente la valeur calculée du test d’Agostino-Pearson.
Normalité
Connaissant les valeurs calculées K2du test d’Agostino-Pearson on on compare ces valeurs à χ20,05,2 = 5,99.
On pose pour chaque groupe :
H0 = la distributions des valeurs de biomasses du mois i suit une loi normale
H1 = la distributions des valeurs de biomasses du i ne suit pas une loi normale
Avec i = mai, juin, juillet.
Mai : Dobs = 0,22 ≤ D0,05, 6 -0 = 0,40 ; H0 est acceptée, la distribution des valeurs de biomasses du mois de mai suit
une loi Normale.
Juin : Dobs = 0,17 ≤ D0,05, 6 -0 = 0,40 ; H0 est acceptée, la distribution des valeurs de biomasses du mois de juin suit
une loi Normale.
Juillet : Dobs = 0,22 ≤ D0,05, 6 -0 = 0,40 ; H0 est acceptée, la distribution des valeurs de biomasses du mois de juillet
suit une loi Normale.
Homoscédasticité.
On teste si les variances des distributions de chaque mois sont homogènes.
On pose
H0 = s²mai = s²juin = s²juillet
H1 = au moins une des variances est différente.
S²mai
S²juin
S²juillet
51,05
41,82
23,19
Les distributions des biomasses de chaque mois suivent une loi Normale, par conséquent on peut effectuer un
test de Bartlett.
1
LSV3 recherche – Statistiques – Contrôle continu novembre 2006 - Correction
K
2
S xp

  n  1 S
i
2
xi
i
K
  n  1
i
i
(5.51, 05  5.41,82  5.23,19) 580, 39

 38, 69
555
15
Puis on calcul une valeur Bc tel que Bc  B avec:
C
K
K


2
B=2,3026  log S xp
.  ni  1    ni  1 log S xi2  
i
i


 2,3026  23, 81  23, 47   0, 78



K


1
1
1
1

  1
C  1
 K
 0, 6  0, 066  1, 08
3  K  1  i ni  1
3  3  1

i  ni  1 

d’où Bc = 0,71
On compare à une valeur du χ²0,05, 2 = 5,99
Bc ≤ χ²0,05, 2 ; H0 est acceptée, les variances sont homogènes.
Pour résumé :
- les variables sont indépendantes entre elles
- les distributions suivent une loi Normale
- les variances sont homogènes entre elles
Par conséquent, on peut effectuer une Analyse de Variance à un critère de classification pour détecter s’il y a une
différence significative entre les biomasses moyennes des 3 mois.
ANOVA
On estime les dispersions intergroupe, intragroupe et totale.
Dispersion intragroupe :
SCE   x ²ij 
( xij )²
ni
 (155, 6)² (128,9)² (123,1)² 
 9910, 42  


6
6 
 6
 580,39
2
LSV3 recherche – Statistiques – Contrôle continu novembre 2006 - Correction
Dispersion intergroupe :
SCI  
( xij )²
ni
( xij )²

N
 (155, 6)² (128,9)² (123,1)²  (407)²




6
6 
18
 6
 100,15
Dispersion totale
SCT = SCI + SCE = 680,54
On calcule CMe = SCE/(N-k) = 38,69
et CMmois = SCI/(k-1) = 50,07
D’où Fc = CM mois / CMe = 1,29 ≤ F0,05, 2, 15 = 3,68
H0 est acceptée à 0,05, il n’a pas de différence significative entre la biomasse moyenne du début de l’été et celles
de la fin du printemps.
RAPPORT DÉTAILLÉ
Groupes
Nombre
d'échantillons
6
6
6
Somme
155,6
128,9
123,1
ANALYSE DE VARIANCE
Source des
variations
Somme des carrés
Totale
680,544444
Mois
100,154444
erreur
580,39
Degré de
liberté
17
2
15
Mai
Juin
Juillet
Moyenne
25,9333333
21,4833333
20,5166667
Variance
51,0546667
41,8296667
23,1936667
Moyenne des
carrés
50,0772222
38,6926667
F
Probabilité
1,29423032
0,30302308
Valeur critique
pour F
3,68232034
Exercice 2. Lors d’une étude sur la production d’œufs de poules faisane en 2004, le niveau de précipitations a
été mesuré en Auvergne pendant un an ainsi que le nombre d’œufs pondus par des poules faisanes au Malawi.
Les résultats sont les suivants :
Précipitations
(mm)
196 289 576 625 729 1089 1156 1369 1600 1681 1764 1849
nbre d'oeufs
61
37
65
69
54
93
87
89
100
90
97
98
Ces données vous permettent-elles de penser que les précipitations auvergnates pourront fournir une bonne
estimation de la fécondité des poules faisanes malawites ?
Il n’y a aucun lien de causalité entre les données de précipitations mesurées en Auvergne et la fécondité de
poules du Malawi (Afrique) donc il n’y a pas de corrélation à calculer.
Exercice 3.
- Que mesure l’écart-type ?
La dispersion des valeurs autour de la moyenne
- Avant un test-t apparié sur quelles valeurs testez-vous la normalité ?
On teste la normalité sur la distribution des différences
3
LSV3 recherche – Statistiques – Contrôle continu novembre 2006 - Correction
- Avant un test T de Wilcoxon quel test utilisez-vous pour tester l’homoscédasticité ?
Aucun test d’homoscédacticité pour des échantillons appariés
- Un collègue biologiste vous contacte pour un conseil en statistique. Il a mesuré la densité de moules
pendant 20 ans au Cap de Nice à raison d’un seul comptage par, dans un seul site. Il souhaite comparer
statistiquement les populations annuelles de moules entre elles. Que lui conseillez-vous de faire ?
De tout refaire en faisant des répliquats
- A partir du résultat sur l’étude de différents sites et différents types de roches sur la densité de Patella
ferruginea déterminer l’effort d’échantillonnage à entreprendre ?
48 mesures de densité
Interpréter les résultats du tableau.
Facteur site. F0,05,1,42 = 4,06 > Fsite -> pas de différence entre les sites
Facteur Types de roches. F0,05,2,42 = 3,2 > Fsit e-> pas de différence entre types de roches
Facteur interaction. F0,05,2,42 = 3,2 > Fintearction-> au moins une des moyennes de l’interactions diffère.
Quel(s) test(s) proposez-vous pour terminer cette analyse ?
On fait un HSD de Tuckey ou un SNK paramétrique sur les moyennes de l’interactions, dans ce cas toutes
les valeurs.
Source des variations
SC
ddl
CM
F
Totale
6325,92
47,00
cellules
1559,17
Site (s)
5,33
1,00
5,33
0,05
Types de roches (T)
560,79
2,00
280,40
2,47
Interaction (s x T)
993,04
2,00
496,52
4,37
erreur
4766,75
42,00
113,49
4
Téléchargement