27
Analyses
simples des données
Les trois chapitres précédents ont été consacres aux différentes manières de présenter
les données, en tableaux de fréquences, en graphiques et enfin
sous
forme résumée.
La plupart des services d’évaluation permanente recevront aussi des demandes d’ana-
lyses des données plus détaillées. Ce chapitre décrira comment les résultats de deux
échantillons peuvent être comparés pour voir s’ils proviennent de la même population
OU
de populations différentes; la procédure pour estimer les relations entre les variables
sera également expliquée.
Les analyses peuvent être faites manuellement
OU
sur
une petite calculatrice.
27.1
Com
para ison
d’éc
hant
i
I
lons
La majeure partie des échantillons dont l’évaluation a été suivie auront été choisis
pour representer différentes populations (par exemple cultivateurs dans le projet
OU
en dehors du projet)
OU
les strates d’une population (par exemple cultivateurs pris
dans des zones agro-climatologiques différentes). Les demandeurs d’informations sur
ces populations
OU
ces strates voudront qu’elles soient comparées pour savoir si elles
diffèrent. Une différence seulement dans les moyennes ne peut le montrer, étant donné
que cette différence peut être due
à
des facteurs aleatoires et au processus d’échantillon-
nage. La distribution des données, indiquée par leur dispersion, doit également être
prise en compte.
Dans le chapitre sur le choix de l’échantillon (chapitre
17)
i1 a été dit qu’un échantillon
doit avoir au moins de dix
à
quinze éléments dans chaque strate. Ceci rend possible
d’appliquer une methode relativement simple pour comparer deux échantillons et tirer
des conclusions
sur
les deux populations dans lesquelles les échantillons ont été pris.
Par cette méthode, on teste si les deux échantillons ont été tires de populations ayant
une même moyenne et si les populations peuvent être considérées comme étant les
mêmes.
Si
le test indique qu’il n’en pas ainsi, on peut en conclure que les deux échantil-
lons ont été pris en partant de populations qui ont des moyennes différentes.
La
procedure du test est la suivante: supposons qu’il
y
a deux échantillons (par exemple
les revenus de cultivateurs dans deux villages). Le premier échantillon a un nombre
d’éléments n, appeles
Xi
(i
=
l....n). Le second échantillon a-m éléments, appelés
Yj
(i
=
I....m). Pour les deux échantillons, la moyenne
o(
et
Y)
et l’écart-type
(sx
et
sy)
peuvent être calculés.
257
La moyenne et l’écart-type des deux exemples peuvent être combinés dans un quotient
z,
qui est exprimé comme étant:
Ce quotient sera petit si les deux moyennes
X
et sont proches l’une de l’autre. Comme
i1
a
été montré au chapitre 26, l’écart-type est un indicateur de la dispersion d’un
échantillon; plus l’écart-type est élevé, plus la dispersion de I’échantillon est grande.
I1 est logique que plus un échantillon est dispersé (et donc aussi la population dont
i1 provient) plus la moyenne de chaque échantillon est influencée par
le
mode de sélec-
tion de l’échantillon; la différence entre les deux moyennes des échantillons doit par
conséquent être plus grande pour être statistiquement significative.
La
conclusion tirée d’une comparaison d’échantillons n’est jamais absolument fiable.
La fiabilité de la conclusion est indiquée par le niveau de signification. I1 existe des
tables qui indiquent les limites de
z
dans lesquelles i1
peut
&re conclu que les moyennes
de deux échantillons sont égales
à
différents niveaux de signification. En règle générale,
si
z
se situe entre -2 et
+
2,
on peut conclure que les moyennes des deux échantillons
sont égales. Autrement, leur différence est statistiquement significative.
Exemple
de comparaison d’échantillons
Dans les Villages
A
et
B,
qui ont des sources de revenus différentes, toutes les activi-
tés génératrices de revenu ont été évaluées au cours de l’année pour savoir si le
revenu moyen dans
un
village différait significativement de celui dans l’autre village.
A l’origine, 25 cultivateurs ont été choisis au hasard dans chaque village, mais quel-
ques séries de données étant incomplètes, elles n’ont pas
PU
être toutes utilides pour
I’analyse.
Les
résultats finalement obtenus étaient:
-
dans le Village A: l’échantillon utilisabie comprenait 16 cultivateurs, qui avaient
-
dans le Village
B:
l’échantillon utilisable comprenait 20 cultivateurs, qui avaient
Le quotient
z
est calculé pour tester si les villages ont
OU
non des revenus différents.
Pour
simplifier, l’information est posée en unités de
1
.O00
CFA.
un revenu moyen de 110.000 CFA, avec un écart-type de 32.000 CFA;
un revenu moyen de 200.000 CFA, avec un écart-type de
40.000
CFA.
x-7
-
1
IC120
-
-90
-90
-
-
=
-
=
-7,5
Z=
Jm
-
,/(32)’/16
+
(40)’/20
fi
12
On obtient ici
z
=
-73,
ce qui est plus petit que
-2.
On peut donc colure que les
deux échantillons ont des moyennes différentes et viennent de populations différen-
tes,
et que les deux villages ont des revenus significativement différents, apparem-
ment dus
à
leurs activités différentes.
L‘information qui est obtenue en comparant des échantillons (et par conséquent des
populations) peut être d‘une grande valeur pour un projet.
Les
comparaisons peuvent faire ressortir les groupes différents dans une population
de cultivateurs, et indiquer, par exemple, leurs potentialités quant
a
l’acceptation de
258
nouvelles technologies. L’indication de différences entre des groupes de cultivateurs,
OU
son
absence, peut mener dans le projet àdes programmes mieux adaptés aux besoins
des cultivateurs.
27.2
Sér
i
es
chrono
I
og
i
q
ues
Une série chronologique est une série de valeurs de la même variable dans le temps,
généralement
à
des intervalles régulièrement espacés.
I1
a été montré au chapitre
25
comment des données de ce genre pouvaient le mieux être présentées dans un graphi-
que. Maintenant, la discussion sera centrée sur la façon dont on peut extrapoler en
partant d’une série chronologique,
OU,
autrement dit, comment estimer la tendance
que les valeurs futures ont toutes chances de suivre.
Un exemple très simple d’une série chronologique est la façon dont un prix change
avec le temps, mais une série chronologique peut aussi décrire des choses telles que
le développement de la production agricole dans une région,
OU
l’offre en main-d’oeu-
vre, et beaucoup d’autres variables qui changent dans le temps.
27.2.1 Extrapolation
à
partir d‘un graphique
L’analyse d’une série chronologique commence généralement par une présentation
graphique de la variable dans le temps. Ceci montre
si
la série semble suivre une séquen-
ce régulière
OU
non, et si une tendance peut être discernée. Parfois une tendance peut
être interrompue.
Par exemple: les prix du pétrole sur le marché mondial ont monte en flèche en
1973,
de sorte que dans une série chronologique des prix mondiaux du pétrole, deux ten-
dances séparées se manisfesteraient; une jusqu’en
1973,
et une autre ensuite.
Dans une série de prix de marché des céreales sur les marchés locaux en Afrique, le
prix fluctue au cours de l’année, mais de façon autre que son evolution d’année en
année, de sorte que pour découvrir une tendance
à
long terme dans une série de ce
genre,
i1
faut exclure les fluctuations mensuelles
(ou
journalières).
Une façon simple de déterminer une tendance est de préparer un graphique dans lequel
chaque valeur est représentée par un point, et de tracer enite une ligne qui soit aussi
proche
que
possible de chaque point. Ce n’est pas une méthode tres précise, mais elle
est rapide et donne souvent une idée générale de ce qui se passe. En partant de cette
ligne
i1
est possible d’extrapoler la tendance au proche futur, en lisant graphiquement
quelle valeur la ligne représenterait par exemple I’année qui suit.
27.2.2 Moyenne mobile
Une méthode plus précise pour estimer une tendance est celle de la moyenne mobile.
Elle est particulierement utile pour les données qui suivent un régime cyclique. C’est
une méthode relativement simple, dans laquelle on commence par déterminer combien
de temps dure un cycle. Pour les prix des céréales sur les marchés locaux, par exemple,
259
en admettant qu’il
y
a une saison agricole par an, le cycle dure un an. La tendance
peut
donc être estimée par
la
moyenne mobile calculée
sur
12
mois.
Pour calculer la moyenne mobile sur
12
mois, on calcule la moyenne arithmétique
des valeurs de douze mois, d’abord pour les valeurs des mois
1
à
12,
puis
de
2
à
13,
de
3
à
14,
etc. Ceci signifie que douze mois sont toujours représentés dans la moyenne,
de sorte que les influences mensuelles peuvent être considérées comme ayant été élimi-
nées. La moyenne mobile indique la tendance de la variable, en excluant les influences
cycliques.
Exemple de moyenne mobile
Les prix de marché du sorgho au Marche
A
sont présentés dans le tableau
27.1.
Le prix moyen pour les premiers
12
mois est de
61
CFA.
I1 est porté au milieu de cette année là. La moyenne mobile pour les mois
2
à
13
est également
61.
Comme on peut le voir sur le tableau, les séries des moyennes
mobiles fluctuent beaucoup moins que les séries originales. Ceci signifie que, les
fluctuations saisonnières mises
à
part, le niveau de prix change très peu.
TABLWU
27.1. Prix mensuels du sorgho sur deux années au Marché A (CFA/kg)
Année Mois Prix Moyenne mobile
(CFA/kg) sur 12 mois
(CFA/kg)
1978 Janvier 59
Février
60
Mars 66
Avril 62
Mai
60
Juin 69
Juillet 65
AoÛt 62
Septembre 62
Octobre
64
Novembre
50
Dkembre
53
1979 Janvier 56
Février 61
Mars 65
Avril 68
Mai 62
Juin 63
Juillet 68
AoÛt 66
Septembre
64
Octobre
58
Novembre 49
mbre 45
61
61
61
61
61
61
61
61
62
62
61
61
60
260
27.3
Corrélat
ion
I
i
néai
re
La plupart des projets agricoles ont pour objectif de promouvoir des techniques cultu-
rales qui sont nouvelles pour les cultivateurs. Souvent des variétés sont introduites
qui ont un haut rendement potentie1 si elles sont combinées
à
I’emploi de fertilisants
et de méthodes culturales appropriées. Sur les parcelles d’essai d’une station expéri-
mentale agricole, les rendements potentiels ont été déterminés pour divers niveaux
d’emploi de fertilisant.
Sous
les conditions réelles de culture, néanmoins, le fertilisant
peut ne pas être appliqué au bon moment
OU
au niveau correct, de sorte que la relation
entre fertilisant et rendement identifiée sur les parcelles d’essai ne reste plus valable
au niveau du cultivateur. La relation réellement existante, OU corrélation, intéresse
generalement les dirigeants de projet, étant donné que l’emploi de fertilisant joue un
rBle important dans de nombreux programmes d’innovations techniques.
En statistisque, un problème de corrélation peut être décrit comme la recherche d’une
relation entre des variables. La corrélation la plus simple est la corrélation linéaire
a
deux variables. Une variable est supposée dépendre d’une autre par suite de principes
théoriques et il est estimé que leur relation peut être approchée par une fonction linéai-
re. La linéarité de la relation semble une contrainte sévhe, mais dans la pratique de
nombreuses fonctions non linéaires peuvent être approchées par une OU plusieurs for-
mes linéaires. De mime, de nombreuses relations non linéaires peuvent être transfor-
mées en relations linéaires par un simple transformation mathématique des variables.
Les deux variables entre lesquelles on présume une relation peuvent être représentées
par
Y
et X,
Y
étant la variable dépendante (par exemple le rendement) et
X
la variable
indépendante (par exemple le fertilisant).
Leur relation estimée ne veut pas dire que l’emploi de fertilisant explique completement
les variations en rendements, mais seulement qu’il est un facteur important.
11
y
a
en général d’autres facteurs (le moment des activités agricoles, la repartition des pluies,
etc.) qui influent sur le rendement, mais la corrélation linéaire considère seulement
le facteur le plus important et essaye de quantifier la relation.
27.3.1
Analyse
par
graphique
Avant de commencer le processus d’estimation de la relation mathématique on établit
tout d’abord un graphique dit ‘nuage de corrélation’ pour voir si la relation attendue
peut être montrée graphiquement.
Le
‘nuage de corrélation’ est une representation graphique de toutes les valeurs de
la
variable indépendante
(X),
mesurée le long de l’axe horizontal, et des valeurs corres-
pondantes de la variable dépendante
(Y)
mesurée le long de l’axe vertical. Chaque
couple de valeurs est représenté par un point. Un exemple d’un nuage de corrélation
indiquant la relation entre emploi de fertilisant et rendement de sorgho est montré
sur
la figure 27.1.
26
1
1 / 17 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !