Telechargé par Moussa Jaouani

biometrie

publicité
La variation et la génétique des populations
Sciences de la vie et de la terre
Introduction :
La génétique mendélienne s’intéresse à l’étude des caractères qualitatifs (la couleur, le forme, …) qui
sont faciles à distinguer. Cependant, il existe d’autres caractères dits quantitatifs non soumis aux lois de
Mendel et qui sont des caractères mesurables (en kg, en m, en l, ...) donc qui peuvent prendre différentes
valeurs, c’est pourquoi qu’on les appelle variables xi. En effet on distingue entre des caractères quantitatifs à
variation discontinue, c.à.d. que les valeurs du variable prennent un nombre fini (nombre des graines dans une
gousse, nombre des œufs pondues, nombre des nouveau-nés, …). Alors que si les caractères quantitatifs
prennent toutes les valeurs possibles comme la glycémie, la pression artérielle, le poids, … On parle de la
variation continue.
La biométrie est donc l’étude statistique des variables quantitatifs non soumis aux lois de Mendel.
Problématiques : Comment se fait l’étude de la variation quantitative chez un groupe d’individus ?
Et quelle est l’utilité de cette étude ?
I. Etude de quelques exemples de la variation génétique quantitatif :
1. Caractère à variation discontinue :
Données expérimentales N°1 :
On s’intéresse à l’étude du nombre des nouveau-nés après chaque grossesse chez une population de 100
souris, et on obtient les résultats suivants :
Variable xi : nombre
des nouveau-nés
Effectif ni : nombre
des femelles
1
2
3
4
5
6
7
8
9
2
8
12
16
23
18
10
7
1
1. Déduire le type du variable étudié. Justifier votre réponse.
2. Représenter graphiquement la répartition des fréquences sous forme de diagramme en bâtons et
polygone de fréquences.
3. Analyser le résultat obtenu et donner une déduction appropriée.
Corrigé :
1. Il s’agit d’un variable discontinu, du fait qu’il prend des valeurs finies.
2. Voir le papier millimétré.
3. On obtient un polygone de fréquences présentant un seul mode
c.à.d. unimodale, d’où l’homogénéité de la population de souries
étudiée.
25
20
15
10
5
0
1
Moussa JAOUANI
1
2
3
4
5
6
7
8
2ème année Bac. SM
9
La variation et la génétique des populations
Sciences de la vie et de la terre
Données expérimentales N°2 :
Le tableau suivant représente les résultats d’étude biométrique de la longueur de la tête des gamètes mâles :
Variable xi : longueur
de la tête en µm
Effectif ni : nombre
des gamètes
2
2,5
3
3,5
4
4,5
5
5,5
6
6,5
7
7,5
8
8,5
1
0
4
12
32
48
37
33
40
51
38
18
5
2
1. Représenter graphiquement la répartition des fréquences sous forme de diagramme en bâtons et
polygone de fréquences.
2. Discuter l’aspect du polygone obtenu. Que peut-on déduire sur l’homogénéité de cette population ?
Corrigé :
1. Voir le papier millimétré.
60
50
40
30
20
10
0
2
2,5
3
3,5
4
4,5
5
5,5
6
6,5
7
7,5
8
8,5
2. On obtient un polygone de fréquences présentant deux modes c.à.d. plurimodale, donc l’épchantillon de
gamètes étudié est hétérogène.
2. Caractère à variation continue :
Données expérimentales N°3 :
Chez une population de vaches importées de 50 individus, on a mesuré la quantité de lait produite par jour
en Kg, on obtient la répartition des fréquences suivante :
Variable xi : Quantité
[13-16[ [16-19[ [19-22[ [22-25[ [25-28[ [28-31[ [31-34[ [34-37[ [37-40[
du lait en Kg
Effectif ni : nombre des
2
6
8
12
10
5
4
2
1
vaches
1. Déduire le type du variable étudié. Justifier votre réponse.
2. Représenter graphiquement la répartition des fréquences sous forme d’histogramme et polygone de
fréquences.
3. Discuter l’aspect du polygone obtenu. Que peut-on déduire sur l’homogénéité de cette population ?
Corrigé :
1. Il s’agit d’un variable continu, du fait qu’il prend toutes les valeurs possible, la raison pour la quelle qu’on
les répertorie en classes dont l’intervalle est constant.
2. Voir le papier millimétré.
14
12
3. On obtient un polygone de fréquences
présentant un seul mode c.à.d. unimodale,
d’où l’homogénéité de la population des
vaches étudiée.
10
8
6
4
2
0
[13-16[ [16-19[ [19-22[ [22-25[ [25-28[ [28-31[ [31-34[ [34-37[ [37-40[
Moussa JAOUANI
2
2ème année Bac. SM
La variation et la génétique des populations
Sciences de la vie et de la terre
Données expérimentales N°4 :
Le tournesol est un ensemble de petites fleurs regroupées sous forme d’inflorescence. Les fleurs du centre
qui s’appellent fleurons se transforment par la suite en graines. On s’intéresse à l’étude de la variation du poids
de chacune de ces graines en centigramme (cg) et on obtient la répartition des fréquences suivante :
Variable xi : poids
[5-10[ [10-15[ [15-20[ [20-25[ [25-30[ [30-35[ [35-40[ [40-45[ [45-50[ [50-55[ [55-60[
des graines en cg
Effectif ni : nombre
13
24
49
37
30
16
27
40
58
34
21
des graines
1. Représenter graphiquement la répartition des fréquences sous forme d’histogramme et polygone de
fréquences.
2. Analyser le polygone obtenu et donner une déduction appropriée.
Corrigé :
1. Voir le papier millimétré.
70
60
50
40
30
20
10
0
2. On obtient un polygone de fréquences présentant deux modes c.à.d. plurimodale, donc l’échantillon de
gamètes étudié est hétérogène.
Remarque :
La représentation graphique généralement ne nous renseigne pas sur les caractéristiques des variables et leur
distributions, c’est pourquoi qu’on a recours au calcule de quelques constantes statistiques en mathématiques.
I. Paramètres de distribution des fréquences des caractères génétiques quantitatifs :
1. Paramètres de position :
Se sont des paramètres qui nous permettent de savoir autour de quelles valeurs se situent les valeurs d'une
variable. Parmi ces paramètres on cite :
→ Le Mode (M) :
Le mode est la valeur de la variable pour laquelle est observé le plus grand effectif ou fréquence. Pour le
variable discontinu on prend le milieu ou le centre de la classe modale la plus fréquente.
→ La moyenne arithmétique (X̅) :
Elle nous renseigne sur la valeur centrale du variable tenant compte des effectifs. Sa formule est :
̅=
𝐗
∑𝒊𝟏 𝒏𝒊 𝒙𝒊
𝑵
Ou bien
̅ = ∑𝒊𝟏 𝒇𝒊 𝒙𝒊
𝐗
Soit : - xi : c’est x1, x2, x3, …, xi qui désignent les valeurs possibles du variable (dans le cas d’une variation
continue, on prend les centres des classes) ;
- ni : c’est n1, n2, n3, …, ni qui désignent les effectifs des valeurs x1, x2, x3, …, xi ;
- N : désigne l’effectif total : N = n1 + n2 + n3 + … + ni ;
Moussa JAOUANI
3
2ème année Bac. SM
La variation et la génétique des populations
Sciences de la vie et de la terre
- fi : c’est f1, f2, f3, …, fi qui désignent les fréquences respectives des valeurs x1, x2, x3, …, xi ;
2. Paramètres de dispersion :
Il se peut qu’un variable ait la même moyenne dans deux distributions, mais les valeurs se présentent avec
des dispersions très différentes. Afin d’estimer cette différence, on peut calculer les paramètres suivants :
→ La variance (V) :
Elle est calculée par la formule suivante : 𝑽 =
̅)𝟐
∑𝒊𝟏 𝒏𝒊 (𝒙𝒊 ˗ 𝐗
𝑵
̅) 𝟐 ;
ou bien 𝑽 = ∑𝒊𝟏 𝒇𝒊 (𝒙𝒊 ˗ 𝐗
→ L’écart-type (σ) :
C’est la racine carrée de la variance : 𝝈 = √𝑽 soit 𝝈 = √
̅)𝟐
∑𝒊𝟏 𝒏𝒊 (𝒙𝒊 ˗ 𝐗
𝑵
̅) 𝟐 ;
ou bien 𝝈 = √∑𝒊𝟏 𝒇𝒊 (𝒙𝒊 ˗ 𝐗
Application : Calculer M, X̅, σ de chaque distribution des données expérimentales 1 et 3.
→ Données expérimentales N°1 :
- Le mode
:M=5;
- La moyenne arithmétique : X̅ = 4,9 ;
- L’écart-type
: σ = 1,77 ;
→ Données expérimentales N°3 :
- Le mode
: M = 23,5 ;
- La moyenne arithmétique : X̅ = 24,64 ;
- L’écart-type
: σ = 5,46 ;
Remarque :
- L’écart-type mesure la dispersion des valeurs du variable autour de la moyenne : plus il est grand, plus les
valeurs sont dispersées, et plus l’homogénéité de la population diminue ; De ce fait on détermine les
intervalles de confiance. Pour une population homogène, on a :
→ Dans l’intervalle [X̅-σ ; X̅+σ] : On trouve les 2/3 c.à.d. 68% des individus de la population ;
→ Dans l’intervalle [X̅-2σ ; X̅+2σ] : On trouve 95,4% des individus de la population ;
𝝈
- Il existe un 3ème paramètre de dispersion appelé Coefficient de variation, sa formule est : 𝑪𝑽 = ̅ ×
𝑿
𝟏𝟎𝟎
En effet : - Si CV < 15% : On dit que la dispersion des valeurs autour de la moyenne est petite, donc la
population est homogène.
- Si 15 ≤ CV < 30% : On dit que les valeurs sont moyennement dispersées, donc une
homogénéité moyenne de la population.
- Si 30 ≤ CV ≤ 100% : On dit que les valeurs sont trop dispersées autour de la moyenne, donc la
population est hétérogène.
Exemple : Dans les données expérimentales N°1, l’intervalle de confiance est [3,13 ; 6,67] qui encadre
58,76% de la population (< 68%) ; donc on a une population ni
hétérogène. Ainsi que le coefficient de variation confirme ce
résultat, on trouve CV = 36,12% (< 30%).
3.
Bilan :
Utilisation
des
paramètres
de
position et de dispersion en agriculture :
Exercice intégré N°1 :
Des mesures concernant le poids en g ont été réalisées
chez deux échantillons A et B de pommes de terre. On
obtient les deux distributions d’effectifs représentées dans
les deux tableaux suivants :
xi
X̅
X̅-σ
X̅-2σ
Moussa JAOUANI
4
68%
95,4%
X̅+σ
X̅+2σ
2ème année Bac. SM
La variation et la génétique des populations
Sciences de la vie et de la terre
Echantillon A
Variable xi : poids
[95- [115- [135- [155- [175- [195- [215- [235- [255- [275[35-55[ [55-75[ [75-95[
115[ 135[ 155[ 175[ 195[ 215[ 235[ 255[ 275[ 295[
des tubercules en cg
Effectif ni : nombre
4
14
21
45
64
85
68
62
49
24
14
8
3
des tubercules
Echantillon B
Variable xi : poids
[115-135[ [135-155[ [155-175[ [175-195[ [195-215[ [215-235[ [235-255[
des tubercules en cg
Effectif ni : nombre
24
45
73
92
83
38
22
des tubercules
1. Représenter graphiquement la répartition des fréquences de chaque échantillon de pommes de terre
sous forme d’histogramme et polygone de fréquences. Discuter les résultats obtenus.
2. Calculer les paramètres de position et de dispersion pour chaque échantillon (M, X̅, V, σ).
3. Déduire l’intervalle de confiance [X̅-σ ; X̅+σ] pour chaque échantillon. Quel est l’échantillon le plus
homogène ? Justifier votre réponse.
Corrigé :
1. Voir le papier millimétré.
On obtient pour chaque échantillon un polygone de fréquence unimodale, donc les échantillons de pommes
de terre sont homogènes.
2. - L’échantillon A : → X̅ = 157,19 ;
→ V = 2179,36 ;
→ σ = 46,68 ;
→ L’intervalle de confiance : [110,50 ; 203,87] soit 60,52% des individus ;
- L’échantillon B : → X̅ = 184,87 ;
→ V = 956,75 ;
→ σ = 30,93 ;
→ L’intervalle de confiance : [153,53 ; 215,40] soit 65,78% des individus ;
3. On remarque que l’écart-type de l’échantillon B est inférieure de celui de l’échantillon A, c.à.d. que les
valeurs du variable (poids du tubercule) sont moins dispersées autour la moyenne, donc c’est l’échantillon B qui
est le plus homogène.
Remarque :
Du point de vue pratique, la connaissance de X̅ et de σ permet aux biologistes (agronomes et éleveurs)
d’analyser la variation, c.à.d. comment se fait la distribution des valeurs du variable. Ces paramètres, complétés
par les techniques de sélection artificielle, permettent de vérifier l’hétérogénéité des populations.
II. Etude de la sélection artificielle : Notion de la race pure :
Données expérimentales N°5 : Les travaux de Wilhelm JOHANNSEN :
Dans une race de haricots, Wilhelm JOHANSSEN remarque une différence au niveau de la taille des graines.
Le tableau suivant représente les résultats d’étude biométrique du poids des graines de haricot, une étude menée
sur une population P de 1337 graines :
Variable xi : poids
[21-25] [26-30] [31-35] [36-40] [41-45] [46-50] [51-55] [56-60] [61-65] [66-70] [71-75] [76-80] [81-85] [86-90]
des graines en cg
Effectif ni :
2
14
32
89
182 293 267 209 130
66
26
17
9
1
nombre des graines
Moussa JAOUANI
5
2ème année Bac. SM
La variation et la génétique des populations
Sciences de la vie et de la terre
1. Représenter graphiquement la répartition des fréquences sous forme d’histogramme et polygone de
fréquences. Analyser le et donner une déduction appropriée.
En 1903, et par une sélection artificielle, JOHANSSEN regroupe les graines lourdes d'un côté (la classe [8690]) et les graines légères de l'autre côté (la classe [21-25]), puis il cultive séparément ces deux souspopulations P1 et P2 en pensant obtenir des graines lourdes d'un côté et des graines légères de l'autre côté. Mais
en fait il obtient les distributions suivantes :
Distribution des Variable xi : poids
[36-40] [41-45] [46-50] [51-55] [56-60] [61-65] [66-70] [71-75] [76-80] [81-85] [86-90]
des graines en cg
effectifs de la
population P1 (les Effectif ni : nombre
2
5
9
14
21
22
24
23
17
6
2
graines lourdes)
des graines
Distribution des effectifs Variable xi : poids [21-25] [26-30] [31-35] [35-40] [41-45] [46-50] [51-55] [56-60] [61-65]
des graines en cg
de la population P2 (les
Effectif ni :
2
7
18
23
20
16
10
5
2
graines légères)
nombre des graines
2. Réaliser les représentations graphiques des deux distributions. Analyser les et déduire l’intérêt de la
réalisation de la sélection artificielle.
3. Déduire la notion de ’’la race pure’’.
Corrigé :
1. Voir le papier millimétré.
On obtient un polygone de fréquences présentant un seul mode c.à.d. unimodale, donc l’échantillon des
graines étudié est homogène.
(X̅ = 52,18 ; σ = 9,91 ; L’intervalle de confiance : [42,27 ; 62,10] soit 71,12% des individus)
2. Voir le papier millimétré.
On obtient pour chaque distribution de fréquence un nouveau mode différent de celui de la population
initiale P, on en déduit que cette dernière n’est plus homogène puisqu’elle a donnée après sélection deux
population P1 et P2 différentes, chacune d’elles constitue une race, on dit que la population P n’est plus de
race pure. En effet, la sélection au sein d’une race P permet d’obtenir deux races P1 et P2 ; ça se traduit par le
fait que la sélection est efficace.
- Pour P1 : (X̅ = 64,69 ; σ = 10,87 ; L’intervalle de confiance : [53,81 ; 75,56] soit 71,72% des individus) ;
- Pour P2 : (X̅ = 41,59 ; σ = 8,74 ; L’intervalle de confiance : [32,85 ; 50,33] soit 74,75% des individus) ;
On répète la même opération pour chacune des deux races P1 et P2 jusqu’à ce que le mode et le polygone de
fréquence ne varie plus ; à ce moment-là on a une population appartenant à une race pure pour ce caractère, et
on dit que la sélection est inefficace.
2. La race pure : ensemble d’individus (population) de même phénotype, la sélection au sein de cette
population est inefficace, puisqu’on obtient chez la descendance après chaque croisement la même distribution
des fréquences caractérisée par un mode constant, ce qui traduit son homogénéité.
Moussa JAOUANI
6
2ème année Bac. SM
Téléchargement