La variation et la génétique des populations Sciences de la vie et de la terre Introduction : La génétique mendélienne s’intéresse à l’étude des caractères qualitatifs (la couleur, le forme, …) qui sont faciles à distinguer. Cependant, il existe d’autres caractères dits quantitatifs non soumis aux lois de Mendel et qui sont des caractères mesurables (en kg, en m, en l, ...) donc qui peuvent prendre différentes valeurs, c’est pourquoi qu’on les appelle variables xi. En effet on distingue entre des caractères quantitatifs à variation discontinue, c.à.d. que les valeurs du variable prennent un nombre fini (nombre des graines dans une gousse, nombre des œufs pondues, nombre des nouveau-nés, …). Alors que si les caractères quantitatifs prennent toutes les valeurs possibles comme la glycémie, la pression artérielle, le poids, … On parle de la variation continue. La biométrie est donc l’étude statistique des variables quantitatifs non soumis aux lois de Mendel. Problématiques : Comment se fait l’étude de la variation quantitative chez un groupe d’individus ? Et quelle est l’utilité de cette étude ? I. Etude de quelques exemples de la variation génétique quantitatif : 1. Caractère à variation discontinue : Données expérimentales N°1 : On s’intéresse à l’étude du nombre des nouveau-nés après chaque grossesse chez une population de 100 souris, et on obtient les résultats suivants : Variable xi : nombre des nouveau-nés Effectif ni : nombre des femelles 1 2 3 4 5 6 7 8 9 2 8 12 16 23 18 10 7 1 1. Déduire le type du variable étudié. Justifier votre réponse. 2. Représenter graphiquement la répartition des fréquences sous forme de diagramme en bâtons et polygone de fréquences. 3. Analyser le résultat obtenu et donner une déduction appropriée. Corrigé : 1. Il s’agit d’un variable discontinu, du fait qu’il prend des valeurs finies. 2. Voir le papier millimétré. 3. On obtient un polygone de fréquences présentant un seul mode c.à.d. unimodale, d’où l’homogénéité de la population de souries étudiée. 25 20 15 10 5 0 1 Moussa JAOUANI 1 2 3 4 5 6 7 8 2ème année Bac. SM 9 La variation et la génétique des populations Sciences de la vie et de la terre Données expérimentales N°2 : Le tableau suivant représente les résultats d’étude biométrique de la longueur de la tête des gamètes mâles : Variable xi : longueur de la tête en µm Effectif ni : nombre des gamètes 2 2,5 3 3,5 4 4,5 5 5,5 6 6,5 7 7,5 8 8,5 1 0 4 12 32 48 37 33 40 51 38 18 5 2 1. Représenter graphiquement la répartition des fréquences sous forme de diagramme en bâtons et polygone de fréquences. 2. Discuter l’aspect du polygone obtenu. Que peut-on déduire sur l’homogénéité de cette population ? Corrigé : 1. Voir le papier millimétré. 60 50 40 30 20 10 0 2 2,5 3 3,5 4 4,5 5 5,5 6 6,5 7 7,5 8 8,5 2. On obtient un polygone de fréquences présentant deux modes c.à.d. plurimodale, donc l’épchantillon de gamètes étudié est hétérogène. 2. Caractère à variation continue : Données expérimentales N°3 : Chez une population de vaches importées de 50 individus, on a mesuré la quantité de lait produite par jour en Kg, on obtient la répartition des fréquences suivante : Variable xi : Quantité [13-16[ [16-19[ [19-22[ [22-25[ [25-28[ [28-31[ [31-34[ [34-37[ [37-40[ du lait en Kg Effectif ni : nombre des 2 6 8 12 10 5 4 2 1 vaches 1. Déduire le type du variable étudié. Justifier votre réponse. 2. Représenter graphiquement la répartition des fréquences sous forme d’histogramme et polygone de fréquences. 3. Discuter l’aspect du polygone obtenu. Que peut-on déduire sur l’homogénéité de cette population ? Corrigé : 1. Il s’agit d’un variable continu, du fait qu’il prend toutes les valeurs possible, la raison pour la quelle qu’on les répertorie en classes dont l’intervalle est constant. 2. Voir le papier millimétré. 14 12 3. On obtient un polygone de fréquences présentant un seul mode c.à.d. unimodale, d’où l’homogénéité de la population des vaches étudiée. 10 8 6 4 2 0 [13-16[ [16-19[ [19-22[ [22-25[ [25-28[ [28-31[ [31-34[ [34-37[ [37-40[ Moussa JAOUANI 2 2ème année Bac. SM La variation et la génétique des populations Sciences de la vie et de la terre Données expérimentales N°4 : Le tournesol est un ensemble de petites fleurs regroupées sous forme d’inflorescence. Les fleurs du centre qui s’appellent fleurons se transforment par la suite en graines. On s’intéresse à l’étude de la variation du poids de chacune de ces graines en centigramme (cg) et on obtient la répartition des fréquences suivante : Variable xi : poids [5-10[ [10-15[ [15-20[ [20-25[ [25-30[ [30-35[ [35-40[ [40-45[ [45-50[ [50-55[ [55-60[ des graines en cg Effectif ni : nombre 13 24 49 37 30 16 27 40 58 34 21 des graines 1. Représenter graphiquement la répartition des fréquences sous forme d’histogramme et polygone de fréquences. 2. Analyser le polygone obtenu et donner une déduction appropriée. Corrigé : 1. Voir le papier millimétré. 70 60 50 40 30 20 10 0 2. On obtient un polygone de fréquences présentant deux modes c.à.d. plurimodale, donc l’échantillon de gamètes étudié est hétérogène. Remarque : La représentation graphique généralement ne nous renseigne pas sur les caractéristiques des variables et leur distributions, c’est pourquoi qu’on a recours au calcule de quelques constantes statistiques en mathématiques. I. Paramètres de distribution des fréquences des caractères génétiques quantitatifs : 1. Paramètres de position : Se sont des paramètres qui nous permettent de savoir autour de quelles valeurs se situent les valeurs d'une variable. Parmi ces paramètres on cite : → Le Mode (M) : Le mode est la valeur de la variable pour laquelle est observé le plus grand effectif ou fréquence. Pour le variable discontinu on prend le milieu ou le centre de la classe modale la plus fréquente. → La moyenne arithmétique (X̅) : Elle nous renseigne sur la valeur centrale du variable tenant compte des effectifs. Sa formule est : ̅= 𝐗 ∑𝒊𝟏 𝒏𝒊 𝒙𝒊 𝑵 Ou bien ̅ = ∑𝒊𝟏 𝒇𝒊 𝒙𝒊 𝐗 Soit : - xi : c’est x1, x2, x3, …, xi qui désignent les valeurs possibles du variable (dans le cas d’une variation continue, on prend les centres des classes) ; - ni : c’est n1, n2, n3, …, ni qui désignent les effectifs des valeurs x1, x2, x3, …, xi ; - N : désigne l’effectif total : N = n1 + n2 + n3 + … + ni ; Moussa JAOUANI 3 2ème année Bac. SM La variation et la génétique des populations Sciences de la vie et de la terre - fi : c’est f1, f2, f3, …, fi qui désignent les fréquences respectives des valeurs x1, x2, x3, …, xi ; 2. Paramètres de dispersion : Il se peut qu’un variable ait la même moyenne dans deux distributions, mais les valeurs se présentent avec des dispersions très différentes. Afin d’estimer cette différence, on peut calculer les paramètres suivants : → La variance (V) : Elle est calculée par la formule suivante : 𝑽 = ̅)𝟐 ∑𝒊𝟏 𝒏𝒊 (𝒙𝒊 ˗ 𝐗 𝑵 ̅) 𝟐 ; ou bien 𝑽 = ∑𝒊𝟏 𝒇𝒊 (𝒙𝒊 ˗ 𝐗 → L’écart-type (σ) : C’est la racine carrée de la variance : 𝝈 = √𝑽 soit 𝝈 = √ ̅)𝟐 ∑𝒊𝟏 𝒏𝒊 (𝒙𝒊 ˗ 𝐗 𝑵 ̅) 𝟐 ; ou bien 𝝈 = √∑𝒊𝟏 𝒇𝒊 (𝒙𝒊 ˗ 𝐗 Application : Calculer M, X̅, σ de chaque distribution des données expérimentales 1 et 3. → Données expérimentales N°1 : - Le mode :M=5; - La moyenne arithmétique : X̅ = 4,9 ; - L’écart-type : σ = 1,77 ; → Données expérimentales N°3 : - Le mode : M = 23,5 ; - La moyenne arithmétique : X̅ = 24,64 ; - L’écart-type : σ = 5,46 ; Remarque : - L’écart-type mesure la dispersion des valeurs du variable autour de la moyenne : plus il est grand, plus les valeurs sont dispersées, et plus l’homogénéité de la population diminue ; De ce fait on détermine les intervalles de confiance. Pour une population homogène, on a : → Dans l’intervalle [X̅-σ ; X̅+σ] : On trouve les 2/3 c.à.d. 68% des individus de la population ; → Dans l’intervalle [X̅-2σ ; X̅+2σ] : On trouve 95,4% des individus de la population ; 𝝈 - Il existe un 3ème paramètre de dispersion appelé Coefficient de variation, sa formule est : 𝑪𝑽 = ̅ × 𝑿 𝟏𝟎𝟎 En effet : - Si CV < 15% : On dit que la dispersion des valeurs autour de la moyenne est petite, donc la population est homogène. - Si 15 ≤ CV < 30% : On dit que les valeurs sont moyennement dispersées, donc une homogénéité moyenne de la population. - Si 30 ≤ CV ≤ 100% : On dit que les valeurs sont trop dispersées autour de la moyenne, donc la population est hétérogène. Exemple : Dans les données expérimentales N°1, l’intervalle de confiance est [3,13 ; 6,67] qui encadre 58,76% de la population (< 68%) ; donc on a une population ni hétérogène. Ainsi que le coefficient de variation confirme ce résultat, on trouve CV = 36,12% (< 30%). 3. Bilan : Utilisation des paramètres de position et de dispersion en agriculture : Exercice intégré N°1 : Des mesures concernant le poids en g ont été réalisées chez deux échantillons A et B de pommes de terre. On obtient les deux distributions d’effectifs représentées dans les deux tableaux suivants : xi X̅ X̅-σ X̅-2σ Moussa JAOUANI 4 68% 95,4% X̅+σ X̅+2σ 2ème année Bac. SM La variation et la génétique des populations Sciences de la vie et de la terre Echantillon A Variable xi : poids [95- [115- [135- [155- [175- [195- [215- [235- [255- [275[35-55[ [55-75[ [75-95[ 115[ 135[ 155[ 175[ 195[ 215[ 235[ 255[ 275[ 295[ des tubercules en cg Effectif ni : nombre 4 14 21 45 64 85 68 62 49 24 14 8 3 des tubercules Echantillon B Variable xi : poids [115-135[ [135-155[ [155-175[ [175-195[ [195-215[ [215-235[ [235-255[ des tubercules en cg Effectif ni : nombre 24 45 73 92 83 38 22 des tubercules 1. Représenter graphiquement la répartition des fréquences de chaque échantillon de pommes de terre sous forme d’histogramme et polygone de fréquences. Discuter les résultats obtenus. 2. Calculer les paramètres de position et de dispersion pour chaque échantillon (M, X̅, V, σ). 3. Déduire l’intervalle de confiance [X̅-σ ; X̅+σ] pour chaque échantillon. Quel est l’échantillon le plus homogène ? Justifier votre réponse. Corrigé : 1. Voir le papier millimétré. On obtient pour chaque échantillon un polygone de fréquence unimodale, donc les échantillons de pommes de terre sont homogènes. 2. - L’échantillon A : → X̅ = 157,19 ; → V = 2179,36 ; → σ = 46,68 ; → L’intervalle de confiance : [110,50 ; 203,87] soit 60,52% des individus ; - L’échantillon B : → X̅ = 184,87 ; → V = 956,75 ; → σ = 30,93 ; → L’intervalle de confiance : [153,53 ; 215,40] soit 65,78% des individus ; 3. On remarque que l’écart-type de l’échantillon B est inférieure de celui de l’échantillon A, c.à.d. que les valeurs du variable (poids du tubercule) sont moins dispersées autour la moyenne, donc c’est l’échantillon B qui est le plus homogène. Remarque : Du point de vue pratique, la connaissance de X̅ et de σ permet aux biologistes (agronomes et éleveurs) d’analyser la variation, c.à.d. comment se fait la distribution des valeurs du variable. Ces paramètres, complétés par les techniques de sélection artificielle, permettent de vérifier l’hétérogénéité des populations. II. Etude de la sélection artificielle : Notion de la race pure : Données expérimentales N°5 : Les travaux de Wilhelm JOHANNSEN : Dans une race de haricots, Wilhelm JOHANSSEN remarque une différence au niveau de la taille des graines. Le tableau suivant représente les résultats d’étude biométrique du poids des graines de haricot, une étude menée sur une population P de 1337 graines : Variable xi : poids [21-25] [26-30] [31-35] [36-40] [41-45] [46-50] [51-55] [56-60] [61-65] [66-70] [71-75] [76-80] [81-85] [86-90] des graines en cg Effectif ni : 2 14 32 89 182 293 267 209 130 66 26 17 9 1 nombre des graines Moussa JAOUANI 5 2ème année Bac. SM La variation et la génétique des populations Sciences de la vie et de la terre 1. Représenter graphiquement la répartition des fréquences sous forme d’histogramme et polygone de fréquences. Analyser le et donner une déduction appropriée. En 1903, et par une sélection artificielle, JOHANSSEN regroupe les graines lourdes d'un côté (la classe [8690]) et les graines légères de l'autre côté (la classe [21-25]), puis il cultive séparément ces deux souspopulations P1 et P2 en pensant obtenir des graines lourdes d'un côté et des graines légères de l'autre côté. Mais en fait il obtient les distributions suivantes : Distribution des Variable xi : poids [36-40] [41-45] [46-50] [51-55] [56-60] [61-65] [66-70] [71-75] [76-80] [81-85] [86-90] des graines en cg effectifs de la population P1 (les Effectif ni : nombre 2 5 9 14 21 22 24 23 17 6 2 graines lourdes) des graines Distribution des effectifs Variable xi : poids [21-25] [26-30] [31-35] [35-40] [41-45] [46-50] [51-55] [56-60] [61-65] des graines en cg de la population P2 (les Effectif ni : 2 7 18 23 20 16 10 5 2 graines légères) nombre des graines 2. Réaliser les représentations graphiques des deux distributions. Analyser les et déduire l’intérêt de la réalisation de la sélection artificielle. 3. Déduire la notion de ’’la race pure’’. Corrigé : 1. Voir le papier millimétré. On obtient un polygone de fréquences présentant un seul mode c.à.d. unimodale, donc l’échantillon des graines étudié est homogène. (X̅ = 52,18 ; σ = 9,91 ; L’intervalle de confiance : [42,27 ; 62,10] soit 71,12% des individus) 2. Voir le papier millimétré. On obtient pour chaque distribution de fréquence un nouveau mode différent de celui de la population initiale P, on en déduit que cette dernière n’est plus homogène puisqu’elle a donnée après sélection deux population P1 et P2 différentes, chacune d’elles constitue une race, on dit que la population P n’est plus de race pure. En effet, la sélection au sein d’une race P permet d’obtenir deux races P1 et P2 ; ça se traduit par le fait que la sélection est efficace. - Pour P1 : (X̅ = 64,69 ; σ = 10,87 ; L’intervalle de confiance : [53,81 ; 75,56] soit 71,72% des individus) ; - Pour P2 : (X̅ = 41,59 ; σ = 8,74 ; L’intervalle de confiance : [32,85 ; 50,33] soit 74,75% des individus) ; On répète la même opération pour chacune des deux races P1 et P2 jusqu’à ce que le mode et le polygone de fréquence ne varie plus ; à ce moment-là on a une population appartenant à une race pure pour ce caractère, et on dit que la sélection est inefficace. 2. La race pure : ensemble d’individus (population) de même phénotype, la sélection au sein de cette population est inefficace, puisqu’on obtient chez la descendance après chaque croisement la même distribution des fréquences caractérisée par un mode constant, ce qui traduit son homogénéité. Moussa JAOUANI 6 2ème année Bac. SM