–Pour les cellules type eucaryote, les valeurs de H supérieures à 0,5 indiquent la
présence de corrélations à longue distance;
–Pour les bactéries (sans noyau donc sans nucléosome) on distingue deux régimes :
pour L inférieur à 200 paires de bases (ordre de grandeur de la taille d'un
chromosome) il n'y a pas de corrélation (H=0,5), pour L supérieur à 200 paires de
bases il y a des corrélations à grande distance.
Ces résultats permettent-ils de distinguer une cellule eucaryote d'une bactérie à coup sûr,
c'est à dire de mettre en évidence la présence ou non de nucléosome?
Pour valider ceci, des tests ont été réalisés à l'aveugle sur 100 virus de différents type
(eucaryote/bactérie) et le diagnostique fut bon pour 96 d'entre eux. Ces 4% d'erreurs pourraient
être acceptable pour un physicien, mais le biologiste cherche à comprendre pourquoi ces quatre
virus « eucaryote » ont été diagnostiqué « bactérie » avec la méthode de la variance. En y
regardant de plus près, il se trouve que ces quatre exceptions sont des « pox virus » qui ont la
particularité de se répliquer dans le cytoplasme et non dans le noyaux, comme c'est
habituellement le cas. Le processus de réplication ne mettant pas en jeu de nucléosome, ces pox
virus ont donc été diagnostiqués comme étant de type bactérie.
La méthode de la variance permet donc de différencier rapidement les virus qui se
répliquent dans le noyau de ceux qui se répliquent dans le cytoplasme, ce qui n'avait jamais pu
être mis en évidence auparavant.
En outre, le régime de corrélations à longue portée induit la formation aisée de boucles de
petite taille (fait expliqué par la modélisation de la formation de ces boucles en physique
statistique), ce qui explique la structure de la chromatine. En effet, le minimum d'energie libre
nécessaire à la formation d'une boucle de taille L diminue avec H.
III. Analyse à grande échelle : mécanisme de transcription?
En se plaçant à une échelle supérieure à 20kb, après lissage du bruit on observe des
oscillations. Deux « bosses » apparaissent : une vers 100kb, taille caractéristique des boucles de
chromatine et une à 400kb, taille moyenne pour le domaine de réplication chez les mammifères.
Cherchons un codage adapté à l'étude du mécanisme de transcription: nous remarquons que la
transcription et la réplication nécessitent l'ouverture de la double hélice et désymétrisent les brins.
Il nous faut donc un codage qui rende compte de la symétrie des brins d'ADN.
Sur une molécule d'ADN, les bases azotées étaient associées par paires AT (ou TA) et CG
(ou GC), le nombre de bases A (noté [A]) est égal au nombre de bases B (noté [B]), de même
[G]=[C]. Quand cette symétrie est brisée, on peut la quantifier en introduisant les quantités SCG et
SAT .
A l'échelle du génome, ces quantités sont nulles, mais à l'échelle d'un million de paires de
bases des fluctuations sont visibles. Ce sont elles que nous allons étudier.
A petite échelle, nous retrouvons dans le bruit des fluctuations d'ordre de grandeur de
100kb et 400kb. A grande échelle, SCG et SAT sont positifs sur quelques millions de paires de base,
puis négatifs sur la même longueur, et ainsi de suite. Comment relier ce comportement aux
caractéristiques physique de la molécule?
Dans le mécanisme de réplication, de l'origine au terminus il y a deux sens possibles : le
chemin rouge ou le chemin bleu (voir page suivante).