Abstract.
1. Entropie et information
1.1. Introduction. On cherche un élément xdans un ensemble …ni Ede cardinal N.
Supposons que l’on puisse déterminer si xpossède ou non une certaine caractéristique.
Cela revient à déterminer si xappartient ou non à la partie Ades éléments de Epossèdant
cette caractéristique. Quelle “quantité”d’information obtient-on ainsi ?
Si x2Aet que la partie Aest petite par rapport à Ealors la quantité d’information est
importante, au contraire si la partie Aest grande E, l’information est faible. De même,
si x2ACla quantité d’information obtenue est une fonction décroissante de la taille
de AC. Pour dé…nir la quantité d’information, on peut utiliser une fonction décroissante
f: [0;1] !R+et poser pour chaque x,IA(x) = f(card A
card E)si x2Aet IA(x) = f(card AC
card E)
si x2AC. On obtient ainsi une fonction dé…nie sur E:
IA(x) = f(card A
card E) 1A(x) + f(card AC
card E) 1Ac(x):
Si A=E, l’information est nulle on peut donc imposer à fla condition f(1) = 0. La
caractéristique utilisée pour classer les éléments de Epeut avoir plus de 2modalités :
l’ensemble Eest partagé en catégories C1; :::; Ck, et pour chaque élément on peut déter-
miner la catégorie Cià laquelle il appartient. De la même manière, la fonction fpermet de
quanti…er l’information apportée par la connaissance de la catégorie à laquelle appartient
un élément :
I(x) =
k
X
i=1
f(card Ci
card E) 1Ci(x):
Les catégories C1; :::; Ckdé…nissent une partition C=fC1; :::; Ckgde Eet on note IC
l’application que l’on vient de dé…nir. Les conditions imposées à fsont f(1) = 0 et
sa décroissance. Ajoutons deux autres contraintes naturelles. D’une part, on souhaite
choisir une fonction findépendante de E. D’autre part, on voudrait que la quantité
d’information soit additive. Plus précisément, supposons que l’on ait deux renseignements
sur les éléments de E. Cela revient à disposer de deux partitions de E,C=fC1; :::; Ckg
et D=fD1; :::; Dlg. Ces deux partitions nous en donne une nouvelle
C _ D =fCi\Dj:i2 f1; :::; kg; j 2 f1; :::; lgg
qui correspond à la connaissances simultanée des deux renseignements. Lorsque ces ren-
seignements sont indépendants, on aimerait avoir la formule
IC_D =IC+ID:
Que signi…e l’indépendance de Cet D? Les deux caractéristiques Cet Dsont indépen-
dantes si pour chaque j, la proportion des éléments possédant le caractère Djparmi ceux
possédant le caractère Cine dépend pas de i. Par conséquent, l’indépendance signi…e que
pour chaque j, on a
8i; card Dj\Ci
card Ci
=card Dj
card E
1