Axiome du choix et conséquences. Tout espace vectoriel admet une

publicité
Axiome du choix et conséquences.
Tout espace vectoriel admet une base.
1
Axiome du choix
Definition 1.1. Etant donnée une famille (Ai )i∈I de parties d’un ensemble E (c’est à dire
une application de I dans P(E)), on définit l’ensemble produit Πi∈I Ai comme l’ensemble des
applications de f : I → E telles que pour tout i ∈ I on a f (i) ∈ Ai
Πi∈I Ai = {f ∈ F(I, E), ∀i ∈ I, f (i) ∈ Ai } .
Cas particuliers :
a) Si pour tout i ∈ I, le sous-ensemble Ai est E tout entier, l’ensemble produit est l’ensemble
de toutes les applications de I dans E :
Πi∈I E = F(I, E),
d’où la notation E I pour désigner l’ensemble des applications de I dans E. On sait que
E I est non vide, il suffit de prendre une application constante f (i) = x0 , ∀i ∈ I.
b) Si I est un ensemble fini, I = {1, 2, . . . , n} on retrouve la notion “usuelle”, à savoir que
Πni=1 Ai est l’ensemble des n-uplets (x1 , . . . , xn ) avec xi ∈ Ai pour i = 1, . . . , n (l’application
associée au n-uplet est celle qui associe à chaque position i la valeur xi ).
Axiome du choix. Etant donné une famille (Ai )i∈I de parties non vides d’un ensemble E,
(∀i ∈ I, Ai ∈ P(E) \ {∅}), l’ensemble Πi∈Ai est non vide.
Cet axiome indique qu’il existe une application f ∈ E I telle que
∀i ∈ I, f (i) ∈ Ai .
Autrement dit étant donné une famille quelconque de sous-ensembles de E, on sait choisir
“simultanément” un élément dans chaque sous-ensemble. Cet axiome semble tout à fait naturel
à première vue. En effet il ne pose pas de problème quand l’ensemble d’indices I est fini. Dans
ces cas là en pratique on sait construire la suite des éléments f (i) ∈ Ai , i ∈ I. En fait c’est dans
le cas infini qu’il pose problème. Plus précisément cet axiome pose l’existence d’une fonction
choix sans préciser de façon de la construire. Et comme nous le verrons plus loin, les résultats
qui reposent sur l’axiome du choix donnent l’existence d’objets mathématiques sans donner de
moyen pratique de les construire. De ce fait ces objets contrarient souvent l’intuition, notamment
dans le cas où I n’est pas dénombrable 1 .
1
On notera que l’on peut travailler avec des théories qui n’admettent l’axiome du choix que dans le cas
dénombrable.
1
2
Axiome du choix et ordre
On rappelle ici les notions associées aux relations d’ordre avant de donner les deux conséquences
de l’axiome du choix que sont le théorème de Zermelo et le théorème de Zorn.
2.1
Relations d’ordre
On rappelle qu’une relation sur un ensembleE est la donnée d’un sous-ensemble Γ de E × E
appelé graphe de la relation. Par définition la relation R est donnée par
(xRy) ⇔ ((x, y) ∈ Γ) .
Definition 2.1. On appelle relation d’ordre sur un ensemble E, toute relation R qui est
a) réflexive :
∀x ∈ E, xRx,
b) anti-symétrique :
∀x, y ∈ E, ((xRy et yRx)) ⇒ (y = x)) ,
c) transitive :
∀x, y, z ∈ E, ((xRy) et (yRz)) ⇒ (xRz) .
On remarque que si X est un sous-ensemble de E, la restriction de R à X dont le graphe
est donné par Γ ∩ X × X est une relation d’ordre sur X.
Definition 2.2. On dit que la relation d’ordre R sur E est totale si deux éléments quelconques
sont toujours comparables :
∀x, y ∈ E, xRy ou yRx.
Dans le cas contraire on dit que la relation d’ordre est partielle.
Exemples :
a) Dans R la relation ≤ donnée par
(x ≤ y) ⇔ (y − x ∈ R+ )
est une relation d’ordre total.
b) Si E est un ensemble P(E) est un ensemble (axiome de sélection) et la relation d’inclusion ⊂
est une relation d’ordre partiel dans P(E) dès que E a deux éléments distincts : Si a, b ∈ E
et a 6= b, on a {a} =
6 ⊂ {b} et {b} =
6 ⊂ {a}.
Nous rappelons ci-dessous les notions élémentaires associées à une relation d’ordre. Soit une
relation d’ordre sur un ensemble E, notée et soit X un sous-ensemble de E.
Definition 2.3. a) Minorant : On dit que a ∈ E est un minorant de X (minore X) si
∀x ∈ X, a x.
2
b) Majorant : On dit que a ∈ E est un majorant de X (majore X) si
∀x ∈ X, x a.
Proposition 2.4. Il y a au plus un élément a de X qui minore X (resp. majore X). Si il existe
on l’appelle minimum de X ou plus petit élément de X (resp. maximum de X ou plus grand
élément de X) et on note
a = min X ou a = min x
x∈X
(resp.a = max X ou a = min x).
x∈X
Preuve. Si a1 et a2 minorent X avec a1 ∈ X et a2 ∈ X, alors on a a1 a2 et a2 a1 .
L’anti-symétrie donne alors a1 = a2 .
Definition 2.5. Si l’ensemble des majorants (resp. minorants) de X a un plus petit élément on
l’appelle borne supérieure de X (resp. borne inférieure). On note
sup X ou sup x = min {a ∈ E, ∀x ∈ X, x a}
x∈X
resp.
inf X ou inf x = max {a ∈ E, ∀x ∈ X, a x} .
x∈X
Exemples :
a) Dans R muni de la relation d’ordre usuelle ≤, tout ensemble admet une borne supérieure.
Dans Q ce n’est plus vrai.
b) Dans P(E) muni de l’inclusion tout sous-ensemble admet une borne supérieure (réunion) et
inférieure (intersection) :
sup X = ∪A∈X A et inf X = ∩A∈X A.
Les théorèmes de Zermelo et de Zorn concernent des relations d’ordre particulières dont les
définitions sont données ci-dessous.
Definition 2.6. On dit que l’ensemble ordonné (E, ) est bien ordonné ( ou que la relation est une relation de bon ordre) si tout sous-ensemble non vide X de E admet un minimum.
On remarque que toute relation de bon ordre est une relation d’ordre total. En effet la paire
{a, b} admet un minimum et donc a et b sont comparables. Une autre propriété qui nous sera
utile et qui vient directement des définitions est que tout partie majorée d’un ensemble bien
ordonnée admet une borne supérieure. L’exemple typique d’une relation de bon ordre est la
relation ≤ sur N ou Z. En revanche sur R, la relation ≤ n’est par une relation de bon ordre
(R∗+ a une borne inférieure 0 qui n’appartient pas à R∗+ ) et d’ailleurs on ne voit pas très bien
comment mettre une relation de bon ordre sur R.
Definition 2.7. On dit qu’un ensemble ordonné (E, ) est dit inductif si tout sous-ensemble
totalement ordonné (ou chaı̂ne) de E admet une borne supérieure.
Nous terminons ce paragraphe avec les notions de segment, d’élément minimal et maximal
associées aux relations d’ordre.
3
Definition 2.8. Si x et y sont deux éléments d’un ensemble ordonné (E, ), on appelle segment
d’extrêmités x et y l’ensemble
[x, y] = {z ∈ E, x z y} .
On définit également les segments à droite ([x, .] ) et à gauche ([., x] ) de x par
[x, .] = {z ∈ E, x z}
et
[., x] = {z ∈ E, z x} .
Notons qu’un segment peut être vide.
La notion d’élément minimal (resp. maximal) est comme nous allons le voir plus générale que
la notion de minimum (resp. maximum).
Definition 2.9. On dit qu’un élément a d’un ensemble ordonné (E, ) est minimal (resp.
maximal) si [., a] = {a} (resp. [a, .] = {a}).
Proposition 2.10. Si la relation d’ordre sur E est totale, il y a au plus un élément minimal
(resp. maximal). S’il existe c’est le minimum (resp. maximum) de E.
Preuve. Supposons que a1 ∈ E et a2 ∈ E soit minimaux. Comme la relation d’ordre est totale
on doit avoir a1 a2 et donc a1 = a2 puisque a2 est minimal, ou bien a2 a1 et donc a1 = a2
puisque a1 est minimal.
Exemple : La notion d’élément minimal ou maximal est intéressante quand on a un ordre
partiel. Si E est un ensemble non vide P(E)\{∅} muni de la relation d’inclusion a pour éléments
minimaux tous les singletons de E.
2.2
Théorèmes de Zermelo et de Zorn
Les propriétés de Zermelo et de Zorn sont données ici comme des théorèmes découlant de
l’axiome du choix. En fait on peut montrer l’equivalence entre la propriété du choix, la propriété
de Zermelo et la propriété de Zorn. Il suffit de prendre l’une d’entre elles comme axiome pour
en déduire les deux autres comme théorèmes.
Théorème de Zermelo. Tout ensemble E peut-être muni d’une relation de bon ordre.
Ce théorème pose l’existence d’une partie Γ de E × E qui a la propriété d’être le graphe
d’une relation de bon ordre. Comme nous allons le voir il repose sur l’axiome du choix. Il dit en
particulier que l’on peut mettre un bon ordre sur R sans dire comment le construire en pratique.
Le théorème de Zorn sera démontré ici comme conséquence du théorème de Zermelo. C’est
ce théorème de Zorn qui donne l’existence d’une base dans tout espace vectoriel.
Théorème de Zorn. Tout ensemble inductif admet un élément maximal.
Là encore le théorème de Zorn donne l’existence d’un élément maximal sans donner de moyen
pratique de le construire en toute généralité.
4
Preuve du théorème de Zermelo. L’idée est de construire un bon ordre à partir d’une fonction
choix (dont l’existence est donnée par l’axiome du choix), f ∈ ΠX∈P(E)\{∅} X vérifiant par
définition f (X) = x ∈ X pour tout X ⊂ E, X 6= ∅. En particulier on note e = f (E). On
considère l’ensemble G des couples (X, ΓX ) ∈ P(E)3 vérifiant
a) ΓX ∈ P(X)2 est le graphe d’un bon ordre sur X.
b) e appartient à X et c’est le plus petit élément de X pour le bon ordre ΓX (ici il est commode
d’utiliser la même notation pour le graphe et la relation).
c) Pour tout x ∈ X \ {e}, on a x = f (E \ [., x)ΓX ) où [., x)ΓX ⊂ X est le segment à gauche de
x privé de x,
[., x)ΓX = [., x]ΓX \ {x} = x′ ∈ X, x′ xetx′ 6= x .
L’ensemble G est non vide. En effet X = {e} muni la relation d’égalité Γ{e} = {(e, e)} vérifie les
propriétés a)b) et c).
Soit (X, ΓX ) et (Y, ΓY ) deux éléments de G et soit I l’ensemble des éléments i de X ∩ Y tels
que
i) [e, i]ΓX = [e, i]ΓY .
ii) Les restrictions des ordres ΓX et ΓY au segment [e, i]ΓX = [e, i]ΓY coı̈ncident.
L’ensemble I n’est pas vide puisque e appartient à I. De plus si x ∈ X vérifie x i avec i ∈ I
pour l’ordre ΓX alors on a
[e, x]ΓX ⊂ [e, i]ΓX = [e, i]ΓY
et comme les ordres ΓX et ΓY coı̈ncident sur [e, i]ΓX = [e, i]ΓY , on en déduit x ∈ I. En
conséquence si X \ I est non vide alors tout élément x de X \ I vérifie pour l’ordre ΓX
∀i ∈ I, i ≺ x( I.E i x et x 6= i).
De plus comme l’ensemble (X, ΓX ) est bien ordonné, le sous-ensemble X \ I supposé non vide
a un plus petit élément x0 . On a alors pour l’ordre ΓX
∀i ∈ I, ∀x ∈ X \ I, i ≺ x0 x.
En conséquence I = [., x0 ) avec x0 ∈ X et la propriété c) requise pour les éléments de G donne
x0 = f (E \ I).
Supposons maintenant que l’on a également Y \ I 6= ∅ alors en notant y0 le plus petit élément
de Y \ I alors on a
y0 = f (E \ I) = x0
et cela entraı̂ne tout de suite [e, x0 ]ΓX = [e, x0 ]ΓY avec coı̈ncidence des ordres ΓX et ΓY . Autrement dit x0 ∈ I ce qui contredit x0 ∈ X \ I. On ne peut avoir X \ I 6= ∅ et Y \ I 6= ∅, c’est à
dire que X ⊂ Y avec ΓX ⊂ ΓY ou bien Y ⊂ X avec ΓY ⊂ ΓX .
On prend maintenant
R = ∪(X,ΓX )∈G X
et
Γ = ∪(X,ΓX )∈G ΓX .
5
On vérifie aisément que (R, Γ) vérifient les propriétés a) b) et c). C’est le maximum de G pour
la relation d’inclusion (X ⊂ Y et ΓX ⊂ ΓY ). De plus on a nécessairement R = E. En effet si
E \ R est non vide on considère R′ = R ∪ {f (E \ R)} muni de l’ordre Γ′ tel que x ≺ f (E \ R)
pour tout x ∈ R et dont la restriction à R est Γ. On a alors (R′ , Γ′ ) ∈ G ce qui contredit la
maximalité de (R, Γ). Dons R = E et Γ définit un bon ordre sur E.
Avant de démontrer le théorème de Zorn, il faut noter que le théorème de Zermelo donne
en quelque sorte une numérotation sur n’importe quel ensemble E. L’idée étant que pour tout
sous-ensemble X de E on peut prendre l’élément qui “suit” X en considérant le plus petit
élément de E \ X dans le bon ordre Γ. Cette “numérotation” permet de construire pour toute
relation d’ordre une chaı̂ne (un ensemble totalement ordonné) sans oublier d’élément. En fait
ce raisonnement est le même que le raisonnement par récurrence. Il s’appuie sur le théorème
de Zermelo et donc l’axiome du choix. Dans le cas non dénombrable on parle de récurrence
transfinie.
Proposition 2.11. Dans tout ensemble ordonné (E, ), il existe une chaı̂ne pour qui est
maximale pour l’inclusion.
Preuve. Le théorème de Zermelo nous dit que l’on peut mettre une relation de bon ordre Γ sur
E. Nous dirons que y suit x (resp. précède x) si y est strictement plus grand (resp. plus petit)
que x dans le bon ordre Γ. On note e le plus petit élément de E pour le bon ordre Γ.
On considère maintenant l’ensemble Σ ⊂ P(E) des parties S de E telles que
a) e ∈ S
b) S est une chaı̂ne pour l’ordre .
c) Si x précède s ∈ S et x est comparable pour à tout élément de S qui le précède, alors
x ∈ S.
L’ensemble Σ n’est pas vide car {e} ∈ Σ. On va suivre la même démarche que pour le théorème
de Zermelo. Si S1 et S2 sont deux éléments de Σ, on note I = S1 ∩ S2 . L’ensemble I n’est pas
vide car e ∈ I. Si S1 \I et S2 \I sont non vides ils possèdent chacun un plus petit élément pour le
bon ordre Γ noté s1 et s2 (s2 6= s1 6∈ S2 ). Supposons que s1 précède s2 . Si il existe un élément s′2
de S2 qui précède s1 qui n’est pas comparable à s1 pour alors il n’appartient pas à S1 puisque
S1 est par définition une chaı̂ne. On alors trouvé un élément de S2 \ I qui précède s1 et donc
s2 ! ! (contraire à la définition de s2 ). En conséquence tous les éléments de S2 qui précèdent s1 lui
sont comparables pour . En conséquence par la propriété c) on doit avoir s1 ∈ S2 ! ! (contraire
à s1 ∈ S1 \ I). En conséquence l’un des deux ensembles S1 \ I, S2 \ I est vide et S1 ⊂ S2 ou
S2 ⊂ S1 .
L’ensemble Σ est donc une chaı̂ne pour l’inclusion et on pose R = ∪S∈Σ S. On vérifie facilement
que R ∈ Σ. C’est donc le maximum de Σ pour la relation d’inclusion.
Montrons enfin que l’on ne peut pas trouver de chaı̂ne pour qui soit plus grande que R
pour l’inclusion. Si ce n’est pas le cas l’ensemble X des éléments de E \ R comparables à tous
les éléments de R est non vide. Soit r sont plus petit élément pour le bon ordre Γ. On pose
R′ = R ∪ {r} et il est facile de voir que R′ ∈ Σ ce qui contredit la maximalité de R dans Σ.
6
Preuve du théorème de Zorn : Soit (E, ) un ensemble inductif. D’après la proposition précédente
cet ensemble admet une chaı̂ne R pour qui est maximale pour l’inclusion. Comme E est inductif, cette chaı̂ne admet une borne supérieure r = sup R. On doit avoir r ∈ R et on ne peut
avoir d’élément r ′ ∈ E tel que r r ′ , sinon R ne serait pas maximale pour l’inclusion. Donc r
est un élément maximal.
On peut avoir besoin d’une variante du théorème de Zorn.
Proposition 2.12. Si (E, ) est un ensemble inductif. Pour tout x0 ∈ E il existe un élément
maximal plus grand que x0 .
Preuve. Cela vient tout simplement du fait que ([x0 , .], ) est encore un ensemble inductif (tout
ensemble totalement ordonné de [x0 , .] est un ensemble totalement ordonné de E).
3
Application à l’existence d’une base
Théorème 3.1. Tout espace vectoriel V sur un corps commutatif K admet une base.
Preuve. L’ensemble L des parties libres muni de la relation d’inclusion ⊂ est un ensemble inductif. En effet si (Li )i∈I est une famille totalement ordonnée de parties libres ((i 6= j) ⇐ (Li ⊂
Lj ou Lj ⊂ Li )) alors L = ∪i∈I Li est une partie libre. En effet si une combinaison linéaire
finie d’éléments de L, α1 x1 + · · · + αn xn est nulle. Il existe j ∈ I tel que xk ∈ Lj , pour tout
k ∈ {1, . . . , n}. Et comme Lj est une partie libre, tous les coefficients αk doivent être nuls.
L’ensemble des parties libres est inductif pour l’inclusion, donc d’après le théorème de Zorn
il existe une partie libre B maximale pour l’inclusion. C’est une base. En effet si x ∈ V le
système constitué de B et x est nécessairement lié, ce qui n’est possible que si x s’écrit comme
combinaison linéaire finie d’éléments de L. Donc B est aussi génératrice.
Théorème de la base incomplète. Si L est une partie libre et G une partie génératrice
contenant L, alors il existe une base B telle que L ⊂ B ⊂ G.
Preuve. On considère l’ensemble E des parties libres contenues dans G et on applique la variante
du théorème de Zorn.
Corollaire 3.2. Tout sous espace vectoriel F de V admet un supplémentaire.
Preuve. Soit L une base de F c’est une partie libre de V . On applique la proposition précédente
avec G = V . En suite on prend pour G l’espace vectoriel engendré par B \ L.
Corollaire 3.3. Il existe des morphismes de groupe de (R, +) qui ne sont pas des applications
R-linéaires.
Preuve. On sait qu’un morphisme de groupe f : R → R doit nécessairement vérifier f ( pq x) =
p
p
q f (x) pour tout q ∈ Q et tout x ∈ R. Ce doit être une application Q-linéaire. Une façon de
construire un morphisme de groupe qui n’est pas R-linéaire et de faire de la façon suivante :
R est un Q espace vectoriel et Q en est un sous-espace. D’après ce qui précède il existe un
supplémentaire G de Q dans R. On considère alors l’application f donnée par f ( pq + xG ) = pq
avec pq ∈ Q et xG ∈ G. Elle est Q-linéaire et non R-linéaire.
7
Téléchargement