Axiome du choix et conséquences. Tout espace vectoriel admet une base. 1 Axiome du choix Definition 1.1. Etant donnée une famille (Ai )i∈I de parties d’un ensemble E (c’est à dire une application de I dans P(E)), on définit l’ensemble produit Πi∈I Ai comme l’ensemble des applications de f : I → E telles que pour tout i ∈ I on a f (i) ∈ Ai Πi∈I Ai = {f ∈ F(I, E), ∀i ∈ I, f (i) ∈ Ai } . Cas particuliers : a) Si pour tout i ∈ I, le sous-ensemble Ai est E tout entier, l’ensemble produit est l’ensemble de toutes les applications de I dans E : Πi∈I E = F(I, E), d’où la notation E I pour désigner l’ensemble des applications de I dans E. On sait que E I est non vide, il suffit de prendre une application constante f (i) = x0 , ∀i ∈ I. b) Si I est un ensemble fini, I = {1, 2, . . . , n} on retrouve la notion “usuelle”, à savoir que Πni=1 Ai est l’ensemble des n-uplets (x1 , . . . , xn ) avec xi ∈ Ai pour i = 1, . . . , n (l’application associée au n-uplet est celle qui associe à chaque position i la valeur xi ). Axiome du choix. Etant donné une famille (Ai )i∈I de parties non vides d’un ensemble E, (∀i ∈ I, Ai ∈ P(E) \ {∅}), l’ensemble Πi∈Ai est non vide. Cet axiome indique qu’il existe une application f ∈ E I telle que ∀i ∈ I, f (i) ∈ Ai . Autrement dit étant donné une famille quelconque de sous-ensembles de E, on sait choisir “simultanément” un élément dans chaque sous-ensemble. Cet axiome semble tout à fait naturel à première vue. En effet il ne pose pas de problème quand l’ensemble d’indices I est fini. Dans ces cas là en pratique on sait construire la suite des éléments f (i) ∈ Ai , i ∈ I. En fait c’est dans le cas infini qu’il pose problème. Plus précisément cet axiome pose l’existence d’une fonction choix sans préciser de façon de la construire. Et comme nous le verrons plus loin, les résultats qui reposent sur l’axiome du choix donnent l’existence d’objets mathématiques sans donner de moyen pratique de les construire. De ce fait ces objets contrarient souvent l’intuition, notamment dans le cas où I n’est pas dénombrable 1 . 1 On notera que l’on peut travailler avec des théories qui n’admettent l’axiome du choix que dans le cas dénombrable. 1 2 Axiome du choix et ordre On rappelle ici les notions associées aux relations d’ordre avant de donner les deux conséquences de l’axiome du choix que sont le théorème de Zermelo et le théorème de Zorn. 2.1 Relations d’ordre On rappelle qu’une relation sur un ensembleE est la donnée d’un sous-ensemble Γ de E × E appelé graphe de la relation. Par définition la relation R est donnée par (xRy) ⇔ ((x, y) ∈ Γ) . Definition 2.1. On appelle relation d’ordre sur un ensemble E, toute relation R qui est a) réflexive : ∀x ∈ E, xRx, b) anti-symétrique : ∀x, y ∈ E, ((xRy et yRx)) ⇒ (y = x)) , c) transitive : ∀x, y, z ∈ E, ((xRy) et (yRz)) ⇒ (xRz) . On remarque que si X est un sous-ensemble de E, la restriction de R à X dont le graphe est donné par Γ ∩ X × X est une relation d’ordre sur X. Definition 2.2. On dit que la relation d’ordre R sur E est totale si deux éléments quelconques sont toujours comparables : ∀x, y ∈ E, xRy ou yRx. Dans le cas contraire on dit que la relation d’ordre est partielle. Exemples : a) Dans R la relation ≤ donnée par (x ≤ y) ⇔ (y − x ∈ R+ ) est une relation d’ordre total. b) Si E est un ensemble P(E) est un ensemble (axiome de sélection) et la relation d’inclusion ⊂ est une relation d’ordre partiel dans P(E) dès que E a deux éléments distincts : Si a, b ∈ E et a 6= b, on a {a} = 6 ⊂ {b} et {b} = 6 ⊂ {a}. Nous rappelons ci-dessous les notions élémentaires associées à une relation d’ordre. Soit une relation d’ordre sur un ensemble E, notée et soit X un sous-ensemble de E. Definition 2.3. a) Minorant : On dit que a ∈ E est un minorant de X (minore X) si ∀x ∈ X, a x. 2 b) Majorant : On dit que a ∈ E est un majorant de X (majore X) si ∀x ∈ X, x a. Proposition 2.4. Il y a au plus un élément a de X qui minore X (resp. majore X). Si il existe on l’appelle minimum de X ou plus petit élément de X (resp. maximum de X ou plus grand élément de X) et on note a = min X ou a = min x x∈X (resp.a = max X ou a = min x). x∈X Preuve. Si a1 et a2 minorent X avec a1 ∈ X et a2 ∈ X, alors on a a1 a2 et a2 a1 . L’anti-symétrie donne alors a1 = a2 . Definition 2.5. Si l’ensemble des majorants (resp. minorants) de X a un plus petit élément on l’appelle borne supérieure de X (resp. borne inférieure). On note sup X ou sup x = min {a ∈ E, ∀x ∈ X, x a} x∈X resp. inf X ou inf x = max {a ∈ E, ∀x ∈ X, a x} . x∈X Exemples : a) Dans R muni de la relation d’ordre usuelle ≤, tout ensemble admet une borne supérieure. Dans Q ce n’est plus vrai. b) Dans P(E) muni de l’inclusion tout sous-ensemble admet une borne supérieure (réunion) et inférieure (intersection) : sup X = ∪A∈X A et inf X = ∩A∈X A. Les théorèmes de Zermelo et de Zorn concernent des relations d’ordre particulières dont les définitions sont données ci-dessous. Definition 2.6. On dit que l’ensemble ordonné (E, ) est bien ordonné ( ou que la relation est une relation de bon ordre) si tout sous-ensemble non vide X de E admet un minimum. On remarque que toute relation de bon ordre est une relation d’ordre total. En effet la paire {a, b} admet un minimum et donc a et b sont comparables. Une autre propriété qui nous sera utile et qui vient directement des définitions est que tout partie majorée d’un ensemble bien ordonnée admet une borne supérieure. L’exemple typique d’une relation de bon ordre est la relation ≤ sur N ou Z. En revanche sur R, la relation ≤ n’est par une relation de bon ordre (R∗+ a une borne inférieure 0 qui n’appartient pas à R∗+ ) et d’ailleurs on ne voit pas très bien comment mettre une relation de bon ordre sur R. Definition 2.7. On dit qu’un ensemble ordonné (E, ) est dit inductif si tout sous-ensemble totalement ordonné (ou chaı̂ne) de E admet une borne supérieure. Nous terminons ce paragraphe avec les notions de segment, d’élément minimal et maximal associées aux relations d’ordre. 3 Definition 2.8. Si x et y sont deux éléments d’un ensemble ordonné (E, ), on appelle segment d’extrêmités x et y l’ensemble [x, y] = {z ∈ E, x z y} . On définit également les segments à droite ([x, .] ) et à gauche ([., x] ) de x par [x, .] = {z ∈ E, x z} et [., x] = {z ∈ E, z x} . Notons qu’un segment peut être vide. La notion d’élément minimal (resp. maximal) est comme nous allons le voir plus générale que la notion de minimum (resp. maximum). Definition 2.9. On dit qu’un élément a d’un ensemble ordonné (E, ) est minimal (resp. maximal) si [., a] = {a} (resp. [a, .] = {a}). Proposition 2.10. Si la relation d’ordre sur E est totale, il y a au plus un élément minimal (resp. maximal). S’il existe c’est le minimum (resp. maximum) de E. Preuve. Supposons que a1 ∈ E et a2 ∈ E soit minimaux. Comme la relation d’ordre est totale on doit avoir a1 a2 et donc a1 = a2 puisque a2 est minimal, ou bien a2 a1 et donc a1 = a2 puisque a1 est minimal. Exemple : La notion d’élément minimal ou maximal est intéressante quand on a un ordre partiel. Si E est un ensemble non vide P(E)\{∅} muni de la relation d’inclusion a pour éléments minimaux tous les singletons de E. 2.2 Théorèmes de Zermelo et de Zorn Les propriétés de Zermelo et de Zorn sont données ici comme des théorèmes découlant de l’axiome du choix. En fait on peut montrer l’equivalence entre la propriété du choix, la propriété de Zermelo et la propriété de Zorn. Il suffit de prendre l’une d’entre elles comme axiome pour en déduire les deux autres comme théorèmes. Théorème de Zermelo. Tout ensemble E peut-être muni d’une relation de bon ordre. Ce théorème pose l’existence d’une partie Γ de E × E qui a la propriété d’être le graphe d’une relation de bon ordre. Comme nous allons le voir il repose sur l’axiome du choix. Il dit en particulier que l’on peut mettre un bon ordre sur R sans dire comment le construire en pratique. Le théorème de Zorn sera démontré ici comme conséquence du théorème de Zermelo. C’est ce théorème de Zorn qui donne l’existence d’une base dans tout espace vectoriel. Théorème de Zorn. Tout ensemble inductif admet un élément maximal. Là encore le théorème de Zorn donne l’existence d’un élément maximal sans donner de moyen pratique de le construire en toute généralité. 4 Preuve du théorème de Zermelo. L’idée est de construire un bon ordre à partir d’une fonction choix (dont l’existence est donnée par l’axiome du choix), f ∈ ΠX∈P(E)\{∅} X vérifiant par définition f (X) = x ∈ X pour tout X ⊂ E, X 6= ∅. En particulier on note e = f (E). On considère l’ensemble G des couples (X, ΓX ) ∈ P(E)3 vérifiant a) ΓX ∈ P(X)2 est le graphe d’un bon ordre sur X. b) e appartient à X et c’est le plus petit élément de X pour le bon ordre ΓX (ici il est commode d’utiliser la même notation pour le graphe et la relation). c) Pour tout x ∈ X \ {e}, on a x = f (E \ [., x)ΓX ) où [., x)ΓX ⊂ X est le segment à gauche de x privé de x, [., x)ΓX = [., x]ΓX \ {x} = x′ ∈ X, x′ xetx′ 6= x . L’ensemble G est non vide. En effet X = {e} muni la relation d’égalité Γ{e} = {(e, e)} vérifie les propriétés a)b) et c). Soit (X, ΓX ) et (Y, ΓY ) deux éléments de G et soit I l’ensemble des éléments i de X ∩ Y tels que i) [e, i]ΓX = [e, i]ΓY . ii) Les restrictions des ordres ΓX et ΓY au segment [e, i]ΓX = [e, i]ΓY coı̈ncident. L’ensemble I n’est pas vide puisque e appartient à I. De plus si x ∈ X vérifie x i avec i ∈ I pour l’ordre ΓX alors on a [e, x]ΓX ⊂ [e, i]ΓX = [e, i]ΓY et comme les ordres ΓX et ΓY coı̈ncident sur [e, i]ΓX = [e, i]ΓY , on en déduit x ∈ I. En conséquence si X \ I est non vide alors tout élément x de X \ I vérifie pour l’ordre ΓX ∀i ∈ I, i ≺ x( I.E i x et x 6= i). De plus comme l’ensemble (X, ΓX ) est bien ordonné, le sous-ensemble X \ I supposé non vide a un plus petit élément x0 . On a alors pour l’ordre ΓX ∀i ∈ I, ∀x ∈ X \ I, i ≺ x0 x. En conséquence I = [., x0 ) avec x0 ∈ X et la propriété c) requise pour les éléments de G donne x0 = f (E \ I). Supposons maintenant que l’on a également Y \ I 6= ∅ alors en notant y0 le plus petit élément de Y \ I alors on a y0 = f (E \ I) = x0 et cela entraı̂ne tout de suite [e, x0 ]ΓX = [e, x0 ]ΓY avec coı̈ncidence des ordres ΓX et ΓY . Autrement dit x0 ∈ I ce qui contredit x0 ∈ X \ I. On ne peut avoir X \ I 6= ∅ et Y \ I 6= ∅, c’est à dire que X ⊂ Y avec ΓX ⊂ ΓY ou bien Y ⊂ X avec ΓY ⊂ ΓX . On prend maintenant R = ∪(X,ΓX )∈G X et Γ = ∪(X,ΓX )∈G ΓX . 5 On vérifie aisément que (R, Γ) vérifient les propriétés a) b) et c). C’est le maximum de G pour la relation d’inclusion (X ⊂ Y et ΓX ⊂ ΓY ). De plus on a nécessairement R = E. En effet si E \ R est non vide on considère R′ = R ∪ {f (E \ R)} muni de l’ordre Γ′ tel que x ≺ f (E \ R) pour tout x ∈ R et dont la restriction à R est Γ. On a alors (R′ , Γ′ ) ∈ G ce qui contredit la maximalité de (R, Γ). Dons R = E et Γ définit un bon ordre sur E. Avant de démontrer le théorème de Zorn, il faut noter que le théorème de Zermelo donne en quelque sorte une numérotation sur n’importe quel ensemble E. L’idée étant que pour tout sous-ensemble X de E on peut prendre l’élément qui “suit” X en considérant le plus petit élément de E \ X dans le bon ordre Γ. Cette “numérotation” permet de construire pour toute relation d’ordre une chaı̂ne (un ensemble totalement ordonné) sans oublier d’élément. En fait ce raisonnement est le même que le raisonnement par récurrence. Il s’appuie sur le théorème de Zermelo et donc l’axiome du choix. Dans le cas non dénombrable on parle de récurrence transfinie. Proposition 2.11. Dans tout ensemble ordonné (E, ), il existe une chaı̂ne pour qui est maximale pour l’inclusion. Preuve. Le théorème de Zermelo nous dit que l’on peut mettre une relation de bon ordre Γ sur E. Nous dirons que y suit x (resp. précède x) si y est strictement plus grand (resp. plus petit) que x dans le bon ordre Γ. On note e le plus petit élément de E pour le bon ordre Γ. On considère maintenant l’ensemble Σ ⊂ P(E) des parties S de E telles que a) e ∈ S b) S est une chaı̂ne pour l’ordre . c) Si x précède s ∈ S et x est comparable pour à tout élément de S qui le précède, alors x ∈ S. L’ensemble Σ n’est pas vide car {e} ∈ Σ. On va suivre la même démarche que pour le théorème de Zermelo. Si S1 et S2 sont deux éléments de Σ, on note I = S1 ∩ S2 . L’ensemble I n’est pas vide car e ∈ I. Si S1 \I et S2 \I sont non vides ils possèdent chacun un plus petit élément pour le bon ordre Γ noté s1 et s2 (s2 6= s1 6∈ S2 ). Supposons que s1 précède s2 . Si il existe un élément s′2 de S2 qui précède s1 qui n’est pas comparable à s1 pour alors il n’appartient pas à S1 puisque S1 est par définition une chaı̂ne. On alors trouvé un élément de S2 \ I qui précède s1 et donc s2 ! ! (contraire à la définition de s2 ). En conséquence tous les éléments de S2 qui précèdent s1 lui sont comparables pour . En conséquence par la propriété c) on doit avoir s1 ∈ S2 ! ! (contraire à s1 ∈ S1 \ I). En conséquence l’un des deux ensembles S1 \ I, S2 \ I est vide et S1 ⊂ S2 ou S2 ⊂ S1 . L’ensemble Σ est donc une chaı̂ne pour l’inclusion et on pose R = ∪S∈Σ S. On vérifie facilement que R ∈ Σ. C’est donc le maximum de Σ pour la relation d’inclusion. Montrons enfin que l’on ne peut pas trouver de chaı̂ne pour qui soit plus grande que R pour l’inclusion. Si ce n’est pas le cas l’ensemble X des éléments de E \ R comparables à tous les éléments de R est non vide. Soit r sont plus petit élément pour le bon ordre Γ. On pose R′ = R ∪ {r} et il est facile de voir que R′ ∈ Σ ce qui contredit la maximalité de R dans Σ. 6 Preuve du théorème de Zorn : Soit (E, ) un ensemble inductif. D’après la proposition précédente cet ensemble admet une chaı̂ne R pour qui est maximale pour l’inclusion. Comme E est inductif, cette chaı̂ne admet une borne supérieure r = sup R. On doit avoir r ∈ R et on ne peut avoir d’élément r ′ ∈ E tel que r r ′ , sinon R ne serait pas maximale pour l’inclusion. Donc r est un élément maximal. On peut avoir besoin d’une variante du théorème de Zorn. Proposition 2.12. Si (E, ) est un ensemble inductif. Pour tout x0 ∈ E il existe un élément maximal plus grand que x0 . Preuve. Cela vient tout simplement du fait que ([x0 , .], ) est encore un ensemble inductif (tout ensemble totalement ordonné de [x0 , .] est un ensemble totalement ordonné de E). 3 Application à l’existence d’une base Théorème 3.1. Tout espace vectoriel V sur un corps commutatif K admet une base. Preuve. L’ensemble L des parties libres muni de la relation d’inclusion ⊂ est un ensemble inductif. En effet si (Li )i∈I est une famille totalement ordonnée de parties libres ((i 6= j) ⇐ (Li ⊂ Lj ou Lj ⊂ Li )) alors L = ∪i∈I Li est une partie libre. En effet si une combinaison linéaire finie d’éléments de L, α1 x1 + · · · + αn xn est nulle. Il existe j ∈ I tel que xk ∈ Lj , pour tout k ∈ {1, . . . , n}. Et comme Lj est une partie libre, tous les coefficients αk doivent être nuls. L’ensemble des parties libres est inductif pour l’inclusion, donc d’après le théorème de Zorn il existe une partie libre B maximale pour l’inclusion. C’est une base. En effet si x ∈ V le système constitué de B et x est nécessairement lié, ce qui n’est possible que si x s’écrit comme combinaison linéaire finie d’éléments de L. Donc B est aussi génératrice. Théorème de la base incomplète. Si L est une partie libre et G une partie génératrice contenant L, alors il existe une base B telle que L ⊂ B ⊂ G. Preuve. On considère l’ensemble E des parties libres contenues dans G et on applique la variante du théorème de Zorn. Corollaire 3.2. Tout sous espace vectoriel F de V admet un supplémentaire. Preuve. Soit L une base de F c’est une partie libre de V . On applique la proposition précédente avec G = V . En suite on prend pour G l’espace vectoriel engendré par B \ L. Corollaire 3.3. Il existe des morphismes de groupe de (R, +) qui ne sont pas des applications R-linéaires. Preuve. On sait qu’un morphisme de groupe f : R → R doit nécessairement vérifier f ( pq x) = p p q f (x) pour tout q ∈ Q et tout x ∈ R. Ce doit être une application Q-linéaire. Une façon de construire un morphisme de groupe qui n’est pas R-linéaire et de faire de la façon suivante : R est un Q espace vectoriel et Q en est un sous-espace. D’après ce qui précède il existe un supplémentaire G de Q dans R. On considère alors l’application f donnée par f ( pq + xG ) = pq avec pq ∈ Q et xG ∈ G. Elle est Q-linéaire et non R-linéaire. 7