probabilité probabilité ces -20

publicité
COINCIDENCES DES DATES D’ANNIVERSAIRES
Jean François Kentzel Lycée Pardailhan à Auch (32)
Remerciements à Martine Babillot-Cornaggia qui m’a permis de simplifier la preuve
donnée à la fin de cet article (en y découvrant une faute) ainsi qu’à Laurent Buquet qui m’a
aidé pour l’utilisation du tableur Excel.
L’an dernier, j’ai fait le pari avec les élèves d’une classe qu’il y avait probablement
parmi eux deux personnes ayant la même date d’anniversaire. Il y avait trente quatre élèves
dans cette classe mais on avait pu constater qu’il n’y avait aucune telle coïncidence de date.
UNE QUESTION CLASSIQUE
Le calcul effectif de la probabilité d’une coïncidence de dates d’anniversaires dans un
groupe de n personnes peut être effectué en classe de première. Désignant par An
l’événement « il y a au moins une coïncidence, » et par Bn l’événement contraire, on obtient
facilement, en supposant l’équiprobabilité des dates d’anniversaires et en laissant de coté le
29 février qui ne change pas grand chose (car la probabilité de son apparition est, en première
approximation, 1/(3.365+366)) :
365!
P (Bn) =
.
n
(365−n)!365
Pour obtenir toutes ces probabilités,
par exemple jusqu’à n = 50,sur une feuille
Excel, il suffit d’installer une colonne
compteur (1,2,3…etc.) et d’utiliser la formule
P (Bn) = P (Bn-1) .(365-(n-1))/365, formule
utilisable aussi avec certaines calculatrices,
qui n’est pas justifiable par un calcul de
probabilité en première (les probabilités
conditionnelles n’étant pas connues) mais
l’est algébriquement. Cet exercice est
vraiment intéressant car on obtient des
résultats étonnants (on peut insister sur ce
point en demandant aux élèves, sans insister
pour obtenir une réponse ! car ce n’est pas
une question sérieuse, l’idée qu’ils ont de
certains résultats avant d’effectuer les
calculs), par exemple P (An) dépasse 0.5
quand n dépasse 22 et vaut environ 0.8 pour n
= 34 (l’intuition « avec 34 dates, on va
utiliser, en gros, un dixième du calendrier »
est tout à fait fausse).
L’assistant graphique donne le dessin cicontre.
Cet exercice est proposé dans plusieurs livres de première S mais il est si intéressant
qu’il peut être traité, malgré sa difficulté, dans d’autres séries (par exemple, dans une classe
de première STT, une bonne dizaine d’élèves ont trouvé la formule d’Excel qui donne le
graphique ci-dessus). Il en est question dans un des articles de la rubrique « Statistiques En
Ligne » du CD ROM d’accompagnement du programme de terminale.
SIMULATION
J’ai effectué en classe quelques simulations sur ce thème. Cette activité a beaucoup plu
aux élèves qui avaient été intrigués par ce pari que j’avais perdu.
Le manuel Terracher Hachette propose, page 278, une procédure pour le faire : dans la
cellule A1 on tape « = ENT (365*ALEA()+1) », qui simule une date d’anniversaire et on le
recopie (33 fois dans mon cas) sur une colonne. Les éventuelles coïncidences ne sautent pas
aux yeux et le livre de Pierre-Henri Terracher propose pour les rendre plus visibles
d’ordonner (tri croissant) ces nombres, ce qui nécessite de les « bloquer »avant le tri en
cochant l’option Sur ordre dans le menu Outil-Options-Calcul..
Ce blocage doit être effectué avant chaque nouvelle simulation. Je propose donc une
autre procédure, plus rapidement exécutable, ce qui peut être utile car les résultats obtenus
heurtent l’intuition et un assez grand nombre de simulations peut être nécessaire si on veut
être convaincant. Des élèves, même assez familiers d’Excel, ont probablement peu de chances
de deviner cette procédure qui consiste à recopier la colonne des dates en lignes puis à
effectuer des soustractions et à compter les 0 qui correspondent aux coîncidences.
Concrètement, dans la cellule A2 on tape « = ENT (365*ALEA()+1) qu’on recopie
jusqu’à A35. Pour recopier sur la première ligne les 34 nombres obtenus, il suffit de
sélectionner puis copier la colonne de dates puis de sélectionner le bloc-ligne B1-AI1 (34
cellules). On entre alors en B1 la formule = TRANSPOSE(A2 :A35), ce qui se fait à la main
ou à l’aide du menu des fonctions. Il faut alors valider en appuyant simultanément sur les trois
touches Ctrl, Majuscule et Entrée. Ce dernier point est essentiel pour pouvoir utiliser ensuite
la touche F9. On n’a alors plus qu’à entrer en B2 « : = $A2-B$1 » qu’on recopie 342 –1 fois.
Il suffit alors de taper »= ( NB.SI(B2 :AI35 ; »=0 »)-34 )/2 » qui donne directement le nombre
c de coïncidences à chaque fois qu’on tape F9. On ne s’intéresse pas ici à la moyenne des
nombres c (qui n’est pas sans intérêt) mais au nombre de c non nuls. Le défaut de cette
méthode est qu’on ne visualise pas bien les coïncidences.
CAS GENERAL
(SANS EQUIPROBABILITE DES DATES D’ANNIVERSAIRES)
On peut se demander si l’équiprobabilité des dates d’anniversaire est un phénomène
réel. Je n’ai pas su trouver cette information sur le site de l’INSEE mais quelques petits
sondages m’ont convaincu que ce n’est pas tout à fait le cas. Il me semble qu’il y a, dans mon
département, un peu plus de naissances au printemps (exercice concret de terminale sur le
paragraphe « adéquation de données statistiques à une loi équirépartie » : traiter les données
relatives aux mois de naissance obtenues dans une maternité donnée), ce phénomène étant
moins marqué qu’il ne l’a été. Je me suis alors demandé si c’était une des causes de ma
mésaventure. Ce qui suit prouve que non.
On désigne par pi la probabilité (quelconque) pour qu’une naissance ait lieu le ième
jour de l’année (pour tout i entre 1 et 365) et par P’ la loi de probabilité associée.
Expression de P’ (Bn)
Pour tout k entre 1 et n et tout i entre 1 et 365, désignons par Ek, i l’événement :la kième personne naît le ième jour de son année de naissance. P’(Ek, i) ne dépend pas de k et vaut
pi.
365  365
 365

Ω=U U ..... U (E1, I E 2, ....E n,   où les n réunions successives sont disjointes.

i1
i2
in  

i1=1 i12 =1  i n =1

Bn s’écrit de la même façon avec la condition supplémentaire que les ik sont tous
distincts.
Les événements E k, sont indépendants donc P’( E1, I E 2, ....E n, ) est le produit
ik
i2
in
i1
des P’( E k, ), c’est à dire le produit des p et la probabilité de non- coïncidence P’ (Bn) vaut
ik
ik
donc
∑ ∑ ∑ ... ∑
( p p ... p ) (les n sommes successives étant
in
i1 i 2≠i1 i3≠i1,i 2 i n≠i1,i 2,...i n −1 i1 i 2
prises à priori de 1 à 365).
Ce nombre est nécessairement inférieur ou égal à P (Bn) calculée dans le cas de
l’équiprobabilité, c’est à dire (365 !/(365-n) ! ). 1/365n
Voici une preuve élémentaire de cette affirmation (qui, dans le cas n = 365 est, au
facteur 365 ! près, l’inégalité arithmético-géométrique qui dit que si on fixe un réel
strictement positif S et un entier non nul n, le produit de n réels positifs de somme S est
majoré par ( S )
n
n
, c’est à dire qu’il est maximum si ces n réels sont tous égaux à S ) :
n
Notations
§ Soit E l’ensemble des 365-uplets de réels positifs dont la somme vaut 1. E est en fait
l’ensemble de toutes les lois de probabilités possibles d’une variable aléatoire pouvant
prendre 365 valeurs. Dans E il y a (1/365…..1/365), noté e, qui est l’équirépartition
§ Soit u = ( p1, p2,…p365) un élément de E.
La somme multiple ci-dessus est notée N (u). Dans la situation étudiée, c’est la probabilité de
non-coïncidence des dates d’anniversaires pour n personnes quand on a la distribution u des
dates pour la population considérée)
Définition :
Soit u, = ( p1, p2,…p365) un élément de E.
Soient i et j deux entiers fixés distincts tels que pi ≤ 1/365 et pi ≥ 1/365. Deux tels
entiers existent nécessairement.
Soit x un réel strictement positif vérifiant x ≤ pi et pj +x ≤ 1.
On définit la « transposition » t ((i,j), x), parfois notée t, de la façon suivante : c’est
l’application d’une partie de E (dépendant de pi et pj , c’est à dire de u) dans E laissant
invariants 363 nombres et ne modifiant que pi et pj: pi est remplacé par pi –x et pj est remplacé
par pj +x.
Notons que t ((i,j), x) « éloigne. de l’équirépartition » les éléments de E sur lesquels
elle peut agir.
On voit qu’il suffit de prouver les deux lemmes :
Lemme 1 : soient u et v dans E et t = t ((i,j), x) une « transposition ».
Si v = t (u), alors N (v) ≤ N (u).
(autrement dit : les « transpositions » font baisser la somme N)
Lemme 2 : soit v, différent de e, dans E. Alors on peut passer de e =
(1/365…..1/365) à v par un produit de « transpositions » définies comme ci-dessus.
PREUVE DU LEMME 1 :
On désigne le produit (
pi pi ... pi ) par A. C’est le terme général de la somme
1
2
n
multiple formant N (u). On regarde comment ce terme est transformé quand on passe de u à v
par t. Il y a trois cas à considérer :
§ Si pi et pj n’apparaissent pas dans A, A n’est pas modifiée.
§ Si pi et pj apparaissent dans A, alors A s’écrit (pi pj C) qui est transformé en A’ = (pi
–x)( pj +x)C et A’ -A= C(( pi –x)( pj +x)- pi pj ) = C(( pi - pj )x –x2) qui est strictement négatif.
On a donc A’ < A.
§ Si pi seul est dans la première parenthèse.(ce qui suit étant correct si c’est pj qui est
dans ce cas), cette parenthèse s’écrit sous la forme r = (w pi ) qui devient r’ = (w( pi-x)) Dans
tous les termes dont N (u ) est la somme, il y a aussi s = (w pj )qui va devenir s’ = (w(pj +x)).
Les termes de ce type sont en nombre pair (en fait, chaque terme figure n ! fois dans N (u) ) et
on peut les regrouper tous deux par deux : (r+s) devient (r’ + s’) mais ces nombres sont égaux
( à w(pi+ pj ))et la somme N (u) n’est pas modifiée avec les termes A de ce type.
PREUVE DU LEMME 2
Soit v = ( p1, p2,…p365) fixé dans T, v différent de e.
Soient I = {i / pi <1/365} et S = {i / pi >1/365}.
Sur les deux dessins ci-dessous, les extrémités des segments verticaux sont les
extrémités supérieures de « bâtons » représentant les pi ; La droite d’équation y = 1/365 est
tracée et les pi tels que i ∈ I sont placés à gauche, les pi tels que i ∈ S sont placés à droite. La
somme des longueurs des segments verticaux placés à gauche est égale à la somme des
longueurs des segments verticaux placés à droite.
§ Première étape
Soit k dans I (I est non vide car v ≠ e). Soit p = pk.
( principe on commence par transformer 1/365 en p, éventuellement en plusieurs
étapes dans le cas de la figure 2, c’est à dire à l’aide de plusieurs des nombres pr avec r dans S
si ces nombres pr sont tous trop proches de 1/365 . On va « équilibrer » le segment p de
gauche à l’aide d’un, ou plusieurs (figure 2), segment(s) de droite, sans dépasser les valeurs
pr,avec r dans S, pour être sur que chaque « transposition » utilisée éloigne bien le 365-uplet
de l’équirépartition.)
On a: 1/365 – p ≤ ∑ (1 / 365 − p ) = ∑ ( p − 1 / 365)
i∈I
i
S’il existe a dans S tel que pa –1/365 >1/365 – p
( voir la figure 1 où paest notée p_a) alors on utilise
t ((k, a), 1/365-p).
Dans le cas inverse (figure 2), pour tout i de S,
pi – 1/365 ≤ 1/365-p et il existe une partie de S notée
S’
et un indice io dans S mais non dans S’ tels que :
i∈S
i
∑ ( p − 1 / 365)
i∈S '
i
≤ 1/365 –p ≤
∑ ( p − 1 / 365) + pi
i∈S '
i
- 1/365.
0
( L’existence de S’ et de io, qui ne sont pas uniques, est évidente à cause de :
1/365 – p ≤ ∑ ( p − 1 / 365)
i∈S
i
et de : pour tout i de S, pi – 1/365 ≤ 1/365-p (qui prouve que l’ensemble S’ n’est pas vide))
Dans ce cas, le produit de composition (commutatif, ce qui est sans importance) de
toutes les transpositions t ((k, i), pi -1/365), i parcourant S’ et de
t ((k, io ), 1/365-p - ∑ ( p -1/365)) permet de transformer 1/365 en pk.
i∈ S '
S.
i
On a seulement « équilibré » 1/365 – p avec (card S’ +1) nombres pr où les r sont dans
§ Deuxième étape (si card I dépasse 1)
On procède ainsi pour chaque indice k de I. I étant fini, le produit (commutatif) de
toutes les « transpositions » obtenues est le produit cherché. Précisons :
A l’issue de la première étape, on a obtenu un élément de E tel que pour certains
indices i de S, 1/365 a été transformé en p’i avec p’i ≤ pi. Pour la deuxième étape, consistant à
« équilibrer un éventuel pl où l est dans I, l ≠ k, on procède comme pour la première étape
mais en remplaçant les pi utilisés à la première étape par pi – p’i.
On poursuit ainsi tant que c’est nécessaire. Les étapes sont au nombre de card (I),
chacune d’elles donnant, dans le pire des cas, card (S) transpositions.
ON A DONC PROUVE QUE C’EST DANS LE CAS DE L’EQUIPROBABILITE QU’IL Y A LE MOINS
DE COÏNCIDENCES.
Remarques :
§ c’est intuitivement « évident » si on pense à des cas extrêmes du type « toutes les
naissances ont eu lieu en deux mois ou bien le même mois » et on peut donc le dire aux élèves
s’ils posent des questions à ce sujet.
§ Ce qui précède permettrait facilement de prouver que la probabilité de noncoïncidence diminue lorsqu’on « s’éloigne de e » en passant d’une distribution de probabilités
u à une distribution de probabilités v par un produit de « transpositions » mais ne dit rien pour
un éloignement quelconque entre u et e qui serait mesuré par
∑ p − 1 / 365
1≤ i ≤ 365
i
par exemple.
CONCLUSION
Ce qui précède montre que nous pouvons continuer à poser sereinement « l’exercice
des anniversaires » en l’agrémentant de sondages ; quelle que soit la classe considérée, la
probabilité d’au moins une coïncidence est au moins celle espérée, même si ça n’empêche pas
que, quasi-fatalement, un d’entre nous, ou un de nos successeurs, passera un jour une heure
entière à se ridiculiser en donnant des prédictions toutes fausses, éventuellement pimentées de
simulations toutes aberrantes ! Il y a des mauvais jours, peu nombreux.
Téléchargement