17 Chapitre Chapitre 17. Quelques exemples de simulations « Anyone who considers arithmetical methods of producing random digits is, of course, in a state of sin. » John Von Neuman, 1951 On « définit » la probabilité en lycée comme la « limite » de la fréquence statistique, quand on répète un très grand nombre de fois et dans des conditions identiques, une expérience aléatoire donnée. C’est ce qui caractérise l’approche fréquentiste des probabilités, qui a l’avantage, en faisant le lien avec les statistiques, de donner à une notion abstraite un support intuitif presque concret. Sans doute dans une première approche faut-il faire effectivement de véritables expériences avec des objets du monde réel – pièces, punaises et autres dés – ne serait-ce que pour en percevoir la lenteur et le caractère laborieux. Bien sûr la simulation automatisée permise par la calculatrice ou l’ordinateur, grâce aux générateurs pseudo-aléatoires, est d’une toute autre efficacité, même si, selon Von Neumann, le pseudo-hasard qu’elle met en œuvre nous plonge dans un état de péché. La rédemption est cependant au bout des algorithmes... Sommaire Chapitre 17. Quelques exemples de simulations.............................................. 427 1. Un problème de référence : la chasse aux canards .......................... 429 1.1 Chassons le canard....................................................................... 429 2. 1.2 Simulation sur le tableur ............................................................... 430 1.3 Capture de la variable ................................................................... 430 1.4 Écriture d’une fonction .................................................................. 432 1.5 Quelques éléments théoriques.................................................... 434 Jets de pièces et dés en tout genre ...................................................... 436 2.1 Simulation d’un jet de dé .............................................................. 436 2.2 Simulation du jet d’une pièce ....................................................... 439 2.3 Le paradoxe du Grand-Duc de Toscane ................................... 443 2.4 Coups consécutifs identiques égaux à pile ou face ................. 446 Christian Vassard (IUFM Rouen) 428 Mathématiques et TI-Nspire 2.5 3. 4. Obtenir tous les numéros quand on jette un dé ....................... 453 Autres problèmes classiques ................................................................. 461 3.1 Le paradoxe des anniversaires ................................................... 461 3.2 Un problème de rencontre ........................................................... 466 3.3 Numéros consécutifs au loto ....................................................... 472 Des probabilités géométriques .............................................................. 477 4.1 Somme de rand() ........................................................................... 477 4.2 Calcul approché de par une méthode de Monte-Carlo ........ 480 4.3 Le jeu de franc-carreau ................................................................ 485 ANNEXE : dénombrer les surjections ............................................................. 489 © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 429 1. Un problème de référence : la chasse aux canards 1.1 Chassons le canard C’est un problème de référence dans la situation d’une part, mais aussi dans la façon dont nous traiterons cette simulation avec TI-Nspire. C’est une simulation classique qui apparaît pour la première fois sans doute dans l’excellent livre d’Arthur Engel Les certitudes du hasard1. Le cadre : dix chasseurs tirent sur dix canards. Comme ils sont adroits… les chasseurs… ils ne ratent jamais leur cible. Comme ils n’ont pas de chance… les canards… ils passent de vie à trépas dès qu’ils sont touchés… Un vrai cauchemar pour les volatiles ! Leur seul espoir de s’en tirer, enfin pour quelques-uns seulement : les chasseurs ne se mettent pas d’accord sur le canard qu’ils visent et ne tirent qu’une fois… Si un malheureux canard, visé par plusieurs chasseurs, est en quelque sorte « tué » plusieurs fois, d’autres survivront ! Pas la peine de faire un dessin : le nombre de canards survivants est donc au mieux de neuf, si tous les chasseurs se sont défoulés au hasard sur un seul oiseau (sera-t-il seulement mangeable, le pauvre ?) ; au pire, aucun si les chasseurs sans le vouloir ont tous tué chacun le leur. Une seule question, pour les canards, mais aussi pour les chasseurs, pour des raisons exactement opposées : combien peut-on en moyenne espérer de survivants après cette boucherie ? Première méthode : on fait venir les chasseurs, les canards etc. On les met par 10, chasseurs, canards, dans une pièce, les coups de feu expédient les canards ad patres… On compte les survivants… enfin chez les canards… Et puis, on recommence avec une autre série2… Ou alors on fait une simulation. Ceux qui n’en verront pas l’avantage seront de mauvaise foi. Elle est moins bruyante, moins traumatisante et surtout moins sanglante. Plus propre, plus rapide et plus économique. Certes, mais comment simuler cette partie de chasse ? L’idée est de récupérer une succession de 10 chiffres aléatoires, comme par exemple : 9 0 6 8 4 6 5 2 8 8. en convenant qu’un chiffre représente le numéro du canard tué. Ainsi, dans notre exemple, on peut constater que le canard 8, le pauvre, a été tué 3 fois3… Oui mais son sacrifice a permis que le canard 1 ou 3 par exemple en réchappe. Combien de survivants dans notre exemple ? 3 canards, les 1, 3, 7, correspondant aux chiffres qui n’apparaissent pas… Remarquons que selon ce modèle, chaque canard a autant de chances d’être tué ou de survivre que son voisin. 1 Qu’on ne peut que recommander si vous ne l’avez pas encore dans votre bibliothèque. ALEAS Editeur. 2 Pensez à changer les canards car les survivants seront traumatisés ! 3 Par les chasseurs 4, 9 et 10… ce qui correspond aux rangs des 8 dans les 10 chiffres. © T³ France 2010 / Photocopie autorisée 430 Mathématiques et TI-Nspire 1.2 Simulation sur le tableur Le tableur est particulièrement indiqué. Dans une feuille de calcul, on saisit dans la colonne A l’instruction =randint(0,9,10). On peut appeler cette colonne salve. Reste à déterminer les numéros qui ne sont pas sortis dans cette salve… Le plus simple est de compter combien de fois chaque numéro de 0 à 9 apparaît. Par conséquent, dans la colonne B, on écrit donc tous les nombres entiers de 0 à 9, correspondant à chaque numéro de canard. En C1, on rentre =countif(salve,b1). La recopie vers le bas donne les autres réponses. Les survivants sont donc les indemnes, c’est-à-dire les numéros en face desquels se trouve un 0. Combien y en-a-t-il ? On peut le faire toujours avec countif. Dans la cellule D1, on tape : =countif(c1:c10,0). et on mémorise le résultat dans la variable surv. Réponse : 4 dans notre exemple… Pour la répéter, on relance les calculs avec CTRL R. Le résultat oscille souvent autour des valeurs 3 et 4. 1.3 Capture de la variable Mais il faudrait pouvoir garder la trace de ces résultats. On peut le faire en capturant les données, selon les modalités qui suivent : on ajoute à surv dans la cellule D1 un petit quelque chose d’aléatoire (rand()/108) qui permet d’être sûr qu’à chaque répétition, la variable surv change de valeur4, si ce n’est sur le nombre de survivants, au moins sur cette partie aléatoire5 ; la capture proprement dit se fait dans la colonne F ; la colonne G permet de récupérer le bon résultat, en prenant la partie entière ; On peut alors en H1 calculer le nombre moyen de survivants, en I5 et I6 leur maximum et minimum. 4 Faute de quoi, la variable surv n’est capturée qu’une fois, ce qui fausse évidemment le résultat. 5 Il est en effet très peu probable que rand()/108 prenne deux fois de suite la même valeur. © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 431 CTRL R6 relance l’expérience et les valeurs capturées apparaissent alors dans la colonne F. On observe que le nombre moyen de survivants s’élève à peu près à 3,5, avec un minimum d’aucun survivant – c’est sans doute très rare – et un maximum de 6 survivants. Évidemment les outils de représentation graphique statistiques peuvent-être utilisés (en nommant par exemple ff la colonne G de tous les résultats des simulations). Voici ce que donnent par exemple les diagrammes en bâtons : on peut de visu constater les effectifs plus importants des 3 et 4… 6 Quand CTRL est pressée, un appui long sur la touche R fait avancer la simulation de quelques dizaines d’expériences. © T³ France 2010 / Photocopie autorisée 432 Mathématiques et TI-Nspire Pourquoi sur cet exemple ne pas pousser l’automatisation jusqu’au bout… CTRL R, c’est bien pour relancer le calcul mais quelque peu fastidieux. On gagnerait à appuyer une fois sur un bouton pour lancer les simulations. On commence par partager horizontalement la feuille de calcul. Dans la partie inférieure, on ouvre l’application Géométrie, juste pour y insérer un curseur, associé à une variable n, dont les valeurs par exemple varient à 1 à 2000 par pas entier (cliquer sur le menu contextuel Réglages). La variable du curseur n en se modifiant doit permettre le re-calcul de toute la feuille. Mais il faut la placer à un endroit stratégique : la colonne A, celle que nous avons appelé salve, est tout indiquée. Il suffit d’ajouter au calcul précédent 0 × n, qui ne changera rien au calcul effectué, mais qui relancera le calcul à chaque changement de la variable n. Autrement dit nous saisissons : salve:=int(randint(0,9,10)+0×n Et c’est tout… L’animation du curseur relance le calcul de la colonne A et par contrecoup provoque les simulations successives ; le fait que le curseur varie de 1 en 1 permet de contrôler, même sommairement, le nombre de simulations effectué7. L’ensemble du classeur est remis à jour, et notamment le diagramme statistique, dont il vaut mieux graduer l’axe vertical en pourcentages. En demandant Zoom - Données, on ajuste parfaitement la fenêtre aux valeurs obtenues. 1.4 Écriture d’une fonction Demeure aussi la possibilité d’écrire une fonction : c’est sûrement moins beau, mais plus rapide. On peut procéder de façon très simple, en gérant une liste à n éléments, représentant nos canards (n = 10 pour nous… mais rien n’interdit de généraliser). 7 Il faut alors penser à réinitialiser la capture. On se place sur l’instruction capture et on valide par ENTER. © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 433 La liste est initialisée à 0 : ces 0 signifient que les canards au départ sont tous vivants. Et puis commencent les tirs des chasseurs : tir simulé avec randint(0,n–1). Le résultat, comme pour le tableur, représente le numéro du canard abattu ; pour indiquer que le canard est tué, on choisit de mettre un 1 dans la liste à l’élément correspondant à ce canard (s’il était à 0 juste avant, c’est que le canard vient d’être tué ; sinon, c’est que le canard a été tué « plusieurs fois », mais on s’en soucie peu). Remarquer le décalage d’indice, car le canard numéro 0 se trouve à la position 1 de la liste… À la fin des n salves, il reste juste à compter le nombre de 0 dans la liste, correspondant aux canards ayant échappé à tous les coups de fusil. Les résultats obtenus sont les suivants… Enfin pour calculer le nombre moyen de canards survivants, il suffit de définir en ligne de commande la fonction suivante : Avec 10 canards, on peut donc raisonnablement espérer qu’en moyenne 3,48 canards survivent à cette boucherie. Cela ouvre la porte à des simulations plus étoffées, comme le montrent les exemples ci-dessous, qui s’exécute à l’ordinateur en un. Avec un millier de ces volatiles caquetant, on peut espérer presque 368 survivants. © T³ France 2010 / Photocopie autorisée 434 Mathématiques et TI-Nspire On obtient proportionnellement plus de survivants, mais la boucherie frappe l’un dans l’autre à peu près la même fraction de la population totale. 1.5 Quelques éléments théoriques L’étude théorique confirme cette valeur empirique. En effet, un canard particulier a une 10 9 probabilité de survie de 0,3486 : il survit lorsque chacun des 10 chasseurs vise de façon 10 indépendante n’importe lequel des 9 autres canards. Cette probabilité est bien sûr la même pour chacun des canards. Par conséquent, si l’on raisonne globalement, à la fin des 10 tirs, un peu plus de 34 % des canards auront survécu. Le nombre moyen de survivants que l’on peut espérer à l’issue de l’expérience « sanglante » est donc : 10 0,3486 3,486 résultat peu éloigné de ceux que l’on a obtenu lors de nos simulations. Attention aux conclusions hâtives… Malgré les apparences, la loi qui donne le nombre de canards tués n’est pas une loi binomiale : pour s’en convaincre, il suffit de se souvenir que les épreuves successives ne sont pas indépendantes. Par exemple, pour le 10e canard, si par un curieux hasard on apprend qu’aucun des autres canards ne sera tué, on ne donnera pas cher de sa peau… et pour cause ! Remarquons enfin que dans le cas de n chasseurs et n canards, avec les mêmes règles du jeu, la n 1 1 probabilité de survie d’un canard particulier est 1 , qui est aussi la proportion de n n canards survivants à l’issue des n tirs. On sait que quand n tend vers l’infini, cette dernière probabilité n tend vers n 1 0, 367 . On retrouve là la valeur qu’on a obtenue avec 1 000 canards à peu de choses e près. Bref, même si n grandit, il demeurera toujours un peu plus d’un tiers de canards survivants en moyenne. © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 435 La loi du nombre de survivants peut être déterminée, mais c’est un peu plus délicat. Nous nous placerons dans le cas de 10 canards. Notons = {H1, …, H10} l’ensemble des 10 chasseurs, et = {C1, …, C10}, supposés distingués par des prénoms (Alphonse, Bernard, … pour les premiers ; Donald, Saturnin, … pour les seconds) ou si l’on préfère des numéros autour du cou. Une salve peut s’interpréter comme une application de dans , chaque chasseur ayant pour image le canard qu’il a tué. Application comme on l’a vu qui est tout à fait quelconque. Il y a donc autant de salves possibles que d’applications de dans soit 1010. Appelons maintenant X la variable aléatoire égale au nombre de canards survivants après la boucherie. Soit k un entier compris entre 0 et 9, le nombre de survivants possibles. Dire que X = k signifie qu’il y a exactement k survivants, donc 10 – k tués. Pour commencer, de combien de façons peut-on par exemple tuer les 10 – k premiers canards et exactement ceux-là et laisser survivre les k derniers ? D’autant de façons que de surjections de l’ensemble sur le sous-ensemble de égal à {C1, …, C10–k} : chacun des canards de cet ensemble doit avoir au moins un antécédent qui n’est autre qu’un de ses « meurtriers ». On sait qu’il existe S 10,10 k 8 surjections entre ces deux ensembles. Ceci donne le nombre de façons de tuer les 10 – k premiers, et de laisser survivre les k derniers. 10 Mais d’autre part, on a façons choisir les k survivants parmi les 10 canards et comme k précédemment pour chacun de ces choix, S 10,10 k façons de tuer les 10–k autres canards. Bref, 10 on a donc S 10,10 k façons d’avoir k survivants à une salve. k 10 10 S 10,10 k S 10,10 k k 10 k En termes de probabilité, on peut écrire que : p X k . 1010 1010 On sait par ailleurs que le nombre de surjections9 d’un ensemble à n éléments sur un ensemble à p p 1 p k n éléments est : S n, p 1 p k k 0 k Après avoir saisi la valeur de S np dans l’application Calculs, puis celle de p X k sous la forme d’une fonction p(k)… 8 S(n,p) désigne le nombre de surjections d’un ensemble à n éléments dans un ensemble à p éléments. 9 Voir l’annexe de ce chapitre. © T³ France 2010 / Photocopie autorisée 436 Mathématiques et TI-Nspire … on peut comparer entre les résultats obtenus sur une simulation de 10 000 salves déterminée par la fonction suivante : … et les valeurs théoriques attendues. On obtient évidemment des valeurs très proches : Les trois dernières colonnes préparent un test de khi2 à la mode terminale : la distance khi2 obtenue vaut 3,03, soit bien moins que 16,919 (=invkhi2(0.95,9)) Il reste le calcul de l’espérance du nombre de canards tués : Le chemin était plus tortueux, certes, mais on retrouve la même valeur que précédemment ! 2. Jets de pièces et dés en tout genre 2.1 Simulation d’un jet de dé Rien n’est plus facile que de simuler le jet d’un dé. Il suffit d’utiliser randInt(1,6), qui renvoie un entier aléatoire entre 1 et 6, suivant la loi équirépartie sur {1,2,3,4,5,6}. © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 437 L’instruction randInt(1,6,100) répète 100 fois l’expérience et renvoie les résultats successifs dans une liste : Dans l’application Tableurs & listes, on peut alors facilement compter la fréquence de chacun des résultats possibles, et même faire varier la valeur de n avec un curseur : La variable n est stockée dans la cellule A1, et pilotée à l’aide d’un curseur de l’application Géométrie, après un partage en deux de la fenêtre10 ; la variable n peut aussi être modifiée directement dans le tableur. On remarquera la souplesse de la construction de cette feuille par rapport à un tableur classique. Jointe aux fonctionnalités d’un véritable tableur, l’utilisation de variables et d’instructions de listes de la calculatrice, simplifie considérablement le travail. L’instruction randint est saisie dans la zone grisée et la liste, qui s’adapte à la taille de n, remplit la colonne B. La liste de tous les résultats est par ailleurs nommée r tout en haut de la colonne. 10 On peut alors réduire au minimum la fenêtre inférieure, pour qu’on ne voie que le curseur. © T³ France 2010 / Photocopie autorisée 438 Mathématiques et TI-Nspire La fréquence des 1 est alors égale à countif(r,d2)/n et la recopie vers le bas donne la fréquence des autres chiffres. 1 – si l’on suppose 6 parfait notre dé – lorsque le nombre d’expériences n augmente. C’est en ce sens que l’on dit que les fréquences convergent vers les probabilités, selon la « loi des grands nombres » qui fonde les probabilités du lycée. On constate bien sûr que les fréquences tendent à se rapprocher de la probabilité Facile, pour ne pas dire immédiat, de visualiser cette convergence avec un histogramme. Ouvrons l’application Données & statistiques et ajoutons la variable r sur l’axe horizontal. On demande ensuite la représentation par histogramme (réglage des rectangles : largeur 0,2, alignement 0,9… pour avoir des diagrammes en bâtons). Verticalement on demande la graduation en pourcentages (Menu Propriétés, Propriétés de l’histogramme). On peut même placer un curseur (menu Actions, Insérer un curseur) pour piloter depuis cette application le changement de valeur de n. La visualisation est encore plus nette quand on trace la droite d’équation y = 1/6 (Menu Analyser, Tracer la fonction puis f1(x) = 100/6 puisque la graduation est en pourcentages). Bref, on obtient très rapidement la fenêtre suivante : L’animation du curseur (clic droit sur le curseur, puis animer) à partir de la valeur 1 montre la lente stabilisation11 des fréquences vers 1/6. Enfin, pour les nostalgiques de la programmation – bien qu’elle devienne moins nécessaire –, on peut encore écrire une fonction renvoyant la fréquence de chaque résultat lorsqu’on a répété l’expérience n fois. La liste qui reçoit les fréquences est initialisée à 0 avec newList. À chaque résultat r obtenu, l[r] est incrémentée de 1. La fonction renvoie tout à la fin la fréquence obtenue en divisant les valeurs de l par n. 11 Attention la liste des résultats est intégralement recalculée lorsque la valeur de n change… © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 439 Voici quelques-uns des résultats obtenus : Un test de khi-deux peut être demandé à partir de ce dernier résultat, pour tester s’il en était encore besoin, l’adéquation à la loi équirépartie12 : la valeur que l’on obtient 3,141188 conduit à accepter le modèle équiréparti. 2.2 Simulation du jet d’une pièce De la même façon, le jet d’une pièce équilibrée peut être facilement simulé avec randInt(0,1). On peut toujours convenir que pile correspond à 1, et face à 0… ou le contraire d’ailleurs. Si la même étude que précédemment peut être menée, nous préférons, sur cet exemple, privilégier une autre approche pour illustrer la convergence de la fréquence vers la probabilité. Avec l’application Tableur & listes, simulons le lancer d’une pièce un certain nombre de fois et mesurons, à chaque étape, la fréquence d’apparition du nombre de piles. On se propose alors d’afficher, au moment de l’expérience numéro i, le point d’abscisse i et d’ordonnée la fréquence de piles à ce moment. 12 N’oublions pas que l’instruction chi2GOF impose que l’on travaille avec des effectifs entiers. © T³ France 2010 / Photocopie autorisée 440 Mathématiques et TI-Nspire Préparons tout d’abord la feuille de calcul. Dans la colonne A, que l’on nomme rang, on met le numéro de l’expérience (de 1 à 500… prévoir même beaucoup moins pour la calculatrice) : seq(k,k,1,500). Dans la colonne B, nommée res, les simulations de jets de pièces : randInt(0,1,500). Dans la colonne C, que l’on nomme freq1, on récupère les fréquences de sortie des 1 (donc pile) : il suffit de saisir dans la zone grisée =cumulativesum(res)/rang. Ci-dessous un exemple d’utilisation de l’instruction cumulativesum : les sommes cumulées sont renvoyées dans une liste. On aurait pu utiliser dans la cellule C1 l’instruction sum($b$1:b1)/rang à la manière des tableurs classiques… mais cela nécessitait une recopie vers le bas, contrairement à cumulativesum. © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 441 Il reste à représenter graphiquement le nuage de points dont l’abscisse est donnée par rang et l’ordonnée par freq1. Enfin, pour relancer le calcul depuis la fenêtre graphique elle-même, on peut insérer un curseur commandant une variable n prenant des valeurs – peu importe lesquelles – entre 0 ou 10. On utilise alors un petit artifice classique : il suffit de remplacer randInt(0,1,500) par randInt(0,1,500)+0.n pour relancer les calculs à chaque changement de la valeur de n et donc relancer un nouvel affichage. Tous ces exemples peuvent s’interpréter en termes de loi normale. Si on appelle Xi la variable aléatoire de Bernoulli donnant le résultat de la ie expérience, on sait que la fréquence de pile au bout 1 n des n lancers est égale à X n X i . Par ailleurs, on sait que Xi a pour espérance p = 1/2 et pour n i 1 © T³ France 2010 / Photocopie autorisée 442 Mathématiques et TI-Nspire 1 . D’après le théorème limite central, lorsque n est suffisamment grand, la 2 0,5 1 fréquence des piles, soit X n , suit la loi normale de moyenne et d’écart-type = . 2 n n On peut faire une simulation pour observer ce résultat. Simulons à l’aide d’une fonction un certain nombre d’expériences dans lesquelles on jette la pièce 500 fois et récupérons dans une liste les différentes fréquences obtenues pour « pile », par exemple 1 dans la simulation. C’est l’objet des deux fonctions ci-dessous : écart-type = p 1 p On obtient les résultats suivants, pour n = 500 et k = 3000 : On peut représenter graphiquement les résultats de 3000 simulations de l’expérience qui consiste à jeter une pièce 500 fois et à mesurer la fréquence de « pile » obtenue, non sans au préalable avoir mémorisé ces résultats dans une liste liste. En réglant l’axe vertical sur la densité de fréquence, on constate la parenté très étroite entre l’histogramme obtenu et la courbe de la densité de la loi normale 1 0, 5 d’espérance et d’écart-type , comme le prévoit le théorème limite central. 2 500 © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 443 D’autre part, on sait que pour une loi normale, on trouve 95 % des valeurs dans un intervalle de rayon 2 autour de l’espérance (et 99 % pour un intervalle de rayon 3). Par conséquent pour n = 500, 95 % des valeurs sont dans un intervalle de rayon 0,5 1 1 1 2 0,0447 autour de la moyenne . Autrement dit 95 % des valeurs sont dans 2 n n 500 l’intervalle [0,4553 ; 0,5447]. De plus, quand n grandit, l’écart-type de la loi normale diminue et l’intervalle autour de la moyenne 1/2 devient de plus en plus petit : c’est le sens d’ailleurs de la convergence de la fréquence vers la probabilité. Par exemple, pour n = 10 000, deux fois l’écart-type de la loi normale donne 1 1 0,01 et dans 95 % des cas, la fréquence sera comprise entre 0,49 et 0,51. 10 000 100 Ci-dessous ont été ajoutées les bornes de l’intervalle de fluctuation, selon la valeur de n : 2.3 Le paradoxe du Grand-Duc de Toscane Galilée (1564-1642), plus connu pour ses travaux sur l’astronomie et l’application des mathématiques au « grand livre de la nature », est l’un des premiers mathématiciens13 à écrire sur les probabilités, bien avant la célèbre correspondance entre Fermat et Pascal qui en marque la naissance officielle. Vers 162014, il écrit un petit mémoire sur les jeux de dés pour répondre à une question posée par le Grand-Duc de Toscane. À cette époque, on jouait beaucoup à la Cour de Florence et le Grand-Duc, fin observateur et grand pratiquant des dés et jeux en tout genre, avait remarqué, sans doute à l’issue d’un grand nombre de lancers, qu’il était plus facile d’obtenir une somme égale à 10 qu’une somme égale à 9 en jetant trois dés. Surprenant selon lui, car il y avait autant de façons d’écrire 10 que 9 comme sommes de trois entiers compris entre 1 et 6, à savoir : 10 = 6 + 3 + 1 = 6 + 2 + 2 = 5 + 4 + 1 = 5 + 3 + 2 = 4 + 4 + 2 = 4 + 3 + 3 (6 possibilités) 13 Cardan écrit en 1526 un Liber de ludo aleae, Livre des jeux de hasard, qui ne sera publié qu’en 1663. 14 Malheureusement publié bien plus tard… © T³ France 2010 / Photocopie autorisée 444 Mathématiques et TI-Nspire 9 = 6 + 2 + 1 = 5 + 3 + 1 = 5 + 2 + 2 = 4 + 4 + 1 = 4 + 3 + 2 = 3 + 3 + 3 (6 possibilités) À défaut d’avoir le coup d’œil du Grand-Duc, on peut faire une simulation avec le tableur TINspire. La simulation se fait sans difficulté particulière en recopiant depuis A1 jusqu’à A200 la formule randInt(1,6)+randInt(1,6)+randInt(1,6). Dans la cellule B1, on mesure la fréquence des 9 dans les 200 lancers avec =countif(9,aa)/200, résultat mémorisé dans f9. Dans la cellule C1, on procède de façon analogue pour déterminer la fréquence des 10, que l’on stocke dans f10. On ajoute à ces deux nombres un petit nombre aléatoire rand()/108 pour être quasi-sûr que les fréquences vont varier d’une fois sur l’autre et que la capture se fera15. Dans la colonne E et dans la colonne F, nommées respectivement ff et gg, on capture les variables f9 et f10 obtenues à la suite des 200 lancers. Dans la cellule H3, on calcule le nombre total de lancers (=200.dim(ff)). Enfin dans les cellules marquées en rouge, figurent les bornes d’un intervalle de fluctuation de la 1 1 ,f fréquence de type f . Nous nous appuierons sur une conjecture de Louis-Marie n n Bonneval, démontrée en 2001 par Christian Maillard16. Pour n suffisamment grand (n 552) – ce qui est le cas ici –, on a l’inégalité : 1 p f p 0.95 . n 15 Ruse classique... En effet, si la valeur ne change pas, ce qui est d’ailleurs très peu probable ici, la capture n’a pas lieu. Les décimales ajoutées influent très peu sur le résultat obtenu, d’autant qu’il est affiché avec 3 décimales. 16 Voir par exemple http://www.apmep-aix-mrs.org/bulletin/num11/load/maillard.pdf. © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 445 Quand la probabilité est connue, ce résultat donne un intervalle de fluctuation de la fréquence dans 95 % des cas. Si la fréquence est donnée, il donne un intervalle de confiance de la probabilité inconnue. Ici, avec les 3 200 lancers effectués, on peut en déduire que dans 95 % des cas, la probabilité d’obtenir 9 est comprise entre 0,10138 et 0,13674 tandis que la probabilité d’avoir 10 est comprise entre 0,11888 et 0,15424. Les deux intervalles se chevauchent et il serait bien imprudent de conclure quoi que ce soit. On peut répéter la simulation et s’arranger si c’est possible pour que les intervalles de confiance obtenus ne se chevauchent plus. C’est ce que donne la feuille de calcul suivante : Les résultats sont plus satisfaisants, avec par exemple 150 000 lancers : dans 95 % des cas, la probabilité d’obtenir 9 est comprise entre 0,1126 et 0,11776 tandis que la probabilité d’avoir 10 est comprise entre 0,1223 et 0,12746. Dans 95 % des cas, comme le Grand-Duc de Toscane, nous sommes en mesure de conclure que la fréquence du 9 est légèrement inférieure à la fréquence de 10 : soulignons l’énorme expérience en matière de jeu de dé, doublée d’une mémoire infaillible, du GrandDuc de Toscane qui pouvait ne s’appuyer que sur ses propres observations. Déterminons par exemple la probabilité d’obtenir une somme égale à 10. Nous sommes clairement dans une situation d’équiprobabilité et la probabilité d’un résultat particulier, dans l’ordre 1 1 où il est écrit vaut 3 . 216 6 Nous avons cité plus haut toutes les façons d’obtenir 10 : 10 = 6 + 3 + 1 = 6 + 2 + 2 = 5 + 4 + 1 = 5 + 3 + 2 = 4 + 4 + 2 = 4 + 3 + 3 (6 possibilités) … mais il faut concrètement dénombrer le nombre de façons de les répartir sur les 3 dés… 1 1 . Mais avec ces même 3 216 6 numéros répartis autrement sur les 3 dés, on peut obtenir 10 de 3! = 6 façons : Ainsi 1 + 3 + 6, dans cet ordre, donne 10 et a pour probabilité 1 + 3 + 6, 1 + 6 + 3, 3 + 1 + 6, 3 + 6 + 1, 6 + 1 + 3 et 6 + 3 + 1. La probabilité d’obtenir 10 avec ces 3 numéros dans n’importe quel ordre est donc © T³ France 2010 / Photocopie autorisée 6 . 216 446 Mathématiques et TI-Nspire La probabilité d’obtenir 10 avec 5, 4, 1 et 5, 3, 2 est aussi pour les même raisons de 6 .. 216 1 1 . Mais le nombre 3 216 6 de façon de l’obtenir est un peu plus petit à cause du numéro qui se répète. On a en effet 3 façons de placer le 6 et une seule de placer alors les 2 qui restent : Examinons le cas de 6 + 2 + 2, dont la probabilité dans cet ordre est aussi 6 + 2 + 2, 2 + 6 + 2, 2 + 2 + 6 et la probabilité d’obtenir 10 avec 6, 2, 2 vaut 3 . Résultat analogue pour 4, 4, 2 et 4, 3, 3. 216 Si bien que la probabilité d’obtenir 10 vaut : 6 6 6 3 3 3 27 1 0,125 . 216 216 216 216 216 216 216 8 Par un raisonnement analogue, à partir de toutes les décompositions de 9 en somme de trois entiers compris entre 1 et 6 : 9 = 6 + 2 + 1 = 5 + 3 + 1 = 5 + 2 + 2 = 4 + 4 + 1 = 4 + 3 + 2 = 3 + 3 + 3 (6 possibilités) on peut en conclure que la probabilité d’une somme égale à 9 vaut : 6 6 3 3 6 1 25 0,11574 216 216 216 216 216 216 216 car le triplet 3, 3, 3 ne peut être obtenu d’une seule façon quand on jette les trois dés. On retrouve à très peu près les valeurs de la simulation. 2.4 Coups consécutifs identiques égaux à pile ou face Supposons par exemple que l’on jette 100 fois une pièce de monnaie et que l’on note tous les résultats successifs dans l’ordre où ils sont apparus. Pour simplifier, nous appellerons séquence toute suite de coups identiques, constitué soit de « pile » soit de « face ». Nous nous intéresserons plus particulièrement à la probabilité, lorsqu’on jette 100 fois la pièce, d’obtenir une séquence de longueur au moins 6. Évidemment, on va réaliser d’abord une simulation17 dans l’application Tableur & listes pour étudier la fréquence de l’événement proposé dans notre feuille de calcul. 17 Pile pour 1 et face pour 0, mais peu importe ! © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 447 Dans la simulation précédente, on observe une séquence de longueur 2, puis suivent trois séquences de longueur 1, enfin une séquence de 6 zéros consécutifs. On peut d’ores et déjà conclure que l’événement que l’on étudie est réalisé. L’apparition d’une séquence de longueur au moins 6 est-elle rare ou non ? L’intérêt est bien sûr d’automatiser dans la feuille de calcul la détermination de la longueur de la séquence maximale. Il suffit d’utiliser la colonne B pour compter, comme on le ferait d’ailleurs à la main. On commence bien sûr par 1 ; ensuite il faut faire un test : si le nombre est identique au précédent, on ajoute 1, sinon on recommence à 1. D’où le test proposé en B2 et recopié sur 100 lignes : =when(a2=a1,b1+1,1) © T³ France 2010 / Photocopie autorisée 448 Mathématiques et TI-Nspire Il reste à renvoyer en D1 la longueur maximale de la colonne B avec max(b[])+rand()/108, le rand() sert ici à assurer la capture pour le cas où deux expériences consécutives donnerait le même résultat 18. Il reste à organiser la capture dans la colonne E, puis dans la colonne F à se débarrasser des chiffres après la virgule inutiles. En G2 (voir sur l’écran ci-dessous), on calcule la fréquence des résultats 1 supérieurs ou égaux à 6, encadrée par la fourchette en ; en H6, on donne pour information le n nombre n de simulations réalisées, soit le nombre d’éléments de la variable a qui ne peut pas dépasser 2 500. En conclusion, la fréquence obtenue dépasse 80 %. On peut penser qu’il en est de même pour la probabilité. On aurait pu aussi écrire une fonction pour réaliser un nombre plus grand nombre d’expériences que dans une feuille de calcul. Ci-dessous une première fonction coupscons(n) qui compte la longueur de la plus grande séquence au cours de n lancers et une deuxième lcc(m,n) qui dresse la liste des longueurs de séquences maximales quand on répète m fois n fois le lancer d’une pièce. 18 Deux résultats identiques surviennent de temps en temps dans cette situation. Il est impératif de pouvoir en tenir compte ! © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 449 Un premier « jet » est simulé avec randInt(0,1) et stocké dans anc (ancien c, c’est-à-dire la valeur de c qui précède celle qu’on est en train de traiter) et la variable ct, qui compte le nombre de coups consécutifs égaux, est initialisée à 1. Le maximum m est lui initialisé à 1. On poursuit les tirages dans la boucle For, pour i allant de 2 jusqu’à n (le premier tirage a été fait hors de la boucle). Le nouveau « jet » randInt(0,1) est mémorisé dans une variable c. À chaque étape, on compare c et anc : si ces deux variables sont les mêmes, c’est que les coups sont de même nature et l’on incrémente ct de 1 ; on remplace aussi m par le maximum entre m et ct ; sinon, les coups ne sont pas de même nature et l’on remet à 1 la variable ct. Avant de repartir dans la boucle, il faut penser que c devient anc pour la valeur suivante de i. On retourne à la fin la valeur maximale rencontrée, contenue dans m. Lors de la mise au point de la fonction, les résultats obtenus lors des n lancers du dé étaient mémorisés dans une liste : il fallait bien s’assurer d’une façon ou d’une autre que le maximum de coups consécutifs renvoyé par la fonction était correct. Les lignes qui correspondent, inutiles maintenant, ont été mises en commentaire. Cette dernière liste peut être étudiée statistiquement. En particulier, une boîte à moustaches peut donner une idée de la répartition des valeurs. On observe en particulier que la médiane est 7, le premier quartile 6, le troisième 8 et que le maximum obtenu s’élève à 18… ce qui peut paraître d’ailleurs énorme. © T³ France 2010 / Photocopie autorisée 450 Mathématiques et TI-Nspire Comment peut-on justifier un tel résultat19 ? Démontrons le résultat non pas quand on jette la pièce 200 fois mais n fois où n est un entier naturel quelconque au moins égal à 1. Un résultat de cette expérience peut alors s’interpréter comme une n-liste de l’ensemble {0,1}. On sait qu’il y en a en tout a 2n, chacune de ces n-listes ayant la même probabilité d’apparaître. Nous voulons donc déterminer le nombre de n-listes présentant au moins une séquence de longueur 6. Nous raisonnerons par événement contraire en cherchant à déterminer le nombre un de listes ne contenant aucune séquence de longueur au moins 6. n La probabilité qu’une telle liste présente au moins une séquence de longueur 6 sera donc 2 –n un. 2 Il reste à évaluer un. De façon évidente, u1 = 2 ; u2 = 22 = 4 ; u3 = 23 = 8 ; u4 = 24 = 16 ; u5 = 25 = 32 car toutes les listes précédentes, possédant strictement moins de 6 éléments, ne risquent pas d’avoir une séquence de longueur au moins 6 ! Mais pour u6, cela devient possible : il y a en tout 26 listes et seulement 2 avec 6 éléments consécutifs égaux, 000000 et 111111. On a donc u6 = 26 – 2 = 64 – 2 = 62. Quid de u7 ? On a 27 = 128 résultats possibles... Seulement 6 listes contiennent une séquence de longueur au moins 6 : 0000001 ; 1000000 (liste commençant ou terminant par 6 « 0 ») 19 Une démonstration analogue est proposée dans L’induction statistique au lycée par Philippe Dutarte, éditions Didier. Je m’en suis inspiré. © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 451 1111110 ; 0111111 (liste commençant ou terminant par 6 « 1 ») 0000000 ; 1111111. On a donc u7 = 27 – 6 = 122. Enfin pour u8... On dénombre cette fois 16 listes contenant une séquence de longueur au moins 6. Ce sont : 00000011 ; 00000010 (liste commençant par 6 « 0 ») 01000000 ; 11000000 (liste terminant par 6 « 0 ») 10000001 (liste avec 6 « 0 » au milieu) 00000001 ; 10000000 (liste commençant ou terminant par 7 « 0 ») 00000000 (liste avec 8 « 0 ») et huit autres suites semblables en échangeant les 0 et les 1. Bilan : u8 = 28 – 16 = 256 – 16 = 240. Or on constate sur ces premiers calculs que un = un – 1 + un – 2 + un – 3 + un – 4 + un – 5. Généralisons ce résultat par récurrence. On suppose donc que la propriété est vraie à l’ordre n. On a donc : un = un – 1 + un – 2 + un – 3 + un – 4 + un – 5. où un désigne le nombre de listes de n éléments qui ne contiennent que des séquences de longueur 5 au maximum. Calculons maintenant un + 1. Nécessairement pour fabriquer une liste de n + 1 éléments sans séquence de longueur au moins 6, on doit partir d’une liste de n éléments sans séquence de longueur au moins 6. La question est de savoir comment, à partir d’une des un listes de n lancers sans séquence de longueur au moins 6, on peut obtenir à l’aide d’un lancer supplémentaire une liste de n + 1 lancers sans séquence de longueur au moins 6. Or, de deux choses l’une : soit la liste de n lancers se termine par une séquence de longueur 5, et on doit la compléter soit par un 1 (si la séquence est une séquence de 5 « 0 ») soit par un 0 sinon. soit la liste de n lancers ne se termine pas par une séquence de longueur 5, et on peut la compléter indifféremment soit par un 0 soit par un 1. Combien y-a-t-il de listes de la première sorte c’est-à-dire de listes de n lancers se terminant par une séquence de longueur 5 ? Elles peuvent se terminer soit par 00000, soit par 11111. Dans le premier cas, les n – 5 premiers termes de cette liste forment une liste de n – 5 lancers, sans séquence de longueur 6, dont le dernier lancer est un 1 ; de la même façon, les n – 5 premiers termes d’une liste de n lancers se terminant par 11111 forment une liste de n – 5 lancers, sans séquence de longueur 6, dont le dernier lancer est un 0. Il y a donc exactement un – 5 listes de n lancers se terminant par une séquence de longueur 5 ; et pour chacune d’elles une seule façon de la compléter pour en faire une liste de n + 1 lancers sans séquence de longueur au moins 6. © T³ France 2010 / Photocopie autorisée 452 Mathématiques et TI-Nspire Combien y a-t-il de listes de la deuxième sorte ? Comme il y en a en tout un, il en reste un – un – 5 et on a vu qu’on pouvait les compléter de deux façons différentes pour en faire une liste de n + 1 lancers sans séquence de longueur au moins 6. Par conséquent : un + 1 = 2(un – un – 5) + un – 5 = 2un – un – 5 = un + (un – un – 5) = un + un – 1 + un – 2 + un – 3 + un – 4 ce qu’il fallait prouver. On peut maintenant calculer u100 avec la calculatrice. Plutôt que d’écrire une fonction, servonsnous de la réflexion matricielle que nous avons mise en œuvre lors de l’étude de la suite de Fibonacci. La transformation matricielle du problème en avait accéléré le traitement. En posant : 0 1 0 0 0 0 0 1 0 0 M 0 0 0 1 0 0 0 0 0 1 1 1 1 1 1 on peut écrire : un 4 un 5 un 3 un 4 un 2 M un 3 un 1 un 2 u u n n 1 Par conséquent, et de proche en proche : u96 u95 u94 u1 2 u97 u96 u95 u2 4 u98 M u97 M 2 u96 ... M 95 u3 M 95 8 . u99 u98 u97 u4 16 32 u u u u 5 100 99 98 Il ne reste plus qu’à finir le calcul à la calculatrice. On rappelle que pour enter la matrice on tape [0,1,0,0,0;0,0 etc.]… le point-virgule permettant de changer de ligne… Le nombre cherché u100 est le cinquième du vecteur colonne obtenu : © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 453 et la probabilité qu’une suite de 100 termes contiennent au moins 6 éléments consécutifs égaux est : 1 u100 0,806 soit un peu plus de 80 % ! 2100 Remarquons que si l’on jette la pièce 200 fois, l’événement est devenu presque une certitude : 2.5 Obtenir tous les numéros quand on jette un dé C’est une question que l’on peut se poser naturellement : combien de fois faut-il en moyenne lancer un dé pour obtenir les 6 numéros possibles au moins une fois20 ? Six coups au minimum sont nécessaires, si l’on a de la chance… mais il est possible au moins en théorie de poursuivre indéfiniment les lancers... Écrivons pour commencer un programme, pour à la fois voir la succession des résultats et le nombre de coups nécessaires à obtenir toutes les faces du dé. On peut par exemple procéder de la façon suivante. Tout d’abord, une liste l de 6 éléments est initialisée à 0. Lorsqu’un numéro sort, par exemple le 2, on met la valeur 1 dans l[2]. On s’arrête lorsqu’il n’y a plus que des 1 dans l – et donc lorsque le produit de ses éléments fait 1. Parallèlement au travail précédent, on mémorise dans une liste rr les résultats successifs du jet du dé. 20 Ou bien combien faut-il acheter de tablettes de chocolat Poulain pour avoir les 10 images d’une collection complète. Dans un cadre général, c’est ce que l’on appelle un problème de collection. © T³ France 2010 / Photocopie autorisée 454 Mathématiques et TI-Nspire On obtient par exemple les résultats suivants : Cette fonction étant écrite, on peut en proposer l’analyse dans une page Tableur & listes. Dans la zone grisée de la colonne A, on rentre =collec(6). Cette colonne peut être appelée a. Enfin dans la cellule B1, on saisit alors =dim(a) et on stocke le résultat dans une variable r. On peut alors observer les différents résultats obtenus. On peut alors observer ce qui se passe et selon les expériences réalisées, voir varier le nombre de lancers nécessaires pour obtenir tous les numéros du dé. Évidemment, il est souhaitable en capturant les données de garder la trace de tous les résultats obtenus. En utilisant le procédé habituel, on capture les différentes valeurs de r dans la colonne C : © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 455 dans B1, on met dim(a)+rand()/10^8 ; on capture r égale à la valeur précédente dans la colonne C ; dans la zone grisée de la colonne D, on saisit =int(C[]) pour neutraliser l’effet de rand(), on nomme alors d la colonne D. Enfin, on peut demander en E1 le calcul de la moyenne de la colonne D et son nombre d’éléments en E2. Il semble qu’en moyenne il faille entre 14 et 15 coups pour qu’en jetant un dé, on ait obtenu tous les résultats possibles. On peut faire une étude statistique plus détaillée, soit avec des histogrammes ou encore avec des boîtes à moustaches. Remarquons que dans un cas, il a fallu attendre jusqu’à 72 lancers de dé pour qu’apparaissent les 6 numéros : c’est la plus grande valeur qu’on observe sur la boîte à moustaches précédente ! © T³ France 2010 / Photocopie autorisée 456 Mathématiques et TI-Nspire Étude théorique Tentons de modéliser cette situation. Une série de lancers peut être représentée par une liste ordonnée d’entiers compris entre 0 et 6, comme par exemple : (4,4,3,6,6,4,5,1,4,5,2,2,2,2,5,…) Notons que cette liste peut être poursuivie indéfiniment. Si l’on observe l’exemple précédent, on a obtenu tous les numéros du dé en 11 lancers, à l’apparition du premier 2, représenté en grand dans la liste. Appelons X la variable aléatoire réelle égale au nombre de lancers nécessaires pour obtenir pour la première fois au moins une fois chaque face. X est susceptible de prendre pour valeurs tous les entiers naturels supérieurs ou égaux à 621. Sur l’exemple précédent, X prend la valeur 11. Nous nous proposons de déterminer la loi de X. Nous commencerons par nous intéresser à l’événement X n, que nous noterons An, où n est un entier supérieur ou égal à 6. Quelle est la probabilité de An ? Quand l’événement An est réalisé, cela signifie qu’on a obtenu tous les numéros du dé au bout du ne lancer, pas nécessairement pour la première fois au rang n mais certainement à un rang k n. Ainsi pour la série qui nous a servi d’exemple précédemment où X prend la valeur 11, les événements A15 par exemple ou A20 sont réalisés, car au bout de 15 ou 20 lancers, on a bien obtenu tous les numéros du dé. Raisonnons par événement contraire. L’événement An signifie qu’au cours des n lancers, il manque au moins un numéro, c’est-à-dire qu’il manque le 1, ou le 2, ou le 3, ou le 4, ou le 5 ou le 622. En notant Bin l’événement « au cours des n lancers, le numéro i n’est pas sorti », pour k entier entre 1 et 6, on peut écrire : An B1n B2n ... B6n . Pour calculer p An , la formule de Poincaré23 s’impose. Elle s’écrit : p B1n B2 n ... B6 n pB pB 1 i 6 in 1 i j 6 1 i j k l 6 in B jn 1i j k 6 p Bin B jn Bkn Bln p Bin B jn Bkn 1i j k l p 6 p Bin B jn Bkn Bln B pn p B1n B2 n B3n B4 n B5n B6 n Évaluons d’abord les p Bin pour i = 1,…,6 c’est-à-dire la probabilité qu’un numéro donné ne sorte pas au cours des n lancers. 5 5 Pour un lancer, cette probabilité vaut et donc pour les n lancers indépendants, elle vaut . Six 6 6 termes de ce type figurent dans la formule de Poincaré, pour chacun des six numéros possibles. n 21 Mais pas moins ! 22 Ou inclusif car plusieurs numéros peuvent manquer… mais pas tous ! 23 Qui donne la probabilité de la réunion d’un nombre fini d’événements. © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 457 On aura aussi besoin de p Bin B jn pour i j qui n’est autre que la probabilité que les deux 6 4 numéros i et j ne sortent pas, probabilité qui vaut avec 15 termes de ce type dans la 6 2 formule. n n 3 Puis p Bin B jn Bkn , avec 6 6 20 termes dans la formule. 3 On poursuit sur la même lancée avec : 6 15 termes tous égaux à 4 n 2 pour les intersections des événements quatre à quatre ; 6 6 1 6 termes tous égaux à pour les intersections des événements cinq à cinq ; 6 5 n 1 terme égal à 0 pour l’intersection des 6 événements… car au cours des n lancers, obligatoirement un numéro est sorti. La formule de Poincaré permet alors d’écrire : p An p B1n B2 n ... B6 n n n n n n 5 4 3 2 1 6 15 20 15 6 0 6 6 6 6 6 Par conséquent : p X n p An 1 p An n n n n 5 4 3 2 1 1 6 15 20 15 6 6 6 6 6 6 n n n n n 6 6 5 15 4 20 3 15 2 6 6n n Nous sommes maintenant en mesure de déterminer la loi de X. En effet, on peut écrire : X n X n X n 1 … le – ici étant un moins d’ensemble… et en déduire : p X n p An p An1 … ce qui conduit à la valeur suivante pour p X n : 6n 6 5n 15 4n 20 3n 15 2n 6 6n 1 6 5n 1 15 4n 1 20 3n 1 15 2n 1 6 6n 6n 1 6n 6 5n 15 4n 20 3n 15 2n 6 6n 6 2 5n 1 90 4n 1 120 3n 1 90 2 n 1 36 p X n 6n 6 5n 1 30 4n 1 60 3n 1 60 2n 1 30 5n 1 5 4n 1 10 3n 1 10 2n 1 5 6n 6n 1 Cette formule, quelque peu compliquée, peut être retrouvée en utilisant le dénombrement des surjections proposé en annexe, dénombrement qui s’appuie sur une démonstration très proche que celle qu’on vient de faire. © T³ France 2010 / Photocopie autorisée 458 Mathématiques et TI-Nspire Conservons les mêmes notations. Un lancer particulier peut être représenté par une liste ordonnée d’entiers compris entre 1 et 6, comme par exemple : (1,3,2,4,5,1,2,3,5,6,3,6,…). Sur cet exemple, on a obtenu tous les numéros du dé en 10 lancers : tous les numéros de 1 à 5 sur les 9 premiers lancers, puis le 6 au dixième lancer. Dénombrons les séquences de 10 lancers donnant les 6 numéros du dé et se terminant par un 6. Or donc, il n’y a qu’une façon de choisir le 6 en 10e place. Pour les 10 – 1 = 9 premières places, on peut associer à un tirage particulier une surjection de l’ensemble E = {1,2,3,4,5,6,7,8,9} sur l’ensemble F = {1,2,3,4,5} : l’image de i E est le résultat obtenu par le dé au ie lancer. C’est bien une surjection car chaque numéro autre que 6 doit être obtenu au moins une fois dans les 9 premiers tirages. Inversement, toute surjection de E sur F définit clairement un tirage. Par exemple celle qui correspond à notre tirage de référence serait la surjection suivante : 1 1 2 2 3 3 4 5 4 5 6 7 8 9 Il y a donc autant de tirages possibles en 10 lancers se terminant par 6 que de surjections de {1,2,3,4,5,6,7,8,9} sur l’ensemble {1,2,3,4,5} : soit S 9,5 , que nous savons dénombrer dans l’annexe de ce chapitre. Pour des raisons évidentes de symétrie, il y en a autant qui se terminent par 5, ou 4, ou 3, ou 2, ou 1. Le nombre de tirages qui donnent tous les numéros du dé en 10 lancers est égal à 6 S(9,5). Comme il existe 610 résultats possibles, tous équiprobables, lorsqu’on jette le dé 10 fois, on en déduit que : p X 10 6 S 9,5 610 Mais le raisonnement que nous venons de tenir est susceptible d’être généralisé à une quelconque valeur n 6. En procédant de la même façon, dénombrons d’abord toutes les listes se terminant au ne lancer par 6, et ayant vu dans les n – 1 premiers lancers tous les numéros de 1 à 5 : pour les mêmes raisons que précédemment, il y en a autant que de surjections de {1,2,...,n–1} sur l’ensemble {1,2,3,4,5}, soit S n 1,5 . La probabilité que les 6 numéros sortent en n lancers exactement est donc 6 S n 1,5 On retrouve bien la formule précédente, sans doute de façon plus simple, car : © T³ France 2010 / Photocopie autorisée 6 n S n 1,5 6n 1 . Quelques exemples de simulation 459 5 5 5 5 5n 1 4n 1 3n 1 2n 1 1n 1 S n 1,5 5n 1 5 4n 1 10 3n 1 10 2n 1 5 1n 1 1 2 3 4 6n 1 6n 1 6n 1 On peut maintenant faire apparaître dans le tableur les probabilités d’obtenir tous les numéros en k lancers, à partir de k = 6 : On observe un maximum pour n = 11. La probabilité décroît très vite, pour être quasiment nulle à partir de n = 40. On a fait figurer dans la cellule E1 le calcul d’une valeur approchée de l’espérance mathématique de X pour les valeurs affichées dans le tableur (sur notre exemple de 6 à 100) : on trouve environ 14,7. Faisons le calcul exact de cette espérance à partir des formules que nous avons établies. On sait que c’est la somme de la série suivante : © T³ France 2010 / Photocopie autorisée 460 Mathématiques et TI-Nspire n p X n n6 n6 n6 5 n 6 n 1 n5n 1 5n 4n 1 10n 3n 1 10n 2n 1 5n 6n 1 5 n6 4 n 6 n 1 10 n6 3 n 6 n 1 10 n6 2 n 6 n 1 5 n6 1 n 6 n 1 Petite parenthèse pour mener le calcul précédent à son terme… on sait que : q n n0 1 pour q tel que q 1 1 q donc par dérivation (c’est possible pour les séries entières) : nq n 1 n0 1 1 q 2 pour q tel que q 1 . Par conséquent : g q nq n 1 nq n 1 1 2q 3q 2 4q 3 5q 4 n6 n0 1 1 q 2 1 2q 3q 2 4q 3 5q 4 . L’espérance mathématique de X vaut : 5 4 3 2 1 147 n p X n g 6 5g 6 10 g 6 10 g 6 5g 6 10 n0 comme le montre l’écran suivant : Signalons enfin qu’il existe une autre façon, plus rapide, d’aborder le problème du calcul de cette espérance. La variable aléatoire X, égale au nombre de lancers nécessaires pour faire apparaître les 6 faces du dé, peut s’écrire sous la forme : X X1 X 2 X 3 X 4 X 5 X 6 où Xi est la variable aléatoire donnant le nombre de lancers nécessaires à ce qu’une face du dé différente des précédentes sorte. Il est clair que X1 = 1… et son espérance vaut 1 ! Pour X2, tout revient à attendre la sortie d’un résultat différent du premier, résultat qui, même si on ne 5 le connaît pas a priori a cependant une probabilité de . En termes de loi, on peut considérer que X2 6 5 est une loi de Pascal dans laquelle la probabilité de succès est égale à p . 6 On sait que l’espérance d’une telle loi, qui est aussi le temps d’attente du succès, est de On peut poursuivre un raisonnement analogue pour les autres lois. © T³ France 2010 / Photocopie autorisée 1 6 . p 5 Quelques exemples de simulation 461 Avec X3, on attend l’apparition d’un résultat différent des deux premiers : c’est de nouveau une loi de 4 6 Pascal avec une probabilité de succès égale à . L’espérance de X3 est donc . 6 4 Etc. jusqu’à X6 dont l’espérance est 6. D’après la linéarité de l’espérance : E X E X1 E X 2 ... E X 6 1 6 6 6 1 1 1 ... 6 1 ... 14,7 5 4 1 6 2 3 Résultat très précisément égal à celui que nous avons obtenu plus haut ! 3. Autres problèmes classiques 3.1 Le paradoxe des anniversaires Est-il besoin de rappeler l’énoncé très classique de ce célèbre exercice ? Dans une assemblée de n personnes, on demande la probabilité qu’au moins deux de ces personnes fêtent leur anniversaire le même jour. Il est bien clair que dès lors que n > 365, cette probabilité est égale à 1 (d’après le principe des tiroirs... ou un peu de bon sens !). À l’inverse quand n = 1, on peut aussi s’attendre à ce qu’elle soit nulle. Mais pour un effectif de 30 personnes (une classe par exemple), quelle peut bien être cette probabilité que deux élèves au moins fêtent leur anniversaire le même jour ? Le bon sens, encore lui – mais cette fois pris en défaut – laisserait croire que cette probabilité est assez faible. Qu’en est-il exactement ? Nous devons toutefois ajouter une hypothèse implicite pour traiter l’exercice : les naissances sont supposées uniformément réparties sur chacun des 365 jours de l’année 24. Enfin nous négligerons le problème des années bissextiles. On peut donc repérer une naissance dans l’année par un nombre entier compris entre 1 et 365. Ces hypothèses étant précisées, on peut faire une première simulation au tableur, précisément pour 30 personnes. La variable n, correspondant au nombre de personnes, est définie dans la cellule A1. 24 En réalité on peut observer un léger pic entre juillet et octobre, mais les écarts ne sont pas si importants que cela. Voir par exemple le site http://www.indices.insee.fr/bsweb/servlet/bsweb?action=BS_SERIE&ONGLET=2&BS_IDBANK=436391 © T³ France 2010 / Photocopie autorisée 462 Mathématiques et TI-Nspire Dans la colonne B, on réalise un tirage au sort, avec randInt, de n nombres entiers compris entre 1 et 365 simulant les dates de naissance équiréparties dans l’année des n personnes considérées. Cette liste est complétée jusqu’à la ligne 365 par des void. Il reste à compter si, dans la liste des dates de naissance, figurent des doublons. En C1, avec countif on regarde si la date de naissance correspondant à la cellule B1 apparaît à un autre endroit dans la liste : =countif(anniv,b1). On recopie ensuite la formule vers le bas, jusqu’à la 365e ligne. Remarquons qu’au-delà d’un nombre de lignes égal à n, la colonne C se complète avec void. Si dans la colonne C on ne trouve que des 1 (ce qui équivaut à dire que la somme des éléments de la liste res est égale à n), c’est que toutes les dates d’anniversaire ne sont rencontrées qu’une fois et une fois seulement. En d’autres termes, les personnes sont nées à des dates différentes (D1 renvoie alors 0). Sinon, deux personnes au moins, peut-être plus, fêtent leur anniversaire à la même date (et D1 renvoie 1). D’où le test dans la cellule D1 : =when(sum(res)=n,0,1) On peut répéter l’expérience manuellement (Ctrl R) une vingtaine de fois pour se rendre compte que la probabilité qu’au moins deux personnes fêtent leur anniversaire le même jour est assez importante. Une animation, avec capture de variable, peut aussi être proposée. Nous n’en donnerons que les grandes lignes car nous l’avons déjà rencontrée dans les exemples précédents : on remplace dans D1 0 par 0+rand()/10^8 et 1 par 1+rand()/10^8 et l’on mémorise le résultat dans une variable r ; on capture cette variable r dans la colonne F et on en prend la partie entière dans la colonne G; enfin on compte la fréquence =((countif(simul,1))/(dim(simul)))*1. de 1 dans Une simulation sur 1547 lancers donne alors une fréquence de 0,697. © T³ France 2010 / Photocopie autorisée la colonne G par Quelques exemples de simulation 463 Le calcul de cette probabilité est relativement classique. Nous nous placerons dans le cas général d’une assemblée de n personnes. Comme on l’a vu, un résultat de cette expérience est une liste ordonnée de nombres entiers compris entre 1 et 365 : le ie nombre de cette liste donne le numéro du jour dans l’année de l’anniversaire de la ie personne. L’univers est l’ensemble de toutes ces listes ordonnées : il y en a 365n. On travaille avec 1 la loi équirépartie sur cet univers : la probabilité d’une liste particulière est donc . 365n Appelons A l’événement « dans l’assemblée de n personnes, au moins deux d’entre elles sont nées le même jour ». Alors A est l’événement « les n personnes de l’assemblée sont toutes nées à des jours différents ». Dénombrons donc les listes constituées de nombres deux à deux différents. De telles listes sont des arrangements de n éléments pris parmi 365. Il y en a : n 365 364 ... 365 n 1 A365 Si bien que p A n A365 . 365n La probabilité cherchée vaut donc p A 1 n A365 . 365n Que donne cette formule sur notre TI-Nspire ? Les résultats sont instructifs : En particulier, pour n 23 personnes, on constate que la probabilité que deux d’entre elles soient nées 1 le même jour est au moins égale à . Surprenant résultat, étant donné le petit nombre de personnes… 2 et c’est en cela que l’on parle de « paradoxe » des anniversaires. Pour mieux visualiser le phénomène on peut représenter la probabilité en fonction du nombre de personnes à l’aide d’un nuage de points. © T³ France 2010 / Photocopie autorisée 464 Mathématiques et TI-Nspire On observe la croissance très rapide de la probabilité pour les valeurs de n comprises entre 1 et 50 (pour n égal à 50, la probabilité vaut 0,97 c’est-à-dire une quasi-certitude). Enfin, pour terminer, observons que : f n 1 n A365 365 364 365 n 1 1 n 1 1 ... 1 1 1 ... 1 n 365 365 365 365 365 365 On sait que pour x suffisamment proche de 0 : ex 1 x . Par conséquent, on peut alors remplacer dans f(n) 1 petit. On obtient alors : © T³ France 2010 / Photocopie autorisée k k par e 365 … en toute rigueur pour k assez 365 Quelques exemples de simulation 1 2 n 1 1 n 1 365 365 365 f n 1 1 ... 1 1 e e ... e 1 e 365 365 465 1 1 2... n 1 365 1 e n n 1 2365 Vérifions la qualité de cette approximation : On constate que l’approximation proposée est excellente. Elle s’éloigne au maximum d’un peu plus d’un centième du résultat exact. Graphiquement, l’écart entre la fonction g et le nuage de points précédents est imperceptible. © T³ France 2010 / Photocopie autorisée 466 Mathématiques et TI-Nspire x2 On peut même se contenter de la fonction h définie par h x 1 e 2365 : l’approximation reste intéressante, notamment pour des calculs simples. Par exemple si l’on cherche à déterminer n tel que f(n) 0,75, on résoudra : 1 e n2 2365 0,75 n2 ln 0, 25 2 365 e n2 2365 0, 25 n2 2 365 ln 1 2 365 ln 4 4 Ce qui conduit à n 31,8119 soit à partir de n = 32, ce que l’on peut vérifier sans problème avec les valeurs exactes. 3.2 Un problème de rencontre Là encore, c’est un problème classique que la TI-Nspire peut facilement simuler, grâce aux nombreux outils qu’elle propose. C’est une histoire par exemple de chapeau sur la tête, quand on est étourdi et qu’on risque de prendre au hasard un autre chapeau que le sien. Plus précisément, n personnes déposent leur chapeau dans un vestiaire. À la sortie, chacune de ces personnes prend un chapeau au hasard. On se pose la question de déterminer la probabilité pn pour qu’au moins une personne récupère son chapeau. On dira dans ce cas qu’il y a eu rencontre25. On peut supposer par exemple que les personnes sont numérotées de 1 à n, de la même façon que leur chapeau. Comme elles reprennent leur chapeau au hasard, il y a autant de façon de le faire que de permutations d’un ensemble à n éléments, la loi étant équirépartie sur cet ensemble. Ainsi avec 5 personnes numérotées de 1 à 5, la permutation (5,3,1,2,4) signifierait que la personne numéro 1 repartirait avec le chapeau numéro 5, la 2 avec le chapeau 3, etc. Ici d’ailleurs chacun s’en irait avec le chapeau d’un autre. Tout revient à dénombrer parmi les permutions de l’ensemble {1,2,…,n} celles qui ont au moins un point fixe. On peut faire une simulation de ce problème dans l’application Tableur & listes. Une fonction de la TI-Nspire peut être utilisée à cette occasion. Il s’agit de randperm(n) qui figure dans la bibliothèque numtheory, qui génère une permutation au hasard de l’ensemble {1, 2, … ,n}. La feuille de calcul suivante permet de simuler le problème : 25 Entre le chapeau et son propriétaire… © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 467 On remarquera tout particulièrement l’instruction =cc-bb qui permet de comparer terme à terme les deux listes, celle des numéros de personnes en B et celle des chapeaux en C. Il y a rencontre lorsque 0 figure dans l’un des résultats de cette liste, c’est-à-dire lorsque le produit des éléments de la liste est égal à 0. Par cette procédure on évite complètement la recopie vers le bas d’une formule ; si l’on change la valeur de n, les calculs vont s’adapter à la taille de la colonne B26. La capture du résultat peut alors être organisée : on ajoute dans E2 la valeur rand()/10^8 ; on capture la variable res dans la colonne F27 et on en prend la partie entière dans la colonne G; enfin on compte la fréquence =((countif(simul,1))/(dim(simul)))*1. de 1 dans la colonne G par En considérant une assemblée de 10 personnes, la simulation donne une fréquence de rencontre environ égale à 0,626 pour 1579 répétitions de l’expérience, comme le montre l’écran ci-dessous. 26 Ce que l’on ne peut pas faire dans un tableur classique. 27 Si l’on souhaite pour des raisons pédagogiques ne pas afficher cette colonne, on peut l’écrire en blanc sur fond blanc. © T³ France 2010 / Photocopie autorisée 468 Mathématiques et TI-Nspire Une fonction peut être rapidement écrite sur la base de cette feuille de calcul : On obtient les résultats suivants, avec des fréquences qui dans l’ensemble semblent être du même ordre de grandeur : Justification du résultat précédent Deux démonstrations peuvent être proposées. La première est basée sur la formule de Poincaré, déjà rencontrée précédemment. On rappelle que ce que l’on appelle rencontre correspond à la situation où un chapeau se retrouve sur la tête de son propriétaire. Soit R l’événement « Il y a au moins une rencontre ». Il est clair que : © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 469 R = R1 R2 ... Rn où Rk est l’événement « il y a une rencontre au rang k » (et peut-être ailleurs, mais sûrement au rang k) La formule de Poincaré s’applique alors. On sait que p( R) p( R1 ... Rn ) S1 S2 ... (1)n Sn . On a : n S1 p( Ri ) n i 1 1 =1 n En effet, l’événement Ri suppose qu’il y ait rencontre en i ; il ne reste que n 1 ! choix possibles pour les autres numéros, donc p( Ri ) n 1! 1 . La somme S n! 1 n possède par ailleurs n termes, d’où le résultat indiqué. On a aussi : S2 n n 1 n 1 1 1 p( Ri R j ) . 2 n n 1 2 1i j n 2 n(n 1) L’événement Ri R j , avec i différent de j, suppose qu’il y ait rencontre en i et j ; il ne reste plus que n 2! choix possibles pour les autres numéros donc p( Ri R j ) n 2 ! n! 1 . La somme S2 n n 1 n possède n termes. 2 En raisonnant de façon analogue, on montre que : S3 n 1 1 p( Ri R j Rk ) . 1i j k n 3 n(n 1)(n 3) 3! ... Sk n 1 1 p( Ri1 Ri2 ... Rk ) . k 1i1 i2 ...ik n n(n 1)...(n k 1) k ! ... Sn p( R1 R2 ... Rn ) 1 . n! La formule de Poincaré permet d’écrire : p R 1 On remarque évidemment que n 1 1 1 . ... 1 2! 3! n! 1 1 1 1 1 1 1 1 1 ... ... . e 2! 3! 4! 2! 3! 4! Par conséquent, la limite de p(R) lorsque n tend vers l’infini est égale à 1 © T³ France 2010 / Photocopie autorisée 1 soit environ e 470 Mathématiques et TI-Nspire n 1 1 1 1 vers 1 étant rapide, il n’est pas surprenant ... 1 2! 3! n! e 1 que même pour des valeurs de n assez petites, la simulation donne des résultats proches de 1 . e La convergence de p R 1 Une deuxième démonstration est possible, basée sur l’étude d’une suite récurrente. On appelle Rn l’événement « on constate au moins une rencontre dans un groupe de n personnes » et pn la probabilité de l’événement contraire Rn . On cherche dans cette méthode à déterminer une relation de récurrence pour la suite (pn). Examinons d’abord quelques cas particuliers. Si n = 1, un chapeau, une personne… et comme la vie est bien faite, la rencontre est obligatoire… en d’autres termes, p1 = 0. Si n = 2, soit chaque personne a récupéré son chapeau, soit il y a échange de chapeaux. Par 1 conséquent, p2 . 2 Si n = 3, on a 6 permutations possibles, que l’on peut résumer ainsi : personne 1 personne 2 personne 3 personne 1 personne 2 personne 3 chapeau 1 chapeau 2 chapeau 3 chapeau 1 chapeau 3 chapeau 2 personne 1 personne 2 personne 3 personne 1 personne 2 personne 3 chapeau 2 chapeau 1 chapeau 3 chapeau 3 chapeau 2 chapeau 1 personne 1 personne 2 personne 3 personne 1 personne 2 personne 3 chapeau 2 chapeau 3 chapeau 1 chapeau 3 chapeau 1 chapeau 2 1 Avec les deux dernières, et elles seulement, on n’a aucune rencontre. Par suite p3 . 3 Considérons donc un groupe quelconque de n personnes, dans lequel nous particularisons une personne particulière, que nous appellerons Henri P28. Lorsque l’événement Rn est réalisé, aucune rencontre ne doit avoir lieu et comme Henri P n’a pas pu reprendre son chapeau, il a nécessairement récupéré celui d’une autre personne. De deux choses l’une : ou bien (événement E) il y a eu échange de chapeau entre Henri P et cette autre personne, autrement dit cette autre personne a récupéré le chapeau d’Henri P ; ou bien (événement E ) il n’y a pas eu échange de chapeau entre Henri P et cette autre personne, c’est-à-dire que cette autre personne a récupéré un autre chapeau que celui d’ Henri P. En d’autres termes, on peut écrire : Rn Rn E Rn E . Calculons la probabilité de E, c’est-à-dire la probabilité qu’il y ait un échange de chapeaux entre Henri P et une autre personne du groupe. Un dénombrement par arbre montre qu’Henri P a n – 1 possibilités pour choisir le chapeau d’une autre personne, cette autre personne n’ayant qu’une possibilité de choisir le chapeau d’Henri P. On a donc n 1 cas favorables. 28 Et si elle s’appelle autrement, ce qui est fort probable, nous la rebaptiserons pour les besoins de l’exercice ainsi ! © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 471 Pour le nombre de cas possibles, Henri P a n chapeaux possibles à choisir, et une deuxième personne n’en a plus que n – 1, soit en tout n(n – 1) cas possibles. En conclusion : p E cas favorables n 1 1 . cas possibles n n 1 n Revenons au calcul de p Rn : p Rn p Rn E p Rn E p E pE Rn p E pE Rn 1 1 pE Rn 1 pE Rn n n Calculons ensuite pE Rn … on sait qu’Henri P et une autre personne se sont échangées leur chapeau. Reste n – 2 personnes avec leurs n – 2 chapeaux, si bien que pE Rn pn 2 . Calculons maintenant pE Rn … La situation est la suivante : Henri P a pris le chapeau d’une des n – 1 autres personnes qui, elle, ne peut pas reprendre le chapeau d’Henri P (sinon il y aurait eu échange !). Faisons comme si le chapeau d’Henri P appartenait à cette infortunée personne : tout se passe comme si elle pouvait prendre tous les autres chapeaux mais pas celui-là. On est donc encore dans une situation où n – 1 personnes se répartissent n – 1 chapeaux, sans qu’il y ait rencontre. La probabilité pE Rn vaut donc pn 1 . Par conséquent : pn 1 1 pn 2 1 pn 1 n n Le calcul des premiers termes de la suite peut alors être fait par le tableur : On remarque que la probabilité qu’il n’y ait pas de rencontre semble tendre très vite vers 1/e. Considérons la suite (un) définie par un pn1 pn pour n entier naturel non nul. © T³ France 2010 / Photocopie autorisée 472 Mathématiques et TI-Nspire Les premiers termes de la suite (un) sont : u1 p2 p1 1 2 1 1 1 u2 p3 p2 3 2 6 La relation de récurrence pn pn pn 1 1 1 pn 2 1 pn 1 peut aussi s’écrire : n n 1 1 1 un pn1 pn2 soit un1 un2 ou un1 n n n2 Autrement dit : 1 1 1 u3 4 6 4! 1 1 1 u4 5 4! 5! Bref, il semble que pour tout entier naturel n un 1 n 1 1 … ce qui se démontre sans peine par n 1! récurrence. Par conséquent, pour tout entier naturel n non nul : 1 . n 1! n 1 un pn 1 pn Écrivons successivement les égalités qui en résultent : p2 p1 1 2! p3 p2 1 3! … pn pn 1 1 n n! Par addition membre à membre de toutes ces égalités, il vient : pn p1 pn 1 1 1 ... 2! 3! n! n C’est bien la formule précédemment obtenue. On en tire les mêmes conclusions. 3.3 Numéros consécutifs au loto Autour de juin 2009, 11 tirages consécutifs du Loto29 ont donné les résultats suivant, le plus récent étant celui de la première ligne : 29 Est-il besoin de rappeler qu’un tel tirage est constitué de 6 numéros choisis entre 1 et 49, sans répétition… Les règles du jeu ont un peu changé depuis l’origine du jeu, mais nous nous intéresserons toujours à des tirages de 6 numéros. © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 473 4 16 17 21 22 1 17 28 36 41 42 4 21 26 27 33 49 7 3 8 27 37 41 2 11 21 40 41 49 4 16 24 28 39 46 4 27 42 45 48 49 7 22 25 29 31 41 5 13 15 32 33 46 10 14 21 26 32 46 6 18 24 26 35 47 1 Examinons ces résultats d’un peu plus près… non pas pour deviner quels prochains numéros sortiront la semaine prochaine (j’ai la méthode mais, pour des raisons éthiques, je ne la divulgue pas)… non, juste pour préciser une particularité étonnante que chacun a sans doute déjà remarqué auparavant… il arrive en effet très souvent que deux numéros au moins d’un tirage soient consécutifs : c’est le cas ici 7 fois sur les 11 tirages mentionnés plus haut. Or quand on choisit aussi peu que 6 nombres parmi 49, l’intuition voudrait qu’on laisse en général de grands vides entre les numéros choisis. Qu’en est-il exactement ? Une simulation à la calculatrice doit permettre de clarifier ce point. Analyse du problème et mise en œuvre sur la calculatrice TI-Nspire On sait que la calculatrice simule le tirage d’un nombre entier au hasard entre 1 et 49 avec l’instruction randInt(1,49). On peut donc imaginer de mettre dans une liste 6 appels successifs à la fonction précédente… mais des précautions doivent être prises ! Un numéro donné ne peut pas apparaître plusieurs fois dans un tirage du loto. Mais il existe une autre instruction, randSamp(l,n,0 ou 1), qui va nous permettre de résoudre le problème. Elle produit un échantillon d’un certain nombre n d’éléments d’une liste l, échantillon avec remise (0) ou sans remise (1). L’exemple suivant illustre l’utilisation de randSamp : Dans le deuxième exemple, on constate la répétition du 7, qui est possible puisque l’échantillon est avec remise. Les trois derniers exemples conviennent parfaitement pour simuler le loto. Cette première étape étant franchie, nous voici très rapidement avec une liste de 6 nombres simulant le tirage du loto… On peut envisager une feuille de calcul. Il reste à tester si cette liste contient des numéros consécutifs ou pas. © T³ France 2010 / Photocopie autorisée 474 Mathématiques et TI-Nspire Le plus simple consiste d’abord à trier la liste, en utilisant la fonction sort_asc de tri croissant de liste qui se trouve dans la librairie numtheory… sortA (ou sortD) ne pouvant pas être utilisé dans le tableur puis à utiliser deltalist qui donne la liste des différences premières de la liste considérée. Les différences premières sont égales à 1 au moment où on rencontre deux termes consécutifs ; en retirant 1 à ces différences premières, les produit des éléments de cette nouvelle liste fait 0 lorsque l’on rencontre au moins une fois deux numéros consécutifs. On peut ensuite capturer les résultats des tirages successsifs, selon le procédé habituel : On arrive à une fréquence légèrement inférieure à 1 , ce qui semble surprenant a priori. 2 Une fonction peut être écrite en suivant exactement le principe de cette feuille de calcul. © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 475 Pour aller plus loin : le calcul de la probabilité La simulation donne une réponse simple, avec peu de moyens, et permet de se convaincre de l’ordre de grandeur du résultat. Reste la justification mathématique, trop délicate pour être présentée à des élèves (même de terminale S) mais qui donnera au professeur la satisfaction d’avoir un peu mieux cerné le problème. Tout d’abord, un résultat classique, et bien connu : le nombre de grilles possibles quand on joue 49 ou 13 983 816. 6 au loto est égal au nombre de façons de choisir 6 numéros parmi 49 soit Nombre énorme certes, qui montre à qui l’aurait oublié la très faible probabilité qu’il y a de gagner le gros lot à ce jeu… Mais il nous faut nous intéresser aux écarts entre deux numéros, ce qui justifie le changement de point de vue qui suit. Examinons par exemple le tirage (fictif ou à venir !) suivant : 6 12 24 27 41 42 Ordonnons 49 boules (non numérotées) dans une « boîte » rectangulaire de 49 cases, dont chacune est numérotée de la gauche vers la droite de 1 à 49 : Insistons sur le fait que la boule n’est pas numérotée, contrairement aux boules du loto : ce qui compte ici, c’est le rang qu’elle occupe dans la boîte rectangulaire. Remplaçons les 6 boules gagnantes de notre tirage (6-12-24-27-41-42) par 6 « parois », qui vont délimiter 7 « boîtes » de B1 à B7. © T³ France 2010 / Photocopie autorisée 476 Mathématiques et TI-Nspire Les 43 boules restantes (49 6) se trouvent donc réparties dans 7 petites boîtes, certaines de ces boîtes pouvant être vides. Ici la boîte B6 est vide car les 5e et 6e numéros du tirage sont consécutifs : B1 B3 B2 B5 B4 B6 B7 Remarquons aussi que les boîtes extrêmes B1 et B7 sont vides lorsque le tirage commence par 1 ou finit par 49 (ce qui n’est pas le cas ici !). Réciproquement, en procédant de manière inverse, une répartition de 43 boules non distinguables dans 7 boites différentes peut s’interpréter comme un tirage du loto. Ainsi si les boîtes B1 à B7 contiennent dans cet ordre les nombres suivants de boules : 3 12 4 6 15 0 3 le tirage qui correspond serait 4 17 22 29 45 46 En d’autres termes, il y a correspondance biunivoque entre un tirage du loto et une répartition de 43 boules dans 7 boîtes comme on vient de l’indiquer. Dénombrer l’un des aspects revient à dénombrer l’autre. La deuxième approche est moins connue : elle présente l’avantage de porter le regard non pas sur les numéros qui sortent, mais sur les écarts entre ces numéros… … ce qui nous permet de dénombrer le nombre de grilles du Loto ne comportant pas de numéros consécutifs. Comme on l’a vu la traduction en est simple : dire que le tirage ne comporte pas de numéros consécutifs revient à dire que toutes les boîtes ont au moins un élément, sauf peut-être les deux boîtes extrêmes… On dispose donc de 43 boules (non distinguables et non numérotées) à placer dans 7 boîtes différentes. 5 sont obligatoirement placées dans les 5 boîtes centrales, ce qui garantit que le tirage correspondant sera sans numéros consécutifs. Il reste à se répartir les 38 autres boules dans les 7 38 6 44 boîtes. Par un raisonnement inverse de celui qui précède, ceci peut se faire de façons 6 6 Si bien que la probabilité que la grille ne comporte pas deux numéros consécutifs est de : 44 6 7059052 0,505 49 13983816 6 et la probabilité que la grille comporte au moins deux numéros consécutifs est de 0,495. Résultats tout à fait conforme aux simulations faites précédemment… Comme on l’a constaté lors de la simulation, c’est une probabilité bien plus grande qu’on ne pourrait l’imaginer de prime abord. © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 477 4. Des probabilités géométriques 4.1 Somme de rand() Combien de fois, en moyenne, faut-il additionner de rand() de la calculatrice pour que le total dépasse 1 ? La question peut paraître facile voire immédiate : elle ne l’est pas du tout. Le résultat est même tellement inattendu qu’on n’ose le formuler, de peur de paraître ridicule. En tout cas, le problème se traite particulièrement bien à une simulation dans l’application Tableur & listes. C’est une première approche intéressante. La feuille suivante appelle peu de commentaires, sauf à comprendre la stratégie employée. On réalise plusieurs appels successifs à la fonction rand() et on cumule dans la colonne C ces valeurs… en repérant le moment où on dépasse 1. On obtient une moyenne de 2,69 environ… soit une valeur assez peu différente de … e ? On n’en croit pas ses yeux ! Abordons le problème en écrivant deux fonctions, la première, som_rand, pour déterminer le nombre d’appels de rand() nécessaires pour dépasser 1, la seconde, ct, pour répéter l’expérience précédente et faire la moyenne des résultats obtenus. On obtient les résultats suivants, qui confirment l’impression précédente d’un nombre moyen d’appels proche de e. © T³ France 2010 / Photocopie autorisée 478 Mathématiques et TI-Nspire Une justification théorique Démontrons tout d’abord le théorème suivant. Théorème a désigne un réel de [0 ; 1] et Xi sont n variables aléatoires indépendantes suivant la loi uniforme sur l’intervalle [0, 1]. Pour tout entier naturel n, on a : p X1 ... X n a an . n! Démonstration Montrons cette propriété par récurrence. Il est clair que la propriété est vraie pour n = 1. Examinons ce qui se passe pour n = 2 ou n = 3. Pour n = 2, en revenant à des notations plus usuelles, appelons X et Y les deux variables aléatoires indépendantes suivant chacune la loi uniforme sur [0 ; 1], cela revient à démontrer que : p X Y a a2 . 2! Une interprétation géométrique peut être faite, qui éclairera le problème. Lorsque X et Y prennent des valeurs, qui sont par hypothèse comprises entre 0 et 1, on peut leur associer un point dans le carré unité, dont les coordonnées sont précisément les valeurs prises par X et Y. L’ensemble des résultats possibles correspond à l’ensemble des points situés à l’intérieur du carré unité. L’événement X Y a sera réalisé lorsque le point associé à X et à Y sera situé en dessous de la droite d’équation x + y = a, c’est-à-dire dans la zone orangée du dessin ci-dessous. On peut donc affirmer que p X Y a est égale au quotient de l’aire du triangle orangé sur le dessin qui suit, divisée par l’aire du carré qui vaut 1, soit La propriété est donc aussi vraie pour n = 2. © T³ France 2010 / Photocopie autorisée 1 a2 . aa 2 2 Quelques exemples de simulation 479 Remarque intéressante pour la généralisation du procédé : le calcul de l’aire orangée se ramène d’un point de vue plus général au calcul de l’intégrale : a a a y 2 2 a y a . dxdy dx dy a y dy 2 2 x y a 0 0 0 0 a Pour n = 3 et 0 a 1, en notant X, Y et Z les variables uniformes qui interviennent, on peut interpréter p X Y Z a comme le quotient de deux volumes, le volume du prisme OABC divisé 1 1 a 2 a3 OA aire OBC a . 3 3 2 6 par le volume du cube unité qui vaut 1, soit On peut aussi calculer cette fois une intégrale triple : a 2 a a z 3 3 a z a . dxdydz dxdy dz dz 2 3! 3! x y z a 0 x y a z 0 0 a en remarquant que a z dxdy 2 découle du résultat précédent valable pour tout a de [0, 1] 2 x y a z appliqué à a – z. Nous sommes maintenant en mesure de généraliser par récurrence. On suppose, avec les hypothèses du théorème, que l’on a : p X1 ... X n a an , pour tout réel a de l’intervalle [0 ; 1]. n! On en déduit que le volume de l’hyperprisme d’équation x1 ... xn a dans un espace affine de dimension n est an . Ou encore que n! ... n1 x1 ,..., xn 0,1 x1 ... xn a dx1...dxn an . n! Montrons la propriété au rang n + 1.Or : a ... x ,..., x , x 0,1n1 dx1...dxn dxn 1 1 n n 1 x1 ... xn xn1 a 0 © T³ France 2010 / Photocopie autorisée ... x ,..., x 0,1n dx1...dxn dxn 1 1 n x1 ... xn a xn1 a 0 a xn1 n! n dxn 1 a n 1 n 1! 480 Mathématiques et TI-Nspire ce qui prouve la propriété au rang n. Nous sommes en mesure maintenant de démontrer notre résultat. Appelons donc Y la variable aléatoire donnant le plus petit nombre n d’appels à la fonction rand() d’une calculatrice pour que n rand() 1 . k 1 Considérons l’événement Y = n : il a donc fallu n fonctions rand() dans la somme pour dépasser 1, alors que les n – 1 premières ne l’avaient pas permis. Autrement dit, on a l’égalité suivante : Y n = X1 ... X n1 1 X1 ... X n1 X n 1 D’autre part, il est clair que l’événement X1 ... X n1 1 si bien que X1 ... X n 1 est inclus dans l’événement p Y n p X 1 ... X n 1 1 X 1 ... X n 1 p X 1 ... X n 1 1 p X 1 ... X n 1 1 1 n 1 n 1! n! n! L’espérance mathématique de Y est donc : 1 n 1 n 1 E Y n e. n 1 n ! n 1 n 1! n 2 n 2 ! Il faut donc en moyenne appeler e fois la fonction rand() pour que la somme n rand() 1 dépasse k 1 pour la première fois 1. Étonnant non ? 4.2 Calcul approché de par une méthode de Monte-Carlo Considérons un carré OABC de côté 1 construit comme ci-dessous sur un repère orthonormé O; i , j . À l’intérieur de ce carré est tracé le quart de cercle de rayon 1 et de centre O. La construction peut être faite dans l’application Graphiques, car nous en aurons besoin pour l’illustration géométrique. Tirons au hasard un point à l’intérieur du carré. De deux choses l’une : ou bien le point tombe à l’intérieur du disque ; ou bien il tombe à l’extérieur. © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 481 On a affaire là à des probabilités continues. Comme le tir est au hasard (le tireur ne cherche pas à viser…), il s’agit d’une loi uniforme à l’intérieur du carré, et la probabilité que le tireur tombe à l’intérieur du disque est égale au rapport de l’aire du disque sur l’aire du carré, soit . 4 Par conséquent, quand on répète l’expérience n fois, le rapport du nombre de points tombés à l’intérieur du disque sur le nombre total de points doit donner une valeur approchée de . 4 C’est le principe de ce que l’on appelle les méthodes de Monte-Carlo de calcul approché d’aire30 : elles ne donnent pas des résultats d’une très grande précision, mais, compte tenu des moyens simples mis en œuvre, un ordre de grandeur tout à fait intéressant. Premier problème à résoudre : comment peut-on tirer au sort un point dans le carré OABC ? Il est clair que cela revient à choisir son abscisse, puis son ordonnée, toutes les deux comprises entre 0 et 1. La fonction rand(), qui simule une loi uniforme sur [0 ; 1[ convient tout à fait : nous l’appliquerons une première fois pour déterminer l’abscisse a du point M, une deuxième pour son ordonnée b. Deuxième problème : le point est-il dans le carré ? Il suffit de montrer que OM2 1, soit que a2 + b2 131. De quoi déjà utiliser le tableur… On peut remarquer la syntaxe de l’instruction de la colonne D : toutes les colonnes, y compris le test, s’ajustent à la valeur de n choisie au départ. 30 Nous verrons l’extension de cette méthode à l’estimation de l’intégrale d’une fonction positive. 31 Il importe peu de prendre le quart de disque ouvert ou fermé. Dans cette situation, les probabilités s’interprètent comme des quotients d’aires et l’on sait bien que l’aire d’une ligne est nulle. Autrement dit, la probabilité d’avoir un point exactement situé sur le quart de cercle est nulle. © T³ France 2010 / Photocopie autorisée 482 Mathématiques et TI-Nspire Pas de commentaire particulier sur les deux colonnes B et C, sauf à rappeler que rand(1000) génère une liste de 1000 nombres aléatoires… peut-être beaucoup d’ailleurs pour la calculatrice. Dans la colonne C, on teste pour savoir si le point qu’on a fabriqué est situé dans le quart de disque (1) ou non (0) : remarquer la syntaxe particulière qui permet d’éviter la recopie d’une instruction vers le bas. Evidemment la fréquence de 1 donne une valeur approchée de avoir une valeur approchée de : =4.sum(d[])/n. . D’où la formule saisie en E1 pour 4 On peut relancer plusieurs fois la simulation par CTRL R, éventuellement changer la valeur de n, pour constater que la valeur renvoyée de est tout à fait honorable. Reste l’affichage graphique… qui n’est pas un problème avec la TI-Nspire… On peut d’abord visualiser le nuage de points dont les abscisses sont x et les ordonnées y. Un curseur permet de piloter le nombre total de points n, mais tout est recalculé à chaque fois que la valeur de n change. Pour avoir un nuage sur lequel on peut faire varier le nombre de points, on définit tout d’abord en H1 une variable k que l’on initialise à 10 par exemple. Dans les colonnes F et G, ce sont les k premières valeurs des listes x et y que nous allons recopier. Nommons xx et yy ces deux listes : ce sont elles que nous représenterons en nuage de points. On peut aussi piloter la variable k avec un curseur. Enfin ajoutons le calcul de la valeur approchée de qui correspond à la valeur de k en cours : dans la cellule H6 du tableur, on calcule 4.sum(mid(r,1,k))/k après avoir appelé r la liste des résultats et on stocke le résultat dans une variable res. Enfin,dans l’application Graphiques, on saisit avec l’outil texte p, dont on demande le calcul. On affiche à côté la valeur obtenue. © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 483 La valeur approchée obtenue de , sans être catastrophique, n’en est pas moins grossière. On peut se poser la question de la qualité de cette approximation en fonction du nombre n d’essais. Un retour aux probabilités s’impose. Le choix du point n°i peut être interprété comme une loi de Bernoulli Xi, pour laquelle le succès, 1 quand le point tombe dans le disque, a une probabilité de et l’échec, 0, 1 . L’espérance d’une 4 4 telle loi est et son écart-type 1 0, 41 . 4 4 4 © T³ France 2010 / Photocopie autorisée 484 Mathématiques et TI-Nspire Quand on répète l’expérience n fois, de façon indépendante, on sait d’après le théorème central limite, que la moyenne M des Xi suit approximativement une loi normale d’espérance et d’écart-type . 4 n Reprenons notre exemple où n vaut 1462. La valeur obtenue pour est 3,12, donc pour , environ 4 0,78. On peut donc dire que 0,78 a 95 % de chances de se trouver dans un intervalle de rayon 0, 41 2 2 0, 021 autour de . 4 n 1462 , en supposant que l’on ne connaisse pas sa valeur et 4 qu’on cherche à l’approcher, a 95 % de chances de se trouver dans un intervalle 0,78 0,021 ; 0,78 0,021 0,759 ; 0,801 . Ce que l’on peut aussi formuler en disant que En revenant à , on peut dire qu’il a 95 % de chances32 de se trouver dans l’intervalle 3, 036 ; 3, 204 33. La méthode n’est donc pas précise : elle le devient si n augmente... car l’écart-type diminue. Calcul d’une intégrale par la méthode de Monte-Carlo. Le même principe que celui que nous venons de voir peut être appliqué au calcul approché d’une intégrale34. Dans un souci de simplification, nous nous placerons dans le cas où l’on cherche à 1 calculer l’intégrale35 I f t dt où f est une fonction vérifiant pour tout x de [0 ; 1], 0 f(x) 1. 0 On peut procéder de la même façon : d’abord un tirage d’un point au hasard dans le carré [0 ; 1] [0 ; 1], un premier appel de rand() donnant l’abscisse de ce point, et un second appel donnant son ordonnée ; ensuite on regarde si le point est sous la courbe représentive de f (la probabilité qu’il le soit est I) ou au dessus (probabilité 1 – I) ; on répète l’expérience un grand nombre n de fois pour obtenir une valeur approchée de I... Comme avec le disque, le choix du point n°i sous la courbe, ou pas, peut être interprété comme une loi de Bernoulli Xi, pour laquelle le succès, ou 1, (le point tombe sous la courbe) a une probabilité de I et l’échec, ou 0, 1 – I. L’espérance d’une telle loi est I et son écart-type I I 1 . Si on réalise l’expérience n fois, on sait que la moyenne M des Xi a pour espérance I et pour écart-type I I 1 n . 32 Donc à l’extérieur de l’intervalle dans 5% des cas... 33 Comme on connaît , on sait que c’est bien le cas... 34 Si pour une intégrale simple, ce n’est pas probant par rapport aux autres méthodes classiques, en revanche, pour une intégrale multiple, cela peut donner efficacement un ordre de grandeur d’un résultat dont on n’a bien souvent pas idée. 35 Qui donc existe... © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 485 4.3 Le jeu de franc-carreau C’est un exemple de probabilité géométrique que l’on aborde bien souvent la classe de troisième. Voilà ce qu’en dit l’Encyclopédie de Diderot et d’Alembert juste après l’article Carreau Franc-Carreau, sorte de jeu dont M. de Buffon a donné le calcul en 1733, avant que d'être de l'Académie des Sciences. Voici l'extrait qu'on trouve de son mémoire sur ce sujet, dans le volume de l'Académie pour cette année-là. Dans une chambre carrelée de carreaux égaux, & supposés réguliers, on jette en l'air un louis ou un écu, & on demande combien il y a à parier que la pièce ne tombera que sur un seul carreau, ou franchement. Nous nous proposons d’abord de réaliser une simulation de ce jeu. Nous partageons au préalable l’écran en deux parties, un partie supérieure avec l’application Graphiques et une partie inférieure avec l’application Géométrie dans laquelle nous plaçons comme ci-dessus un curseur pour définir une variable n qui servira à relancer l’expérience (variation par pas de 1). Dans l’application Graphiques, on s’appuie sur un repère orthonormé pour réaliser le quadrillage cidessus : en gros de –6 à 6 sur l’axe des abscisses et de –4 à 4 sur l’axe des ordonnées36. On trace les droites perpendiculaires aux axes et passant par les points des axes dont les coordonnées sont entières, points qu’il faut avoir au préalable placés sur chacun des axes. On allonge si nécessaire les droites pour qu’elles atteignent le bord de l’écran. On masque ensuite les extrémités des axes, on cache la graduation et tout ce qui est inutile, pour arriver simplement au dessin qui précède. Il faut préparer maintenant le tracé du cercle, dont les paramètres vont être définis dans l’application Tableur & listes. En A2, on saisit une variable a, qui sera l’abscisse du centre, décrivant la loi uniforme sur l’intervalle [–6 ; 6] : =12.rand() – 6 +0.’n 36 Mais cela dépend de la résolution de l’écran. En tout état de cause, on place les droites sur l’ensemble de l’écran visible. © T³ France 2010 / Photocopie autorisée 486 Mathématiques et TI-Nspire puis en B2 une variable b, qui sera l’ordonnée du centre, décrivant la loi uniforme sur l’intervalle [–4 ; 4] : =8.rand() – 4 +0.’n enfin en A5 une variable rayon, avec la valeur 0,25 pour commencer. Le terme en apparence inutile 0.’n a pour rôle de relancer le calcul – et donc de modifier les coordonnées du centre du cercle – à chaque fois que l’on modifie la valeur de n, c’est-à-dire à chaque fois que l’on touche au curseur. En conséquence, le cercle va se déplacer dans le plan. Dans l’écran Graphiques, on fait afficher la valeur de la variable rayon : menu Texte, on saisit rayon, puis avec Calculer, on en demande la valeur. On trace ensuite un cercle de centre quelconque, en faisant apparaître ses coordonnées, et de rayon la valeur rayon que l’on vient de faire apparaître. On lie l’abscisse du centre à la variable a et son ordonnée à la variable b. Comment savoir s’il coupe ou non le quadrillage ? On s’appuie sur le fait que le quadrillage repose sur une graduation entière. Le cercle ne coupera pas le quadrillage lorsque chacune de ses deux coordonnées aura sa partie décimale 37 comprise entre r et 1– r. On peut ensuite démarre l’opération de capture : on ajoute rand()/108 à la variable noncoupe pour la modifier à tous les coups et en permettre la capture… … capture que l’on demande dans la colonne D… … dans la colonne E, on prend la partie entière de la colonne qui précède pour rétablir les valeurs correctes et annuler l’effet du rand()/108 37 On utilise x – int(x) car fpart(x) renvoie des résultats qui ne conviennent pas lorsque x est négatif. © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 487 Laissons tourner quelque temps la simulation : On obtient une fréquence proche de 0,25. Le résultat peut être facilement justifié. Regardons ce qu’en dit la célèbre Encyclopédie. Supposons que le carreau donné soit quarré; dans ce quarré inscrivons-en un autre qui en soit distant partout de la longueur du demi-diamètre de la pièce; il est évident que toutes les fois que le centre de la pièce tombera sur le petit quarré ou sur sa circonférence, la pièce tombera franchement; & qu'au contraire elle ne tombera pas franchement, si le centre de la pièce tombe hors du quarré inscrit: donc la probabilité que la pièce tombera franchement, est à la probabilité contraire, comme l'aire du petit quarré est à la différence de l'aire des deux quarrés. Le dessin ci-dessous illustre les explications de l’Encyclopédie : Le grand carré a pour côté 1. Le carré grisé est construit à une distance r des bords du grand carré. Il a donc une aire de 1 2r . 2 À chaque fois que le centre est situé à l’intérieur du carré grisé, le cercle est franc-carreau, c’est-à-dire qu’il ne coupe pas les bords du grand carré (figure de droite) ; si le centre n’est pas à l’intérieur du grand carré, le cercle coupe les bords du grand carré. La probabilité d’être franc-carreau est alors une probabilité géométrique. © T³ France 2010 / Photocopie autorisée 488 Mathématiques et TI-Nspire Elle vaut : 2 aire du carré grisé 1 1 2r avec r compris entre 0 et . aire du grand carré 2 Avec r = 0,25, on trouve bien une probabilité égale à 0,25. 1 , la probabilité vaut 0, ce que 2 l’on peut comprendre intuitivement. On peut, par exemple, déterminer le rayon du cercle pour que la 1 probabilité soit égale à : 2 Quand r vaut 0, la probabilité est égale à 1 tandis que quand r vaut La représentation graphique de la fonction p qui à x associe 1 2x est donnée ci-après : 2 La fonction est bien sûr décroissante quand le rayon augmente. © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 489 ANNEXE : dénombrer les surjections Définition Soient E et F deux ensembles respectivement de cardinaux n et p. On note S(n,p) le nombre de surjections de E dans F. Si p est strictement supérieur à n, il est clair que S(n,p) = 0. On suppose donc dans la suite que n est supérieur ou égal à p. Se donner une surjection de E sur F équivaut : d’abord se donner une partition de E en p sous-ensembles, formées des éléments qui vont avoir tous la même image par la surjection ; enfin établir une bijection entre ces p sous-ensembles et F. On en déduit la définition et les résultats qui suivent. Définition Soient E de cardinal n. On appelle p-partition de E toute partition en p sous-ensembles non vides. Théorème Si on note S np le nombre de p-partitions de E, on peut écrire : S n, p p!Snp . Définition Les nombres S np sont appelés nombres de Stirling de deuxième espèce. Il nous reste à dénombrer le nombre de p-partitions ensemble E à n éléments. Relations de récurrence Considérons un ensemble E de cardinal n + 1 : E x1 , x2 ,..., xn1 . Cherchons le nombre de p-partitions de E. On peut répartir ces p-partitions en deux catégories : celles qui contiennent le singleton xn1 comme sous-ensemble de cette partition : il y en a autant que de (p – 1)-partitions de l’ensemble à n éléments x1 , x2 ,..., xn , soit Snp 1 celle qui ne contiennent pas le singleton x1 , x2 ,..., xn xn1 : il y a alors S np p-partitions de l’ensemble et p possibilités d’y adjoindre l’élément xn 1 , soit au total pSnp . Bref, on a prouvé que : Snp1 Snp 1 pSnp pour n et p entiers naturels, avec n supérieur ou égal à p. En multipliant par p!, on peut écrire : p!Snp1 p!Snp 1 p! pSnp soit S n 1, p p S n, p 1 p S n, p p S n, p 1 S n, p . © T³ France 2010 / Photocopie autorisée 490 Mathématiques et TI-Nspire On a donc : S n 1, p p S n, p 1 S n, p pour n et p entiers naturels, n étant supérieur ou égal à p. À l’aide de ces formules de récurrence, nous pouvons lister dans une feuille de calcul les premiers S np , nombres de Stirling de deuxième espèce : et S n, p , nombre de surjections d’un ensemble à n éléments vers un ensemble à p éléments Calcul explicite de S(n,p) Tentons de dénombrer directement le nombre de surjections de E dans F, en conservant les notations précédentes. © T³ France 2010 / Photocopie autorisée Quelques exemples de simulation 491 Posons F y1 , y2 ,..., y p . Soit NS l’ensemble de toutes les applications de E dans F qui ne sont pas des surjections, ensemble que nous allons chercher à dénombrer. Nous poserons : A1 f NS / y1 f E A2 f NS / y2 f E … Ap f NS / y p f E Il est clair que NS A1 A2 ... Ap . Nous appliquerons la formule suivante38, qui est l’analogue en dénombrement de la formule de Poincaré en probabilité : p card A car A1 A2 ... Ap 1i j p 1 k 1 1i1 ...ik p card Ai1 ... Aik ... 1 p 1 card A1 ... Ap card Ai1 ... Aik k 1 1i1 ...ik p Chacun des termes peut facilement être évalué : p card Ai A j ... i i 1 1 k 1 p card A p p 1 card Ai p 1 donc n i i 1 card Ai Aj p 2 donc n n p n p 1 ; 1 p n card Ai Aj p 2 ; 2 1i j p … card Ai1 Ai2 ... Aik p k donc n p n card Ai1 Ai2 ... Aik p k ; k 1i j p … card A1 A2 ... Ap 1 p p 1 1 donc la somme des p termes semblables au n p n précédent vaut p 1 p p 1 p 1 p n card A1 A2 ... Ak 0 p p … p … si bien que : 38 Appelée parfois formule de Sylvester. © T³ France 2010 / Photocopie autorisée 492 Mathématiques et TI-Nspire p p p n n n card NS p 1 p 2 p 3 ... 1 2 3 n m 1 p n p p 1 p m ... 1 p p 1 m p 1 On en déduit que le nombre de surjections de E sur F est donné par : p p p n n n S n, p p n p 1 p 2 p 3 ... 1 2 3 n m p n p 1 p 1 p m ... 1 p p 1 m p 1 p 1 k p n 1 p k k k 0 © T³ France 2010 / Photocopie autorisée