Chapitre 1
Préambule
The capricious gods that were previously invoked to explain the lack of predicta-
bility in the world have been replaced by mathematical, statistical and computer-
based models that allow us to understand and manipulate uncertain events.
D. Hand, H. Mannila, P. Smyth (2001). Principles of Data Mining, MIT Press.
Ce cours développe la théorie des probabilités et adopte un point de
vue pragmatique : il s’agit de pouvoir utiliser des éléments de cette théorie
à des fins informatiques. Les probabilités interviennent souvent dès lors
que l’on veut analyser le comportement d’un algorithme ou comprendre
comment se distribuent certains objets de l’informatique en fonction de
paramètres de forme : les permutations, les arbres, les graphes, etc.
Un autre aspect présent dans ce cours est la simulation : les processus
probabilistes prennent tout leur sens en informatique dès lors que l’on
peut leur donner corp et les “faire vivre” en machine. La simulation appa-
raît comme une alternative, parfois obligée, à une analyse mathématique
(analytique) en proposant plutôt une imitation d’un système. Elle met en
oeuvre un modèle (agençant mathématique et informatique), est souvent
conceptuellement plus simple et permet d’obtenir des informations quan-
titatives là où l’analyse mathématique échoue.
Les simulations sont aujourd’hui très populaires et sont pratiquées dans
de nombreux domaines scientifiques, technologiques, industriels et éco-
nomiques. Une simulation génère un volume important de données décri-
vant un système (à travers le modèle que l’on en a formulé). Contrairement
à une étude analytique, les inférences liées à la simulation (les conclusions
tirées des valeurs observées) sont de nature statistiques et peuvent être in-
terprétées de façon équivoque. Les résultats obtenus sont intimement liés
aux postulats de départ et une légère variation de ceux-ci peut modifier ra-
dicalement les résultats obtenus (selon la sensibilité du modèle). La mise
au point de simulations requière la génération de valeurs possibles de cer-
tains paramètres dont on suppose souvent qu’ils suivent une loi de proba-
bilité, ou de certains processus que l’on modélisent à l’aide de processus
5