2
Random Forest: principe
u Principe du test:
- Utiliser un grand nombre d’arbres de décision construits
chacun avec un sous-échantillon différent de l’ensemble
des données (bootstraping)
- Pour chaque construction d’arbre, la décision à un nœud
(répartition des objets) est faite en fonction d’un sous-
ensemble de variables tirées au hasard: on tire
aléatoirement m variables parmi les p disponibles et on
cherche parmi celles-ci la meilleure coupure (avec toujours
le même critère).
- Utilise l’ensemble des arbres de décision produits pour
faire la prédiction/choisir le nombre de groupes, avec un
choix fait à la majorité.
- Classification: variable prédite est de type facteur;
Régression: variable prédite de type numérique