Guide de l’analyse prédicve
4
résultats futurs. An de pouvoir faire des prédicons
sur la base d’un ensemble de données spécique,
on ulise une ou plusieurs variables prédicves pour
prédire une variable réponse. Sous sa forme la plus
simple, l’analyse prédicve est un support permet-
tant d’établir des prévisions pour la prise de décision
en entreprise. Pour des exigences plus complexes,
on ulise des techniques d’analyse prédicve avan-
cées an d’orienter les processus stratégiques de
l’entreprise. Cee secon vous présente une vue
d’ensemble des principales catégories de l’analyse
prédicve : l’apprenssage supervisé et l’apprens-
sage non supervisé.
L’apprenssage supervisé est divisé en deux grandes
catégories : la régression pour les réponses quan-
taves (une valeur numérique), par exemple le
nombre de kilomètres par litre d’essence pour une
voiture donnée, et la classicaon pour les réponses
qui peuvent uniquement prendre quelques valeurs
connues, telles que « vrai » ou « faux ».
• Régression : la régression est la forme la plus
courante de l’analyse prédicve. Elle fait inter-
venir une variable réponse quantave (ce que
vous tentez de prédire), par exemple le prix de
vente d’une maison, selon une série de variables
prédicves (nombre de mètres carrés, nombre
de chambres, revenus moyens dans le voisinage
selon les données de recensement...). La rela-
on entre le prix de vente et les prédicteurs de
l’ensemble d’apprenssage fournirait un modèle
prédicf.
Les méthodes de régression, y compris celles
menonnées ci-dessus, sont nombreuses : ré-
gression linéaire mulvariée, régression polyno-
miale, arbres de régression, pour n’en citer que
quelques-unes.
• Classicaon : la classicaon est un autre
type d’analyse prédicve communément u-
lisé. Elle fait intervenir une variable réponse
qualitave, par exemple l’échelle salariale, qui
peut être partagée en trois classes ou catégo-
ries : salaire élevé, salaire moyen et bas salaire.
Cee méthode examine un ensemble de don-
nées dans lequel chaque observaon conent
des informaons sur la variable réponse ainsi
que sur les variables prédicves. Supposons
qu’un analyste souhaite pouvoir classier
l’échelle salariale de personnes n’appartenant
pas à l’ensemble de données, en foncon des
caractérisques associées à ces personnes, par
exemple l’âge, le sexe et la profession. Cee
tâche de classicaon se déroulerait de la ma-
nière suivante : examiner l’ensemble de don-
nées contenant les variables prédicves et la
variable réponse déjà classiée, l’échelle sala-
riale. L’algorithme apprend ainsi les combinai-
sons de variables associées à tel ou tel niveau
de l’échelle salariale. Cet ensemble de don-
nées est appelé l’ensemble d’apprenssage.
L’algorithme examinerait ensuite les nouvelles
observaons pour lesquelles aucune infor-
maon sur l’échelle salariale n’est disponible.
Sur la base des classicaons dans l’ensemble
d’apprenssage, l’algorithme aribuerait des
classicaons aux nouvelles observaons. Par
exemple, une directrice markeng de 51 ans
pourrait être classée dans l’échelon des reve-
nus élevés.
Les types de méthodes de classicaon sont
nombreux : régression logisque, arbres de
décision, machines à vecteurs de support,
forêts aléatoires, k plus proches voisins, naïve
bayésienne, etc.
L’apprenssage non supervisé permet de rer des
conclusions à parr d’ensembles de données compo-
sés de données en entrée sans réponses équetées.
La méthode d’apprenssage non supervisé la plus
Les classes dans l’analyse prédicve
La régression est la forme la plus
courante de l’analyse prédicve. Elle
fait intervenir une variable réponse
quantave (ce que vous tentez de
prédire).
La classicaon est un autre type
d’analyse prédicve communé-
ment ulisé. Elle fait intervenir une
variable réponse qualitave. Cee
méthode examine un ensemble de
données dans lequel chaque obser-
vaon conent des informaons sur
la variable réponse ainsi que sur les
variables prédicves.