Université de Montpellier 2
M2 MASS
TP5 : Introduction au logiciel SAS
Classification supervisée : Analyses Discriminantes et Régression Logistique
1 Les données
On étudie les données du fichier entreprises.txt qui présentent 46 entreprises dont certaines
ont fait faillite (valeur 1) et d’autres ont gardé une situation financière stable (valeur 2). On
dispose de 4 variables quantitatives X1, X2, X3et X4qui décrivent la situation des entreprises :
–X1: Flux de trésorerie/Dette totale
–X2: Revenu Net/ Total des actifs au bilan
–X3: Actif réalisable et disponible/Passif courant
–X4: Actif réalisable/Ventes nettes
Le passif représente ce que l’entreprise doit. Le passif courant regroupe les dettes des fournis-
seurs, les provisions, les emprunts. Ce sont des dettes dont l’échéance est inférieure à 12 mois
(court terme).
L’actif désigne l’ensemble du patrimoine de l’entreprise.
La variable X1est un indicateur de la bonne santé de l’entreprise. Le Flux de trésorerie est
la différence entre les recettes et les dépenses. Si X1est négative, c’est que le flux de trésorerie
est négatif : les dépenses de l’entreprise sont supérieures aux recettes.
La variable X2mesure la performance de production de l’entreprise : c’est un indicateur de
la rentabilité globale de l’entreprise.
La variable X3exprime la capacité de l’entreprise à rembourser ses dettes à court terme.
Deux ans après le recueil de ces données, on sait que 21 de ces entreprises ont fait faillite et
que 25 ont conservé une situation financière stable. On cherche à mettre en œuvre des méthodes
de classification supervisée afin de prédire à 2 ans la situation financière des entreprises.
Première Analyse des données
La procédure DISCRIM de SAS permet de faire une analyse discriminante des données.
1. Créer la table SAS des données à partir du fichier entreprise.txt disponible sur l’ENT. Ajouter
une variable qualitative situation dont les modalités sont "Faillite" ou "Stable" selon l’état
de l’entreprise (1 ou 2).
2. Réaliser une PROC MEANS de la table créée pour visualiser l’étendue de chacune des variables.
3. Représenter les couples de variables (X1, X2) (X1, X3) (X1, X4)et (X2, X3)en utilisant un
style différent pour les entreprises ayant fait faillite et les autres. Pour cela on définit un style
de graphique à l’aide de la PROC TEMPLATE et on utilise la procédure SGRENDER. Cette procédure
permet de faire des graphiques à partir de modèles qui ont été définis par la procédure TEMPLATE.