PRONOSTIC DE DECES OU SURVIE DE VICTIMES D'INFARCTUS DU MYOCARDE Sur un échantillon de patients entrant à l'hôpital suite à un accident cardiaque, sept variables sont mesurées (fréquence cardiaque, index cardiaque, index systolique, pression diastolique, pression artérielle pulmonaire, pression ventriculaire, résistance pulmonaire). Nous nous intéressons notamment à l'influence de ces variables sur l'issue de l'accident cardiaque : décès ou survie de la victime. Les données se trouvent dans le répertoire sur tice et s'appelle Myocarde.txt Les colonnes sont : FreqCard IndCard IndSys PresDias PAPulm PVent ResPulm Issue FreqCard=fréquence cardiaque IndCard=index cardiaque IndSys=index systolique PresDias=pression diastolique PAPulm=pression artérielle pulmonaire PVent=pression ventriculaire ResPulm=resistance pulmonaire Issue= décès/survie Pistes Effectuer une analyse descriptive des données. Etudier comment varie la probabilité de survie en fonction des variables -> construction d'un prédicteur. Réfléchir aux variables à retenir Evaluer les performances du prédicteur. Mémo SAS Faire un histogramme proc GChart data=table; pattern1 c=black v=solid; -> pour pouvoir visualiser pattern2 c=black v=empty; -> deux histogrammes surperposés vbar Variables / subgroup=VariableQualitative; -> détermine les groupes run; Faire des tests de comparaison de moyennes proc TTest data=table noprob -> pour ne pas afficher les tests et les probas nosimple -> pour ne pas afficher les statistiques descriptives ; class VariableQualitative; var Variables; run; Calculer des corrélations ->détermine les groupes proc corr data=table; run; par groupe : il faut d'abord trier la table proc sort data=table; by VariableQualitative; run; proc corr data=table; var VariablesQuantitatives; (par défaut, calcule pour toutes les Vquan. de la table) run; Faire une régression logistique Dans le programme précédent, on avait utilisé la procédure genmod qui est la procédure générale pour étudier un modèle linéaire généralisé. Pour une régression logistique, il existe une procédure spécifique à la régression logistique proc Logistic data=table; model VaribleQualitative= Variables / outroc=ROC -> pour créer une table roc selection=stepwise -> pour sélectionner les variables output ; out=LOGIT -> pour créer une table avec les résultats predprobs=x -> pour obtenir les prédictions par validation-croisée ; run; Faire la courbe ROC data ROC; set ROC; _Spec_=1-_1MSpec_; proc gplot data=ROC; symbol1 i=join v=none l=1 c=black; symbol2 i=join v=none l=2 c=red; plot _Sensit_*_Prob_ _Spec_*_Prob_ / overlay; -> superpose les graphes run;