Programme du Cours Analyse de données avec Stata Année universitaire 2015 - 2016 SESSION 1 : Commandes Stata et tests univariés 2 - 6 novembre 2015 Co-directeurs Arnaud FONTANET et Yoann MADEC Institut Pasteur Unité d’Epidémiologie des Maladies Emergentes Chefs de travaux Loïc CHARTIER LYSARC Centre Hospitalier Lyon-Sud Bich-Tram HUYNH Lénaig LE FOULER Institut Pasteur Unité de Pharmacoépidémiologie et Maladies Infectieuses DESCRIPTION DU COURS Cette première session Stata alternant cours théoriques et travaux dirigés débutera par la manipulation de fichiers (ouverture, importation de données, fusion de fichiers), l’exploration d’une base de données (structure, recherche de doublons, données manquantes, valeurs aberrantes, recodage des variables), et la réalisation de graphiques. Puis seront étudiés les tests statistiques (paramétriques et non paramétriques) comparant des variables discrètes ou continues entre deux groupes indépendants (Test t de Student, test de Mann-Whitney, test du Chi² ou test exact de Fisher), plus de deux groupes indépendants (Analyse de variance, test de Kruskal-Wallis, comparaisons multiples) ou deux groupes appariés (Test de Student sur séries appariées, test des rangs signés de Wilcoxon, test de Mc Nemar). Enfin, les étudiants apprendront comment faire un calcul de taille d’échantillon avec Stata. ******* Analyse de données avec Stata - Session 1 Lundi 2 novembre 2015 9h00 - 9h30 Accueil des étudiants Secrétariat de la Scolarité, A. Fontanet B. T. Huynh, L. Chartier et L. Le Fouler 9h30 - 12h30 Introduction à l'analyse de données sur Stata B. T. Huynh L. Chartier L. Le Fouler 13h30 - 17h00 Exploration d'un fichier de données B. T. Huynh L. Chartier L. Le Fouler Mardi 3 novembre 2015 9h00 - 12h30 Création de variables B. T. Huynh L. Chartier L. Le Fouler 13h30 - 17h00 Organisation d'une base de données B. T. Huynh L. Chartier L. Le Fouler Mercredi 4 novembre 2015 9h00 - 13h00 Contrôle de qualité des données / nettoyage B. T. Huynh L. Chartier L. Le Fouler 14h00 - 17h00 Commandes pour faire des graphiques B. T. Huynh L. Chartier L. Le Fouler Jeudi 5 novembre 2015 9h00 - 13h00 Comparaison de variables continues entre deux / plusieurs groupes A. Fontanet, B. T. Huynh L. Le Fouler 14h00 - 17h00 Comparaison de variables discrètes entre deux / plusieurs groupes A. Fontanet, B. T. Huynh L. Le Fouler Vendredi 6 novembre 2015 9h00 - 12h30 Taille d'échantillon / Révisions 14h00 - 17h00 Examen : analyse d'une base de données à l'aide du logiciel Stata (faite de façon individuelle et guidée par des questions) durée 3h00, noté sur 20 A. Fontanet, B. T. Huynh L. Le Fouler Pôle Epidémiologie et Santé Publique Programme du cours Analyse de données avec Stata Année universitaire 2015 - 2016 SESSION 2 : Régression logistique 14 - 18 décembre 2015 Co-directeurs Arnaud FONTANET et Yoann MADEC Unité de recherche et d'expertise Epidémiologie des Maladies Emergentes Institut Pasteur Chefs de travaux Lénaig LE FOULER Unité de Pharmacoépidémiologie et maladies infectieuses Institut Pasteur Laura TONDEUR Unité de recherche et d'expertise Epidémiologie des Maladies Emergentes Institut Pasteur DESCRIPTIF Le cours Stata 2 est destiné à des personnes ayant déjà été initiées au logiciel Stata, et possédant des connaissances en statistiques de niveau Césam ou équivalent. Ce cours permettra aux participants de savoir analyser une base de données, de construire un modèle de régression logistique et de pouvoir interpréter les résultats obtenus. Les enseignements, répartis sur 5 journées, porteront sur l’introduction à la régression logistique, la prise en compte de facteurs de confusion, l’évaluation d’une interaction entre facteurs et enfin la construction d’un modèle de régression logistique. Seront également abordées les techniques de mesure d’adéquation du modèle, la construction d’un score clinique prédictif, les méthodes d’imputation multiple, et la régression logistique conditionnelle pour les observations appariées. En pratique, les matinées seront consacrées à une partie théorique suivie d’exercices commentés ; les après-midi seront dédiés à des travaux dirigés avec mise en application sur des bases de données réelles, chaque participant bénéficiant d’un ordinateur individuel. Les enseignants assisteront les étudiants et corrigeront les exercices proposés. Le cours sera validé par un examen final. ***** Lundi 14 décembre 2015 9h00 - 9h30 Accueil des étudiants Arnaud Fontanet Lénaig Le Fouler Laura Tondeur 9h30 - 10h30 Introduction à la régression logistique Arnaud Fontanet 10h45 - 12h30 Exercices commentés Arnaud Fontanet 14h00 - 17h30 Travaux dirigés Arnaud Fontanet Lénaig Le Fouler Laura Tondeur Mardi 15 décembre 2015 9h00 - 10h30 Comment évaluer l'effet d'un facteur de confusion ? Arnaud Fontanet 10h45 - 12h30 Exercices commentés Arnaud Fontanet 14h00 - 17h30 Travaux dirigés Arnaud Fontanet Lénaig Le Fouler Laura Tondeur Mercredi 16 décembre 2015 9h00 - 10h30 Comment évaluer une interaction entre deux facteurs ? Arnaud Fontanet 10h45 - 12h30 Exercices commentés Arnaud Fontanet 14h00 - 17h30 Travaux dirigés Arnaud Fontanet Lénaig Le Fouler Laura Tondeur Jeudi 17 décembre 2015 9h00 - 10h30 Comment construire un modèle ? Arnaud Fontanet 10h45 - 12h30 Exercices commentés Arnaud Fontanet 14h00 - 17h30 Travaux dirigés Arnaud Fontanet Lénaig Le Fouler Laura Tondeur Vendredi 18 décembre 2015 9h00 - 12h30 Révisions et applications de la régression logistique Arnaud Fontanet 14h00 - 17h30 Examen : analyse d'une base de données à l'aide du logiciel Stata (durée 3h, noté sur 20) Arnaud Fontanet Lénaig Le Fouler Laura Tondeur ***** Pôle Epidémiologie & Santé Publique Cours Analyse de données avec Stata Année universitaire 2015 - 2016 SESSION 3 : ANALYSE DE SURVIE ET MODELES DE COX 9 - 13 mai 2016 Co-directeur Co-directeur et enseignant Arnaud FONTANET Yoann MADEC Unité de Recherche et d'Expertise Epidémiologie des Maladies Emergentes Institut Pasteur Chefs de travaux Bich-Tram HUYNH Laura TONDEUR Unité de Biostatistiques, biomathématiques et pharmacoépidémiologie des maladies infectieuses Institut Pasteur Unité de Recherche et d'Expertise Epidémiologie des Maladies Emergentes Institut Pasteur DESCRIPTIF DU COURS Le cours Stata 3 est destiné à des personnes ayant déjà été initiées au logiciel Stata, et possédant des connaissances en statistiques (niveau CESAM ou équivalent). Cet enseignement à pour objectif de se familiariser avec les données de survie et les données de cohortes, et de pouvoir effectuer une analyse de survie à l’aide du logiciel Stata. Les méthodes abordées sont les méthodes d’analyse de survie non paramétriques (courbes de Kaplan-Meier et test du logrank), semi-paramétriques (modèle de Cox) et les méthodes paramétriques. Ce cours permettra aux participants de savoir analyser une base de données, de construire un modèle de régression et de pouvoir interpréter les résultats obtenus. En pratique, cet enseignement est reparti sur 5 journées. Les matinées seront consacrées à la théorie ; les après-midi seront dédiés à des travaux dirigés avec mise en application sur des bases de données réelles, chaque participant bénéficiant d’un ordinateur individuel. Les enseignants assisteront les étudiants et corrigeront les exercices proposés. Le cours sera validé par un examen final. _________ Cours Analyse de données avec Stata SESSION 3 : ANALYSE DE SURVIE ET MODELES DE COX Lundi 9 mai 2016 9h00 - 9h30 Accueil des étudiants 9h30 - 12h00 Introduction aux analyses de survie et utilisation du logiciel Stata 14h00 - 17h00 Travaux dirigés Y. Madec, B-T. Huynh, L. Tondeur, et le Secrétariat de la Scolarité Y. Madec Y. Madec, B-T. Huynh et L. Tondeur Mardi 10 mai 2016 9h00 - 12h00 Méthode de survie non-paramétrique (estimateur de Kaplan-Meier) 14h00 - 17h00 Travaux dirigés Y. Madec Y. Madec, B-T. Huynh et L. Tondeur Mercredi 11 mai 2016 9h00 - 12h00 Méthode de survie semi-paramétrique : modèle de Cox 14h00 - 17h00 Travaux dirigés Y. Madec Y. Madec, B-T. Huynh et L. Tondeur Jeudi 12 mai 2016 9h00 - 12h00 Méthodes de survies paramétriques 14h00 - 17h00 Travaux dirigés Y. Madec Y. Madec, B-T. Huynh et L. Tondeur Vendredi 13 mai 2016 9h00 - 12h00 Révisions Y. Madec 14h00 - 17h00 Examen L’examen du cours consiste en une analyse statistique à mener sur une base de données longitudinale comprenant des données de survie. Durée 3 heures Y. Madec