Analyse de données avec Stata

publicité
Programme du Cours
Analyse de données avec Stata
Année universitaire 2015 - 2016
SESSION 1 :
Commandes Stata et tests univariés
2 - 6 novembre 2015
Co-directeurs
Arnaud FONTANET et Yoann MADEC
Institut Pasteur
Unité d’Epidémiologie des Maladies Emergentes
Chefs de travaux
Loïc CHARTIER
LYSARC
Centre Hospitalier Lyon-Sud
Bich-Tram HUYNH
Lénaig LE FOULER
Institut Pasteur
Unité de Pharmacoépidémiologie
et Maladies Infectieuses
DESCRIPTION DU COURS
Cette première session Stata alternant cours théoriques et travaux dirigés débutera par la
manipulation de fichiers (ouverture, importation de données, fusion de fichiers), l’exploration
d’une base de données (structure, recherche de doublons, données manquantes, valeurs
aberrantes, recodage des variables), et la réalisation de graphiques.
Puis seront étudiés les tests statistiques (paramétriques et non paramétriques) comparant des
variables discrètes ou continues entre deux groupes indépendants (Test t de Student, test de
Mann-Whitney, test du Chi² ou test exact de Fisher), plus de deux groupes indépendants
(Analyse de variance, test de Kruskal-Wallis, comparaisons multiples) ou deux groupes
appariés (Test de Student sur séries appariées, test des rangs signés de Wilcoxon, test de Mc
Nemar).
Enfin, les étudiants apprendront comment faire un calcul de taille d’échantillon avec Stata.
*******
Analyse de données avec Stata
- Session 1 Lundi 2 novembre 2015
9h00 - 9h30
Accueil des étudiants
Secrétariat de la Scolarité, A. Fontanet
B. T. Huynh, L. Chartier
et L. Le Fouler
9h30 - 12h30
Introduction à l'analyse de données sur Stata
B. T. Huynh
L. Chartier
L. Le Fouler
13h30 - 17h00
Exploration d'un fichier de données
B. T. Huynh
L. Chartier
L. Le Fouler
Mardi 3 novembre 2015
9h00 - 12h30
Création de variables
B. T. Huynh
L. Chartier
L. Le Fouler
13h30 - 17h00
Organisation d'une base de données
B. T. Huynh
L. Chartier
L. Le Fouler
Mercredi 4 novembre 2015
9h00 - 13h00
Contrôle de qualité des données / nettoyage
B. T. Huynh
L. Chartier
L. Le Fouler
14h00 - 17h00
Commandes pour faire des graphiques
B. T. Huynh
L. Chartier
L. Le Fouler
Jeudi 5 novembre 2015
9h00 - 13h00
Comparaison de variables continues
entre deux / plusieurs groupes
A. Fontanet, B. T. Huynh
L. Le Fouler
14h00 - 17h00
Comparaison de variables discrètes
entre deux / plusieurs groupes
A. Fontanet, B. T. Huynh
L. Le Fouler
Vendredi 6 novembre 2015
9h00 - 12h30
Taille d'échantillon / Révisions
14h00 - 17h00
Examen : analyse d'une base de données à l'aide
du logiciel Stata (faite de façon individuelle et
guidée par des questions)
durée 3h00, noté sur 20
A. Fontanet, B. T. Huynh
L. Le Fouler
Pôle Epidémiologie et Santé Publique
Programme du cours
Analyse de données avec Stata
Année universitaire 2015 - 2016
SESSION 2 : Régression logistique
14 - 18 décembre 2015
Co-directeurs
Arnaud FONTANET et Yoann MADEC
Unité de recherche et d'expertise
Epidémiologie des Maladies Emergentes
Institut Pasteur
Chefs de travaux
Lénaig LE FOULER
Unité de Pharmacoépidémiologie et maladies infectieuses
Institut Pasteur
Laura TONDEUR
Unité de recherche et d'expertise
Epidémiologie des Maladies Emergentes
Institut Pasteur
DESCRIPTIF
Le cours Stata 2 est destiné à des personnes ayant déjà été initiées au logiciel Stata, et possédant
des connaissances en statistiques de niveau Césam ou équivalent.
Ce cours permettra aux participants de savoir analyser une base de données, de construire un
modèle de régression logistique et de pouvoir interpréter les résultats obtenus. Les enseignements,
répartis sur 5 journées, porteront sur l’introduction à la régression logistique, la prise en compte de
facteurs de confusion, l’évaluation d’une interaction entre facteurs et enfin la construction d’un
modèle de régression logistique.
Seront également abordées les techniques de mesure
d’adéquation du modèle, la construction d’un score clinique prédictif, les méthodes d’imputation
multiple, et la régression logistique conditionnelle pour les observations appariées.
En pratique, les matinées seront consacrées à une partie théorique suivie d’exercices commentés ;
les après-midi seront dédiés à des travaux dirigés avec mise en application sur des bases de
données réelles, chaque participant bénéficiant d’un ordinateur individuel. Les enseignants
assisteront les étudiants et corrigeront les exercices proposés. Le cours sera validé par un examen
final.
*****
Lundi 14 décembre 2015
9h00 - 9h30
Accueil des étudiants
Arnaud Fontanet
Lénaig Le Fouler
Laura Tondeur
9h30 - 10h30
Introduction à la régression logistique
Arnaud Fontanet
10h45 - 12h30
Exercices commentés
Arnaud Fontanet
14h00 - 17h30
Travaux dirigés
Arnaud Fontanet
Lénaig Le Fouler
Laura Tondeur
Mardi 15 décembre 2015
9h00 - 10h30
Comment évaluer l'effet d'un facteur de confusion ?
Arnaud Fontanet
10h45 - 12h30
Exercices commentés
Arnaud Fontanet
14h00 - 17h30
Travaux dirigés
Arnaud Fontanet
Lénaig Le Fouler
Laura Tondeur
Mercredi 16 décembre 2015
9h00 - 10h30
Comment évaluer une interaction
entre deux facteurs ?
Arnaud Fontanet
10h45 - 12h30
Exercices commentés
Arnaud Fontanet
14h00 - 17h30
Travaux dirigés
Arnaud Fontanet
Lénaig Le Fouler
Laura Tondeur
Jeudi 17 décembre 2015
9h00 - 10h30
Comment construire un modèle ?
Arnaud Fontanet
10h45 - 12h30
Exercices commentés
Arnaud Fontanet
14h00 - 17h30
Travaux dirigés
Arnaud Fontanet
Lénaig Le Fouler
Laura Tondeur
Vendredi 18 décembre 2015
9h00 - 12h30
Révisions et applications de la régression logistique
Arnaud Fontanet
14h00 - 17h30
Examen : analyse d'une base de données
à l'aide du logiciel Stata (durée 3h, noté sur 20)
Arnaud Fontanet
Lénaig Le Fouler
Laura Tondeur
*****
Pôle Epidémiologie & Santé Publique
Cours Analyse de données avec Stata
Année universitaire 2015 - 2016
SESSION 3 :
ANALYSE DE SURVIE ET MODELES DE COX
9 - 13 mai 2016
Co-directeur
Co-directeur et enseignant
Arnaud FONTANET
Yoann MADEC
Unité de Recherche et d'Expertise
Epidémiologie des Maladies Emergentes
Institut Pasteur
Chefs de travaux
Bich-Tram HUYNH
Laura TONDEUR
Unité de Biostatistiques, biomathématiques et
pharmacoépidémiologie des
maladies infectieuses
Institut Pasteur
Unité de Recherche et d'Expertise
Epidémiologie des Maladies Emergentes
Institut Pasteur
DESCRIPTIF DU COURS
Le cours Stata 3 est destiné à des personnes ayant déjà été initiées au logiciel Stata, et possédant
des connaissances en statistiques (niveau CESAM ou équivalent).
Cet enseignement à pour objectif de se familiariser avec les données de survie et les données de
cohortes, et de pouvoir effectuer une analyse de survie à l’aide du logiciel Stata. Les méthodes
abordées sont les méthodes d’analyse de survie non paramétriques (courbes de Kaplan-Meier et
test du logrank), semi-paramétriques (modèle de Cox) et les méthodes paramétriques. Ce cours
permettra aux participants de savoir analyser une base de données, de construire un modèle de
régression et de pouvoir interpréter les résultats obtenus.
En pratique, cet enseignement est reparti sur 5 journées. Les matinées seront consacrées à la
théorie ; les après-midi seront dédiés à des travaux dirigés avec mise en application sur des bases
de données réelles, chaque participant bénéficiant d’un ordinateur individuel. Les enseignants
assisteront les étudiants et corrigeront les exercices proposés. Le cours sera validé par un examen
final.
_________
Cours Analyse de données avec Stata
SESSION 3 :
ANALYSE DE SURVIE ET MODELES DE COX
Lundi 9 mai 2016
9h00 - 9h30
Accueil des étudiants
9h30 - 12h00
Introduction aux analyses de survie
et utilisation du logiciel Stata
14h00 - 17h00
Travaux dirigés
Y. Madec, B-T. Huynh, L. Tondeur,
et le Secrétariat de la Scolarité
Y. Madec
Y. Madec,
B-T. Huynh et L. Tondeur
Mardi 10 mai 2016
9h00 - 12h00
Méthode de survie non-paramétrique
(estimateur de Kaplan-Meier)
14h00 - 17h00
Travaux dirigés
Y. Madec
Y. Madec,
B-T. Huynh et L. Tondeur
Mercredi 11 mai 2016
9h00 - 12h00
Méthode de survie semi-paramétrique : modèle de Cox
14h00 - 17h00
Travaux dirigés
Y. Madec
Y. Madec,
B-T. Huynh et L. Tondeur
Jeudi 12 mai 2016
9h00 - 12h00
Méthodes de survies paramétriques
14h00 - 17h00
Travaux dirigés
Y. Madec
Y. Madec,
B-T. Huynh et L. Tondeur
Vendredi 13 mai 2016
9h00 - 12h00
Révisions
Y. Madec
14h00 - 17h00
Examen
L’examen du cours consiste en une analyse statistique à mener
sur une base de données longitudinale comprenant des données
de survie.
Durée 3 heures
Y. Madec
Téléchargement