MAT-4200 Description du travail # 1 Ce travail consiste à créer une banque de données réaliste dans le contexte de votre domaine d’études, à analyser ces données à l’aide de SPSS et de fournir des annotations/interprétations des résultats. 1. Définition d’un modèle : a. Définir une variable dépendante pertinente à votre domaine d’étude b. Définir quelques variables indépendantes susceptibles d’influencer la variable dépendante. c. Définir des paramètres (coefficients de régression) plausibles. d. Exemple : Influence du sexe, de la nature de l’école (publique ou privée), du score au GMAT, la moyenne pondérée cumulative au Lycée, et du statut socioéconomique du sujet, sur la performance dans un programme universitaire : 2. Utiliser la fonction TRANSFORM de SPSS pour générer des données pour chaque variable du modèle, de manière à avoir 150-200 observations (sujets) : a. Exemple : i. GMAT=RV.NORMAL(250,50) : GMAT est normalement distribuée avec une moyenne de 250 et un écart-type de 50 ii. SEXE=RV.BERNOUILLI(.6) : une variable binaire avec environ 60% de 1=Femme, et 40% de 0=Homme iii. PUBLIQUE=RV.BERNOUILLI(.8) : une variable binaire avec environ 80% de i=École publique, et 20% de 0 = École privée iv. GPA=.3*GMAT+RV.NORMAL(0,10) : GPA est corrélée avec GMAT… L’ajout d’une erreur (RV.NORMAL(0,10)) permet d’éviter une relation parfaite! v. SES=RV.F(5,20) : Distribution asymétrique positive du statut socioéconomique… vi. PERFORM=1.2*SEXE-0.8*PUBLIQUE+1.5*GMAT+.92*GPA-0.3*SES56.2+RV.NORMAL(0,70) b. NOTE : i. J’utilise des valeurs arbitraires pour les coefficients. ii. Il ne faut pas oublier d’inclure des erreurs (RV.NORMAL(0,x.yy) dans la définition des variables dépendantes… iii. Des données collinéaires sont générées en définissant une équation de régression entre variables indépendantes, comme en (iv)… iv. Et on peut introduire des données extrêmes en éditant quelques données pour inclure des valeurs ‘hors-norme’… v. Faire en sorte que le modèle ne soit pas trop ‘parfait’! Jouer avec les valeurs des coefficients et la variabilité des erreurs pour rendre la banque de données plus réaliste… 3. Analyser les données de manière exhaustive avec SPSS et/ou AMOS… a. Faire le tour des options disponibles b. Essayer différentes procédures. Par exemple, entrée forcée de toutes les variables indépendantes vs une procédure par étape ou hiérarchique c. Produire le diagnostic de la régression 4. Commenter/annoter les résultats : a. Faire ressortir les statistiques les plus pertinentes et en donner une interprétation i. Coefficients de régression ii. Coefficient de détermination iii. Diagnostic de collinéarité iv. etc