Telechargé par Wougens Vincent

Travail Pratique

publicité
MAT-4200
Description du travail # 1
Ce travail consiste à créer une banque de données réaliste dans le contexte de votre domaine
d’études, à analyser ces données à l’aide de SPSS et de fournir des annotations/interprétations
des résultats.
1. Définition d’un modèle :
a. Définir une variable dépendante pertinente à votre domaine d’étude
b. Définir quelques variables indépendantes susceptibles d’influencer la variable
dépendante.
c. Définir des paramètres (coefficients de régression) plausibles.
d. Exemple : Influence du sexe, de la nature de l’école (publique ou privée), du
score au GMAT, la moyenne pondérée cumulative au Lycée, et du statut socioéconomique du sujet, sur la performance dans un programme universitaire :
2. Utiliser la fonction TRANSFORM de SPSS pour générer des données pour chaque variable
du modèle, de manière à avoir 150-200 observations (sujets) :
a. Exemple :
i. GMAT=RV.NORMAL(250,50) : GMAT est normalement distribuée avec
une moyenne de 250 et un écart-type de 50
ii. SEXE=RV.BERNOUILLI(.6) : une variable binaire avec environ 60% de
1=Femme, et 40% de 0=Homme
iii. PUBLIQUE=RV.BERNOUILLI(.8) : une variable binaire avec environ 80% de
i=École publique, et 20% de 0 = École privée
iv. GPA=.3*GMAT+RV.NORMAL(0,10) : GPA est corrélée avec GMAT… L’ajout
d’une erreur (RV.NORMAL(0,10)) permet d’éviter une relation parfaite!
v. SES=RV.F(5,20) : Distribution asymétrique positive du statut socioéconomique…
vi. PERFORM=1.2*SEXE-0.8*PUBLIQUE+1.5*GMAT+.92*GPA-0.3*SES56.2+RV.NORMAL(0,70)
b. NOTE :
i. J’utilise des valeurs arbitraires pour les coefficients.
ii. Il ne faut pas oublier d’inclure des erreurs (RV.NORMAL(0,x.yy) dans la
définition des variables dépendantes…
iii. Des données collinéaires sont générées en définissant une équation de
régression entre variables indépendantes, comme en (iv)…
iv. Et on peut introduire des données extrêmes en éditant quelques données
pour inclure des valeurs ‘hors-norme’…
v. Faire en sorte que le modèle ne soit pas trop ‘parfait’! Jouer avec les
valeurs des coefficients et la variabilité des erreurs pour rendre la banque
de données plus réaliste…
3. Analyser les données de manière exhaustive avec SPSS et/ou AMOS…
a. Faire le tour des options disponibles
b. Essayer différentes procédures. Par exemple, entrée forcée de toutes les
variables indépendantes vs une procédure par étape ou hiérarchique
c. Produire le diagnostic de la régression
4. Commenter/annoter les résultats :
a. Faire ressortir les statistiques les plus pertinentes et en donner une
interprétation
i. Coefficients de régression
ii. Coefficient de détermination
iii. Diagnostic de collinéarité
iv. etc
Téléchargement