© Benoit Duguay, 2014 Plan la séance 11 L’analyse multivariée Les tableaux croisés L’hypothèse Le test du khi carré Démonstration du logiciel SPSS (tableaux croisés) Autres types d’analyses multivariées Comparaison de moyennes Analyses de variance Analyses de corrélation Analyses de régression Atelier : Réaliser des analyses croisées avec vos données Rencontre de chacune des équipes avec le professeur © Benoit Duguay, 2014 Les tableaux croisés Analyse des données en fonction de deux variables (parfois plus) Variable indépendante VS variable dépendante Analyse du pourcentage des réponses selon la variable indépendante Comparaison des différences entre deux catégories de la variable indépendante © Benoit Duguay, 2014 Tableau croisé de la variable « Consommation » selon le sexe Existe-t-il des différences entre les hommes et les femmes dans le niveau de consommation? Consommation * Sexe Crosstabulation Les différences ne sont ni fortes, ni significatives (47,7%, p = 0,523) Consommation Plus Comparable Moins Total Count % within Sexe Count % within Sexe Count % within Sexe Count % within Sexe Sexe Féminin Masculin 17 13 17,7% 17,1% 64 46 66,7% 60,5% 15 17 15,6% 22,4% 96 76 100,0% 100,0% Total 30 17,4% 110 64,0% 32 18,6% 172 100,0% © Benoit Duguay, 2014 L’hypothèse Proposition, souvent intuitive, qui permet d’expliquer un phénomène, (p. ex. : Les hommes consomment plus que les femmes) Afin de rejeter ou non une hypothèse, on doit démontrer l’existence de différences significatives entre deux catégories d’une variable (p. ex. féminin ou masculin pour le sexe) par rapport à une autre variable (p. e. le niveau de consommation). Formulation H0 : %F = %M (hypothèse nulle : il n’existe pas de différence entre les femmes et les hommes [quant au niveau de consommation]) H1 : %F ≠ %M (hypothèse alternative il existe une différence entre les femmes et les hommes [quant au niveau de consommation]) Dans cet exemple (diapo précédente), on ne rejette PAS l’hypothèse nulle © Benoit Duguay, 2014 Test d’hypothèse : le test du khi carré (ou Khi deux – X2) Un test statistique parmi les plus utiles Utilisable avec tout type de données : PCQ tous les types de données peuvent être transformées en données nominales Détection de différence significatives entre les fréquences observées dans l’étude et les fréquences théoriques attendues Seuil de signification : probabilité permettant de rejeter ou non l’hypothèse nulle H0 usuel ≥ 95% (p ≤ 0,05) Tiré et adapté de: McGown, K.L., Marketing Research: Text and Cases, Winthrop Publishers, 1979, p. 236 © Benoit Duguay, 2014 Tableau croisé de la variable « Restaurant » selon l’estime de soi H0 : %SEI- = %SEI moyen = %SEI+ Il n’existe pas de différences entre le pourcentage des personnes dont l’estime est faible et celui des personnes dont l’estime est forte (quant à la mention du restaurant) L'estime de soi n'influence pas la mention du restaurant comme produit représentatif de l'image de soi H1 : %SEI- ≠ %SEI moyen ≠ %SEI+ Il existe des différences entre le pourcentage des personnes dont l’estime est faible et celui des personnes dont l’estime est forte (quant à la mention du restaurant) L'estime de soi influence la mention du restaurant comme produit représentatif de l'image de soi © Benoit Duguay, 2014 Tableau croisé de la variable « Restaurant » selon l’estime de soi H0 : %SEI - = %SEI moyen = %SEI + H1 : %SEI - ≠ %SEI moyen ≠ %SEI +Crosstab Restaurant Non Oui Total Count % within SEI personnel regroupé (3-2-3) Count % within SEI personnel regroupé (3-2-3) Count % within SEI personnel regroupé (3-2-3) SEI personnel regroupé (3-2-3) Faible ou très Fort ou très faible (1,2,3) Moyen (4,5) fort (6,7,8) 4 9 29 Total 42 10,3% 21,4% 30,9% 24,0% 35 33 65 133 89,7% 78,6% 69,1% 76,0% 39 42 94 175 100,0% 100,0% 100,0% 100,0% © Benoit Duguay, 2014 Tableau croisé de la variable « Restaurant » selon l’estime de soi Chi-Square Tests Pearson Chi-Square Likelihood Ratio Linear-by-Linear As sociation N of Valid Cases Value 6,610a 7,274 6,559 2 2 As ymp. Sig. (2-sided) ,037 ,026 1 ,010 df 175 a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 9,36. © Benoit Duguay, 2014 Tableau croisé de la variable « Restaurant » selon l’estime de soi On peut rejeter H0 (il existe des différences entre %SEI- et %SEI+) Avec un seuil de signification supérieur à 95 % (p = 0,037) on peut affirmer qu’un pourcentage plus élevé de personnes dont l’estime de soi est faible mentionne le restaurant comme un produit représentatif de l’image de soi L'estime de soi influence la mention du restaurant comme produit représentatif de l'image de soi © Benoit Duguay, 2014 Tableau croisé de l’usage d’internet selon le sexe Données du tableau 13.1 H0 : %F = %M Il n’existe pas de différences entre le pourcentage des femmes et celui des hommes (quant l’usage d’Internet) Le sexe n'influence pas l’usage d’internet H1 : %F ≠ %M Il existe des différences entre le pourcentage des femmes et celui des hommes (quant l’usage d’Internet) Le sexe influence l’usage d’internet © Benoit Duguay, 2014 Tableau croisé de l’usage d’internet selon le sexe Données du tableau 13.1 H0 : %F = %H H1 : %F ≠ %H Us age Internet (Class es) Usage Internet (Classes) * Sexe Crosstabulation 5 hres ou moins /sem. 6 à 10 hres /sem. 11 hres ou plus /sem. Total Count % within Sexe Count % within Sexe Count % within Sexe Count % within Sexe Sexe Masculin Féminin 5 10 33,3% 66,7% 3 5 20,0% 33,3% 7 0 46,7% ,0% 15 15 100,0% 100,0% Total 15 50,0% 8 26,7% 7 23,3% 30 100,0% © Benoit Duguay, 2014 Tableau croisé de l’usage d’internet selon le sexe Données du tableau 13.1 Chi-Square Tests Pearson Chi-Square Likelihood Ratio Linear-by-Linear As sociation N of Valid Cases Value 9,167a 11,908 7,007 2 2 As ymp. Sig. (2-sided) ,010 ,003 1 ,008 df 30 a. 4 cells (66,7%) have expected count less than 5. The minimum expected count is 3,50. © Benoit Duguay, 2014 Tableau croisé de l’usage d’internet selon le sexe Données du tableau 13.1 On peut rejeter H0 (il existe des différences entre %F = %M) Avec un seuil de signification égal à 99 % (p = 0,010) on peut affirmer que seulement des hommes utilisent l’Internet 11 heures ou plus par semaine Inversement, on peut également affirmer qu’un pourcentage deux fois plus élevé de femmes que d’hommes utilisent l’Internet 5 heures ou moins par semaine Le sexe influence la durée de l’usage d’Internet © Benoit Duguay, 2014 L’analyse de corrélation linéaire Relation entre deux variables métriques (intervalle ou de proportion) L’augmentation de la variable 1 correspond-t-il à une augmentation ou à une diminution de la variable 2? Relation linéaire Coefficient de corrélation de Pearson (r) +1 = relation positive parfaite -1 = relation négative parfaite Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France. © Benoit Duguay, 2014 Balises établies par Cohen (1988) pour estimer l’effet de corrélation Coefficient de Pearson (r) Effet Autour de 0,10 Faible Autour de 0,30 Moyen Supérieur à 0,50 Fort Source : http://pages.usherbrooke.ca/spss/pages/statistiquesinferentielles/correlation.php?searchresult=1&sstring=corr%C3 %A9lation © Benoit Duguay, 2014 Analyse de corrélation linéaire entre l’âge et l’estime de soi personnelle Ho : r = 0 (aucune corrélation entre âge et SEI personnel) Correlations H1 : r ≠ 0 (corrélation entre âge et SEI personnel) Âge Âge SEI personnel Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N 1 173 ,169* ,027 173 SEI personnel ,169* ,027 173 1 *. Correlation is s ignificant at the 0.05 level (2-tailed). 175 © Benoit Duguay, 2014 Analyse de corrélation linéaire entre l’âge et l’estime de soi personnelle On peut rejeter H0 (il existe une corrélation entre l’âge et l’estime de soi personnelle) Avec un seuil de signification supérieur à 95 % (p = 0,027) on peut affirmer que l’âge influence l’estime de soi personnelle La valeur positive de r (= +0,169) indique une relation positive entre les variables En outre, la valeur plus proche de « 0 » que de « +1 » de r indique une corrélation positive imparfaite (plutôt faible) L’estime de soi personnelle augmente un peu avec l’âge © Benoit Duguay, 2014 Analyse de corrélation linéaire entre l’attitude envers la ville et la durée de résidence Données du tableau 15.1 Ho : r = 0 (aucune corrélation entre attitude et durée) Correlations H1 : r ≠ 0 (corrélation entre attitude et durée) Attitude ville Durée résidence Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Durée Attitude ville rés idence 1 ,936** ,000 12 12 ,936** 1 ,000 12 12 **. Correlation is s ignificant at the 0.01 level (2-tailed). © Benoit Duguay, 2014 Analyse de corrélation linéaire entre l’attitude envers la ville et la durée de résidence Données du tableau 15.1 On peut rejeter H0 (il existe une corrélation entre l’attitude envers la ville et la durée de résidence) Avec un seuil de signification supérieur à 99 % (p = 0,000) on peut affirmer que la durée de résidence influence l’attitude envers la ville La valeur positive de r est (= +0,936) indique une relation positive entre les variables En outre, la valeur très proche de « +1 » de r indique une corrélation positive presque parfaite (très forte) L’attitude envers la ville devient plus favorable avec une augmentation de la durée de résidence © Benoit Duguay, 2014 Démonstration du logiciel SPSS Réalisation de plusieurs analyses croisées avec des données fictives : tableau_13_1.sav : http://eut4115.uqam.ca/spss /tableau_13_1.sav restaurants_categories.sav : http://eut4115.uqam.ca/spss /restaurants_categories.sav Source : http://en.wikipedia.org/wiki/SPSS © Benoit Duguay, 2014 Les comparaisons de moyennes Analyser la relation entre une variable non métrique (nominale ou ordinale) et une variable métrique (intervalle ou de proportion) Comparaison de deux moyennes indépendantes Comparaison de deux moyennes appareillées Comparaison de plusieurs moyennes Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France. © Benoit Duguay, 2014 Moyennes indépendantes Test en t (T-Test) Hypothèse : H0 : μ1 = μ2 (les moyennes sont identiques) H1 : μ1 ≠ μ2 (les moyennes sont différentes) Si les moyennes sont différentes, il existe une relation entre la variable indépendante et la variable dépendante Rejeter H0 si t > 1,98 ou t < -1,98 p ≤ 0,05, seuil de signification ≥ 95 % Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France. © Benoit Duguay, 2014 Moyennes indépendantes Analyse de la variable « Spectacle culturel » selon l’estime de soi H0 : μ1 = μ2 (Moyenne SEI NON = Moyenne SEI OUI) Group Statistics H1 : μ1 ≠ μ2 (Moyenne SEI NON ≠ Moyenne SEI OUI) SEI personnel Spectacle culturel Non Oui N 39 136 Mean 6,10 5,15 Std. Deviation 1,553 2,033 Std. Error Mean ,249 ,174 Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means Bilatéral F SEI personnel Equal variances as sumed Equal variances not ass umed 7,641 Sig. ,006 t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper 2,694 173 ,008 ,948 ,352 ,254 1,643 3,123 79,156 ,003 ,948 ,304 ,344 1,552 © Benoit Duguay, 2014 Moyennes indépendantes Analyse de la variable « Spectacle culturel » selon l’estime de soi Les personnes qui mentionnent le spectacle culturel comme un produit représentatif de leur image sont plus nombreuses que celles qui ne mentionnent pas ce produit (136 VS 39) L’écart des moyennes (6,10 VS 5,15) est significatif (t = 2,694) On peut rejeter H0 (les moyennes sont différentes) Avec un seuil de signification supérieur à 99 % (p = 0,008) on peut affirmer que la moyenne de l’estime de soi des personnes qui mentionnent le spectacle culturel comme un produit représentatif de leur image est plus faible L’estime de soi personnelle influence la mention du spectacle culturel comme produit représentatif de l’image de soi © Benoit Duguay, 2014 Moyennes indépendantes Analyse de l’usage d’Internet selon le sexe Données du Tableau 13.1 H0 : μ1 = μ2 (Moyenne F = Moyenne M) Group Statistics H1 : μ1 ≠ μ2 (Moyenne F ≠ Moyenne M) Us age Internet (Hres/Sem.) Sexe Masculin Féminin N Mean 9,36 3,87 14 15 Std. Deviation 4,568 1,685 Std. Error Mean 1,221 ,435 Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means Bilatéral F Us age Internet (Hres/Sem.) Equal variances as sumed Equal variances not ass umed 21,681 Sig. ,000 t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper 4,354 27 ,000 5,490 1,261 2,903 8,078 4,237 16,267 ,001 5,490 1,296 2,747 8,234 © Benoit Duguay, 2014 Moyennes indépendantes Analyse de l’usage d’Internet selon le sexe Données du Tableau 13.1 L’écart des moyennes (9,36 VS 3,87) est significatif (t = 4,354) On peut rejeter H0 (les moyennes sont différentes) Avec un seuil de signification supérieur à 99 % (p = 0,000) on peut affirmer que le nombre d’heures d’usage d’Internet est plus élevé pour les hommes (9,36) que pour les femmes (3,87) Le sexe influence l’usage de l’Internet © Benoit Duguay, 2014 Moyennes appariées Test en t (T-Test) Hypothèse : H0 : μ1 = μ2 (les moyennes sont identiques) H1 : μ1 ≠ μ2 (les moyennes sont différentes) Si les moyennes sont identiques, il existe une relation entre les deux variables Rejeter H0 si t > 1,98 ou t < -1,98 p ≤ 0,05, seuil de signification ≥ 95 % Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France. © Benoit Duguay, 2014 Moyennes appariées Analyse de l’estime de soi sociale et de l’estime de soi personnelle H0 : μ1 = μ2 (Moyenne SEI social = Moyenne SEI personnel) Paired Samples Statistics H1 : μ1 ≠ μ2 (Moyenne SEI social ≠ Moyenne SEI personnel) Pair 1 SEI social SEI pers onnel Mean 6,75 5,37 N 174 174 Std. Deviation 1,049 1,977 Std. Error Mean ,080 ,150 Paired Samples Test Paired Differences Mean Pair 1 SEI social SEI pers onnel 1,39 Std. Deviation Std. Error Mean 1,961 ,149 95% Confidence Interval of the Difference Lower Upper 1,09 1,68 t 9,317 df 173 Sig. (2-tailed) ,000 © Benoit Duguay, 2014 Moyennes appariées Analyse de l’estime de soi sociale et de l’estime de soi personnelle L’écart des moyennes (6,75 VS 5,37) est significatif (t = 9,317 ) On peut rejeter H0 (les moyennes sont différentes) Avec un seuil de signification supérieur à 99 % (p = 0,000) on peut affirmer que les moyennes de l’estime de soi sociale et de l’estime de soi personnelle sont différentes Il n’existe pas de relation entre ces deux aspects de l’estime de soi © Benoit Duguay, 2014 Moyennes appariées Analyse de l’attitude envers Internet et de l’attitude envers la technologie Données du Tableau 13.1 H0 : μ1 = μ2 (Moyenne Internet = Moyenne Technologie) Paired Samples Statistics H1 : μ1 ≠ μ2 (Moyenne Internet ≠ Moyenne Technologie) Pair 1 Attitude Internet Attitude technologie Mean 5,17 4,10 N 30 30 Std. Deviation 1,234 1,398 Std. Error Mean ,225 ,255 Paired Samples Test Paired Differences Mean Pair 1 Attitude Internet Attitude technologie 1,067 Std. Deviation Std. Error Mean ,828 ,151 95% Confidence Interval of the Difference Lower Upper ,758 1,376 t 7,059 df Sig. (2-tailed) 29 ,000 © Benoit Duguay, 2014 Moyennes appariées Analyse de l’attitude envers Internet et de l’attitude envers la technologie Données du Tableau 13.1 L’écart des moyennes (5,17 VS 4,10) est significatif (t = 7,059 ) On peut rejeter H0 (les moyennes sont différentes) Avec un seuil de signification supérieur à 99 % (p = 0,000) on peut affirmer que les moyennes de l’attitude envers Internet et de l’attitude envers la technologie sont différentes Il n’existe pas de relation entre les deux attitudes © Benoit Duguay, 2014 Plusieurs moyennes Analyse de variance Hypothèse : H0 : μ1 = μ2 = μ3 (les moyennes sont identiques) H1 : μ1 ≠ μ2 ≠ μ3 (les moyennes sont différentes) Si les moyennes sont différentes, il existe une relation entre la variable indépendante et la variable dépendante Rejeter H0 si l’un ou l’autre des critères suivants est satisfait : Fcalculé ≥ Ftable p ≤ 0,05 (seuil de signification ≥ 95 %) Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France. © Benoit Duguay, 2014 Plusieurs moyennes Analyse de variance du niveau de consommation selon le revenu Ho : μ1 = μ2 = μ3 (Moyenne Plus = Moyenne Comparable = Moyenne Moins) H Revenu 1 Descriptives : μ1 ≠ μ2 ≠ μ3 (Moyenne Plus ≠ Moyenne Comparable ≠ Moyenne Moins) N Plus Comparable Moins Total 29 108 32 169 Mean 9,14 6,80 6,13 7,07 Std. Deviation 4,249 4,499 3,722 4,406 Std. Error ,789 ,433 ,658 ,339 95% Confidence Interval for Mean Lower Bound Upper Bound 7,52 10,75 5,94 7,65 4,78 7,47 6,40 7,74 Minimum 1 1 1 1 Maximum 15 15 15 15 ANOVA Ftable = 3,07 si p = 0,05 Revenu Between Groups W ithin Groups Total Sum of Squares 160,681 3100,467 3261,148 df 2 166 168 Mean Square 80,341 18,678 F 4,301 Sig. ,015 © Benoit Duguay, 2014 Plusieurs moyennes Analyse de variance du niveau de consommation selon le revenu © Benoit Duguay, 2014 Plusieurs moyennes Analyse de variance du niveau de consommation selon le revenu On peut rejeter H0 (les moyennes sont différentes) Fcalculé = 4,301 ≥ Ftable = 3,07 p = 0,015 ≤ 0,05 L’écart des moyennes (9,14 VS 6,80 VS 6,13) est significatif Avec un seuil de signification supérieur à 95 % (p = 0,015), on peut affirmer que les personnes dont la moyenne du revenu est plus élevée affirment consommer davantage Une augmentation du revenu augmente le niveau de consommation (ce qui n’est pas surprenant à vrai dire) © Benoit Duguay, 2014 Plusieurs moyennes Analyse de variance de l’usage d’internet selon l’attitude envers Internet Données du Tableau 13.1 Ho : μ1 = μ2 = μ3 (Moyenne 5- = Moyenne 6-10 = Moyenne 11+) Descriptives Attitude Internet H1 : μ1 ≠ μ2 ≠ μ3 (Moyenne 5- ≠ Moyenne 6-10 ≠ Moyenne 11+) N 5 hres ou moins /sem. 6 à 10 hres /sem. 11 hres ou plus /sem. Total 15 8 7 30 Mean 4,73 5,13 6,14 5,17 Std. Deviation 1,223 ,991 1,069 1,234 Std. Error ,316 ,350 ,404 ,225 95% Confidence Interval for Mean Lower Bound Upper Bound 4,06 5,41 4,30 5,95 5,15 7,13 4,71 5,63 Minimum 3 3 4 3 ANOVA Ftable = 3,35 si p = 0,05 At titude Internet Between Groups W ithin Groups Total Sum of Squares 9,501 34,665 44,167 df 2 27 29 Mean Square 4,751 1,284 F 3,700 Sig. ,038 Maximum 7 6 7 7 © Benoit Duguay, 2014 Plusieurs moyennes Analyse de variance de l’usage d’internet selon l’attitude envers Internet - Données du Tableau 13.1 © Benoit Duguay, 2014 Plusieurs moyennes Analyse de variance de l’usage d’internet selon l’attitude envers Internet Données du Tableau 13.1 On peut rejeter H0 (les moyennes sont différentes) : Fcalculé = 3,700 ≥ Ftable = 3,35 p = 0,038 ≤ 0,05 L’écart des moyennes (4,73 VS 5,13 VS 6,14) est significatif Avec un seuil de signification supérieur à 95 % (p = 0,038), on peut affirmer que les personnes qui font un usage d’Internet de 11 heures ou plus par semaine ont une attitude en moyenne plus positive que celles qui l’utilisent pendant 6 à 10 heures ou 5 heures et moins Une attitude positive envers Internet augmente l’usage d’Internet (ce qui n’est pas surprenant à vrai dire) © Benoit Duguay, 2014 L’analyse de régression linéaire simple Relation de dépendance entre deux variables métriques (intervalle ou de proportion) : Modèle de prédiction Yi = β0 + β1Xi + ei Yi = variable dépendante β0 = constante (origine) β1 = coefficient de régression Xi = variable indépendante ou explicative ei = erreur (ou résidus) Variation totale expliquée : r2 = coefficient de détermination r2 varie entre 0 et 1 Rejeter H0 si F ≥ 3,07 Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France. © Benoit Duguay, 2014 Analyse de régression linéaire entre l’estime de soi personnelle et l’âge Ho : β1 = 0 (aucune relation entre SEI et âge) a H1 : β1 ≠ 0 (SEI varie avec âge)Coefficients Model 1 β0 (Constant) β1 Âge Unstandardized Coefficients B Std. Error 4,142 ,564 ,038 ,017 Standardized Coefficients Beta ,169 t 7,347 2,237 Sig. ,000 ,027 F 5,002 Sig. ,027a a. Dependent Variable: SEI personnel ANOVAb Model 1 Regres sion Residual Total Sum of Squares 18,978 648,802 667,780 df a. Predic tors : (Const ant), Âge b. Dependent Variable: SEI personnel 1 171 172 Mean Square 18,978 3,794 © Benoit Duguay, 2014 Analyse de régression linéaire entre l’estime de soi personnelle et l’âge Model Summary Model 1 R ,169a R Square ,028 a. Predictors: (Constant), Âge Adjusted R Square ,023 Std. Error of the Estimate 1,948 © Benoit Duguay, 2014 Analyse de régression linéaire entre l’estime de soi personnelle et l’âge β0 © Benoit Duguay, 2014 Analyse de régression linéaire entre l’estime de soi personnelle et l’âge On peut rejeter H0 (F = 5,002) L’âge exerce une influence sur l’estime de soi personnelle SEIi = 4,142 + 0,038(âgei) + ei Avec un seuil de signification supérieur à 95 % (p = 0,027) on peut affirmer que pour chaque augmentation d’un an de l’âge, l’estime de soi personnelle augmente de 0,038 Le modèle explique 2,8 % de la variation (r2 = 0,028) © Benoit Duguay, 2014 Analyse de régression linéaire entre l’attitude envers la ville et la durée de résidence Ho : β1 = 0 (aucune relation entre l’attitudea et la durée) Coefficients H1 : β1 ≠ 0 (attitude varie avec durée) Model 1 β0 (Constant) β1 Durée résidence Unstandardized Coefficients B Std. Error 1,079 ,743 ,590 ,070 Standardized Coefficients Beta ,936 t 1,452 8,414 Sig. ,177 ,000 a. Dependent Variable: Attitude ville ANOVAb Model 1 Regres sion Residual Total Sum of Squares 105,952 14,964 120,917 df 1 10 11 a. Predic tors : (Const ant), Durée résidenc e b. Dependent Variable: Attitude ville Mean Square 105,952 1,496 F 70,803 Sig. ,000a © Benoit Duguay, 2014 Analyse de régression linéaire entre l’attitude envers la ville et la durée de résidence Model Summaryb Model 1 R ,936a R Square ,876 Adjusted R Square ,864 a. Predictors: (Constant), Durée rés idence b. Dependent Variable: Attitude ville Std. Error of the Estimate 1,223 © Benoit Duguay, 2014 Analyse de régression linéaire entre l’attitude envers la ville et la durée de résidence β0 © Benoit Duguay, 2014 Analyse de régression linéaire entre l’attitude envers la ville et la durée de résidence On peut rejeter H0 (F = 70,803) avec un seuil de signification supérieur à 99 % (p = 0,000) La durée de résidence exerce une influence sur l’attitude positive envers la ville Attitudei = 1,079 + 0,590(duréei) + ei On peut affirmer que pour chaque augmentation d’un an de la durée de résidence, l’attitude positive envers la ville augmente de 0,590 Le modèle explique 87,6 % de la variation (r2 = 0,876) © Benoit Duguay, 2014 L’analyse de régression multiple Relation de dépendance entre trois, ou plus, variables métriques : Modèle de prédiction Yi = β0 + (β1X1)i+ (β2X2)i + (β3X3)i +… + ei Yi = variable dépendante β0 = constante (origine) Β1-n = coefficients de régression X1-n = variables indépendantes ou explicatives ei = erreur (ou résidus) Variation totale expliquée : r2 = coefficient de détermination r2 varie entre 0 et 1 Test t (T-Test) indique l’influence relative de chaque variable Rejeter H0 si F ≥ 3,07 Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France. © Benoit Duguay, 2014 Régression multiple entre les ventes, la publicité, l’expérience du cuisinier et le diplôme ITHQ (Données restaurants.sav) Ho : β1-n = 0 (aucun effet durée pub., expérience et diplôme sur ventes) a Coefficients H1 : β1-n ≠ 0 (ventes varient en fonction pub., expérience et diplôme) Model β0 (Constant) 1 β1 Publicité ($) β2 Expérience (ans ) β3 Diplôme ITHQ Unstandardized Coefficients B Std. Error 150,767 6,124 ,094 ,008 27,647 4,940 54,243 9,707 Standardized Coefficients Beta ,585 ,333 ,117 t 24,619 11,749 5,596 5,588 Sig. ,000 ,000 ,001 ,001 a. Dependent Variable: Ventes (000$) ANOVAb Model 1 Regres sion Residual Total Sum of Squares 483197,0 457,893 483654,9 df 3 8 11 Mean Square 161065,675 57,237 F 2814,032 a. Predic tors : (Const ant), Diplôme ITHQ, Publicité ($), Ex périence (ans) b. Dependent Variable: Ventes (000$) Sig. ,000a © Benoit Duguay, 2014 Régression multiple entre les ventes, la publicité, l’expérience du cuisinier et le diplôme ITHQ (Données restaurants.sav) Model Summ aryb Model 1 R R Square 1,000a ,999 Adjust ed R Square ,999 St d. Error of the Es timate 7,565 a. Predic tors: (Constant), Diplôme ITHQ, Publicité ($), Ex périence (ans) b. Dependent Variable: Ventes (000$) © Benoit Duguay, 2014 Régression multiple entre les ventes, la publicité, l’expérience du cuisinier et le diplôme ITHQ (Données restaurants.sav) © Benoit Duguay, 2014 Régression multiple entre les ventes, la publicité, l’expérience du cuisinier et le diplôme ITHQ (Données restaurants.sav) © Benoit Duguay, 2014 Régression multiple entre les ventes, la publicité, l’expérience du cuisinier et le diplôme ITHQ (Données restaurants.sav) © Benoit Duguay, 2014 Régression multiple entre les ventes, la publicité, l’expérience du cuisinier et le diplôme ITHQ (Données restaurants.sav) On peut rejeter H0 (F = 2814,032) avec un seuil de signification supérieur à 99 % (p = 0,000) La publicité, l’expérience du cuisinier et le diplôme de l’ITHQ exercent une influence sur les ventes d’un restaurant Ventesi = 150,767 + 0,094 (publicitéi) + 27,647 (expériencei) + 54,243 (diplômei) + ei On peut affirmer que : pour chaque augmentation de 1$ de publicité, les ventes augmentent de 94$ (t = 11,749; p = 0,000) pour chaque augmentation d’un an d’expérience du cuisinier, les ventes augmentent de 27 647$ (t = 5,596; p = 0,001) avec l’obtention d’un diplôme de l’ITHQ, les ventes augmentent en moyenne de 54 243$ (t = 5,588; p = 0,001) Le modèle explique 99,9 % de la variation (r2 = 0,999) © Benoit Duguay, 2014 Régression multiple entre attitude envers la ville, durée de résidence et importance attachée climat (Données Tableau 15.1) Ho : β1-n = 0 (aucun effet durée résid. et import. climat sur attitude) a Coeffi cients H1 : β1-n ≠ 0 (attitude varie en fonction durée résid. et import. climat) Model β0 (Const ant) 1 β1 Durée résidenc e β2 Import ance climat Unstandardized Coeffic ient s B St d. Error ,337 ,567 ,481 ,059 ,289 ,086 St andardiz ed Coeffic ient s Beta ,764 ,314 t ,595 8,160 3,353 Sig. ,567 ,000 ,008 a. Dependent Variable: At titude ville ANOVAb Model 1 Regres sion Residual Total Sum of Squares 114,264 6,652 120,917 df 2 9 11 Mean Square 57,132 ,739 a. Predic tors : (Const ant), Importance climat, Durée résidence b. Dependent Variable: Attitude ville F 77,294 Sig. ,000a © Benoit Duguay, 2014 Régression multiple entre attitude envers la ville, durée de résidence et importance attachée climat (Données Tableau 15.1) Model Summ aryb Model 1 R R Square ,972a ,945 Adjust ed R Square ,933 St d. Error of the Es timate ,860 a. Predic tors: (Constant), Importance climat, Durée rés idence b. Dependent Variable: Attitude ville © Benoit Duguay, 2014 Régression multiple entre attitude envers la ville, durée de résidence et importance attachée climat (Données Tableau 15.1) © Benoit Duguay, 2014 Régression multiple entre attitude envers la ville, durée de résidence et importance attachée climat (Données Tableau 15.1) © Benoit Duguay, 2014 Régression multiple entre attitude envers la ville, durée de résidence et importance attachée climat (Données Tableau 15.1) On peut rejeter H0 (F = 77,294) avec un seuil de signification supérieur à 99 % (p = 0,000) La durée de résidence et l’importance attachée au climat exercent une influence sur l’attitude positive envers la ville Attitudei = 0,337 + 0,481 (duréei) + 0,289 (importancei) + ei On peut affirmer que : pour chaque augmentation d’un an de la durée de résidence, l’attitude positive envers la ville augmente de 0,481 (t = 8,160; p = 0,000) pour chaque augmentation de « 1 » de l’importance attachée au climat, l’attitude positive envers la ville augmente de 0,289 (t = 3,353; p = 0,008) Le modèle explique 94,5 % de la variation (r2 = 0,945) © Benoit Duguay, 2014 Atelier Réaliser des analyses croisées avec vos données Consignes pour les étudiants : Placer la variable indépendante dans la colonne (position en français dans SPSS) Demander les statistiques khi deux et corrélation Demander le pourcentage de la colonne Rencontre de chacune des équipes avec le professeur