L`analyse multivariée et la présentation des - MDT8601

publicité
© Benoit Duguay, 2014
Plan la séance 11
L’analyse multivariée





Les tableaux croisés
L’hypothèse
Le test du khi carré
Démonstration du logiciel SPSS (tableaux croisés)
Autres types d’analyses multivariées




Comparaison de moyennes
Analyses de variance
Analyses de corrélation
Analyses de régression
 Atelier :
 Réaliser des analyses croisées avec vos données
 Rencontre de chacune des équipes avec le professeur
© Benoit Duguay, 2014
Les tableaux croisés
 Analyse des données en
fonction de deux variables
(parfois plus)
 Variable indépendante VS
variable dépendante
 Analyse du pourcentage
des réponses selon la
variable indépendante
 Comparaison des
différences entre deux
catégories de la variable
indépendante
© Benoit Duguay, 2014
Tableau croisé de la variable
« Consommation » selon le sexe
Existe-t-il des différences entre les hommes et les femmes
dans le niveau de consommation?
Consommation * Sexe Crosstabulation
Les différences ne sont ni fortes, ni
significatives (47,7%, p = 0,523)
Consommation
Plus
Comparable
Moins
Total
Count
% within Sexe
Count
% within Sexe
Count
% within Sexe
Count
% within Sexe
Sexe
Féminin
Masculin
17
13
17,7%
17,1%
64
46
66,7%
60,5%
15
17
15,6%
22,4%
96
76
100,0%
100,0%
Total
30
17,4%
110
64,0%
32
18,6%
172
100,0%
© Benoit Duguay, 2014
L’hypothèse
 Proposition, souvent intuitive, qui permet d’expliquer un
phénomène, (p. ex. : Les hommes consomment plus que les
femmes)
 Afin de rejeter ou non une hypothèse, on doit démontrer
l’existence de différences significatives entre deux
catégories d’une variable (p. ex. féminin ou masculin pour
le sexe) par rapport à une autre variable (p. e. le niveau de
consommation).
 Formulation
 H0 : %F = %M (hypothèse nulle : il n’existe pas de différence
entre les femmes et les hommes [quant au niveau de
consommation])
 H1 : %F ≠ %M (hypothèse alternative il existe une différence
entre les femmes et les hommes [quant au niveau de
consommation])
 Dans cet exemple (diapo précédente), on ne rejette PAS
l’hypothèse nulle
© Benoit Duguay, 2014
Test d’hypothèse : le test du khi
carré (ou Khi deux – X2)
 Un test statistique parmi les plus
utiles
 Utilisable avec tout type de
données :
 PCQ tous les types de données
peuvent être transformées en
données nominales
 Détection de différence
significatives entre les
fréquences observées dans
l’étude et les fréquences
théoriques attendues
 Seuil de signification :
 probabilité permettant de rejeter
ou non l’hypothèse nulle H0
 usuel ≥ 95% (p ≤ 0,05)
Tiré et adapté de: McGown, K.L., Marketing Research: Text and Cases, Winthrop Publishers, 1979, p. 236
© Benoit Duguay, 2014
Tableau croisé de la variable
« Restaurant » selon l’estime de soi
 H0 : %SEI- = %SEI moyen = %SEI+
 Il n’existe pas de différences entre le pourcentage des
personnes dont l’estime est faible et celui des personnes
dont l’estime est forte (quant à la mention du restaurant)
 L'estime de soi n'influence pas la mention du restaurant
comme produit représentatif de l'image de soi
 H1 : %SEI- ≠ %SEI moyen ≠ %SEI+
 Il existe des différences entre le pourcentage des
personnes dont l’estime est faible et celui des personnes
dont l’estime est forte (quant à la mention du restaurant)
 L'estime de soi influence la mention du restaurant comme
produit représentatif de l'image de soi
© Benoit Duguay, 2014
Tableau croisé de la variable
« Restaurant » selon l’estime de soi
H0 : %SEI - = %SEI moyen = %SEI +
H1 : %SEI - ≠ %SEI moyen ≠ %SEI +Crosstab
Restaurant
Non
Oui
Total
Count
% within SEI personnel
regroupé (3-2-3)
Count
% within SEI personnel
regroupé (3-2-3)
Count
% within SEI personnel
regroupé (3-2-3)
SEI personnel regroupé (3-2-3)
Faible ou très
Fort ou très
faible (1,2,3)
Moyen (4,5)
fort (6,7,8)
4
9
29
Total
42
10,3%
21,4%
30,9%
24,0%
35
33
65
133
89,7%
78,6%
69,1%
76,0%
39
42
94
175
100,0%
100,0%
100,0%
100,0%
© Benoit Duguay, 2014
Tableau croisé de la variable
« Restaurant » selon l’estime de soi
Chi-Square Tests
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear
As sociation
N of Valid Cases
Value
6,610a
7,274
6,559
2
2
As ymp. Sig.
(2-sided)
,037
,026
1
,010
df
175
a. 0 cells (,0%) have expected count less than 5. The
minimum expected count is 9,36.
© Benoit Duguay, 2014
Tableau croisé de la variable
« Restaurant » selon l’estime de soi
 On peut rejeter H0 (il existe des différences entre
%SEI- et %SEI+)
 Avec un seuil de signification supérieur à 95 % (p
= 0,037) on peut affirmer qu’un pourcentage plus
élevé de personnes dont l’estime de soi est faible
mentionne le restaurant comme un produit
représentatif de l’image de soi
 L'estime de soi influence la mention du restaurant
comme produit représentatif de l'image de soi
© Benoit Duguay, 2014
Tableau croisé de l’usage d’internet
selon le sexe
Données du tableau 13.1
 H0 : %F = %M
 Il n’existe pas de différences entre le pourcentage des
femmes et celui des hommes (quant l’usage d’Internet)
 Le sexe n'influence pas l’usage d’internet
 H1 : %F ≠ %M
 Il existe des différences entre le pourcentage des femmes
et celui des hommes (quant l’usage d’Internet)
 Le sexe influence l’usage d’internet
© Benoit Duguay, 2014
Tableau croisé de l’usage d’internet
selon le sexe
Données du tableau 13.1
H0 : %F = %H
H1 : %F ≠ %H
Us age Internet
(Class es)
Usage Internet (Classes) * Sexe Crosstabulation
5 hres ou moins /sem.
6 à 10 hres /sem.
11 hres ou plus /sem.
Total
Count
% within Sexe
Count
% within Sexe
Count
% within Sexe
Count
% within Sexe
Sexe
Masculin
Féminin
5
10
33,3%
66,7%
3
5
20,0%
33,3%
7
0
46,7%
,0%
15
15
100,0%
100,0%
Total
15
50,0%
8
26,7%
7
23,3%
30
100,0%
© Benoit Duguay, 2014
Tableau croisé de l’usage d’internet
selon le sexe
Données du tableau 13.1
Chi-Square Tests
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear
As sociation
N of Valid Cases
Value
9,167a
11,908
7,007
2
2
As ymp. Sig.
(2-sided)
,010
,003
1
,008
df
30
a. 4 cells (66,7%) have expected count less than 5. The
minimum expected count is 3,50.
© Benoit Duguay, 2014
Tableau croisé de l’usage d’internet
selon le sexe
Données du tableau 13.1
 On peut rejeter H0 (il existe des différences entre
%F = %M)
 Avec un seuil de signification égal à 99 % (p =
0,010) on peut affirmer que seulement des
hommes utilisent l’Internet 11 heures ou plus par
semaine
 Inversement, on peut également affirmer qu’un
pourcentage deux fois plus élevé de femmes que
d’hommes utilisent l’Internet 5 heures ou moins
par semaine
 Le sexe influence la durée de l’usage d’Internet
© Benoit Duguay, 2014
L’analyse de corrélation linéaire
 Relation entre deux variables
métriques (intervalle ou de
proportion)
 L’augmentation de la variable 1
correspond-t-il à une augmentation
ou à une diminution de la variable 2?
 Relation linéaire
 Coefficient de corrélation de Pearson
(r)
 +1 = relation positive parfaite
 -1 = relation négative parfaite
Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France.
© Benoit Duguay, 2014
Balises établies par Cohen (1988)
pour estimer l’effet de corrélation
Coefficient de Pearson (r)
Effet
Autour de 0,10
Faible
Autour de 0,30
Moyen
Supérieur à 0,50
Fort
Source : http://pages.usherbrooke.ca/spss/pages/statistiquesinferentielles/correlation.php?searchresult=1&sstring=corr%C3
%A9lation
© Benoit Duguay, 2014
Analyse de corrélation linéaire entre
l’âge et l’estime de soi personnelle
Ho : r = 0 (aucune corrélation entre âge et SEI personnel)
Correlations
H1 : r ≠ 0 (corrélation entre âge et SEI personnel)
Âge
Âge
SEI personnel
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
1
173
,169*
,027
173
SEI personnel
,169*
,027
173
1
*. Correlation is s ignificant at the 0.05 level (2-tailed).
175
© Benoit Duguay, 2014
Analyse de corrélation linéaire entre
l’âge et l’estime de soi personnelle
 On peut rejeter H0 (il existe une corrélation entre l’âge et
l’estime de soi personnelle)
 Avec un seuil de signification supérieur à 95 % (p = 0,027)
on peut affirmer que l’âge influence l’estime de soi
personnelle
 La valeur positive de r (= +0,169) indique une relation
positive entre les variables
 En outre, la valeur plus proche de « 0 » que de « +1 » de r
indique une corrélation positive imparfaite (plutôt faible)
 L’estime de soi personnelle augmente un peu avec l’âge
© Benoit Duguay, 2014
Analyse de corrélation linéaire entre l’attitude
envers la ville et la durée de résidence
Données du tableau 15.1
Ho : r = 0 (aucune corrélation entre attitude et durée)
Correlations
H1 : r ≠ 0 (corrélation entre attitude et durée)
Attitude ville
Durée résidence
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Durée
Attitude ville
rés idence
1
,936**
,000
12
12
,936**
1
,000
12
12
**. Correlation is s ignificant at the 0.01 level (2-tailed).
© Benoit Duguay, 2014
Analyse de corrélation linéaire entre l’attitude
envers la ville et la durée de résidence
Données du tableau 15.1
 On peut rejeter H0 (il existe une corrélation entre l’attitude
envers la ville et la durée de résidence)
 Avec un seuil de signification supérieur à 99 % (p = 0,000)
on peut affirmer que la durée de résidence influence
l’attitude envers la ville
 La valeur positive de r est (= +0,936) indique une relation
positive entre les variables
 En outre, la valeur très proche de « +1 » de r indique une
corrélation positive presque parfaite (très forte)
 L’attitude envers la ville devient plus favorable avec une
augmentation de la durée de résidence
© Benoit Duguay, 2014
Démonstration du logiciel SPSS
 Réalisation de plusieurs
analyses croisées avec des
données fictives :
 tableau_13_1.sav :
http://eut4115.uqam.ca/spss
/tableau_13_1.sav
 restaurants_categories.sav :
http://eut4115.uqam.ca/spss
/restaurants_categories.sav
Source :
http://en.wikipedia.org/wiki/SPSS
© Benoit Duguay, 2014
Les comparaisons de moyennes
 Analyser la relation entre une
variable non métrique
(nominale ou ordinale) et une
variable métrique (intervalle ou
de proportion)
 Comparaison de deux
moyennes indépendantes
 Comparaison de deux
moyennes appareillées
 Comparaison de plusieurs
moyennes
Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France.
© Benoit Duguay, 2014
Moyennes indépendantes
Test en t (T-Test)
 Hypothèse :
 H0 : μ1 = μ2 (les moyennes sont identiques)
 H1 : μ1 ≠ μ2 (les moyennes sont différentes)
 Si les moyennes sont différentes, il existe une relation entre
la variable indépendante et la variable dépendante
 Rejeter H0 si t > 1,98 ou t < -1,98
 p ≤ 0,05, seuil de signification ≥ 95 %
Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France.
© Benoit Duguay, 2014
Moyennes indépendantes
Analyse de la variable « Spectacle
culturel » selon l’estime de soi
H0 : μ1 = μ2 (Moyenne SEI NON = Moyenne SEI OUI)
Group Statistics
H1 : μ1 ≠ μ2 (Moyenne SEI NON ≠ Moyenne SEI OUI)
SEI personnel
Spectacle culturel
Non
Oui
N
39
136
Mean
6,10
5,15
Std. Deviation
1,553
2,033
Std. Error
Mean
,249
,174
Independent Samples Test
Levene's Test for
Equality of Variances
t-test for Equality of Means
Bilatéral
F
SEI personnel
Equal variances
as sumed
Equal variances
not ass umed
7,641
Sig.
,006
t
df
Sig. (2-tailed)
Mean
Difference
Std. Error
Difference
95% Confidence
Interval of the
Difference
Lower
Upper
2,694
173
,008
,948
,352
,254
1,643
3,123
79,156
,003
,948
,304
,344
1,552
© Benoit Duguay, 2014
Moyennes indépendantes
Analyse de la variable « Spectacle
culturel » selon l’estime de soi
 Les personnes qui mentionnent le spectacle culturel comme
un produit représentatif de leur image sont plus nombreuses
que celles qui ne mentionnent pas ce produit (136 VS 39)
 L’écart des moyennes (6,10 VS 5,15) est significatif (t =
2,694)
 On peut rejeter H0 (les moyennes sont différentes)
 Avec un seuil de signification supérieur à 99 % (p = 0,008)
on peut affirmer que la moyenne de l’estime de soi des
personnes qui mentionnent le spectacle culturel comme un
produit représentatif de leur image est plus faible
 L’estime de soi personnelle influence la mention du spectacle
culturel comme produit représentatif de l’image de soi
© Benoit Duguay, 2014
Moyennes indépendantes
Analyse de l’usage d’Internet selon le sexe
Données du Tableau 13.1
H0 : μ1 = μ2 (Moyenne F = Moyenne M)
Group Statistics
H1 : μ1 ≠ μ2 (Moyenne F ≠ Moyenne M)
Us age Internet
(Hres/Sem.)
Sexe
Masculin
Féminin
N
Mean
9,36
3,87
14
15
Std. Deviation
4,568
1,685
Std. Error
Mean
1,221
,435
Independent Samples Test
Levene's Test for
Equality of Variances
t-test for Equality of Means
Bilatéral
F
Us age Internet
(Hres/Sem.)
Equal variances
as sumed
Equal variances
not ass umed
21,681
Sig.
,000
t
df
Sig. (2-tailed)
Mean
Difference
Std. Error
Difference
95% Confidence
Interval of the
Difference
Lower
Upper
4,354
27
,000
5,490
1,261
2,903
8,078
4,237
16,267
,001
5,490
1,296
2,747
8,234
© Benoit Duguay, 2014
Moyennes indépendantes
Analyse de l’usage d’Internet selon le sexe
Données du Tableau 13.1
 L’écart des moyennes (9,36 VS 3,87) est significatif (t =
4,354)
 On peut rejeter H0 (les moyennes sont différentes)
 Avec un seuil de signification supérieur à 99 % (p = 0,000)
on peut affirmer que le nombre d’heures d’usage d’Internet
est plus élevé pour les hommes (9,36) que pour les femmes
(3,87)
 Le sexe influence l’usage de l’Internet
© Benoit Duguay, 2014
Moyennes appariées
Test en t (T-Test)
 Hypothèse :
 H0 : μ1 = μ2 (les moyennes sont identiques)
 H1 : μ1 ≠ μ2 (les moyennes sont différentes)
 Si les moyennes sont identiques, il existe une relation entre
les deux variables
 Rejeter H0 si t > 1,98 ou t < -1,98
 p ≤ 0,05, seuil de signification ≥ 95 %
Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France.
© Benoit Duguay, 2014
Moyennes appariées
Analyse de l’estime de soi sociale et de
l’estime de soi personnelle
H0 : μ1 = μ2 (Moyenne SEI social = Moyenne SEI personnel)
Paired Samples Statistics
H1 : μ1 ≠ μ2 (Moyenne SEI social ≠ Moyenne SEI personnel)
Pair
1
SEI social
SEI pers onnel
Mean
6,75
5,37
N
174
174
Std. Deviation
1,049
1,977
Std. Error
Mean
,080
,150
Paired Samples Test
Paired Differences
Mean
Pair
1
SEI social SEI pers onnel
1,39
Std. Deviation
Std. Error
Mean
1,961
,149
95% Confidence
Interval of the
Difference
Lower
Upper
1,09
1,68
t
9,317
df
173
Sig. (2-tailed)
,000
© Benoit Duguay, 2014
Moyennes appariées
Analyse de l’estime de soi sociale et de
l’estime de soi personnelle
 L’écart des moyennes (6,75 VS 5,37) est significatif (t =
9,317 )
 On peut rejeter H0 (les moyennes sont différentes)
 Avec un seuil de signification supérieur à 99 % (p = 0,000)
on peut affirmer que les moyennes de l’estime de soi sociale
et de l’estime de soi personnelle sont différentes
 Il n’existe pas de relation entre ces deux aspects de l’estime
de soi
© Benoit Duguay, 2014
Moyennes appariées
Analyse de l’attitude envers Internet et de
l’attitude envers la technologie
Données du Tableau 13.1
H0 : μ1 = μ2 (Moyenne Internet = Moyenne Technologie)
Paired Samples Statistics
H1 : μ1 ≠ μ2 (Moyenne Internet ≠ Moyenne Technologie)
Pair
1
Attitude Internet
Attitude technologie
Mean
5,17
4,10
N
30
30
Std. Deviation
1,234
1,398
Std. Error
Mean
,225
,255
Paired Samples Test
Paired Differences
Mean
Pair
1
Attitude Internet Attitude technologie
1,067
Std. Deviation
Std. Error
Mean
,828
,151
95% Confidence
Interval of the
Difference
Lower
Upper
,758
1,376
t
7,059
df
Sig. (2-tailed)
29
,000
© Benoit Duguay, 2014
Moyennes appariées
Analyse de l’attitude envers Internet et de
l’attitude envers la technologie
Données du Tableau 13.1
 L’écart des moyennes (5,17 VS 4,10) est significatif (t =
7,059 )
 On peut rejeter H0 (les moyennes sont différentes)
 Avec un seuil de signification supérieur à 99 % (p = 0,000)
on peut affirmer que les moyennes de l’attitude envers
Internet et de l’attitude envers la technologie sont
différentes
 Il n’existe pas de relation entre les deux attitudes
© Benoit Duguay, 2014
Plusieurs moyennes
Analyse de variance
 Hypothèse :
 H0 : μ1 = μ2 = μ3 (les moyennes sont identiques)
 H1 : μ1 ≠ μ2 ≠ μ3 (les moyennes sont différentes)
 Si les moyennes sont différentes, il existe une relation entre la
variable indépendante et la variable dépendante
 Rejeter H0 si l’un ou l’autre des critères suivants est satisfait :
 Fcalculé ≥ Ftable
 p ≤ 0,05 (seuil de signification ≥ 95 %)
Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France.
© Benoit Duguay, 2014
Plusieurs moyennes
Analyse de variance du niveau de
consommation selon le revenu
Ho : μ1 = μ2 = μ3 (Moyenne Plus = Moyenne Comparable = Moyenne Moins)
H
Revenu 1
Descriptives
: μ1 ≠ μ2 ≠ μ3 (Moyenne Plus ≠ Moyenne Comparable ≠ Moyenne Moins)
N
Plus
Comparable
Moins
Total
29
108
32
169
Mean
9,14
6,80
6,13
7,07
Std. Deviation
4,249
4,499
3,722
4,406
Std. Error
,789
,433
,658
,339
95% Confidence Interval for
Mean
Lower Bound Upper Bound
7,52
10,75
5,94
7,65
4,78
7,47
6,40
7,74
Minimum
1
1
1
1
Maximum
15
15
15
15
ANOVA
Ftable = 3,07 si p = 0,05
Revenu
Between Groups
W ithin Groups
Total
Sum of
Squares
160,681
3100,467
3261,148
df
2
166
168
Mean Square
80,341
18,678
F
4,301
Sig.
,015
© Benoit Duguay, 2014
Plusieurs moyennes
Analyse de variance du niveau de consommation
selon le revenu
© Benoit Duguay, 2014
Plusieurs moyennes
Analyse de variance du niveau de
consommation selon le revenu
 On peut rejeter H0 (les moyennes sont différentes)
 Fcalculé = 4,301 ≥ Ftable = 3,07
 p = 0,015 ≤ 0,05
 L’écart des moyennes (9,14 VS 6,80 VS 6,13) est significatif
 Avec un seuil de signification supérieur à 95 % (p = 0,015),
on peut affirmer que les personnes dont la moyenne du
revenu est plus élevée affirment consommer davantage
 Une augmentation du revenu augmente le niveau de
consommation (ce qui n’est pas surprenant à vrai dire)
© Benoit Duguay, 2014
Plusieurs moyennes
Analyse de variance de l’usage d’internet
selon l’attitude envers Internet
Données du Tableau 13.1
Ho : μ1 = μ2 = μ3 (Moyenne 5- = Moyenne 6-10 = Moyenne 11+)
Descriptives
Attitude Internet
H1 : μ1 ≠ μ2 ≠ μ3 (Moyenne 5- ≠ Moyenne 6-10 ≠ Moyenne 11+)
N
5 hres ou moins /sem.
6 à 10 hres /sem.
11 hres ou plus /sem.
Total
15
8
7
30
Mean
4,73
5,13
6,14
5,17
Std. Deviation
1,223
,991
1,069
1,234
Std. Error
,316
,350
,404
,225
95% Confidence Interval for
Mean
Lower Bound Upper Bound
4,06
5,41
4,30
5,95
5,15
7,13
4,71
5,63
Minimum
3
3
4
3
ANOVA
Ftable = 3,35 si p = 0,05
At titude Internet
Between Groups
W ithin Groups
Total
Sum of
Squares
9,501
34,665
44,167
df
2
27
29
Mean Square
4,751
1,284
F
3,700
Sig.
,038
Maximum
7
6
7
7
© Benoit Duguay, 2014
Plusieurs moyennes
Analyse de variance de l’usage d’internet selon
l’attitude envers Internet - Données du Tableau 13.1
© Benoit Duguay, 2014
Plusieurs moyennes
Analyse de variance de l’usage d’internet
selon l’attitude envers Internet
Données du Tableau 13.1
 On peut rejeter H0 (les moyennes sont différentes) :
 Fcalculé = 3,700 ≥ Ftable = 3,35
 p = 0,038 ≤ 0,05
 L’écart des moyennes (4,73 VS 5,13 VS 6,14) est significatif
 Avec un seuil de signification supérieur à 95 % (p = 0,038),
on peut affirmer que les personnes qui font un usage
d’Internet de 11 heures ou plus par semaine ont une
attitude en moyenne plus positive que celles qui l’utilisent
pendant 6 à 10 heures ou 5 heures et moins
 Une attitude positive envers Internet augmente l’usage
d’Internet (ce qui n’est pas surprenant à vrai dire)
© Benoit Duguay, 2014
L’analyse de régression linéaire
simple
 Relation de dépendance entre deux
variables métriques (intervalle ou
de proportion) :
Modèle de prédiction
Yi = β0 + β1Xi + ei
Yi = variable dépendante
β0 = constante (origine)
β1 = coefficient de régression
Xi = variable indépendante ou
explicative
 ei = erreur (ou résidus)






 Variation totale expliquée :
 r2 = coefficient de détermination
 r2 varie entre 0 et 1
 Rejeter H0 si F ≥ 3,07
Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France.
© Benoit Duguay, 2014
Analyse de régression linéaire entre
l’estime de soi personnelle et l’âge
Ho : β1 = 0 (aucune relation entre SEI et âge)
a
H1 : β1 ≠ 0 (SEI varie avec âge)Coefficients
Model
1
β0 (Constant)
β1 Âge
Unstandardized
Coefficients
B
Std. Error
4,142
,564
,038
,017
Standardized
Coefficients
Beta
,169
t
7,347
2,237
Sig.
,000
,027
F
5,002
Sig.
,027a
a. Dependent Variable: SEI personnel
ANOVAb
Model
1
Regres sion
Residual
Total
Sum of
Squares
18,978
648,802
667,780
df
a. Predic tors : (Const ant), Âge
b. Dependent Variable: SEI personnel
1
171
172
Mean Square
18,978
3,794
© Benoit Duguay, 2014
Analyse de régression linéaire entre
l’estime de soi personnelle et l’âge
Model Summary
Model
1
R
,169a
R Square
,028
a. Predictors: (Constant), Âge
Adjusted
R Square
,023
Std. Error of
the Estimate
1,948
© Benoit Duguay, 2014
Analyse de régression linéaire entre
l’estime de soi personnelle et l’âge
β0
© Benoit Duguay, 2014
Analyse de régression linéaire entre
l’estime de soi personnelle et l’âge
On peut rejeter H0 (F = 5,002)
L’âge exerce une influence sur l’estime de soi personnelle
SEIi = 4,142 + 0,038(âgei) + ei
Avec un seuil de signification supérieur à 95 % (p = 0,027)
on peut affirmer que pour chaque augmentation d’un an de
l’âge, l’estime de soi personnelle augmente de 0,038
 Le modèle explique 2,8 % de la variation (r2 = 0,028)




© Benoit Duguay, 2014
Analyse de régression linéaire entre l’attitude
envers la ville et la durée de résidence
Ho : β1 = 0 (aucune relation entre l’attitudea et la durée)
Coefficients
H1 : β1 ≠ 0 (attitude varie avec durée)
Model
1
β0 (Constant)
β1 Durée résidence
Unstandardized
Coefficients
B
Std. Error
1,079
,743
,590
,070
Standardized
Coefficients
Beta
,936
t
1,452
8,414
Sig.
,177
,000
a. Dependent Variable: Attitude ville
ANOVAb
Model
1
Regres sion
Residual
Total
Sum of
Squares
105,952
14,964
120,917
df
1
10
11
a. Predic tors : (Const ant), Durée résidenc e
b. Dependent Variable: Attitude ville
Mean Square
105,952
1,496
F
70,803
Sig.
,000a
© Benoit Duguay, 2014
Analyse de régression linéaire entre l’attitude
envers la ville et la durée de résidence
Model Summaryb
Model
1
R
,936a
R Square
,876
Adjusted
R Square
,864
a. Predictors: (Constant), Durée rés idence
b. Dependent Variable: Attitude ville
Std. Error of
the Estimate
1,223
© Benoit Duguay, 2014
Analyse de régression linéaire entre l’attitude
envers la ville et la durée de résidence
β0
© Benoit Duguay, 2014
Analyse de régression linéaire entre l’attitude
envers la ville et la durée de résidence
 On peut rejeter H0 (F = 70,803) avec un seuil de
signification supérieur à 99 % (p = 0,000)
 La durée de résidence exerce une influence sur l’attitude
positive envers la ville
 Attitudei = 1,079 + 0,590(duréei) + ei
 On peut affirmer que pour chaque augmentation d’un an de
la durée de résidence, l’attitude positive envers la ville
augmente de 0,590
 Le modèle explique 87,6 % de la variation (r2 = 0,876)
© Benoit Duguay, 2014
L’analyse de régression multiple
 Relation de dépendance entre trois, ou plus,
variables métriques :







Modèle de prédiction
Yi = β0 + (β1X1)i+ (β2X2)i + (β3X3)i +… + ei
Yi = variable dépendante
β0 = constante (origine)
Β1-n = coefficients de régression
X1-n = variables indépendantes ou explicatives
ei = erreur (ou résidus)
 Variation totale expliquée :
 r2 = coefficient de détermination
 r2 varie entre 0 et 1
 Test t (T-Test) indique l’influence relative de
chaque variable
 Rejeter H0 si F ≥ 3,07
Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2007), Études Marketing avec SPSS, 5e éd., Paris: Pearson Education France.
© Benoit Duguay, 2014
Régression multiple entre les ventes, la publicité, l’expérience du
cuisinier et le diplôme ITHQ (Données restaurants.sav)
Ho : β1-n = 0 (aucun effet durée pub., expérience et diplôme sur ventes)
a
Coefficients
H1 : β1-n ≠ 0 (ventes varient en fonction
pub., expérience et diplôme)
Model
β0 (Constant)
1
β1 Publicité ($)
β2 Expérience (ans )
β3 Diplôme ITHQ
Unstandardized
Coefficients
B
Std. Error
150,767
6,124
,094
,008
27,647
4,940
54,243
9,707
Standardized
Coefficients
Beta
,585
,333
,117
t
24,619
11,749
5,596
5,588
Sig.
,000
,000
,001
,001
a. Dependent Variable: Ventes (000$)
ANOVAb
Model
1
Regres sion
Residual
Total
Sum of
Squares
483197,0
457,893
483654,9
df
3
8
11
Mean Square
161065,675
57,237
F
2814,032
a. Predic tors : (Const ant), Diplôme ITHQ, Publicité ($), Ex périence (ans)
b. Dependent Variable: Ventes (000$)
Sig.
,000a
© Benoit Duguay, 2014
Régression multiple entre les ventes, la publicité, l’expérience du
cuisinier et le diplôme ITHQ (Données restaurants.sav)
Model Summ aryb
Model
1
R
R Square
1,000a
,999
Adjust ed
R Square
,999
St d. Error of
the Es timate
7,565
a. Predic tors: (Constant), Diplôme ITHQ, Publicité ($),
Ex périence (ans)
b. Dependent Variable: Ventes (000$)
© Benoit Duguay, 2014
Régression multiple entre les ventes, la publicité, l’expérience du
cuisinier et le diplôme ITHQ (Données restaurants.sav)
© Benoit Duguay, 2014
Régression multiple entre les ventes, la publicité, l’expérience du
cuisinier et le diplôme ITHQ (Données restaurants.sav)
© Benoit Duguay, 2014
Régression multiple entre les ventes, la publicité, l’expérience du
cuisinier et le diplôme ITHQ (Données restaurants.sav)
© Benoit Duguay, 2014
Régression multiple entre les ventes, la publicité, l’expérience du
cuisinier et le diplôme ITHQ (Données restaurants.sav)
 On peut rejeter H0 (F = 2814,032) avec un seuil de
signification supérieur à 99 % (p = 0,000)
 La publicité, l’expérience du cuisinier et le diplôme de
l’ITHQ exercent une influence sur les ventes d’un restaurant
 Ventesi = 150,767 + 0,094 (publicitéi) + 27,647
(expériencei) + 54,243 (diplômei) + ei
 On peut affirmer que :
 pour chaque augmentation de 1$ de publicité, les ventes
augmentent de 94$ (t = 11,749; p = 0,000)
 pour chaque augmentation d’un an d’expérience du cuisinier,
les ventes augmentent de 27 647$ (t = 5,596; p = 0,001)
 avec l’obtention d’un diplôme de l’ITHQ, les ventes augmentent
en moyenne de 54 243$ (t = 5,588; p = 0,001)
 Le modèle explique 99,9 % de la variation (r2 = 0,999)
© Benoit Duguay, 2014
Régression multiple entre attitude envers la ville, durée de
résidence et importance attachée climat (Données Tableau 15.1)
Ho : β1-n = 0 (aucun effet durée résid. et import.
climat sur attitude)
a
Coeffi cients
H1 : β1-n ≠ 0 (attitude varie en fonction
durée résid. et import. climat)
Model
β0 (Const ant)
1
β1 Durée résidenc e
β2 Import ance climat
Unstandardized
Coeffic ient s
B
St d. Error
,337
,567
,481
,059
,289
,086
St andardiz ed
Coeffic ient s
Beta
,764
,314
t
,595
8,160
3,353
Sig.
,567
,000
,008
a. Dependent Variable: At titude ville
ANOVAb
Model
1
Regres sion
Residual
Total
Sum of
Squares
114,264
6,652
120,917
df
2
9
11
Mean Square
57,132
,739
a. Predic tors : (Const ant), Importance climat, Durée résidence
b. Dependent Variable: Attitude ville
F
77,294
Sig.
,000a
© Benoit Duguay, 2014
Régression multiple entre attitude envers la ville, durée de
résidence et importance attachée climat (Données Tableau 15.1)
Model Summ aryb
Model
1
R
R Square
,972a
,945
Adjust ed
R Square
,933
St d. Error of
the Es timate
,860
a. Predic tors: (Constant), Importance climat, Durée
rés idence
b. Dependent Variable: Attitude ville
© Benoit Duguay, 2014
Régression multiple entre attitude envers la ville, durée de
résidence et importance attachée climat (Données Tableau 15.1)
© Benoit Duguay, 2014
Régression multiple entre attitude envers la ville, durée de
résidence et importance attachée climat (Données Tableau 15.1)
© Benoit Duguay, 2014
Régression multiple entre attitude envers la ville, durée de
résidence et importance attachée climat (Données Tableau 15.1)
 On peut rejeter H0 (F = 77,294) avec un seuil de signification
supérieur à 99 % (p = 0,000)
 La durée de résidence et l’importance attachée au climat
exercent une influence sur l’attitude positive envers la ville
 Attitudei = 0,337 + 0,481 (duréei) + 0,289 (importancei) + ei
 On peut affirmer que :
 pour chaque augmentation d’un an de la durée de résidence,
l’attitude positive envers la ville augmente de 0,481 (t = 8,160; p
= 0,000)
 pour chaque augmentation de « 1 » de l’importance attachée au
climat, l’attitude positive envers la ville augmente de 0,289 (t =
3,353; p = 0,008)
 Le modèle explique 94,5 % de la variation (r2 = 0,945)
© Benoit Duguay, 2014
Atelier
 Réaliser des analyses
croisées avec vos données
 Consignes pour les
étudiants :
 Placer la variable
indépendante dans la colonne
(position en français dans
SPSS)
 Demander les statistiques khi
deux et corrélation
 Demander le pourcentage de
la colonne
 Rencontre de chacune des
équipes avec le professeur
Téléchargement