Analyse statistique de base

publicité
Analyse statistique
de base
Soc-1011
Cours 10
Présentation
Calcul des fréquences
Mode, moyenne et médiane
La variance et l’écart-type
Analyse bivariée
Calcul des fréquences 1
Fréquence absolue simple : nombre de
personnes associées à une valeur ou
catégorie d’une variable (x) par rapport
au nombre total de répondants à
l’enquête (y), donc un ratio entre 0 et 1
dont la somme égale 1
 55 personnes ont indiqué sexe féminin
sur 100 personnes, donc 55/100 égale :
0.55 ; 0.55 + 0.45 = 1
Calcul des fréquences 2
Fréquence relative simple : la
fréquence absolue relative multipliée
par 100 pour obtenir une proportion du
total. Attention, des proportions
identiques ne signifient pas que les
fréquences absolues sont identiques :
10 % de la population québécoise
représente un chiffre absolu plus
important que 10 % de la population
québécoise
Calcul des fréquences 3
Fréquence absolues cumulées et
fréquences relatives cumulées : une
opération qui vous permet de suivre
l’évolution cumulées des fréquences :
Absolues, donc nombre total cumulatif de
répondants
Relatives, donc proportion cumulée de
répondants
Mode, médiane et moyenne 1
 Mode : la valeur ou la catégorie de la variable qui a
la plus forte fréquence (qui se répète le plus
souvent) : par exemple, pour la variable sexe : les
données indiquent une fréquence absolue de 55
femmes et de 45 hommes, le mode est la valeur
femme. Une distribution peut ne pas avoir de mode
(a), ou peut en avoir plusieurs (b) :
(a) : 25 personnes de 0 à 25 ans ; 25 personnes de 26 à 50
ans ; 25 personnes de 51 à 75 ans ; 25 personnes de 76 ans
et plus (aucun mode)
(b) : 50 personnes parlent français ; 50 personnes parlent
anglais ; 26 personnes parlent italien et 24 personnes
parlent espagnol (deux modes)
Mode, médiane et moyenne 2
 Distribution amodale (pas de mode) ou distribution
rectangulaire
 Distribution bimodale (deux fréquences maximales)
 Distribution plurimodale (plusieurs fréquences
maximales)
 La médiane = la valeur d’une variable où 50 % des
cas lui sont inférieurs et supérieurs
Mode, médiane et moyenne 3
 Moyenne : la moyenne d’une variable X est la
somme de toutes les données correspondant à cette
variable, divisée par le nombre total de données
 Minima : plus petite valeur d’une distribution
 Maxima : plus grande valeur d’une distribution
 Distribution : une distribution normale est
symétrique : mode, médiane et moyenne sont égaux
(donc unimodale)
 Variance et écart-type sont utilisés pour analyser les
distributions asymétriques et caractériser les
populations étudiées
Analyse bivariée 1
Relation symétrique : quand les deux
variables agissent l’une sur l’autre
simultanément (A  B)
Relation asymétrique : quand une
variable agit sur l’autre (A  B), la
variable effet est dite dépendante (B :
cancer) de la la variable indépendante
(A : cigarette) ou explicative de l’effet
observé
Différent de A  B  C
Analyse bivariée 2
Relation forte : comportement d’une
variable est très lié à une autre
Relation faible : quand le
comportement d’une variable à peu
d’effet sur une autre
Relation nulle : aucune relation entre
les variables
Analyse bivariée 3
Relation positive : quand deux
variables varient dans le même sens
(augmentent ou diminuent en même
temps : fortement ou faiblement)
Relation négative : quand les deux
variables varient dans des sens
opposés (une augment alors que
l’autre diminue : fortement ou
faiblement)
Téléchargement