Analyse Bidimensionnelle : Variables et Méthodes Statistiques

Telechargé par atktaou abdellatif

Téléchargement

Chapitre I

ANALYSE BIDIMENSIONNELLE

L'analyse bidimensionnelle ou bivariée consiste à étudier conjointement deux

variables. L'objet est de quantifier la relation entre deux ou plusieurs variables

principal, une telle étude essaie de mettre en évidence une éventuelle liaison

statistique qui peut exister entre les deux variables de manière à ce qu’on puisse

expliquer l’une par l’autre.

La mise en évidence permet aussi de spécifier la nature et l’intensité d’une telle

relation.

Dans le cas quantitative on parle d’ajustement ou de régression et de corrélation

Dans le cas qualitative, on parle de tableau de contingence de test de chi-deux,

de coefficient d’association et de corrélation de spearman.

La recherche de combinaison entre deux variables dépend donc de la nature des

variables ; s’agit t’il de variables quantitatives, de variables qualitatives

nominales ou de variables qualitatives ordinales.

Il est évident quelque soit la nature des variables, et quelque soit la nature de la

méthode choisie ; l’objectif et de tirer des conclusions concrètes en relation avec

le problème étudié, un tel problème est fixé au préalable.

I. Combinaison de deux variables qualitatives nominales

Le croisement de deux variables qualitatives nominales définit un tableau de

contingence où les lignes correspondent aux modalités de la variable 1 mise en

lignes et les colonnes correspondent aux modalités de la variables 2 mise en

colonnes. A l'intersection de la ligne i et de la colonne j on trouve nij le nombre

d'individus ayant simultanément la modalité i de la variable 1 et la modalité j de

la variable 2.

Exemple : Soit un échantillon de 240 personnes. Deux variables nominales ont

été relevées : - Sexe (deux modalités)

- Lieu d'achat du dentifrice (trois modalités)

Pharmacie Ailleurs NSP ni.

Masculin 30 90 0 120

Féminin 60 40 20 120

n.j 90 130 20 240

A partir d'un tableau de contingence on peut définir un tableau de fréquences

obtenu en divisant chaque case par l'effectif total n.

soit fij = nij / n

On définit aussi :

i. = Σj f ij Fréquences marginales en lignes

.j = Σi f ij Fréquences marginales en colonnes

.. = Σj f .j = Σi f i. = 1

La lecture de ce tableau de fréquences permet d'avoir une idée sur la distribution

de l'échantillon sur les deux variables statistiques.

L'analyse numérique effectuée sur un tel tableau vise la mesure de

l'indépendance entre les deux variables X et Y. Cette mesure est donnée par le χ2

qui teste l'existence d'une liaison statistique significative entre les deux

variables.

(n ij - T ij)2

Calcul du χ2 : χ2 = Σ ---------------

Les Tij sont les fréquences théoriques calculées sous l'hypothèse d'indépendance

entre les deux variables.

Dans les cas de l'exemple étudié, celles-ci sont données dans le tableau suivant :

Pharmacie Ailleurs NSP Total

Masculin 45 65 10 120

Féminin 45 65 10 120

Total 90 130 20 240

Application numérique : χ2 = 49, 24

Cette valeur est à comparer avec une valeur théorique donnée par la table de la

loi du Χ2 en fonction du nombre de degrés de liberté ddl et du risque d'erreur

qu'on est prés à tolérer. Le nombre de degrés de liberté est ddl = (L - 1)(C - 1).

Dans ce cas ddl = 2; et pour un risque de 5% la valeur critique du χ2critique = 5,99

Comme la valeur calculée est supérieure à la valeur critique, l'hypothèse de

l'indépendance est donc rejetée au risque de 5%. En définitive, le lieu d'achat de

dentifrice ne peut être considéré comme totalement indépendant du sexe de

l'acheteur.

On peut mesurer le degré de dépendance ou d'association entre les deux

variables grâce au coefficient d'association C :

Ce coefficient, s'il est toujours nul en cas d'indépendance, il prend dans le cas

d'association parfaite une valeur maximale en fonction des dimensions du

tableau de contingence. Un extrait de la table de ces valeurs maximales est

donné ci-après :

Dimensions du tableau C max Dimensions du tableau C max

2 x 2 0,707 3 x 4 0,786

2 x3 0,685 3 x 5 0,810

2 x 4 0,730 4 x 4 0,866

2 x 5 0,752 4 x 5 0,863

3 x 3 0,816 4 x 6 0,877

Pour notre exemple le Cmax est de 0,685. Pour ramener notre coefficient

d'association sur un intervalle [0;1], on prend sa valeur normalisée 0,4126/0,685

= 0,60. Ce résultat indique une association moyennement importante entre les

deux variables.

III- Combinaison de deux variables qualitatives ordinales

Une telle combinaison donne lieu bien évidemment à un tableau de contingence

et la liaison entre les deux variables peut être mesurée par le Χ2. Mais le

caractère ordinale des deux variables peut être pris en considération grâce au

coefficient de Spearman. Ce coefficient donne une idée sur le degré

d’association entre les deux variables définies par des rangs.

Exemple : Sur un échantillon de 24 individus nous avons posé deux questions :

1- Classez par ordre d’importance décroissante les trois qualités suivantes :

Goût Texture, consistance Caractéristiques médicales et d’hygiène

2- Pour vous une pâte dentifrice est :

Inutile Utile Très utile Indispensable.

Pour calculer le coefficient de corrélation de Spearman il faut ordonner les 24

réponses en fonction des deux variables.

Soit le tableau condensé des deux variables :

Numéro Goût Utilité

1 3 1

2 2 2

3 1 1

4 3 1

5 2 1

6 3 1

7 1 2

8 2 1

9 1 1

10 2 1

11 1 2

12 1 3

13 1 3

14 2 2

15 1 -1

16 3 3

17 2 3

18 1 2

19 2 1

20 2 2

21 3 3

22 3 3

23 1 2

24 3 2

Pour ordonner les 24 réponses selon le goût et l’utilité il faut résoudre le

problème des ex-aequo. Les neufs réponses qui classent le goût en premier

auront un rang égal à :

1+2+3+4+5+6+7+8+9 45

--------------------------- = ----- = 5

9 9

Ainsi le tableau des classements est le suivant :

Numéro Classemen

t selon le

goût

Classement

selon l’utilité

d i d i2

1 21 19 2 4

2 13.5 10.5 3 9

3 5 19 14 196

4 21 19 2 4

5 13.5 19 5.5 30.25

6 21 19 2 4

7 5 10.5 5.5 30.25

8 13.5 19 5.5 30.25

9 5 19 14 196

10 13.5 19 5.5 30.25

11 5 10.5 5.5 30.25

12 5 3.5 1.5 2.25

13 5 3.5 1.5 2.25

14 13.5 10.5 3 9

15 5 24 19 361

16 21 3.5 17.5 306.25

17 13.5 3.5 10 100

18 5 10.5 5.5 30.25

19 13.5 19 5.5 30.25

20 13.5 10.5 3 9

21 21 3.5 17.5 306.25

22 21 3.5 17.5 306.25

23 5 10.5 5.5 30.25

24 21 10.5 10.5 110.25

2167.5

Le coefficient de Spearman est donné par :

6 Σ d i2

r = 1 - ------------------- = 0,06

n (n

2 – 1)

1 / 14 100%

Documents connexes

Exercices de statistiques descriptives

Fo8 Déterminer une fonction linéaire.docx

resume

CONCOURS GÉNÉRAL D'ADMINISTRATEUR DES SERVICES DU SÉNAT 2005-2006 EPREUVE D’ADMISSIBILITÉ

Chapitre 1 Généralités sur la thermodynamique

Chapitre 2 :Qu`apporte le management à la gestion des

Evaluation type - classe de première ES La courbe C ci

fs 185 mono 1

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Analyse Bidimensionnelle : Variables et Méthodes Statistiques

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Analyse Bidimensionnelle : Variables et Méthodes Statistiques

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib