Laboratoire d`Analyse – Recherche en Economie Quantitative

Téléchargement

Foura Mayemba Sasi

Laboratoire d’Analyse – Recherche en Economie Quantitative

Modèles dichotomiques et Spécification linéaire

Laboratoire

d’

Analyse

–

Recherche

Economie Quantitative

One Pager

Novembre 2013

Vol. 8 – Num. 006

http://www.lareq.com

Modèles dichotomiques et Spécification linéaire

Foura Mayemba Sasi

« Le véritable travail, c’est de savoir attendre . . .

Je n’ai besoin de rien, mais rien ne me suffirait. »

Jean Edmond Cyrus Rostand (1894 – 1977)

Résumé

Ce papier propose une brève introduction aux modèles à variable dépendante dichotomique

(Logit et Probit).

Mots – clé : Logit, Probit.

Abstract

This paper discusses on the dichotomous dependent variable models (Logit and Probit).

Introduction

L’une des extensions majeures de l’économétrie dans les années 60 et 70 fut incontestablement

liée à l’utilisation croissante des données microéconomiques relatives à des caractéristiques

économiques d’agents individuels tels que les firmes, les consommateurs ou les centres de profits.

Bien souvent, les données statistiques disponibles dans ces bases sont relatives à des caractères

qualitatifs comme par exemple, le sexe, la nationalité, la catégorie socio-professionnelle, le type

d’études réalisées, le fait de travailler ou au contraire d’être au chômage, d’acheter ou de ne pas

acheter un certain produit, etc. Cependant, la modélisation et l’étude des caractères quantitatifs

par les méthodes d’inférences traditionnelles ne sont pas possibles.

Ainsi, pour remédier à cette difficulté, plusieurs modèles ont été mis en œuvre. Ceux – ci sont des

extensions directes du modèle linéaire. Il s’agit notamment des modèles Logit, Probit, Tobit ou

modèles linéaires généralisés.

Et ce papier, qui est une introduction à cette nouvelle approche, se propose de présenter les

modèles dichotomiques simples, notamment les modèles Logit développés particulièrement par

Verhulst (1938, 1945, 1947), puis Berkson (1944, 1951) ; et les modèles Tobit introduits par Bliss

(1934) et Gaddum (1933).

Ainsi, dans une section première, il est question d’analyser les modèles binaires univariés, et dans

les sections deuxième et troisième, d’examiner la problématique de la spécification linéaire des

Je remercie Jean – Paul K. Tsasa pour ses commentaires.

Foura Mayemba Sasi

Laboratoire d’Analyse – Recherche en Economie Quantitative

modèles à variables endogènes dichotomiques et de procéder à une brève présentation des

modèles logit et probit.

Les modèles binaires univariés

Les modèles binaires univariés ont été développés dans l’optique de fournir un cadre d’analyse

formel qui permettrait de modéliser le lien pouvant exister entre une variable dépendante, notées

 ne prenant que deux modalités (variable dichotomique) et une variable indépendante

quelconque.

Ainsi, le modèle s’écrit : 



A titre illustratif, considérons un échantillon de  individus, tel qu’on observe pour chacun d’eux le

statut socio – économique : employé salarié ou chômeur. On note par  la variable codée

associée à la nature du statut en cause.

On pose, pour  :







En notant  l’âge de l’individu  et  une variable aléatoire telle que :









il y a lieu d’exprimer ce problème à l’aide du modèle 

Le choix retenu traditionnellement du codage  pour les modèles dichotomiques, permet de

définir en réalité la probabilité de tirer dans l’échantillon considéré l’individu qui dispose d’un

emploi rémunérateur ou non.

Ainsi, en notant : 

et 

alors, l’espérance de  s’écrit :



Foura Mayemba Sasi

Laboratoire d’Analyse – Recherche en Economie Quantitative

En vertu des axiomes de Kolmogorov

, pour tout sous - ensemble  de l’univers  représentant

toutes les éventualités possibles, on a que :

 la probabilité est à support positif:  (axiome de positivité) ;

 la probabilité de l’univers est de masse unitaire :  ;

 la probabilité est additive : 

Dès lors, la modélisation des variables dichotomiques ne peut se faire par une spécification

linéaire standard, au regard de la restriction du domaine de définition des probabilités.

Problématique de la spécification linéaire des modèles dichotomiques

Comme vu précédemment, les modèles à variables dépendantes qualitatives se distinguent du

modèle linéaire classique. Ainsi, l’estimation de ce type des modèles exige la mise en œuvre des

techniques appropriées devant prendre en compte quelques spécificités et caractéristiques desdits

modèles. Si l’on se proposait d’appliquer une forme fonctionnelle linéaire, on fera face à plusieurs

difficultés techniques.

En effet, dans ces modèles, la variable endogène , dichotomique ne prend que les valeurs 0 ou 1.

Par conséquent, la spécification linéaire  implique que la perturbation  ne devra également

prendre que deux valeurs, conditionnellement au vecteur  :

Pour  l’équation  s’écrit : 

et pour  l’équation  : 

Ainsi, la perturbation  du modèle  doit nécessairement admettre une loi discrète, ce qui

exclurait en particulier l’hypothèse de normalité des résidus !

Par ailleurs, lorsque l’on suppose que les résidus  sont de moyenne nulle, la probabilité 

associée à l’événement  est alors déterminée de façon unique :



Une simple manipulation algébrique donne le complément à l’unité de l’expression  :





où la composante  est telle que : 

Andreï Nikolaïevitch Kolmogorov (1903 – 1987), mathématicien russe, qui fut le premier à établir une

connexion entre la théorie de la mesure de Borel, la théorie de l’intégration de Lebesgue et les probabilités, et

proposa ainsi un ensemble d’axiomes qui permit la formalisation de l’étude des probabilités en une ‘théorie

mathématique’.

Foura Mayemba Sasi

Laboratoire d’Analyse – Recherche en Economie Quantitative

Cependant, rien ne garantie que la partie  satisfait toujours telles conditions, avec  est un

estimateur des moindres carrés appliqués dans  alors que l’équation définie en  n’aurait

aucun sens si ces contraintes ne sont pas garanties.

Et en plus, même si l’on parvenait à assurer le fait que toutes ces contraintes soient satisfaites par

l’estimateur des moindres carrés des paramètres du modèle linéaire, il n’en demeurerait pas

moins une difficulté liée à la présence d’hétéroscédasticité. En effet, il convient de remarquer la

matrice de variance covariance des résidus varie entre les individus en fonction de leur statut

associé aux exogènes  :



Pour démontrer ce résultat il suffit de considérer la loi discrète des résidus et de calculer la

variance de la variable aléatoire comme suit :



Connaissant  et  l’équation  devient :







Ce résultat justifie ainsi la présence d’hétéroscédasticité dans la variance du terme de l’erreur.

Sachant qu’une telle difficulté ne peut être résolu par l’usage d’une technique d’estimation par les

moindres carrés ordinaires, ni par les moindres carrés généralisés même si on tenait compte de la

contrainte d’inégalité, puisqu’en réalité, la matrice de variance covariance des perturbations

dépend du vecteur  des paramètres à estimer dans la spécification linéaire. Ce dernier est par

nature supposé inconnu.

Somme toute, les difficultés que présente l’application d’une forme fonctionnelle linéaire aux

modèles à variable endogène dichotomique et l’usage de la méthode des moindres carrés, ont

incité les économètres à développer des techniques appropriés pour traiter adéquatement les

différents problèmes évoqués précédemment. D’où, notamment les modèles logit et probit

Modèles Logit et Probit

Le modèle logit ou à régression logistique et le modèle probit permettent de modéliser les

interactions existant entre une variable dépendante dichotomique  et un vecteur de variables

aléatoire  à la seule différence, le logit utilise une fonction logistique, et le probit,

une fonction probit.

On distingue également d’autres types de modèles tels que les modèles linéaires, extension des modèles logit.

Foura Mayemba Sasi

Laboratoire d’Analyse – Recherche en Economie Quantitative

En effet, la fonction Logit a été proposée initialement par Verhulst (1838, 1845, 1847), puis

développé plus tard par le statisticien américain Joseph Berkson dans les années 1940. Elle a été

formalisée par analogie et en opposition au terme Probit, notion développée par le biologiste

américain Chester Ittner Bliss et le pharmacologue britannique John Gaddum dans les années

1930.

Le modèle logit est tel que :









où  est le vecteur paramétrique.

En parallèle, la fonction probit correspond à la réciproque de la fonction de la répartition de la loi

normale centrée réduite :

 

Et le modèle probit consiste à utiliser la fonction de répartition d’une variable normale centrée

réduite :





 







où  désigne la fonction de densité d’une loi normale centrée réduite et  sa fonction de

répartition.

Pour estimer ces modèles, on applique généralement la méthode d’estimation du maximum de

vraisemblance. Voir Togba et Tsasa (2013) pour de plus amples détails.

Somme toute, ce papier s’est proposé de mettre en évidence les difficultés qu’implique une

formalisation linéaire des modèles à variable dépendante dichotomique et leur estimation par la

méthode des moindres carrés. A ce titre, il place donc une première pierre dans l’édifice à ériger

dans les publications ultérieures dans le cadre du traitement et de l’étude des modèles à variables

qualitatives.

1 / 6 100%

Documents connexes

I Le projet - maleka.net – maleka.net

TD N° 14 - UTC

slides_1

Recherche dichotomique dans un tableau [re04] Exercice

Econométrie des variables qualitatives

Représentations et attentes des patients

ANALYSE DICHOTOMIQUE DES GENRES

L’irrigation de complément permet-elle aux paysans

Télécharger le document

La régression logistique en épidémiologie - HAL

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Laboratoire d`Analyse – Recherche en Economie Quantitative

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Laboratoire d`Analyse – Recherche en Economie Quantitative

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib