Foura Mayemba Sasi
Laboratoire d’Analyse – Recherche en Economie Quantitative
61
Modèles dichotomiques et Spécification linéaire
Laboratoire
d’
Analyse
Recherche
en
Economie Quantitative
One Pager
Novembre 2013
Vol. 8 Num. 006
Copyright © Laréq 2013
http://www.lareq.com
Modèles dichotomiques et Spécification linéaire
Foura Mayemba Sasi
1
« Le véritable travail, c’est de savoir attendre . . .
Je n’ai besoin de rien, mais rien ne me suffirait. »
Jean Edmond Cyrus Rostand (1894 1977)
Résumé
Ce papier propose une brève introduction aux modèles à variable dépendante dichotomique
(Logit et Probit).
Mots clé : Logit, Probit.
Abstract
This paper discusses on the dichotomous dependent variable models (Logit and Probit).
Introduction
L’une des extensions majeures de l’économétrie dans les années 60 et 70 fut incontestablement
liée à l’utilisation croissante des données microéconomiques relatives à des caractéristiques
économiques d’agents individuels tels que les firmes, les consommateurs ou les centres de profits.
Bien souvent, les données statistiques disponibles dans ces bases sont relatives à des caractères
qualitatifs comme par exemple, le sexe, la nationalité, la catégorie socio-professionnelle, le type
d’études réalisées, le fait de travailler ou au contraire d’être au chômage, d’acheter ou de ne pas
acheter un certain produit, etc. Cependant, la modélisation et l’étude des caractères quantitatifs
par les méthodes d’inférences traditionnelles ne sont pas possibles.
Ainsi, pour remédier à cette difficulté, plusieurs modèles ont été mis en œuvre. Ceux ci sont des
extensions directes du modèle linéaire. Il s’agit notamment des modèles Logit, Probit, Tobit ou
modèles linéaires généralisés.
Et ce papier, qui est une introduction à cette nouvelle approche, se propose de présenter les
modèles dichotomiques simples, notamment les modèles Logit développés particulièrement par
Verhulst (1938, 1945, 1947), puis Berkson (1944, 1951) ; et les modèles Tobit introduits par Bliss
(1934) et Gaddum (1933).
Ainsi, dans une section première, il est question d’analyser les modèles binaires univariés, et dans
les sections deuxième et troisième, d’examiner la problématique de la spécification linéaire des
1
Je remercie Jean Paul K. Tsasa pour ses commentaires.
Foura Mayemba Sasi
Laboratoire d’Analyse – Recherche en Economie Quantitative
62
modèles à variables endogènes dichotomiques et de procéder à une brève présentation des
modèles logit et probit.
Les modèles binaires univariés
Les modèles binaires univariés ont été développés dans l’optique de fournir un cadre d’analyse
formel qui permettrait de modéliser le lien pouvant exister entre une variable dépendante, notées
ne prenant que deux modalités (variable dichotomique) et une variable indépendante
quelconque.
Ainsi, le modèle s’écrit : 

A titre illustratif, considérons un échantillon de individus, tel qu’on observe pour chacun d’eux le
statut socio économique : employé salarié ou chômeur. On note par la variable codée
associée à la nature du statut en cause.
On pose, pour  :



En notant l’âge de l’individu  et une variable aléatoire telle que :
et



il y a lieu d’exprimer ce problème à l’aide du modèle
Le choix retenu traditionnellement du codage  pour les modèles dichotomiques, permet de
définir en réalité la probabilité de tirer dans l’échantillon considéré l’individu qui dispose d’un
emploi rémunérateur ou non.
Ainsi, en notant :
et
alors, l’espérance de s’écrit :

Foura Mayemba Sasi
Laboratoire d’Analyse – Recherche en Economie Quantitative
63
En vertu des axiomes de Kolmogorov
1
, pour tout sous - ensemble de l’univers représentant
toutes les éventualités possibles, on a que :
la probabilité est à support positif: (axiome de positivité) ;
la probabilité de l’univers est de masse unitaire : ;
la probabilité est additive : 
Dès lors, la modélisation des variables dichotomiques ne peut se faire par une spécification
linéaire standard, au regard de la restriction du domaine de définition des probabilités.
Problématique de la spécification linéaire des modèles dichotomiques
Comme vu précédemment, les modèles à variables dépendantes qualitatives se distinguent du
modèle linéaire classique. Ainsi, l’estimation de ce type des modèles exige la mise en œuvre des
techniques appropriées devant prendre en compte quelques spécificités et caractéristiques desdits
modèles. Si l’on se proposait d’appliquer une forme fonctionnelle linéaire, on fera face à plusieurs
difficultés techniques.
En effet, dans ces modèles, la variable endogène , dichotomique ne prend que les valeurs 0 ou 1.
Par conséquent, la spécification linéaire implique que la perturbation ne devra également
prendre que deux valeurs, conditionnellement au vecteur :
Pour  l’équation s’écrit :
et pour  l’équation  : 
Ainsi, la perturbation du modèle doit nécessairement admettre une loi discrète, ce qui
exclurait en particulier l’hypothèse de normalité des résidus !
Par ailleurs, lorsque l’on suppose que les résidus sont de moyenne nulle, la probabilité
associée à l’événement est alors déterminée de façon unique :

Une simple manipulation algébrique donne le complément à l’unité de l’expression :


où la composante est telle que : 
1
Andreï Nikolaïevitch Kolmogorov (1903 1987), mathématicien russe, qui fut le premier à établir une
connexion entre la théorie de la mesure de Borel, la théorie de l’intégration de Lebesgue et les probabilités, et
proposa ainsi un ensemble d’axiomes qui permit la formalisation de l’étude des probabilités en une ‘théorie
mathématique’.
Foura Mayemba Sasi
Laboratoire d’Analyse – Recherche en Economie Quantitative
64
Cependant, rien ne garantie que la partie satisfait toujours telles conditions, avec est un
estimateur des moindres carrés appliqués dans alors que l’équation définie en n’aurait
aucun sens si ces contraintes ne sont pas garanties.
Et en plus, même si l’on parvenait à assurer le fait que toutes ces contraintes soient satisfaites par
l’estimateur des moindres carrés des paramètres du modèle linéaire, il n’en demeurerait pas
moins une difficulté liée à la présence d’hétéroscédasticité. En effet, il convient de remarquer la
matrice de variance covariance des résidus varie entre les individus en fonction de leur statut
associé aux exogènes :

Pour démontrer ce résultat il suffit de considérer la loi discrète des résidus et de calculer la
variance de la variable aléatoire comme suit :

Connaissant et l’équation devient :

Ce résultat justifie ainsi la présence d’hétéroscédasticité dans la variance du terme de l’erreur.
Sachant qu’une telle difficulté ne peut être résolu par l’usage d’une technique d’estimation par les
moindres carrés ordinaires, ni par les moindres carrés généralisés même si on tenait compte de la
contrainte d’inégalité, puisqu’en réalité, la matrice de variance covariance des perturbations
dépend du vecteur des paramètres à estimer dans la spécification linéaire. Ce dernier est par
nature supposé inconnu.
Somme toute, les difficultés que présente l’application d’une forme fonctionnelle linéaire aux
modèles à variable endogène dichotomique et l’usage de la méthode des moindres carrés, ont
incité les économètres à développer des techniques appropriés pour traiter adéquatement les
différents problèmes évoqués précédemment. D’où, notamment les modèles logit et probit
1
.
Modèles Logit et Probit
Le modèle logit ou à régression logistique et le modèle probit permettent de modéliser les
interactions existant entre une variable dépendante dichotomique et un vecteur de variables
aléatoire à la seule différence, le logit utilise une fonction logistique, et le probit,
une fonction probit.
1
On distingue également d’autres types de modèles tels que les modèles linéaires, extension des modèles logit.
Foura Mayemba Sasi
Laboratoire d’Analyse – Recherche en Economie Quantitative
65
En effet, la fonction Logit a été proposée initialement par Verhulst (1838, 1845, 1847), puis
développé plus tard par le statisticien américain Joseph Berkson dans les années 1940. Elle a été
formalisée par analogie et en opposition au terme Probit, notion développée par le biologiste
américain Chester Ittner Bliss et le pharmacologue britannique John Gaddum dans les années
1930.
Le modèle logit est tel que :


et

est le vecteur paramétrique.
En parallèle, la fonction probit correspond à la réciproque de la fonction de la répartition de la loi
normale centrée réduite :
 
Et le modèle probit consiste à utiliser la fonction de répartition d’une variable normale centrée
réduite :

 
et



désigne la fonction de densité d’une loi normale centrée réduite et  sa fonction de
répartition.
Pour estimer ces modèles, on applique généralement la méthode d’estimation du maximum de
vraisemblance. Voir Togba et Tsasa (2013) pour de plus amples détails.
Somme toute, ce papier s’est proposé de mettre en évidence les difficultés qu’implique une
formalisation linéaire des modèles à variable dépendante dichotomique et leur estimation par la
méthode des moindres carrés. A ce titre, il place donc une première pierre dans l’édifice à ériger
dans les publications ultérieures dans le cadre du traitement et de l’étude des modèles à variables
qualitatives.
1 / 6 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !