Théorie du consommateur Classiques: les biens ont une utilité ou

publicité
Théorie du consommateur
Classiques: les biens ont une utilité ou une valeur d’usage et une
valeur d’échange. Paradoxe de l’eau et du diamand.
Smith A. (1776), An Inquiry into the Nature and Causes of the Wealth
of Nations
1705: machine à vapeur, début de la révolution industrielle.
Marginalistes
Gossen H. (1854), Entwickelung der Gesetze des menschlichen Verkehrs
und der daraus fliessenden Regeln für menschliches Handeln
1) Première loi de Gossen: l’utilité marginale est décroissante:
Utilité additive directe. Exemple:
u = a1 ln q1 + a2 ln q2 + . . . + am ln qm
∂u
∂qi
=
ai
qi
>0
;
∂2 u
∂qi2
= − qa2i < 0
i
2) Deuxième loi de Gossen: une personne maximise son utilité lorsqu’elle distribue l’argent dont elle dispose, pour l’achat des différents biens,
de manière à obtenir la même satisfaction avec le dernier atome de monnaie dépensé pour chaque bien. Nous verrons ci-dessous l’interprétation
de cette loi.
Edgeworth et Pareto proposent une fonction d’utilité où l’utilité marginale d’un bien dépend aussi de la quantité consommée d’autres biens.
Edgeworth F. (1881), Mathematical Psychics
Pareto V. (1909), Manuel d’économie politique
Walras L. (1874), Eléments d’économie politique pure
On a alors:
u = f (q1 , q2 , . . . , qm )
Par exemple:
am
u = q1a1 q2a2 . . . qm
On peut exprimer mathématiquement la décision du consommateur de
la manière suivante:
max u = f (q1 , q2 , . . . , qm )
S.C. y = p1 q1 + p2 q2 + . . . + pm qm
En utilisant les vecteurs q = [qi ] et p = [pi ] ; i = 1, 2, . . . , m , on peut
écrire:
max u = f (q) S.C. y = pT q
Le lagrangien est:
P
L = f (q1 , q2 , . . . , qm ) + λ(y − pj qj )
où y est le revenu du consommateur.
Les conditions de premier ordre sont:
∂L
∂u
=
i = 1, 2, . . . , m
∂qi
∂qi − λpi = 0
P
∂L
= y − pj q j = 0
∂λ
En prenant deux équations quelconques i et j, on a:
∂u
∂u
/p
=
λ
;
i
∂qi
∂qj /pj = λ
∂u 1
∂q1 p1
∂u 1
∂u 1
= ∂q
=
.
.
.
=
∂qm pm = λ
2 p2
C’est la deuxième loi de Gossen. En effet:
∂L∗
∂u∗
∂y = ∂y = λ est l’utilité marginale du revenu. L’utilité marginale de
chaque bien, pondérée par son prix, doit être égale à l’utilité marginale
du revenu.
La condition de deuxième ordre pour un maximum est:
T
xT Hx ≤ 0 S.C. ( ∂u
)
x = 0 où
∂q
∂u
∂q
∂u
] (i = 1, 2, . . . , m) et
= [ ∂q
i
H=
∂2 u
∂qi ∂qj
(i, j = 1, 2, . . . , m)
est la matrice hessienne de la fonction d’utilité. Il s’agit d’une matrice
symétrique (théorème de Young). Si la fonction d’utilité est additive directe, alors la matrice hessienne est une matrice diagonale avec les variations de l’utilité marginale sur la diagonale. Toutes ces valeurs étant
négatives selon l’hypothèse de l’utilité marginale décroissante, la matrice hessienne est une matrice définie négative et alors la condition de
deuxième ordre est satisfaite (xT Hx < 0 pour tout x et alors aussi
T
)
x = 0). La première loi de Gossen permet de satisfaire la
pour ( ∂u
∂q
condition de deuxième ordre lorsque l’utilité est additive directe. Dans
le cas général, la condition ci-dessus peut être vérifiée en calculant les
déterminants suivants:
f11
f
21
B
|Hi | = . . .
fi1
−p
1
f12
...
f1i
f22
...
f2i
...
...
...
fi2
...
fii
−p2
. . . −pi
i = 2, 3, . . . , m avec fij =
∂2 u
∂qi ∂qj
−p1 −p2 . . . −pi 0 Il faut que:
B
|H2B | > 0 ; |H3B | < 0 ; . . . (−1)m |Hm
|>0
Si la fonction d’utilité est strictement quasi-concave, alors cette condition est satisfaite. Une fonction est strictement quasi-concave si pour
tout q 1 6= q 2 , on a:
f [λq 1 + (1 − λ)q 2 ] > min {f [q 1 ], f [q 2 ]}
0<λ<1
i
]
avec q i = [q1i , q2i , . . . , qm
Si
B
|H2B | > 0 ; |H3B | < 0 ; . . . (−1)m |Hm
|>0
avec
f11 f12
f
21 f22
B
|Hi | = . . . . . .
fi1 fi2
f
f2
1
i = 2, 3, . . . , m
. . . f1i
. . . f2i
...
...
...
fii
...
fi
f1 f2 . . . fi 0 alors la fonction est strictement quasi-concave. Comme fi = λpi , la
condition de deuxième ordre est satisfaite.
Les courbes de niveau d’une fonction quasi-concave (avec ∂u/∂qi > 0)
sont convexes.
Utilité cardinale et utilité ordinale
Les premiers marginalistes pensaient que l’utilité pouvait être mesurée,
comme la température. On dit qu’il s’agit d’une grandeur cardinale. On
s’est ensuite rendu compte que la demande ne changeait pas lorsqu’on
effectuait une transformation monotone croissante (ou positive) de la
fonction d’utilité. En effet, soit
U = F (u) avec F ′ > 0
√
2
Exemples U = ln u ; U = u ; U = u
Le lagrangien sera alors:
L = F (u) + µ(y − pT q)
Les conditions de premier ordre sont:
∂L
′ ∂u
=
F
∂qi
∂qi − µpi = 0 i = 1, 2, . . . , m
∂L
∂µ
= y − pT q = 0
En prenant deux équations quelconques i et j, on a:
F′
∂u
∂qi
∂u
F ′ ∂q
j
=
pi
pj
et alors les conditions de premier ordre sont identiques car F ′ disparaı̂t.
Une transformation monotone continue laisse inchangée la courbe
d’indifférence. En effet, on a:
∂u
′ ∂u
′ ∂u
dq
+
F
dq
+
.
.
.
+
F
dU = F ′ ∂q
1
2
∂q2
∂qm dqm = 0
1
La pente de la courbe d’indifférence (cas de deux biens) est:
dq2
dq1
= −
F′
∂u
∂q1
∂u
F ′ ∂q
2
et elle est invariante par rapport à une transformation
monotone croissante de la fonction d’utilité.
Par contre, les utilités marginales changent:
∂U
∂qi
∂u
′
= F ′ ∂q
;
µ
=
F
λ
i
Exemple: si u = q1a1 q2a2 (avec ai > 1), on a des utilités marginales croissantes. Par contre, si l’on prend la transformation monotone croissante
U = ln u = a1 ln q1 + a2 ln q2 , l’utilité marginale devient décroissante,
comme voulu par la première loi de Gossen.
Pareto et d’autres économistes ont alors présenté la théorie du consommateur en partant directement des courbes d’indifférence. Ces
courbes ne permettent qu’un classement des complexes de biens [complexes préférés, complexes indifférents (sur la courbe), et complexes
pas préférés]. Comme il y a plusieurs fonctions d’utilité qui donnent la
même courbe d’indifférence, l’utilité n’est qu’une mesure ordinale qui
permet le classement des complexes de biens. La pente de la courbe
d’indifférence (sans le signe négatif) est appelée le taux marginal de substitution:
TMS =
dq2
− dq
1
=
∂u
∂q1
∂u
∂q2
Une courbe d’indifférence convexe implique un taux marginal de substitution décroissant.
Le mathématicien Volterra fit remarquer à Pareto que si l’on commence
avec la notion de courbes d’indifférence il faut que certaines conditions
soient satisfaites pour pouvoir remonter à la fonction d’utilité (lorsque le
nombre de biens est supérieur à 2). Par exemple, l’équation
q2 q3 dq1 + q1 q3 dq2 + q1 q2 dq3 = 0
est intégrable car u = q1 q2 q3 donne cette équation. Par contre;
dq1 + q3 dq2 + 2q2 dq3 = 0
n’est pas intégrale. L’équation:
f1 dq1 + f2 dq2 + f3 dq3 = 0
est intégrable lorsque:
∂f3
∂f3
∂f1
∂f1
∂f2
2
−
)
+
f
(
−
)
+
f
(
−
f1 ( ∂f
2
3
∂q3
∂q1
∂q1
∂q3
∂q2
∂q3 ) = 0
On peut montrer que si l’effet de substitution est symétrique alors il est
possible de remonter à la fonction d’utilité.
Théorie des choix
La fonction d’utilité ou la courbe d’indifférence ne servent qu’à exprimer
les préférences des consommateurs. On a alors proposé une théorie des
choix sans aucune référence aux anciennes notions d’utilité ou de courbe
d’indifférence.
Soient deux ensembles non vides X et Y . Par exemple, X pourraient
être les montagnes valaisannes et Y les montagnes bernoises. On peut
prendre des éléments de X (par exemple le Cervin) et de Y (par exemple l’Eiger) et former l’ensemble {x, y} où x ∈ X et y ∈ Y . Lorsque
l’ordre joue un rôle, on dit que (x, y) est une paire ordonnée. Un ensemble de paires ordonnées est appelé une relation binaire. Soit R une
relation binaire entre les éléments de l’ensemble X et ceux de l’ensemble
Y . Si deux éléments quelconques x et y satisfont à la relation binaire on
écrit x R y.
Souvent l’ensemble Y est le même que l’ensemble X. On parle alors
de relation binaire sur l’ensemble X. Lorsque la relation binaire sur
l’ensemble X satisfait aux deux axiomes suivants (x, y, z ∈ X):
(1) réflexivité: xRx pour tout x ∈ X
(2) transitivité: xRy et yRz
=⇒
xRz
on dit qu’on a un préordre.
La relation ≥ est une relation réflexive tandis que > ne l’ait pas. La relation ≥ est une relation transitive. La relation “au moins aussi difficile
que (AAD)” est réflexive mais peut ne pas être transitive si un alpiniste
considère que Cervin AAD Dent Blanche et Dent Blanche AAD Dom
mais Cervin pas AAD Dom. La relation binaire q 1 q 2 (q 1 “préféré ou
indifférent à” q 2 ou q 2 “pas préféré à q 1 ”) est réflexive mais peut ne pas
être transitive si le consommateur classe trois paniers (A, B et C) de la
manière suivante: A B ; B C mais A pas C.
Le préordre est complet lorsque l’axiome suivant est satisfait:
(3) xRy ou yRx (ou les deux)
Il faut que tous les cas puissent être classés dans l’une ou l’autre de ces
relations. Par exemple, si tous préfèrent A à B on peut écrire que, pour
la société, A B. Par contre, si entre A et C les opinions divergent,
on ne sait pas si, pour la société A C ou le contraire. Dans ce cas le
préodre n’est pas complet.
Ces trois axiomes sont suffisants pour représenter les préférences du consommateur. Néanmoins, il est beaucoup plus pratique d’ajouter l’axiome
de continuité suivant:
(4) quel que soit q o ∈ X, l’ensemble {q ∈ X|q o q} et l’ensemble
{q ∈ X|q q o } sont fermés dans X.
car on peut représenter les relations de préférence par une fonction
d’utilité.
Un ensemble est fermé s’il contient ses points limites. Par exemple
a ≤ x ≤ b est un ensemble fermé tandis que a < x < b est un ensemble ouvert. Dans le cas du consommateur, cela signifie qu’il doit se
comporter de manière rationnelle aussi pour de petites variations des
quantités.
L’utilité est ici une fonction définie sur X avec la propriété que
u(q 1 ) ≥ u(q 2 ) si et seulement si q 1 q 2
Elle ne sert donc qu’à exprimer les préférences sans les mesurer (utilité
ordinale).
Dans la plupart des cas, cette hypothèse est théoriquement acceptable,
comme vous pouvez le voir par les cas spéciaux où elle n’est pas satisfaite.
Soit l’ordre lexicographique, défini de la manière suivante:
q1 q2
si q11 > q12
ou bien q11 = q12 et q21 ≥ q22
où q1 et q2 sont les quantités des deux biens des complexes q 1 et q 2 .
C’est comme dans le classement des noms par ordre alphabétique, on
commence à regarder la quantité du premier bien et on passe ensuite
au deuxième bien seulement si celle du premier bien est identique. On
mentionne parfois les préférences d’un alcoolique pour illustrer ce cas (le
premier bien étant le vin).
Nous ferons normalement l’hypothèse que la fonction d’utilité est continûment différenciable même si dans ce cas on élimine la possibilité
de stricte complémentarité. Il ne faut pas utiliser le lagrangien pour
résoudre ce cas spécial. Il suffit de prendre la contrainte budgétaire et
le rapport entre les deux biens.
Exemple: max u = min(H, 0.5G) où H est un habit de ski et G un
gant. Si les prix sont pH = 500 et pG = 50 et le revenu 600, la solution s’obtient en prenant le lien entre habit et gant (H = 0.5G) et la
contrainte budgétaire:
50G + 500H = 50G + 500(0.5G) = 600
G=2 ;
H=1
Si les conditions de premier ordre conduisent à des quantités négatives,
alors il faut préciser explicitement que qi ≥ 0. Dans ce cas il faut utiliser
les conditions de Kuhn-Tucker:
∂u
≤0
i = 1, 2, . . . , m
∂qi − λpi
P
y − pj q j ≥ 0
Si l’égalité ne peut pas être atteinte alors qi = 0. On peut alors écrire:
∂u
[ ∂qi − λpi ]qi = 0
i = 1, 2, . . . , m
P
[y − pj qj ]λ = 0
∂u
− λpi < 0 alors qi = 0. En d’autres termes, un bien n’est pas
Si ∂q
i
acheté si son utilité marginale, pondérée par son prix, est inférieure à
∂u 1
< λ].
l’utilité marginale du revenu [ ∂q
i pi
La fonction de demande
On peut normalement résoudre les conditions de premier ordre
∂L
∂u
=
i = 1, 2, . . . , m
∂qi
∂qi − λpi = 0
P
∂L
= y − pj q j = 0
∂λ
et trouver la fonction de demande:
qi = φi (p1 , p2 , . . . , pm , y)
Elle dépend donc des prix de tous les biens et du revenu du consommateur. Il s’agit d’une fonction homogène de degré zéro par rapport aux
prix et au revenu (pas d’illusion monétaire). On peut alors utiliser le
théorème d’Euler sur les fonctions homogènes de degré s. Soit
y = f (x1 , x2 , . . . , xm )
γ s y = f (γx1 , γx2 , . . . , γxm )
Si z = γ s y ; vi = γxi on a:
z = f (v1 , v2 , . . . , vm )
P
dvi
dz
=
f
vi dγ
dγ
P
s−1
sγ
y = fvi xi
Lorsque γ = 1 on obtient le théorème d’Euler:
P
fxi xi = sy
Ici s = 0 et alors:
∂qi
∂qi
∂qi
∂qi
p
+
p
+
.
.
.
+
p
+
∂p1 1
∂p2 2
∂pm m
∂y y = 0
En utilisant les élasticités-prix et les élasticités-revenu:
∂qi y
∂qi pj
;
η
=
εij = ∂p
i
∂y qi
j qi
on a:
P
j εij + ηi = 0
La contrainte budgétaire permet d’obtenir deux autres relations entre les
élasticités. La relation d’agrégation de Cournot est obtenue en prenant
les dérivées par rapport au prix:
P
j ωj εji = −ωi
où ωi = pi qi /y est la part du revenu consacré au bien i.
La propriété d’agrégation d’Engel est obtenue en prenant la dérivée par
rapport au revenu:
P
j ωj ηj = 1
Statique comparative
Quels sont les effets sur la demande d’une variation du revenu ou des
prix? Engel a trouvé que lorsque le revenu augmente, la part consacrée aux biens alimentaires diminue. On a alors une élasticité-revenu
inférieure à 1:
dω1
dy
yp1
dq1
dy
−p1 q1
=
<0
y2
η1 < 1
La loi d’Engel est vérifiée dans tous les pays et à toutes les époques.
Si l’utilité est une fonction homothétique [U = F (u) avec F ′ > 0 et
u une fonction homogène de degré 1] alors l’élasticité-revenu est égale
à l’unité. En effet, le taux marginal de substitution ne dépend que du
rapport des quantités et la courbe d’Engel est une droite.
L’effet d’une variation des prix est plus difficile à déterminer car une
hausse des prix correspond à une baisse du revenu réel. Il faut alors
éliminer cet effet de revenu. En différenciant les conditions de premier
ordre on obtient:
f11 dq1 + . . . + f1m dqm − p1 dλ − λdp1 = 0
f21 dq1 + . . . + f2m dqm − p2 dλ − λdp2 = 0
...
fm1 dq1 + . . . + fmm dqm − pm dλ − λdpm = 0
p1 dq1 + q1 dp1 + . . . + qm dpm = dy
où fij =
∂2 u
∂qi ∂qj
Sous forme matricielle on a:

f11
f12
...
f1m
−p1

dq1

  dq 
f
f
.
.
.
f
−p
2 
22
2m
2 
 21



 ............................  ...  =






 fm1 fm2 . . . fmm −pm   dqm 
−p1
−p2
. . . −pm
0
dλ

λ
0
...
0
0
 0 λ ... 0
0


 .....................


 0 0 ... λ
0
q1
H
−pT
q2

dp1

  dp 
 2 


 ... 




  dpm 
. . . qm −1
−p
dq
λI
= T
0
dλ
q
dy
0
−1
dp
dy
où H est la matrice hessienne, I la matrice unitaire, dq = [dqi ] et dp =
[dpi ] , i = 1, . . . , m.
Pour connaı̂tre l’effet d’une variation des prix sur les quantités achetées,
il suffit de prémultiplier ce système par la première matrice à gauche.
Les conditions de deuxième ordre pour un maximum sous contrainte
nous disent que cette matrice est non singulière. Si son inverse est:
−1 1
H
−p
K
−b
λ
[H B ]−1 =
=
−pT
0
−bT
c
on a:
dq
dλ
dq
=
=
1
λK
T
−b
−b
c
K − bq T
λI
qT
0
dp
−1
dy
b
dp
dλ
−λbT + cq T −c
dy
En prenant uniquement le vecteur des variations des quantités on peut
écrire:
dq = [K − bq T ]dp + b dy = Kdp + b(dy − q T dp)
Ceci est une généralisation de l’équation de Slutsky. La deuxième partie
est appelée l’effet de revenu d’une variation des prix. En effet, l’effet de
la variation du revenu sur la quantité achetée du bien est:
∂q
∂y
=b
Si l’on veut obtenir l’effet pur d’une variation du prix il faut éliminer
cet effet de revenu. Slutsky a alors imaginé de compenser le consommateur de manière qu’il puisse toujours acheter les mêmes quantités de
biens. Il faut alors que son revenu augmente de dy = q T dp. Dans ce cas,
le deuxième terme disparaı̂t et l’effet pur est donné par la matrice K.
Quelles sont les propriétés de cette matrice?
Comme [H B ][H B ]−1 = I, on a:
1
T
HK
+
pb
λ
− λ1 pT K = 0
B
= I ; −Hb − pc = 0
; pT b = 1
H et H sont des matrices symétriques. Par conséquent [H B ]−1 et K le
sont aussi. D’autre part, K est une matrice singulière car Kp = 0. En
prémultipliant par K la première équation ci-dessus on obtient:
1
λ KHK
+ KpbT = K
et sa transposée est:
1
λ KHK
+ bpT K = K
Comme pT K = 0, on a:
1
λ KHK
=K
Etudions les propriétés de la forme quadratique:
z T Kz = z T KHKz = xT Hx
avec x = Kz. Les conditions de deuxième ordre nous disent que
T
)
x = 0. D’autre part, Kp=0 et K
xT Hx ≤ 0 sous la contrainte ( ∂u
∂q
est de rang m-1. Par conséquent, x =0 seulement si z = αp où α est une
constante quelconque. La matrice K est donc une matrice semi-définie
négative. Par conséquent:
Kii < 0
Si le prix du bien i augmente la quantité consommée diminue même si
l’on compense le consommateur afin qu’il puisse continuer à acheter la
même quantité. Le consommateur substitue une partie de ce bien par
un autre meilleur marché. La matrice K est alors appelée la matrice de
l’effet de substitution.
Si uniquement le prix pj varie on obtient l’effet suivant sur la quantité
qi :
∂qi
∂pj
= Kij −
∂qi
∂y
qj
Kij est l’effet pur ou effet de substitution et le reste l’effet de revenu
d’une variation du prix. C’est l’équation de Slutsky. On peut l’exprimer
en utilisant les élasticités:
εij = ξij − ωj ηi
Si, pour i 6= j, l’élasticité-prix pure ξij est positive on dit que i et j sont
deux biens substituts purs. Par contre, si εij > 0 on dit que les deux
biens sont des substituts bruts. Lorsque l’élasticité est négative on parle
de biens complémentaires (purs ou bruts). Par exemple, si u = q1 q2 les
deux biens sont des substituts purs mais ε12 = 0 (indépendants bruts).
L’approche duale
La maximisation de l’utilité sous la contrainte budgétaire permet de
trouver le point sur la droite du budget dont l’utilité est la plus élevée.
Si l’on cherche à minimiser les dépenses nécessaires pour atteindre ce
niveau d’utilité on trouve le même point. Cette approche duale est souvent utilisée dans l’analyse du coût de la vie car on cherche précisément
le budget minimum pour garder le même niveau de satisfaction. Le
problème est alors:
P
min C = j pj qj S.C. f (q) = u∗
La fonction:
C(p, u∗ ) = min pT q S.C. f (q) = u∗
est appelée la fonction de coût ou de dépense.
La dérivée de cette fonction par rapport au prix du bien donne directement l’effet de substitution (car l’utilité est constante, comme dans
l’interprétation de Hicks-Allen):
∂C
∗
∗
=
(q
)
[q
=
h
(p,
u
)]
i
u=u
i
i
∂pi
Soit l’expression suivante:
ψ(p) = C(p, u∗ ) − pT q ∗
où q ∗ est la quantité qui maximise l’utilité. Cette expression n’est jamais positive et son maximum est obtenu lorsque p est le vecteur des
prix qui a conduit à la solution q ∗ . Dans ce cas ψ(p∗ ) = 0. On obtient
alors:
∂ψ ∗
∂C
∂C
∗
∗
=
−
q
=
0
=⇒
−
q
i
i =0
∂pi
∂pi
∂pi
Cette demande est celle d’un consommateur qui a été compensé par la
baisse du pouvoir d’achat (lorsque les prix augmentent). On parle alors
de demande compensée ou demande hicksienne tandis que la fonction de
demande usuelle est appelée la demande marshallienne.
En utilisant l’équation de Slutsky:
∂qi
∂qi
∂qi
∗
−
=
(
)
∂pi
∂pi u=u
∂y qi
on peut dire que la demande compensée a une pente plus forte que la
∂pi
i
∗
|
<
|(
demande marshallienne [| ∂p
∂qi
∂qi )u=u |], sauf dans le cas des biens
inférieurs.
Exemple: u = q1 q2
La demande marshallienne est:
q1 =
y
2p1
; q2 =
y
2p2
∗
; u =
y2
4p1 p2
La demande hicksienne est:
q ∗
q ∗
q1 = up1p2 ; q2 = up2p1
La fonction de coût:
√
C = 2 p1 p2 u ∗
donne directement la demande hicksienne en prenant la dérivée par rapport au prix:
q ∗
q ∗
u p2
u p1
∂C
∂C
=
;
=
∂p1
p1
∂p2
p2
La dérivée de la demande hicksienne donne l’effet de substitution:
q 2
q ∗
u p2
y p2
y
∂q1
1
1
=
−
=
−
=
−
3
4
∂p1
2
2
p
4p p2
4p2
1
1
1
et ceci correspond au terme K11 dans l’équation de Slutsky:
K11 =
∂q1
∂p1
+
∂q1
∂y
q1 = − 2py2 +
1
y
1
2p1 2p1
= − 4py2 .
1
La fonction de coût est une fonction homogène de degré 1. On peut
montrer qu’elle est concave.
Si l’on introduit les quantités optimales dans la fonction d’utilité on obtient la fonction d’utilité indirecte, définie ainsi:
v(p, y) = max u(q)
Ci-dessus on a déjà calculé la fonction d’utilité indirecte correspondant à
y2
∗
la fonction directe u = q1 q2 . En effet v = u = 4p1 p2 .
L’utilité indirecte permet d’obtenir la demande marshallienne en utilisant l’identité de Roy:
∂v
− ∂p
∂v
∂y
i
= qi (p, y)
Cette identité peut être démontrée de la manière suivante. En prenant
la définition de la fonction d’utilité indirecte, on peut écrire:
v(p, y) ≡ u∗ = f (q ∗ ) ≡ f [φ1 (p, y), ..., φm (p, y)]
La dérivée par rapport au prix pi est:
P ∗ ∂qj
∂v
j fj ∂pi
∂pi =
En utilisant les conditions de premier ordre (fi = λpi ) et la relation
P
∂q
d’agrégation de Cournot (qi + j pj ∂pji = 0) on obtient:
P ∂qj
= λ( pj ∂pi )
= −λqi
La dérivée par rapport à y est:
P ∗ ∂qj
∂v
j fj ∂y
∂y =
et elle devient, en procédant de la même manière que ci-dessus:
P
∂qj
∂v
=
λ(
p
j j ∂y )
∂y
=λ
Nous avons ainsi démontré que le multiplicateur de Lagrange est effectivement égal à l’utilité marginale du revenu. En définitive on obtient:
∂v
∂v
=
−
∂pi
∂y qi
On peut alors écrire:
∂v
∂pi
qi = φi (p, y) =
∂v(p,y)
∂pi
∂v(p,y)
∂y
−
Exemple:
Si v =
q1 =
y2
4p1 p2
y 2 /4p21 p2
2y/4p1 p2
on a:
=
y
2p1
qui est la demande marshallienne lorsque u = q1 q2 .
Le surplus du consommateur
La proposition de Dupuit de mesurer l’utilité d’un bien par la surface
sous la fonction de demande a été étudiée par Marshall qui indiqua une
restriction importante pour son utilisation. Il faut que l’utilité marginale
du revenu soit constante. En effet, si le consommateur doit payer plus
cher les premières unités, il aura moins d’argent pour acheter les autres.
Comme la part du revenu consacré à chaque bien est peu importante,
Marshall juge acceptable cette restriction. On peut comprendre la restriction imposée par Marshall en utilisant l’identité de Roy:
qi (p, y) =
∂v
− ∂p
∂v
∂y
i
= − λ1
∂v
∂pi
Si le prix pi passe de p1i à poi la variation du surplus est:
R 1 ∂v
R poi
S = p1 qi dpi = − λ ∂pi dpi
i
Si l’utilité marginale du revenu est constante, on peut écrire:
S=
1
λ|
−
po
v(p, y)|pi1
i
=
1
1
[v(p
, y)
λ
− v(po , y)]
Le surplus représente la variation de l’utilité du consommateur. L’utilité
marginale du revenu “transforme” cette utilité en valeur monétaire cal-
culable.
Si l’utilité marginale du revenu varie, on peut calculer le “vrai” surplus
de la manière suivante. Si le prix baisse (de poi à p1i ), l’utilité du consommateur augmente. Quelle somme faut-il lui prendre pour que son
utilité ne change pas? En utilisant la fonction de coût, on peut écrire:
CV = C(po , uo ) − C(p1 , uo )
On l’appelle la variation compensée. Graphiquement, la variation compensée est la surface sous la fonction de demande compensée tandis que
le surplus est la surface sous la fonction de demande marshallienne.
On pourrait aussi prendre le niveau de satisfaction dans la nouvelle situation comme point de comparaison. Par exemple, si le gouvernement
veut empêcher que le prix du lait baisse de poi à p1i , quelle somme doit-il
donner au consommateur afin que son niveau d’utilité soit celui obtenu
avec une baisse du prix? Cette somme est la variation équivalente:
EV = C(po , u1 ) − C(p1 , u1 )
Pour des biens normaux, EV > CV .
√
∗
Exemple: u = q1 q2 → C(p, u ) = 2 p1 p2 u∗
Si y = 24 , po1 = 2 , po2 = 0.5, on a uo = 144 et C(2, 0.5, 144) = 24 = y.
Si le prix p1 baisse de 2 à 0.5 on a:
R2 y
S = 0.5 2p1 dp1 = 16.6
CV = C(2, 0.5, 144) − C(0.5, 0.5, 144) = 24 − 12 = 12
EV = C(2, 0.5, 576) − C(0.5, 0.5, 576) = 48 − 24 = 24
La fonction d’utilité indirecte monnaie-métrique
Pour des valeurs données des prix, la fonction de coût varie selon les
valeurs de l’utilité. On l’appelle la fonction d’utilité directe monnaiemétrique, c’est-à-dire mesurée en termes de monnaie (en francs). Si
l’on prend la fonction d’utilité indirecte v(po , y), la fonction de coût
C(p1 , uo ) devient:
C(p1 , uo ) = C[p1 , v(po , y)] = µ(p1 , po , y)
On l’appelle la fonction d’utilité indirecte monnaie-métrique. Elle indique le revenu nécessaire pour que le consommateur ait la même utilité
lorsque les prix sont p1 que celle qu’il avait avec les prix po .
Exemple
Soit la fonction d’utilité u = q1 q2 , le revenu y et les prix p = [p1 p2 ].
√
La fonction de coût est C(p, u) = 2 p1 p2 u et l’utilité indirecte v(p, y) =
y 2 /4p1 p2 . La fonction d’utilité indirecte monnaie-métrique est alors:
q 1 1 2
p1 p2 y
1 o
µ(p , p , y) = 2 4po po
1 2
Si po1 = 1 , po2 = 2 , y = 24, alors q1o = 12 , q2o = 6 et l’utilité est 72.
Lorsque les prix sont p11 = 2 , p12 = 4, on trouve µ = 48. En effet, on a
multiplié par 2 les prix et alors le revenu doit doubler pour que l’utilité
reste la même.
On peut exprimer les variations compensée et équivalente en prenant
l’utilité indirecte monnaie-métrique. Supposons que le consommateur
dispose d’un revenu de y o lorsque les prix sont po et de y 1 lorsqu’ils
sont de p1 . La variation de bien-être peut être calculée en prenant la
différence des fonctions d’utilité indirecte v(p1 , y 1 ) − v(po , y o ). Cette
différence peut être exprimée en termes monétaires en prenant la fonction d’utilité indirecte monnaie-métrique. Les variations compensée et
équivalente sont alors:
CV = µ(p1 , p1 , y 1 ) − µ(p1 , po , y o )
= y 1 − C(p1 , uo )
EV = µ(po , p1 , y 1 ) − µ(po , po , y o )
= C(po , u1 ) − y o
Lorsqu’on examine la variation de bien-être due à une modification des
prix, le revenu ne change pas et alors: y 1 = C(p1 , u1 ) = y o = C(po , uo ).
Par conséquent:
CV = C(po , uo ) − C(p1 , uo )
EV = C(po , u1 ) − C(p1 , u1 )
comme indiqué précédemment.
15
14
13
12
11

10



9
CV

8


7
6
5
4
3
2
1
Variation compensée
q2
...
...
...
...
...
...
...
...
...
.
.
.....
...
...
.
.......
...
...
.
........ ..
...
... ..... ...
...
... ........
...
... .......
...
... ........
...
... ... ......
..
... .. .....
... ... ...... ....
..... ...
... ...
..... ...
... ...
.....
..... ..
......
..
..... ...
.
.
.....
.....
........
.
..
.....
........
........
.
..... ......
......
.. ..
.....
..... ....
.....
.. ...
o
..... 1
.
.....
........
....
.......
..........
......
...........
.
.
.......
............
..... ........
.........
..... ........
... ......
..... ..........
... ......
..........
.....
... ..............
...........
.....
.......
...
...
.
.....
... ..... ...........
.....
..........
..
...
............ ......
...
.....
...................
...
..
..................
.....
...
.
.
.....
.....
...
.....
...
.....
.
.....
...
.....
.
...
...
•S
•S
q1
0 1 2 3 4 5 6 7 8 9 10
Variation équivalente
15 q2

...

..
14


...


13 ......
.
...
EV 12
..
... . ...

... ... ...


... . ...
11

... .. ...

.

10 ................. ......... ...............
... ..... ..
. ...
... ..... ..
.
.
.
.
.
.
9 ..... ............. .............
... ......
......
... ... ......
.
... .. ..... .....
8
... ... ...... ..
..... ...
... ...
..... ...
... ...
..... ...
7
.....
..... ...
......
........
......
........
....
.
.......
.
6
...
.....
...
...........
...
o
.. ...... 1
...
.....
5
•S
...
..
...•S
.....
.. ..............
.....
....
........
... ....................
4
........
..... .......
..
... ......
..... .........
.........
.....
... .......
.
.
..........
...
.....
... .......
3
............
.....
.......
...
.
........ ..
.....
...
...........
.
.
.
...
.
....
.........
...
2
... ...................................
...
...............
..
...
.....
...
.....
...
1
...
.....
..
..
..
...
..
.....
...
q1
0 1 2 3 4 5 6 7 8 9 10
..
Théorie de la préférence révélée
Plutôt que de demander aux consommateurs quelles sont ses préférences,
Samuelson suggéra d’observer son comportement afin de tirer des renseignements sur ses préférences.
1 T
]
Supposons que le consommateur achète les quantités q 1 = [q11 , q21 , .., qm
(vecteur-colonne) lorsque les prix sont
p1 = [p11 , p12 , . . . , p1m ]
(vecteur-ligne). Sa dépense est p1 q 1 . Prenons maintenant un autre complexe q 2 qui ne coûte pas plus cher que q 1 [p1 q 2 ≤ p1 q 1 ]. Le consommateur pouvait acheter ce complexe et il ne l’a pas fait. On dira alors qu’il
préfère q 1 à q 2 . On écrira:
q1 R q 2 q 1 6= q 2
c’est-à-dire “q 1 révélé préféré à q 2 ” ou q 2 “pas révélé préféré à” q 1 . Par
contre, si un complexe q 3 est plus cher [p1 q 3 > p1 q 1 ], on ne peut rien
dire car on ne sait pas si le consommateur ne le préfère pas ou s’il n’a
pas assez d’argent pour l’acheter.
Toujours en observant le consommateur, supposons que quelques jours
plus tard il achète le complexe q 2 et les prix sont p2 . Si son comportement est rationnel et si ses goûts n’ont pas changé, il ne doit pas révéler
qu’il préfère q 2 à q 1 . L’axiome faible de la préférence révélée dira que:
q1 R q2
=⇒
q 2 pas R q1
La relation doit être asymétrique comme dans le cas de >.
Si cet axiome est satisfait, le consommateur a acheté q 2 car il est maintenant meilleur marché que q 1 [p2 q 2 < p2 q 1 ].
Samuelson a réussi à déduire l’homogénéité de degré zéro de la fonction de demande et le signe négatif de l’effet de substitution en utilisant
uniquement cet axiome.
Prenons deux vecteurs de prix p1 et p2 qui ont les mêmes éléments exceptés les premiers prix. En d’autres termes, c’est uniquement le prix du
premier bien qui a changé (p1i = p2i i = 2, . . . , m ; p11 6= p21 ). Supposons
que le consommateur achète le complexe q 1 lorsque les prix sont p1 et q 2
lorsqu’ils sont p2 . Lorsque les prix sont p1 , le consommateur aurait aussi
pu acheter le complexe q 2 car le coût est le même (p1 q 1 = p1 q 2 ). Il a
alors révélé qu’il préfère q 1 à q 2 (q 1 R q 2 ). L’axiome faible nous dit que
p2 q 2 < p2 q 1 . Comme p1 q 1 − p1 q 2 = 0, on a:
[p1 q 1 − p1 q 2 ] + p2 q 2 − p2 q 1 < 0
(p2 − p1 )(q 2 − q 1 ) < 0
(p21 − p11 )(q12 − q11 ) < 0 → ∆p1 ∆q1 < 0
L’homogénéité de degré zéro peut être démontrée en multipliant les prix
et le revenu par une constante γ. Soit p2 = γp1 ; y 2 = γy 1 . On a:
p2 q 2 = y 2 = γy 1 = γp1 q 1
Comme p2 = γp1 , on peut écrire:
γp1 q 2 = γp1 q 1 → p1 q 2 = p1 q 1
Supposons que q 1 6= q 2 . Selon l’axiome faible, q 1 R q 2 car le coût est le
même et le consommateur a acheté q 1 . On a alors:
p 2 q 1 > p2 q 2
γp1 q 1 > γp1 q 2
p 1 q 1 > p1 q 2
et ceci est une contradiction car p1 q 1 = p1 q 2 . Par conséquent, q 1 = q 2 et
alors la quantité achetée ne change pas.
Samuelson n’a pas réussi à montrer la symétrie de l’effet de substitution.
Dans ce cas, on aurait pu faire le lien avec les préférences provenant
d’une fonction d’utilité.
Houthakker a montré qu’il fallait un axiome plus fort qui ne se limitait
pas à la comparaison entre deux complexes. L’axiome fort est le suivant:
q1 R q2 R q 3 . . . q n−1 R q n → q n pas R q1
Il ne faut pas qu’il y ait un cycle. Cette condition est similaire à une
condition d’acyclicité introduite par von Neumann et Morgenstern.
Exemple:
p1 = [ 3 2 1 ] ; p2 = [ 1 3 1 ]
p3 = [ 10 6 8 ]
T
q 1 = [ 2 15 10 ]
T
T
; q 2 = [ 3 9 15 ]
q 3 = [ 12 5 6 ]
On a:
p1 q 1 = 46 ; p1 q 2 = 42 ; p1 q 3 = 52 → q 1 R q2
p2 q 1 = 57 ; p2 q 2 = 45 ; p2 q 3 = 33 → q 2 R q3
p3 q 1 = 190 ; p3 q 2 = 204 ; p3 q 3 = 198 → q 3 R q1
L’axiome faible est satisfait tandis que l’axiome fort ne l’ait pas car
q1 R q2 R q3 → q1 R q3 .
Si l’on accepte des courbes d’indifférence avec une partie droite (courbe
convexe au lieu de strictement convexe) alors le consommateur peut
choisir des valeurs différentes sur cette partie droite sans qu’il y ait contradiction. Dans ce cas, il suffit de prendre un axiome généralisé de la
préférence révélée (GARP).
On dit que:
1) q 1 est directement révélé préféré à q 2 (q 1 R D q 2 ) si p1 q 1 ≥ p1 q 2
2) q 1 R qn → q1 R D q2 . . . R D qn
Un ensemble de données satisfait GARP si q 1 R q n → pn q 1 ≥ pn q n .
Un ensemble de données est conforme à la maximisation de l’utilité si et
seulement si il satisfait GARP.
Dans une analyse de données avec GARP, il faut naturellement tenir
compte du pouvoir du test. En effet, si le revenu augmente, tous les
complexes de biens qui se trouvent sur la nouvelle contrainte budgétaire
sont souvent conformes à la maximisation de l’utilité. Le pouvoir du
test est nul.
Le modèle de Lancaster
La théorie du consommateur a été développée au XIX siècle lorsque
les biens achetés étaient peu nombreux. Aujourd’hui le consommateur
a le choix entre plusieurs milliers de biens. Ceci posait des problèmes
aux économistes qui devaient calculer des indices de prix car les biens
changeaient d’une année à l’autre. Il y avait deux possibilités: soit ignorer les différences et considérer qu’il s’agit d’un même bien, soit considérer que les deux biens étaient totalement différents. Cette solution
n’était pas satisfaisante car dans le premier cas on peut confondre un
changement de qualité par une hausse de prix et dans le deuxième cas
il est impossible de calculer la hausse des prix. On a alors construit
des indices “hédonistes” où l’on considère qu’un bien possède un certain nombre de caractéristiques. Par exemple, la différence entre une
voiture X et une autre voiture XL n’est peut-être qu’un problème de
peinture métallique. Si l’on tient compte de ce coût supplémentaire, on
peut calculer la hausse du prix du modèle actuel par rapport au modèle
de l’année passée.
Lancaster s’est inspiré de cette notion de caractéristiques pour dévelop-
per une nouvelle théorie du consommateur. Les biens possèdent des
caractéristiques objectives (châssis, moteur, carrosserie, etc. pour une
voiture; vitamines, protéines, etc. pour la nourriture). Les individus ont
des préférences subjectives pour ces caractéristiques. Les préférences
pour les biens sont indirectes car les biens possèdent les caractéristiques
dans des proportions variables. Lancaster suppose qu’il y a un lien
linéaire entre bien et caractéristiques:
Pm
zi = j=1 bij qj i = 1, 2, . . . , r
où zi est la caractéristique i et bij est une constante. La matrice B =
[bij ] est appelée la matrice de la technologie de la consommation. Le
problème du consommateur est alors le suivant:
max u = (z) S.C. z = Bq ; q ≥ 0 ; pq ≤ y
Il s’agit d’un problème de programmation non-linéaire.
Le modèle de Lancaster est utilisé pour analyser les changements de
qualité. Dans tous les autres cas, on continue à utiliser le modèle traditionnel.
Le modèle intertemporel
Théoriquement, il est facile de généraliser le modèle du consommateur
en introduisant plusieurs périodes. La fonction d’utilité deviendrait:
u(q11 , . . . , qm1 ; q12 , . . . , qm2 ; . . . ; q1T , . . . , qmT )
où le premier indice indique le bien, le deuxième la période et T est le
nombre total de périodes. La contrainte serait:
PT Pm
PT Pm
o
p
q
=
p
q
jt
jt
jt
jt
t=1
j=1
t=1
j=1
o
sont les ressources du consommateur. Les prix et les ressources
où qjt
futurs sont naturellement des valeurs anticipées. Le prix d’un même
bien à deux époques différentes permet de calculer le facteur d’escompte
ou d’intérêt, spécifique pour chaque bien.
En maximisant l’utilité sous cette contrainte on obtient les quantités
que le consommateur planifie de consommer pendant toutes les périodes.
Ce modèle est peu réaliste si on l’applique à un nombre arbitraire de
biens. La vie du consommateur devient impossible s’il doit planifier le
nombre de lacets de souliers qu’il pense acheter dans 20 ans. On suppose alors qu’il procède en deux étapes. Dans une première étape il se
P
limite à prévoir la consommation dans chaque période (ct =
pit qit ).
Ensuite, il répartit cette somme entre les différents biens qu’il pense
acheter. Cette deuxième étape correspond
au modèle statique qu’on a
P
vu [max u = f (q1 , . . . , qm ) S.C.
pi qi = c]. La première étape est
alors:
max V = f (c1 , c2 , . . . , cT ) S.C.
P
P
yt
ct
=
t (1+r1 )...(1+rt−1 )
t (1+r1 )...(1+rt−1 )
où rt sont les taux d’intérêt (r0 = 0) et yt les revenus du consommateur.
Les conditions de premier ordre sont:
 ∂L
∂v
λ
=
−

∂cj
(1+r1 )(1+r2 )...(1+rj−1 ) = 0
 ∂cj
P
yt
∂L
=
∂λ
(1+r )(1+r2 )...(1+rt−1 )

P 1

ct
−
(1+r1 )(1+r2 )...(1+rt−1 ) = 0
(j = 1, 2, . . . , T )
De ces conditions on tire:
δj =
∂v
∂cj
∂v
∂cj+1
− 1 = rj
j = 1, 2, . . . , T − 1
Les taux de préférence pour le temps (δj ) doivent être égaux aux taux
d’intérêt.
On fait souvent l’hypothèse que l’utilité est additive par rapport au
temps:
PT
u(ct )
v(c1 , c2 , . . . , cT ) = t=0 (1+ρ
t
t)
où u(ct ) est la fonction d’utilité “instantanée” et ρt est le taux d’escompte subjectif.
Si ce taux subjectif n’est pas constant, le consommateur ne va pas suivre
le plan qu’il avait préparé. En effet, Strotz a montré que, même lorsque
toutes les anticipations restent les mêmes, le consommateur trouve que
son plan n’est plus optimal lorsqu’il le réexamine quelque temps plus
tard. On fait alors l’hypothèse que le taux est constant et on écrit:
PT
1
v = t=0 ( 1+ρ
)t u(ct )
D’autre part, on préfère souvent travailler avec un temps continu et
alors on a:
R T −ρt
v = t=0 e u(ct )dt
De nombreuses enquêtes auprès des consommateurs révèlent que cet es-
compte “exponentiel” ne correspond pas à la réalité. Les périodes lointaines sont escomptées à un taux plus bas que les périodes récentes.
Un escompte “hyperbolique” du type φ(t) = (1 + αt)−ρ/α donne de
meilleurs résultats. On obtient l’escompte exponentiel lorsque α → 0
(φ(t) = e−ρt ). Dans ce qui suit, on va néanmoins continuer à utiliser
l’escompte exponentiel.
La variation des actifs du consommateur (at ) est représentée par le
revenu reçu, y compris l’intérêt sur les actifs, moins les dépenses. On
a alors:
ȧ = ra + y − c
Si l’on suppose que le consommateur désire garder un actif à la fin de la
période, le problème devient:
R T −ρt
max o e u(ct ) dt + e−ρT u(aT )
S.C. ȧ = ra + y − c
C’est un problème de calcul des variations. Il existe une méthode similaire à celle de Lagrange pour résoudre ce problème. C’est la méthode
de Pontryagin qui utilise la valeur courante de l’hamiltonien:
H c = u(ct ) + λ[ra + y − c]
où λ est une variable auxiliaire appelée la costate. Les conditions de
premier ordre sont:
∂H c
∂u
=
∂c
∂c − λ = 0
λ̇ = ρλ − λr = (ρ − r)λ
Il faut aussi satisfaire la condition de transversalité:
T)
λ(T ) = ∂u(a
∂aT
En éliminant λ on trouve:
u′′ (c) ċ
[c u′ (c) ] c = ρ − r
Cette expression est appelée l’équation d’Euler. Si le temps est discret,
il faut utiliser la programmation dynamique et le principe d’optimalité
de Bellman. Le problème devient:
P 1 t
max V = t ( 1+ρ ) u(ct )
S.C. at+1 = (1 + r)at + yt − ct
Supposons que nous sommes arrivés au temps to > 0. Le principe
d’optimalité de Bellman dit que, quel que soit l’état initial, si les
premières décisions sont celles du plan optimal, alors les décisions successives sont obtenues en cherchant le plan optimal pour le problème
commençant en to avec l’état du système résultant des décisions précédentes (l’actif au temps to dépend des décisions précédentes).
Soit
PT
1
t−to
W (a, to ) = max
(
)
u(ct )
t=to 1+ρ
En utilisant successivement le principe de Bellman, on peut écrire:
W (at , to ) = max[u(cto ) + W (ato +1 , to+1 )]
to
Si l’on utilise la valeur courante de cette fonction:
W c (ato , to )(1 + ρ)to
on a:
W c (ato , to ) = max[u(cto )+
to
1
c
1+ρ W (ato +1 , to+1 )]
Cette expression est très pratique lorsqu’on introduit explicitement
l’incertitude sous la forme de valeurs espérées. On a:
W c (ato , to ) = max[u(cto )+
1
c to
( 1+ρ )Eto {W (ato +1 , to+1 )}]
où les anticipations sont celles de la période to . Cette maximisation est
effectuée sous la contrainte
ato +1 = (1 + r)ato + yto − cto
Les conditions de premier ordre sont:
∂u
∂ct = λ(to )
o
1
λ(to ) = 1+ρ
Eto {λ(to + 1)(1 + r)}
Cette dernière relation est appelée l’équation d’Euler, comme dans le cas
continu.
Choix en situation d’incertitude
Le consommateur doit souvent faire des choix sans connaı̂tre les conséquences de sa décision. Par exemple, il décide de prendre une assurance
contre le vol sans savoir si on lui vole quelque chose; il achète des actions
sans savoir si elles vont augmenter ou baisser, etc.
Von Neumann et Morgenstern ont proposé un modèle pour expliquer
le comportement de l’individu en cas de risque ou d’incertitude. En
prenant une série d’axiomes, ils arrivent à la conclusion que l’individu
maximise l’utilité espérée.
Lorsqu’il y a incertitude, il faut considérer les états de la nature (vol
ou pas vol, etc.). D’autre part, il faut toujours associer un bien à l’état
de la nature dans laquelle ce bien est disponible. On parle alors d’un
bien contingent ou d’une perspective. Il s’agit d’un complexe de bien
doté d’une probabilité pi . On écrira xi = [xij ] j = 1, 2, . . . m ; i =
1, 2, . . . , N . N est le nombre d’états de la nature et m le nombre de biens.
Von Neumann et Morgenstern supposent que les préférences du consommateur dépendent uniquement des utilités élémentaires u(xi ) et des
probabilités avec lesquelles les vecteurs xi se réalisent. Les événements
qui déterminent les probabilités pi n’ont aucune influence sur les
préférences du consommateur.
Prenons le cas où le complexe de biens ne comprend que 2 valeurs: la
somme nette que l’on peut gagner avec un billet de loterie et le montant
perdu si l’on ne gagne pas. On écrira la perspective q de la manière suivante: q = (x1 , p1 ; x2 , p2 ) où xi (i = 1, 2) est le bien et pi sa probabilité.
Supposons qu’avec la loterie A, la probabilité de gagner 10’000 francs
est de 0.2% et le prix du billet est de 100 francs. On représentera cette
perspective en utilisant le vecteur q = (9’900 , 0.002; -100 , 0.998). Si
le consommateur préfère la loterie B, décrite par le vecteur r, où il y a
une probabilité de 0.1% de gagner 30’000 francs et le prix du billet est le
même, on écrira r q avec r = (29’900 , 0.001 ; -100 , 0.999).
Les axiomes proposés par von Neumann et Morgenstern sont les suivants:
1) Rationalité: les préférences constituent un préordre complet
2) Continuité: pour toute perspective q, r, s avec q r et r s , il existe une probabilité p telle que la perspective (q , p ; s , 1-p), composée
des deux perspectives q et s, est indifférente à la perspective r.
Si ces deux axiomes sont satisfaits, on peut représenter les préférences à
l’aide d’une fonction d’utilité V(q).
3) Indépendance: si q r alors (q, p; s, 1 − p) (r, p; s, 1 − p).
Si l’on mélange de la même manière les deux perspectives q et r
avec une perspective s quelconque, alors la perspective contenant q
doit toujours être préférée à celle contenant r. Les préférences sont
indépendantes de la perspective s. Cet axiome d’indépendance permet
de représenter les préférences de la manière suivante:
P
V (q) = pi u(xi )
où u(xi ) désigne l’utilité du bien xi . Les préférences du consommateur
P
pour la perspective q sont représentées par l’utilité espérée
pi u(xi ).
L’axiome 3) implique que la fonction d’utilité a une forme linéaire dans
les probabilités.
Les choix du consommateur sont obtenus en maximisant l’utilité espérée.
Exemple
La fortune d’un consommateur est constituée par sa maison dont la
valeur est W . Il y a une probabilité p que la maison brûle et que la
perte soit de L. Le coût d’une assurance contre l’incendie est ax où a
est la prime unitaire et x le montant assuré. Ce montant est obtenu en
maximisant l’utilité espérée:
E(u) = pu[W − L + x − ax] + (1 − p)u[W − ax]
La condition de premier ordre est:
dE(u)
dx
= pu′ [W − L + x(1 − a)](1 − a) + (1 − p)u′ [W − ax](−a) = 0
où l’apostrophe désigne la première dérivée de la fonction d’utilité. On
obtient:
u′ [W −L+x(1−a)]
1−p a
=
′
u [W −ax]
p 1−a
La valeur espérée de la fortune du consommateur est:
E(W ) = p[W − L + x − ax] + (1 − p)[W − ax]
Le profit espéré de la compagnie d’assurances est:
−p(1 − a)x + (1 − p)ax
S’il y a concurrence le profit sera nul et alors la prime sera a = p.
Si le consommateur est averse au risque, sa fonction d’utilité est concave
et alors u′′ (W ) < 0. Avec une prime a = p le consommateur s’assure
totalement (x = L) car:
u′ [W − L + x(1 − a)] = u′ [W − ax]
et alors x = L.
Si un consommateur est averse au risque, alors u[E(W )] > E(u). S’il
aime le risque l’inégalité est renversée et s’il est neutre il y a égalité.
Un consommateur qui a une fonction d’utilité convexe aime le risque. Si
sa fonction est linéaire il est neutre vis-à-vis du risque.
Une mesure du degré absolu d’aversion vis-à-vis du risque est donnée
par l’expression suivante:
u′′ (W )
− u′ (W )
=
d ln u′ (W )
−
dW
Le degré relatif d’aversion au risque est donné par l’expression:
u′′ (W )W
− u′ (W )
=
d ln u′ (W )
−
W
dW
On suppose souvent que le degré d’aversion vis-à-vis du risque est
décroissant par rapport à la fortune du consommateur. La fonction
d’utilité u = ln (W + 1) satisfait cette condition.
On utilise parfois les deux fonctions suivantes:
u(W ) =
− α1 e−αW
; u(W ) =
W 1−γ
1−γ
La première a un degré absolu d’aversion au risque constant (α) tandis
que la deuxième a un degré relatif d’aversion au risque constant (γ).
Ces résultats sont invariants par rapport à une transformation monotone
linéaire (ou affine) de la fonction d’utilité. Dans un certain sens, l’utilité
von Neumann-Morgenstern est une utilité “cardinale”.
L’axiome d’indépendance, qui ne tient pas compte de la distribution des
probabilités, a été critiqué par Allais. Allais critique la pertinence de la
théorie de l’utilité espérée en prenant un exemple où le comportement
des individus n’est pas conforme à la théorie. On doit choisir entre les
deux perspectives suivantes:
s1 : 100 millions certains
r1 : 500 millions avec probabilité 0.10
100 millions avec probabilité 0.89
0 avec probabilité 0.01
Beaucoup d’individus préfèrent 100 millions certains:
(100, 1) (500, 0.1; 100, 0.89; 0, 0.01)
Par contre, si l’on doit choisir entre:
s2 : 100 millions avec probabilité 0.11
0 avec probabilité 0.89
r2 : 500 millions avec probabilité 0.1
0 avec probabilité 0.9
la plupart des individus préfère r2 car les probabilités sont presque les
mêmes mais r2 permet de gagner cinq fois plus que s2 .
Ces choix ne sont pas compatibles avec la théorie de l’utilité espérée. On
parle de l’effet de certitude ou du paradoxe de la conséquence commune.
En effet, ces perspectives sont du type suivant:
s = (x2 , p; x1 , 1 − p)
r = (q, p; x1 , 1 − p)
avec q = (x3 , λ ; 0, 1 - λ ) (0 < λ < 1). En développant la deuxième
perspective, on obtient r = [x3 , λp; 0, (1 − λ)p; x1 , (1 − p)].
La conséquence commune est x1 . Selon l’axiome d’indépendance, les
choix ne dépendent pas de la valeur de x1 . Le paradoxe d’Allais montre
que ceci n’est pas le cas. On obtient ses valeurs en mettant x2 = 100 ,
10
x3 = 500 , p = 0.11 et λ = 11
. Dans le premier cas x1 =100 et dans le
deuxième x1 =0. Lorsque x1 =100 s r et lorsque x1 =0 r s.
On peut représenter les préférences de l’individu en utilisant le triangle des probabilités. La pente de la courbe d’indifférence dépend de
l’aversion au risque de l’individu. Elle sera forte lorsque celle-ci sera
grande. Par convention, la somme la plus élevée se trouve en haut et
la plus basse à droite. Par conséquent, l’utilité augmente lorsqu’on se
déplace vers la gauche (voir graphique).
L’axiome d’indépendance implique que les courbes d’indifférence sont
des droites parallèles (droites traitillées) car sur les axes il y a les probabilités.
Dans l’exemple ci-dessus, r1 s1 et r2 s2 . Si la pente est plus forte,
on aurait s1 r1 et s2 r2 . Il est impossible d’avoir s1 r1 et
r2 s2 comme trouvé avec le paradoxe d’Allais.
Il convient de noter que l’on passe de s1 à s2 et de r1 à r2 en diminuant de 0.89 la probabilité de gagner 100 millions et en augmentant dans
la même mesure la probabilité de ne rien gagner. Graphiquement, les
points r1 et s1 se déplacent de manière parallèle à r2 , s2 (droite con-
tinue). Par conséquent, si r1 s1 alors r2 s2 .
De nombreuses expériences confirment l’importance du paradoxe
d’Allais. MacCrimmon trouve qu’environ un tiers des 36 hommes
d’affaires interviewés donne les réponses prévues par Allais. Le pourcentage s’élève à 44% dans l’expérience de Conlisk avec 236 individus
et à plus de 80% dans celle de Kahneman et Tversky avec 72 étudiants.
Cette dernière expérience est très intéressante car les sommes proposées
ne correspondaient qu’à environ un mois de salaire.
Un autre paradoxe, aussi proposé par Allais, est celui du rapport commun. On a les deux perspectives suivantes:
s∗1 : 100 millions certains
r1∗ : 500 millions avec probabilité 0.8
0 avec probabilité 0.2
La plupart des individus préfèrent s∗1 (s∗1 r∗1 ). D’autre part, si l’on
doit choisir entre les deux perspectives suivantes:
s∗2 : 100 millions avec probabilité 0.05
0 avec probabilité 0.95
r2∗ : 500 millions avec probabilité 0.04
0 avec probabilité 0.96
on préfère r2∗ (r∗2 s∗2 ). Il s’agit ici de perspectives de la forme suivante:
s∗ = (x2 , p; 0, 1 − p) r∗ = (x3 , λp; 0, 1 − λp)
Il y a un rapport commun λ entre les deux probabilités. On obtient
l’exemple ci-dessus lorsque x2 =100, x3 =500 et λ = 0.8. Dans le premier
cas p=1 et dans le deuxième p=0.05.
Comme on peut le voir dans le graphique ci-dessus, la théorie de l’utilité
espérée implique que si r∗2 s∗2 alors r∗1 s∗1 et non pas comme indiqué
dans l’exemple proposé. Les préférences ne doivent pas dépendre de la
valeur de p.
On passe de s∗1 à s∗2 en divisant par 20 la probabilité de gagner 100
millions et de r∗1 à r∗2 en divisant par 20 la probabilité de gagner 500
millions. Graphiquement, les points r∗1 et s∗1 se déplacent de manière
parallèle à r∗2 , s∗2 (droite pointillée). Par conséquent, si r∗1 s∗1 alors
r∗2 s∗2 .
Ce deuxième paradoxe aussi a été confirmé par de nombreuses expérien-
ces. MacCrimmon et Larsson trouvent qu’une majorité des 18 étudiants
interrogés ont un comportement qui n’est pas conforme à la théorie de
l’utilité espérée. Toutefois, lorsque la somme proposée était réduite, les
incohérences diminuent. Kahneman et Tversky obtiennent des résultats
encore plus frappants. Le 82% des 72 étudiants interrogés préfèrent s∗1
lorsque x2 =3000 , x3 =4000 (lires israéliennes). Dans le deuxième cas,
65% préfèrent r∗2 lorsque p=0.25.
Toutes ces expérimentations sont basées sur des questions hypothétiques
car on ne peut pas payer des sommes aussi importantes. Les individus n’ont alors aucune incitation à répondre selon leurs préférences
véritables. Il y aura un certain nombre de choix aléatoires. Toutefois,
un pourcentage significatif des réponses confirment les affirmations des
partisans des paradoxes. Par ailleurs, des expériences effectuées dans des
pays où le taux de change permettait de payer des sommes correspondant à plusieurs mois de salaire montrent qu’il n’y a pas de différences
fondamentales entres les deux types d’expérimentation.
Le caractère peu réaliste de la théorie de l’utilité espérée a été récemment illustré par Rabin. Dans la théorie de l’utilité espérée, l’aversion
au risque est le résultat de la concavité de la fonction d’utilité. Ceci signifie que si un individu a de l’aversion au risque dans le cas de petits
montants en jeu, alors l’utilité marginale doit fortement diminuer. Par
conséquent, cet individu doit aussi rejeter des jeux très favorables avec
des montants élevés.
Si un individu refuse le jeu où la probabilité de gagner 125 $ est la
même que celle de perdre 100 $ (lorsque sa fortune initiale est inférieure
à 300’000 $) alors il doit refuser de participer à un jeu ayant les mêmes
probabilités (50%) mais avec une perte de 600 $ et un gain de 36 milliards de dollars (à partir d’une fortune initiale de 290’000 $) !
On peut tenir compte des résultats des différentes expériences sur les
préférences des individus en situation d’incertitude en supposant que
les courbes d’indifférence ne soient pas des droites parallèles. Il suffit de
supposer que les préférences soient représentées par la fonction suivante:
P
V (q) = π(pi )u(xi )
où les probabilités sont pondérées selon l’expression π(pi ). Lattimore,
Backer et Witte proposent la formule suivante:
π(pi ) =
αpβ
i
αpβ
+
i
P
k6=i
pβ
k
Lorsque α = β = 1 on retrouve le modèle de l’utilité espérée. En
prenant 57 individus, les auteurs trouvent que les valeurs de α et β sont
inférieures à 1. Les individus cherchent le risque lorsque la probabilité
est faible et l’évitent lorsqu’elle est forte. D’autre part, la théorie de
l’utilité espérée n’est la meilleure explication que dans 20% des cas.
Un autre paradoxe qui intrigue les chercheurs est le renversement des
préférences. Lichtenstein et Slovic proposent aux participants de choisir
entre les perspectives (4 , 0.99 ; -1 , 0.01) et (16, 0.33 ; -2 , 0.67). La
première est appelée le P-bet, car dans ce pari la probabilité est très
élevée, et la deuxième le $-bet car la somme que l’on peut gagner est
plus élevée. En général, les individus préfèrent le P-bet. Ensuite, après
quelques autres questions, on demande aux participants d’indiquer le
prix de vente minimum de ces billets. On obtient alors des sommes plus
élevées pour le $-bet. Le 73% des participants préfèrent le P-bet mais
exigent un prix plus élevé pour le $-bet. Il y a donc un renversement
surprenant des préférences entre la première et la deuxième question.
On constate le même phénomène lorsque les choix sont réels et non pas
hypothétiques. Le renversement des préférences obtenu par Grether et
Plott est de 70%. Avec des sommes plus élevées, Pommerehne, Schneider et Zweifel ne trouvent que 45% des participants qui préfèrent le Pbet mais exigent un prix plus élevé pour le $-bet. Par contre Bohm
n’observe aucun renversement mais, dans son expérience, il s’agit de
faire des choix entre deux voitures d’occasion.
En permettant les achats et les ventes des deux types de paris (P-bet et
$ bet), Knez et Smith obtiennent une réduction du nombre de renversement de préférences (de 60% à 40%). Par ailleurs, il arrive souvent que
les achats et les ventes effectués ne soient pas conformes aux réponses
données précédemment.
Cox et Grether utilisent plusieurs méthodes pour déterminer les préférences des individus, en particulier l’enchère au deuxième prix et
l’enchère anglaise. Lorsque l’expérience est répétée plusieurs fois avec les
mêmes participants, le nombre de renversement de préférences diminue,
surtout avec ces dernières méthodes et des incitations monétaires.
Le renversement des préférences montre que les réponses dépendent
de comment la question est formulée. Un exemple classique est celui
présenté par Tversky et Kahneman. On prévoit qu’une nouvelle maladie va causer 600 décès aux Etats-Unis. Plusieurs programmes de lutte
contre cette maladie sont proposés:
A: 200 personnes sauvées
B: 600 personnes sauvées, probabilité 1/3;
0 personnes sauvées, probabilité 2/3
C: 400 personnes décédées
D: 600 personnes décédées, probabilité 2/3;
0 personnes décédées, probabilité 1/3
On obtient en général que A B et D C. La formulation en termes
de personnes sauvées ne donne pas le même résultat que celle en terme
de personnes décédées. Un problème similaire est aussi rencontré dans
certains sondages.
En économie, on peut rencontrer un problème de ce type lorsque les
gains et les pertes sont évalués selon des critères différents.
La théorie de la perspective
Kahneman et Tversky proposent une nouvelle théorie pour expliquer
le comportement de l’individu en cas de risque ou incertitude. Leur
théorie de la perspective comprend une étape préliminaire où l’individu
simplifie et reformule les perspectives de manière à faciliter le choix. Il
s’agit ensuite de choisir un point de référence à partir duquel les gains
et les pertes sont évalués. Par exemple, le point de référence peut être
la fortune actuelle de l’individu. Dans ce cas, le choix de la perspective
dépendra de la variation de la fortune et non pas de la fortune finale.
Les résultats des perspectives sont évalués en utilisant une fonction
d’utilité centrée autour du point de référence. Cette fonction est concave en cas de gains et convexe en cas de pertes. Tversky et Kahneman
proposent la fonction suivante:
α
x
pour x ≥ 0
u(x) =
−λ(−x)β
pour x < 0
où x est la variation de la fortune, λ le coefficient d’aversion au risque, α
et β deux paramètres inférieurs à l’unité.
L’utilité espérée de la perspective q sera:
V (q) = π(p)u(x1 ) + π(1 − p)u(x2 )
où la pondération des probabilités est donnée par l’expression suivante:
pγ
π(p) = (pγ +(1−p)γ )1/γ
Benartzi et Thaler utilisent cette théorie pour expliquer le rendement excessif des actions par rapport à celui des obligations. Mehra et
Prescott trouvent une différence de six points de pourcentage entre les
deux rendements et ceci implique que l’indice relatif d’aversion au risque
est supérieur à 30. Or, les estimations de cet indice donnent des valeurs
proches de l’unité. Il y a par conséquent une énigme que la théorie de
l’utilité espérée n’arrive pas à expliquer. Dans le cas d’une fonction
d’utilité iso-élastique, un indice relatif d’aversion au risque de 30 signifie que l’individu est indifférent, par exemple, entre (100’000, 0.5; 50’000
, 0.5) et une somme certaine de 51209 francs. Par contre, avec un indice
de 1 la somme certaine est de 70711 francs et elle est plus vraisemblable
que celle de 51209 francs.
Les gains et les pertes d’un investissement en actions dépendent de la
longueur de la période considérée. Plus la période est longue, moins
il y aura de risque de perte par rapport à l’investissement initial. En
prenant des échantillons de rendement mensuel des actions et des obligations américaines, Benartzi et Thaler trouvent qu’une évaluation annuelle des deux types d’investissement donne la même utilité selon le
modèle de Tversky et Kahneman (avec γ = 0.61 pour les gains et
γ = 0.69 pour les pertes, α = β = 0.88 et λ = 2.255). Une analyse
à court terme associée à une forte aversion des pertes conduirait à un
rendement excessif des actions.
Téléchargement