Théorie du consommateur Classiques: les biens ont une utilité ou une valeur d’usage et une valeur d’échange. Paradoxe de l’eau et du diamand. Smith A. (1776), An Inquiry into the Nature and Causes of the Wealth of Nations 1705: machine à vapeur, début de la révolution industrielle. Marginalistes Gossen H. (1854), Entwickelung der Gesetze des menschlichen Verkehrs und der daraus fliessenden Regeln für menschliches Handeln 1) Première loi de Gossen: l’utilité marginale est décroissante: Utilité additive directe. Exemple: u = a1 ln q1 + a2 ln q2 + . . . + am ln qm ∂u ∂qi = ai qi >0 ; ∂2 u ∂qi2 = − qa2i < 0 i 2) Deuxième loi de Gossen: une personne maximise son utilité lorsqu’elle distribue l’argent dont elle dispose, pour l’achat des différents biens, de manière à obtenir la même satisfaction avec le dernier atome de monnaie dépensé pour chaque bien. Nous verrons ci-dessous l’interprétation de cette loi. Edgeworth et Pareto proposent une fonction d’utilité où l’utilité marginale d’un bien dépend aussi de la quantité consommée d’autres biens. Edgeworth F. (1881), Mathematical Psychics Pareto V. (1909), Manuel d’économie politique Walras L. (1874), Eléments d’économie politique pure On a alors: u = f (q1 , q2 , . . . , qm ) Par exemple: am u = q1a1 q2a2 . . . qm On peut exprimer mathématiquement la décision du consommateur de la manière suivante: max u = f (q1 , q2 , . . . , qm ) S.C. y = p1 q1 + p2 q2 + . . . + pm qm En utilisant les vecteurs q = [qi ] et p = [pi ] ; i = 1, 2, . . . , m , on peut écrire: max u = f (q) S.C. y = pT q Le lagrangien est: P L = f (q1 , q2 , . . . , qm ) + λ(y − pj qj ) où y est le revenu du consommateur. Les conditions de premier ordre sont: ∂L ∂u = i = 1, 2, . . . , m ∂qi ∂qi − λpi = 0 P ∂L = y − pj q j = 0 ∂λ En prenant deux équations quelconques i et j, on a: ∂u ∂u /p = λ ; i ∂qi ∂qj /pj = λ ∂u 1 ∂q1 p1 ∂u 1 ∂u 1 = ∂q = . . . = ∂qm pm = λ 2 p2 C’est la deuxième loi de Gossen. En effet: ∂L∗ ∂u∗ ∂y = ∂y = λ est l’utilité marginale du revenu. L’utilité marginale de chaque bien, pondérée par son prix, doit être égale à l’utilité marginale du revenu. La condition de deuxième ordre pour un maximum est: T xT Hx ≤ 0 S.C. ( ∂u ) x = 0 où ∂q ∂u ∂q ∂u ] (i = 1, 2, . . . , m) et = [ ∂q i H= ∂2 u ∂qi ∂qj (i, j = 1, 2, . . . , m) est la matrice hessienne de la fonction d’utilité. Il s’agit d’une matrice symétrique (théorème de Young). Si la fonction d’utilité est additive directe, alors la matrice hessienne est une matrice diagonale avec les variations de l’utilité marginale sur la diagonale. Toutes ces valeurs étant négatives selon l’hypothèse de l’utilité marginale décroissante, la matrice hessienne est une matrice définie négative et alors la condition de deuxième ordre est satisfaite (xT Hx < 0 pour tout x et alors aussi T ) x = 0). La première loi de Gossen permet de satisfaire la pour ( ∂u ∂q condition de deuxième ordre lorsque l’utilité est additive directe. Dans le cas général, la condition ci-dessus peut être vérifiée en calculant les déterminants suivants: f11 f 21 B |Hi | = . . . fi1 −p 1 f12 ... f1i f22 ... f2i ... ... ... fi2 ... fii −p2 . . . −pi i = 2, 3, . . . , m avec fij = ∂2 u ∂qi ∂qj −p1 −p2 . . . −pi 0 Il faut que: B |H2B | > 0 ; |H3B | < 0 ; . . . (−1)m |Hm |>0 Si la fonction d’utilité est strictement quasi-concave, alors cette condition est satisfaite. Une fonction est strictement quasi-concave si pour tout q 1 6= q 2 , on a: f [λq 1 + (1 − λ)q 2 ] > min {f [q 1 ], f [q 2 ]} 0<λ<1 i ] avec q i = [q1i , q2i , . . . , qm Si B |H2B | > 0 ; |H3B | < 0 ; . . . (−1)m |Hm |>0 avec f11 f12 f 21 f22 B |Hi | = . . . . . . fi1 fi2 f f2 1 i = 2, 3, . . . , m . . . f1i . . . f2i ... ... ... fii ... fi f1 f2 . . . fi 0 alors la fonction est strictement quasi-concave. Comme fi = λpi , la condition de deuxième ordre est satisfaite. Les courbes de niveau d’une fonction quasi-concave (avec ∂u/∂qi > 0) sont convexes. Utilité cardinale et utilité ordinale Les premiers marginalistes pensaient que l’utilité pouvait être mesurée, comme la température. On dit qu’il s’agit d’une grandeur cardinale. On s’est ensuite rendu compte que la demande ne changeait pas lorsqu’on effectuait une transformation monotone croissante (ou positive) de la fonction d’utilité. En effet, soit U = F (u) avec F ′ > 0 √ 2 Exemples U = ln u ; U = u ; U = u Le lagrangien sera alors: L = F (u) + µ(y − pT q) Les conditions de premier ordre sont: ∂L ′ ∂u = F ∂qi ∂qi − µpi = 0 i = 1, 2, . . . , m ∂L ∂µ = y − pT q = 0 En prenant deux équations quelconques i et j, on a: F′ ∂u ∂qi ∂u F ′ ∂q j = pi pj et alors les conditions de premier ordre sont identiques car F ′ disparaı̂t. Une transformation monotone continue laisse inchangée la courbe d’indifférence. En effet, on a: ∂u ′ ∂u ′ ∂u dq + F dq + . . . + F dU = F ′ ∂q 1 2 ∂q2 ∂qm dqm = 0 1 La pente de la courbe d’indifférence (cas de deux biens) est: dq2 dq1 = − F′ ∂u ∂q1 ∂u F ′ ∂q 2 et elle est invariante par rapport à une transformation monotone croissante de la fonction d’utilité. Par contre, les utilités marginales changent: ∂U ∂qi ∂u ′ = F ′ ∂q ; µ = F λ i Exemple: si u = q1a1 q2a2 (avec ai > 1), on a des utilités marginales croissantes. Par contre, si l’on prend la transformation monotone croissante U = ln u = a1 ln q1 + a2 ln q2 , l’utilité marginale devient décroissante, comme voulu par la première loi de Gossen. Pareto et d’autres économistes ont alors présenté la théorie du consommateur en partant directement des courbes d’indifférence. Ces courbes ne permettent qu’un classement des complexes de biens [complexes préférés, complexes indifférents (sur la courbe), et complexes pas préférés]. Comme il y a plusieurs fonctions d’utilité qui donnent la même courbe d’indifférence, l’utilité n’est qu’une mesure ordinale qui permet le classement des complexes de biens. La pente de la courbe d’indifférence (sans le signe négatif) est appelée le taux marginal de substitution: TMS = dq2 − dq 1 = ∂u ∂q1 ∂u ∂q2 Une courbe d’indifférence convexe implique un taux marginal de substitution décroissant. Le mathématicien Volterra fit remarquer à Pareto que si l’on commence avec la notion de courbes d’indifférence il faut que certaines conditions soient satisfaites pour pouvoir remonter à la fonction d’utilité (lorsque le nombre de biens est supérieur à 2). Par exemple, l’équation q2 q3 dq1 + q1 q3 dq2 + q1 q2 dq3 = 0 est intégrable car u = q1 q2 q3 donne cette équation. Par contre; dq1 + q3 dq2 + 2q2 dq3 = 0 n’est pas intégrale. L’équation: f1 dq1 + f2 dq2 + f3 dq3 = 0 est intégrable lorsque: ∂f3 ∂f3 ∂f1 ∂f1 ∂f2 2 − ) + f ( − ) + f ( − f1 ( ∂f 2 3 ∂q3 ∂q1 ∂q1 ∂q3 ∂q2 ∂q3 ) = 0 On peut montrer que si l’effet de substitution est symétrique alors il est possible de remonter à la fonction d’utilité. Théorie des choix La fonction d’utilité ou la courbe d’indifférence ne servent qu’à exprimer les préférences des consommateurs. On a alors proposé une théorie des choix sans aucune référence aux anciennes notions d’utilité ou de courbe d’indifférence. Soient deux ensembles non vides X et Y . Par exemple, X pourraient être les montagnes valaisannes et Y les montagnes bernoises. On peut prendre des éléments de X (par exemple le Cervin) et de Y (par exemple l’Eiger) et former l’ensemble {x, y} où x ∈ X et y ∈ Y . Lorsque l’ordre joue un rôle, on dit que (x, y) est une paire ordonnée. Un ensemble de paires ordonnées est appelé une relation binaire. Soit R une relation binaire entre les éléments de l’ensemble X et ceux de l’ensemble Y . Si deux éléments quelconques x et y satisfont à la relation binaire on écrit x R y. Souvent l’ensemble Y est le même que l’ensemble X. On parle alors de relation binaire sur l’ensemble X. Lorsque la relation binaire sur l’ensemble X satisfait aux deux axiomes suivants (x, y, z ∈ X): (1) réflexivité: xRx pour tout x ∈ X (2) transitivité: xRy et yRz =⇒ xRz on dit qu’on a un préordre. La relation ≥ est une relation réflexive tandis que > ne l’ait pas. La relation ≥ est une relation transitive. La relation “au moins aussi difficile que (AAD)” est réflexive mais peut ne pas être transitive si un alpiniste considère que Cervin AAD Dent Blanche et Dent Blanche AAD Dom mais Cervin pas AAD Dom. La relation binaire q 1 q 2 (q 1 “préféré ou indifférent à” q 2 ou q 2 “pas préféré à q 1 ”) est réflexive mais peut ne pas être transitive si le consommateur classe trois paniers (A, B et C) de la manière suivante: A B ; B C mais A pas C. Le préordre est complet lorsque l’axiome suivant est satisfait: (3) xRy ou yRx (ou les deux) Il faut que tous les cas puissent être classés dans l’une ou l’autre de ces relations. Par exemple, si tous préfèrent A à B on peut écrire que, pour la société, A B. Par contre, si entre A et C les opinions divergent, on ne sait pas si, pour la société A C ou le contraire. Dans ce cas le préodre n’est pas complet. Ces trois axiomes sont suffisants pour représenter les préférences du consommateur. Néanmoins, il est beaucoup plus pratique d’ajouter l’axiome de continuité suivant: (4) quel que soit q o ∈ X, l’ensemble {q ∈ X|q o q} et l’ensemble {q ∈ X|q q o } sont fermés dans X. car on peut représenter les relations de préférence par une fonction d’utilité. Un ensemble est fermé s’il contient ses points limites. Par exemple a ≤ x ≤ b est un ensemble fermé tandis que a < x < b est un ensemble ouvert. Dans le cas du consommateur, cela signifie qu’il doit se comporter de manière rationnelle aussi pour de petites variations des quantités. L’utilité est ici une fonction définie sur X avec la propriété que u(q 1 ) ≥ u(q 2 ) si et seulement si q 1 q 2 Elle ne sert donc qu’à exprimer les préférences sans les mesurer (utilité ordinale). Dans la plupart des cas, cette hypothèse est théoriquement acceptable, comme vous pouvez le voir par les cas spéciaux où elle n’est pas satisfaite. Soit l’ordre lexicographique, défini de la manière suivante: q1 q2 si q11 > q12 ou bien q11 = q12 et q21 ≥ q22 où q1 et q2 sont les quantités des deux biens des complexes q 1 et q 2 . C’est comme dans le classement des noms par ordre alphabétique, on commence à regarder la quantité du premier bien et on passe ensuite au deuxième bien seulement si celle du premier bien est identique. On mentionne parfois les préférences d’un alcoolique pour illustrer ce cas (le premier bien étant le vin). Nous ferons normalement l’hypothèse que la fonction d’utilité est continûment différenciable même si dans ce cas on élimine la possibilité de stricte complémentarité. Il ne faut pas utiliser le lagrangien pour résoudre ce cas spécial. Il suffit de prendre la contrainte budgétaire et le rapport entre les deux biens. Exemple: max u = min(H, 0.5G) où H est un habit de ski et G un gant. Si les prix sont pH = 500 et pG = 50 et le revenu 600, la solution s’obtient en prenant le lien entre habit et gant (H = 0.5G) et la contrainte budgétaire: 50G + 500H = 50G + 500(0.5G) = 600 G=2 ; H=1 Si les conditions de premier ordre conduisent à des quantités négatives, alors il faut préciser explicitement que qi ≥ 0. Dans ce cas il faut utiliser les conditions de Kuhn-Tucker: ∂u ≤0 i = 1, 2, . . . , m ∂qi − λpi P y − pj q j ≥ 0 Si l’égalité ne peut pas être atteinte alors qi = 0. On peut alors écrire: ∂u [ ∂qi − λpi ]qi = 0 i = 1, 2, . . . , m P [y − pj qj ]λ = 0 ∂u − λpi < 0 alors qi = 0. En d’autres termes, un bien n’est pas Si ∂q i acheté si son utilité marginale, pondérée par son prix, est inférieure à ∂u 1 < λ]. l’utilité marginale du revenu [ ∂q i pi La fonction de demande On peut normalement résoudre les conditions de premier ordre ∂L ∂u = i = 1, 2, . . . , m ∂qi ∂qi − λpi = 0 P ∂L = y − pj q j = 0 ∂λ et trouver la fonction de demande: qi = φi (p1 , p2 , . . . , pm , y) Elle dépend donc des prix de tous les biens et du revenu du consommateur. Il s’agit d’une fonction homogène de degré zéro par rapport aux prix et au revenu (pas d’illusion monétaire). On peut alors utiliser le théorème d’Euler sur les fonctions homogènes de degré s. Soit y = f (x1 , x2 , . . . , xm ) γ s y = f (γx1 , γx2 , . . . , γxm ) Si z = γ s y ; vi = γxi on a: z = f (v1 , v2 , . . . , vm ) P dvi dz = f vi dγ dγ P s−1 sγ y = fvi xi Lorsque γ = 1 on obtient le théorème d’Euler: P fxi xi = sy Ici s = 0 et alors: ∂qi ∂qi ∂qi ∂qi p + p + . . . + p + ∂p1 1 ∂p2 2 ∂pm m ∂y y = 0 En utilisant les élasticités-prix et les élasticités-revenu: ∂qi y ∂qi pj ; η = εij = ∂p i ∂y qi j qi on a: P j εij + ηi = 0 La contrainte budgétaire permet d’obtenir deux autres relations entre les élasticités. La relation d’agrégation de Cournot est obtenue en prenant les dérivées par rapport au prix: P j ωj εji = −ωi où ωi = pi qi /y est la part du revenu consacré au bien i. La propriété d’agrégation d’Engel est obtenue en prenant la dérivée par rapport au revenu: P j ωj ηj = 1 Statique comparative Quels sont les effets sur la demande d’une variation du revenu ou des prix? Engel a trouvé que lorsque le revenu augmente, la part consacrée aux biens alimentaires diminue. On a alors une élasticité-revenu inférieure à 1: dω1 dy yp1 dq1 dy −p1 q1 = <0 y2 η1 < 1 La loi d’Engel est vérifiée dans tous les pays et à toutes les époques. Si l’utilité est une fonction homothétique [U = F (u) avec F ′ > 0 et u une fonction homogène de degré 1] alors l’élasticité-revenu est égale à l’unité. En effet, le taux marginal de substitution ne dépend que du rapport des quantités et la courbe d’Engel est une droite. L’effet d’une variation des prix est plus difficile à déterminer car une hausse des prix correspond à une baisse du revenu réel. Il faut alors éliminer cet effet de revenu. En différenciant les conditions de premier ordre on obtient: f11 dq1 + . . . + f1m dqm − p1 dλ − λdp1 = 0 f21 dq1 + . . . + f2m dqm − p2 dλ − λdp2 = 0 ... fm1 dq1 + . . . + fmm dqm − pm dλ − λdpm = 0 p1 dq1 + q1 dp1 + . . . + qm dpm = dy où fij = ∂2 u ∂qi ∂qj Sous forme matricielle on a: f11 f12 ... f1m −p1 dq1 dq f f . . . f −p 2 22 2m 2 21 ............................ ... = fm1 fm2 . . . fmm −pm dqm −p1 −p2 . . . −pm 0 dλ λ 0 ... 0 0 0 λ ... 0 0 ..................... 0 0 ... λ 0 q1 H −pT q2 dp1 dp 2 ... dpm . . . qm −1 −p dq λI = T 0 dλ q dy 0 −1 dp dy où H est la matrice hessienne, I la matrice unitaire, dq = [dqi ] et dp = [dpi ] , i = 1, . . . , m. Pour connaı̂tre l’effet d’une variation des prix sur les quantités achetées, il suffit de prémultiplier ce système par la première matrice à gauche. Les conditions de deuxième ordre pour un maximum sous contrainte nous disent que cette matrice est non singulière. Si son inverse est: −1 1 H −p K −b λ [H B ]−1 = = −pT 0 −bT c on a: dq dλ dq = = 1 λK T −b −b c K − bq T λI qT 0 dp −1 dy b dp dλ −λbT + cq T −c dy En prenant uniquement le vecteur des variations des quantités on peut écrire: dq = [K − bq T ]dp + b dy = Kdp + b(dy − q T dp) Ceci est une généralisation de l’équation de Slutsky. La deuxième partie est appelée l’effet de revenu d’une variation des prix. En effet, l’effet de la variation du revenu sur la quantité achetée du bien est: ∂q ∂y =b Si l’on veut obtenir l’effet pur d’une variation du prix il faut éliminer cet effet de revenu. Slutsky a alors imaginé de compenser le consommateur de manière qu’il puisse toujours acheter les mêmes quantités de biens. Il faut alors que son revenu augmente de dy = q T dp. Dans ce cas, le deuxième terme disparaı̂t et l’effet pur est donné par la matrice K. Quelles sont les propriétés de cette matrice? Comme [H B ][H B ]−1 = I, on a: 1 T HK + pb λ − λ1 pT K = 0 B = I ; −Hb − pc = 0 ; pT b = 1 H et H sont des matrices symétriques. Par conséquent [H B ]−1 et K le sont aussi. D’autre part, K est une matrice singulière car Kp = 0. En prémultipliant par K la première équation ci-dessus on obtient: 1 λ KHK + KpbT = K et sa transposée est: 1 λ KHK + bpT K = K Comme pT K = 0, on a: 1 λ KHK =K Etudions les propriétés de la forme quadratique: z T Kz = z T KHKz = xT Hx avec x = Kz. Les conditions de deuxième ordre nous disent que T ) x = 0. D’autre part, Kp=0 et K xT Hx ≤ 0 sous la contrainte ( ∂u ∂q est de rang m-1. Par conséquent, x =0 seulement si z = αp où α est une constante quelconque. La matrice K est donc une matrice semi-définie négative. Par conséquent: Kii < 0 Si le prix du bien i augmente la quantité consommée diminue même si l’on compense le consommateur afin qu’il puisse continuer à acheter la même quantité. Le consommateur substitue une partie de ce bien par un autre meilleur marché. La matrice K est alors appelée la matrice de l’effet de substitution. Si uniquement le prix pj varie on obtient l’effet suivant sur la quantité qi : ∂qi ∂pj = Kij − ∂qi ∂y qj Kij est l’effet pur ou effet de substitution et le reste l’effet de revenu d’une variation du prix. C’est l’équation de Slutsky. On peut l’exprimer en utilisant les élasticités: εij = ξij − ωj ηi Si, pour i 6= j, l’élasticité-prix pure ξij est positive on dit que i et j sont deux biens substituts purs. Par contre, si εij > 0 on dit que les deux biens sont des substituts bruts. Lorsque l’élasticité est négative on parle de biens complémentaires (purs ou bruts). Par exemple, si u = q1 q2 les deux biens sont des substituts purs mais ε12 = 0 (indépendants bruts). L’approche duale La maximisation de l’utilité sous la contrainte budgétaire permet de trouver le point sur la droite du budget dont l’utilité est la plus élevée. Si l’on cherche à minimiser les dépenses nécessaires pour atteindre ce niveau d’utilité on trouve le même point. Cette approche duale est souvent utilisée dans l’analyse du coût de la vie car on cherche précisément le budget minimum pour garder le même niveau de satisfaction. Le problème est alors: P min C = j pj qj S.C. f (q) = u∗ La fonction: C(p, u∗ ) = min pT q S.C. f (q) = u∗ est appelée la fonction de coût ou de dépense. La dérivée de cette fonction par rapport au prix du bien donne directement l’effet de substitution (car l’utilité est constante, comme dans l’interprétation de Hicks-Allen): ∂C ∗ ∗ = (q ) [q = h (p, u )] i u=u i i ∂pi Soit l’expression suivante: ψ(p) = C(p, u∗ ) − pT q ∗ où q ∗ est la quantité qui maximise l’utilité. Cette expression n’est jamais positive et son maximum est obtenu lorsque p est le vecteur des prix qui a conduit à la solution q ∗ . Dans ce cas ψ(p∗ ) = 0. On obtient alors: ∂ψ ∗ ∂C ∂C ∗ ∗ = − q = 0 =⇒ − q i i =0 ∂pi ∂pi ∂pi Cette demande est celle d’un consommateur qui a été compensé par la baisse du pouvoir d’achat (lorsque les prix augmentent). On parle alors de demande compensée ou demande hicksienne tandis que la fonction de demande usuelle est appelée la demande marshallienne. En utilisant l’équation de Slutsky: ∂qi ∂qi ∂qi ∗ − = ( ) ∂pi ∂pi u=u ∂y qi on peut dire que la demande compensée a une pente plus forte que la ∂pi i ∗ | < |( demande marshallienne [| ∂p ∂qi ∂qi )u=u |], sauf dans le cas des biens inférieurs. Exemple: u = q1 q2 La demande marshallienne est: q1 = y 2p1 ; q2 = y 2p2 ∗ ; u = y2 4p1 p2 La demande hicksienne est: q ∗ q ∗ q1 = up1p2 ; q2 = up2p1 La fonction de coût: √ C = 2 p1 p2 u ∗ donne directement la demande hicksienne en prenant la dérivée par rapport au prix: q ∗ q ∗ u p2 u p1 ∂C ∂C = ; = ∂p1 p1 ∂p2 p2 La dérivée de la demande hicksienne donne l’effet de substitution: q 2 q ∗ u p2 y p2 y ∂q1 1 1 = − = − = − 3 4 ∂p1 2 2 p 4p p2 4p2 1 1 1 et ceci correspond au terme K11 dans l’équation de Slutsky: K11 = ∂q1 ∂p1 + ∂q1 ∂y q1 = − 2py2 + 1 y 1 2p1 2p1 = − 4py2 . 1 La fonction de coût est une fonction homogène de degré 1. On peut montrer qu’elle est concave. Si l’on introduit les quantités optimales dans la fonction d’utilité on obtient la fonction d’utilité indirecte, définie ainsi: v(p, y) = max u(q) Ci-dessus on a déjà calculé la fonction d’utilité indirecte correspondant à y2 ∗ la fonction directe u = q1 q2 . En effet v = u = 4p1 p2 . L’utilité indirecte permet d’obtenir la demande marshallienne en utilisant l’identité de Roy: ∂v − ∂p ∂v ∂y i = qi (p, y) Cette identité peut être démontrée de la manière suivante. En prenant la définition de la fonction d’utilité indirecte, on peut écrire: v(p, y) ≡ u∗ = f (q ∗ ) ≡ f [φ1 (p, y), ..., φm (p, y)] La dérivée par rapport au prix pi est: P ∗ ∂qj ∂v j fj ∂pi ∂pi = En utilisant les conditions de premier ordre (fi = λpi ) et la relation P ∂q d’agrégation de Cournot (qi + j pj ∂pji = 0) on obtient: P ∂qj = λ( pj ∂pi ) = −λqi La dérivée par rapport à y est: P ∗ ∂qj ∂v j fj ∂y ∂y = et elle devient, en procédant de la même manière que ci-dessus: P ∂qj ∂v = λ( p j j ∂y ) ∂y =λ Nous avons ainsi démontré que le multiplicateur de Lagrange est effectivement égal à l’utilité marginale du revenu. En définitive on obtient: ∂v ∂v = − ∂pi ∂y qi On peut alors écrire: ∂v ∂pi qi = φi (p, y) = ∂v(p,y) ∂pi ∂v(p,y) ∂y − Exemple: Si v = q1 = y2 4p1 p2 y 2 /4p21 p2 2y/4p1 p2 on a: = y 2p1 qui est la demande marshallienne lorsque u = q1 q2 . Le surplus du consommateur La proposition de Dupuit de mesurer l’utilité d’un bien par la surface sous la fonction de demande a été étudiée par Marshall qui indiqua une restriction importante pour son utilisation. Il faut que l’utilité marginale du revenu soit constante. En effet, si le consommateur doit payer plus cher les premières unités, il aura moins d’argent pour acheter les autres. Comme la part du revenu consacré à chaque bien est peu importante, Marshall juge acceptable cette restriction. On peut comprendre la restriction imposée par Marshall en utilisant l’identité de Roy: qi (p, y) = ∂v − ∂p ∂v ∂y i = − λ1 ∂v ∂pi Si le prix pi passe de p1i à poi la variation du surplus est: R 1 ∂v R poi S = p1 qi dpi = − λ ∂pi dpi i Si l’utilité marginale du revenu est constante, on peut écrire: S= 1 λ| − po v(p, y)|pi1 i = 1 1 [v(p , y) λ − v(po , y)] Le surplus représente la variation de l’utilité du consommateur. L’utilité marginale du revenu “transforme” cette utilité en valeur monétaire cal- culable. Si l’utilité marginale du revenu varie, on peut calculer le “vrai” surplus de la manière suivante. Si le prix baisse (de poi à p1i ), l’utilité du consommateur augmente. Quelle somme faut-il lui prendre pour que son utilité ne change pas? En utilisant la fonction de coût, on peut écrire: CV = C(po , uo ) − C(p1 , uo ) On l’appelle la variation compensée. Graphiquement, la variation compensée est la surface sous la fonction de demande compensée tandis que le surplus est la surface sous la fonction de demande marshallienne. On pourrait aussi prendre le niveau de satisfaction dans la nouvelle situation comme point de comparaison. Par exemple, si le gouvernement veut empêcher que le prix du lait baisse de poi à p1i , quelle somme doit-il donner au consommateur afin que son niveau d’utilité soit celui obtenu avec une baisse du prix? Cette somme est la variation équivalente: EV = C(po , u1 ) − C(p1 , u1 ) Pour des biens normaux, EV > CV . √ ∗ Exemple: u = q1 q2 → C(p, u ) = 2 p1 p2 u∗ Si y = 24 , po1 = 2 , po2 = 0.5, on a uo = 144 et C(2, 0.5, 144) = 24 = y. Si le prix p1 baisse de 2 à 0.5 on a: R2 y S = 0.5 2p1 dp1 = 16.6 CV = C(2, 0.5, 144) − C(0.5, 0.5, 144) = 24 − 12 = 12 EV = C(2, 0.5, 576) − C(0.5, 0.5, 576) = 48 − 24 = 24 La fonction d’utilité indirecte monnaie-métrique Pour des valeurs données des prix, la fonction de coût varie selon les valeurs de l’utilité. On l’appelle la fonction d’utilité directe monnaiemétrique, c’est-à-dire mesurée en termes de monnaie (en francs). Si l’on prend la fonction d’utilité indirecte v(po , y), la fonction de coût C(p1 , uo ) devient: C(p1 , uo ) = C[p1 , v(po , y)] = µ(p1 , po , y) On l’appelle la fonction d’utilité indirecte monnaie-métrique. Elle indique le revenu nécessaire pour que le consommateur ait la même utilité lorsque les prix sont p1 que celle qu’il avait avec les prix po . Exemple Soit la fonction d’utilité u = q1 q2 , le revenu y et les prix p = [p1 p2 ]. √ La fonction de coût est C(p, u) = 2 p1 p2 u et l’utilité indirecte v(p, y) = y 2 /4p1 p2 . La fonction d’utilité indirecte monnaie-métrique est alors: q 1 1 2 p1 p2 y 1 o µ(p , p , y) = 2 4po po 1 2 Si po1 = 1 , po2 = 2 , y = 24, alors q1o = 12 , q2o = 6 et l’utilité est 72. Lorsque les prix sont p11 = 2 , p12 = 4, on trouve µ = 48. En effet, on a multiplié par 2 les prix et alors le revenu doit doubler pour que l’utilité reste la même. On peut exprimer les variations compensée et équivalente en prenant l’utilité indirecte monnaie-métrique. Supposons que le consommateur dispose d’un revenu de y o lorsque les prix sont po et de y 1 lorsqu’ils sont de p1 . La variation de bien-être peut être calculée en prenant la différence des fonctions d’utilité indirecte v(p1 , y 1 ) − v(po , y o ). Cette différence peut être exprimée en termes monétaires en prenant la fonction d’utilité indirecte monnaie-métrique. Les variations compensée et équivalente sont alors: CV = µ(p1 , p1 , y 1 ) − µ(p1 , po , y o ) = y 1 − C(p1 , uo ) EV = µ(po , p1 , y 1 ) − µ(po , po , y o ) = C(po , u1 ) − y o Lorsqu’on examine la variation de bien-être due à une modification des prix, le revenu ne change pas et alors: y 1 = C(p1 , u1 ) = y o = C(po , uo ). Par conséquent: CV = C(po , uo ) − C(p1 , uo ) EV = C(po , u1 ) − C(p1 , u1 ) comme indiqué précédemment. 15 14 13 12 11 10 9 CV 8 7 6 5 4 3 2 1 Variation compensée q2 ... ... ... ... ... ... ... ... ... . . ..... ... ... . ....... ... ... . ........ .. ... ... ..... ... ... ... ........ ... ... ....... ... ... ........ ... ... ... ...... .. ... .. ..... ... ... ...... .... ..... ... ... ... ..... ... ... ... ..... ..... .. ...... .. ..... ... . . ..... ..... ........ . .. ..... ........ ........ . ..... ...... ...... .. .. ..... ..... .... ..... .. ... o ..... 1 . ..... ........ .... ....... .......... ...... ........... . . ....... ............ ..... ........ ......... ..... ........ ... ...... ..... .......... ... ...... .......... ..... ... .............. ........... ..... ....... ... ... . ..... ... ..... ........... ..... .......... .. ... ............ ...... ... ..... ................... ... .. .................. ..... ... . . ..... ..... ... ..... ... ..... . ..... ... ..... . ... ... •S •S q1 0 1 2 3 4 5 6 7 8 9 10 Variation équivalente 15 q2 ... .. 14 ... 13 ...... . ... EV 12 .. ... . ... ... ... ... ... . ... 11 ... .. ... . 10 ................. ......... ............... ... ..... .. . ... ... ..... .. . . . . . . 9 ..... ............. ............. ... ...... ...... ... ... ...... . ... .. ..... ..... 8 ... ... ...... .. ..... ... ... ... ..... ... ... ... ..... ... 7 ..... ..... ... ...... ........ ...... ........ .... . ....... . 6 ... ..... ... ........... ... o .. ...... 1 ... ..... 5 •S ... .. ...•S ..... .. .............. ..... .... ........ ... .................... 4 ........ ..... ....... .. ... ...... ..... ......... ......... ..... ... ....... . . .......... ... ..... ... ....... 3 ............ ..... ....... ... . ........ .. ..... ... ........... . . . ... . .... ......... ... 2 ... ................................... ... ............... .. ... ..... ... ..... ... 1 ... ..... .. .. .. ... .. ..... ... q1 0 1 2 3 4 5 6 7 8 9 10 .. Théorie de la préférence révélée Plutôt que de demander aux consommateurs quelles sont ses préférences, Samuelson suggéra d’observer son comportement afin de tirer des renseignements sur ses préférences. 1 T ] Supposons que le consommateur achète les quantités q 1 = [q11 , q21 , .., qm (vecteur-colonne) lorsque les prix sont p1 = [p11 , p12 , . . . , p1m ] (vecteur-ligne). Sa dépense est p1 q 1 . Prenons maintenant un autre complexe q 2 qui ne coûte pas plus cher que q 1 [p1 q 2 ≤ p1 q 1 ]. Le consommateur pouvait acheter ce complexe et il ne l’a pas fait. On dira alors qu’il préfère q 1 à q 2 . On écrira: q1 R q 2 q 1 6= q 2 c’est-à-dire “q 1 révélé préféré à q 2 ” ou q 2 “pas révélé préféré à” q 1 . Par contre, si un complexe q 3 est plus cher [p1 q 3 > p1 q 1 ], on ne peut rien dire car on ne sait pas si le consommateur ne le préfère pas ou s’il n’a pas assez d’argent pour l’acheter. Toujours en observant le consommateur, supposons que quelques jours plus tard il achète le complexe q 2 et les prix sont p2 . Si son comportement est rationnel et si ses goûts n’ont pas changé, il ne doit pas révéler qu’il préfère q 2 à q 1 . L’axiome faible de la préférence révélée dira que: q1 R q2 =⇒ q 2 pas R q1 La relation doit être asymétrique comme dans le cas de >. Si cet axiome est satisfait, le consommateur a acheté q 2 car il est maintenant meilleur marché que q 1 [p2 q 2 < p2 q 1 ]. Samuelson a réussi à déduire l’homogénéité de degré zéro de la fonction de demande et le signe négatif de l’effet de substitution en utilisant uniquement cet axiome. Prenons deux vecteurs de prix p1 et p2 qui ont les mêmes éléments exceptés les premiers prix. En d’autres termes, c’est uniquement le prix du premier bien qui a changé (p1i = p2i i = 2, . . . , m ; p11 6= p21 ). Supposons que le consommateur achète le complexe q 1 lorsque les prix sont p1 et q 2 lorsqu’ils sont p2 . Lorsque les prix sont p1 , le consommateur aurait aussi pu acheter le complexe q 2 car le coût est le même (p1 q 1 = p1 q 2 ). Il a alors révélé qu’il préfère q 1 à q 2 (q 1 R q 2 ). L’axiome faible nous dit que p2 q 2 < p2 q 1 . Comme p1 q 1 − p1 q 2 = 0, on a: [p1 q 1 − p1 q 2 ] + p2 q 2 − p2 q 1 < 0 (p2 − p1 )(q 2 − q 1 ) < 0 (p21 − p11 )(q12 − q11 ) < 0 → ∆p1 ∆q1 < 0 L’homogénéité de degré zéro peut être démontrée en multipliant les prix et le revenu par une constante γ. Soit p2 = γp1 ; y 2 = γy 1 . On a: p2 q 2 = y 2 = γy 1 = γp1 q 1 Comme p2 = γp1 , on peut écrire: γp1 q 2 = γp1 q 1 → p1 q 2 = p1 q 1 Supposons que q 1 6= q 2 . Selon l’axiome faible, q 1 R q 2 car le coût est le même et le consommateur a acheté q 1 . On a alors: p 2 q 1 > p2 q 2 γp1 q 1 > γp1 q 2 p 1 q 1 > p1 q 2 et ceci est une contradiction car p1 q 1 = p1 q 2 . Par conséquent, q 1 = q 2 et alors la quantité achetée ne change pas. Samuelson n’a pas réussi à montrer la symétrie de l’effet de substitution. Dans ce cas, on aurait pu faire le lien avec les préférences provenant d’une fonction d’utilité. Houthakker a montré qu’il fallait un axiome plus fort qui ne se limitait pas à la comparaison entre deux complexes. L’axiome fort est le suivant: q1 R q2 R q 3 . . . q n−1 R q n → q n pas R q1 Il ne faut pas qu’il y ait un cycle. Cette condition est similaire à une condition d’acyclicité introduite par von Neumann et Morgenstern. Exemple: p1 = [ 3 2 1 ] ; p2 = [ 1 3 1 ] p3 = [ 10 6 8 ] T q 1 = [ 2 15 10 ] T T ; q 2 = [ 3 9 15 ] q 3 = [ 12 5 6 ] On a: p1 q 1 = 46 ; p1 q 2 = 42 ; p1 q 3 = 52 → q 1 R q2 p2 q 1 = 57 ; p2 q 2 = 45 ; p2 q 3 = 33 → q 2 R q3 p3 q 1 = 190 ; p3 q 2 = 204 ; p3 q 3 = 198 → q 3 R q1 L’axiome faible est satisfait tandis que l’axiome fort ne l’ait pas car q1 R q2 R q3 → q1 R q3 . Si l’on accepte des courbes d’indifférence avec une partie droite (courbe convexe au lieu de strictement convexe) alors le consommateur peut choisir des valeurs différentes sur cette partie droite sans qu’il y ait contradiction. Dans ce cas, il suffit de prendre un axiome généralisé de la préférence révélée (GARP). On dit que: 1) q 1 est directement révélé préféré à q 2 (q 1 R D q 2 ) si p1 q 1 ≥ p1 q 2 2) q 1 R qn → q1 R D q2 . . . R D qn Un ensemble de données satisfait GARP si q 1 R q n → pn q 1 ≥ pn q n . Un ensemble de données est conforme à la maximisation de l’utilité si et seulement si il satisfait GARP. Dans une analyse de données avec GARP, il faut naturellement tenir compte du pouvoir du test. En effet, si le revenu augmente, tous les complexes de biens qui se trouvent sur la nouvelle contrainte budgétaire sont souvent conformes à la maximisation de l’utilité. Le pouvoir du test est nul. Le modèle de Lancaster La théorie du consommateur a été développée au XIX siècle lorsque les biens achetés étaient peu nombreux. Aujourd’hui le consommateur a le choix entre plusieurs milliers de biens. Ceci posait des problèmes aux économistes qui devaient calculer des indices de prix car les biens changeaient d’une année à l’autre. Il y avait deux possibilités: soit ignorer les différences et considérer qu’il s’agit d’un même bien, soit considérer que les deux biens étaient totalement différents. Cette solution n’était pas satisfaisante car dans le premier cas on peut confondre un changement de qualité par une hausse de prix et dans le deuxième cas il est impossible de calculer la hausse des prix. On a alors construit des indices “hédonistes” où l’on considère qu’un bien possède un certain nombre de caractéristiques. Par exemple, la différence entre une voiture X et une autre voiture XL n’est peut-être qu’un problème de peinture métallique. Si l’on tient compte de ce coût supplémentaire, on peut calculer la hausse du prix du modèle actuel par rapport au modèle de l’année passée. Lancaster s’est inspiré de cette notion de caractéristiques pour dévelop- per une nouvelle théorie du consommateur. Les biens possèdent des caractéristiques objectives (châssis, moteur, carrosserie, etc. pour une voiture; vitamines, protéines, etc. pour la nourriture). Les individus ont des préférences subjectives pour ces caractéristiques. Les préférences pour les biens sont indirectes car les biens possèdent les caractéristiques dans des proportions variables. Lancaster suppose qu’il y a un lien linéaire entre bien et caractéristiques: Pm zi = j=1 bij qj i = 1, 2, . . . , r où zi est la caractéristique i et bij est une constante. La matrice B = [bij ] est appelée la matrice de la technologie de la consommation. Le problème du consommateur est alors le suivant: max u = (z) S.C. z = Bq ; q ≥ 0 ; pq ≤ y Il s’agit d’un problème de programmation non-linéaire. Le modèle de Lancaster est utilisé pour analyser les changements de qualité. Dans tous les autres cas, on continue à utiliser le modèle traditionnel. Le modèle intertemporel Théoriquement, il est facile de généraliser le modèle du consommateur en introduisant plusieurs périodes. La fonction d’utilité deviendrait: u(q11 , . . . , qm1 ; q12 , . . . , qm2 ; . . . ; q1T , . . . , qmT ) où le premier indice indique le bien, le deuxième la période et T est le nombre total de périodes. La contrainte serait: PT Pm PT Pm o p q = p q jt jt jt jt t=1 j=1 t=1 j=1 o sont les ressources du consommateur. Les prix et les ressources où qjt futurs sont naturellement des valeurs anticipées. Le prix d’un même bien à deux époques différentes permet de calculer le facteur d’escompte ou d’intérêt, spécifique pour chaque bien. En maximisant l’utilité sous cette contrainte on obtient les quantités que le consommateur planifie de consommer pendant toutes les périodes. Ce modèle est peu réaliste si on l’applique à un nombre arbitraire de biens. La vie du consommateur devient impossible s’il doit planifier le nombre de lacets de souliers qu’il pense acheter dans 20 ans. On suppose alors qu’il procède en deux étapes. Dans une première étape il se P limite à prévoir la consommation dans chaque période (ct = pit qit ). Ensuite, il répartit cette somme entre les différents biens qu’il pense acheter. Cette deuxième étape correspond au modèle statique qu’on a P vu [max u = f (q1 , . . . , qm ) S.C. pi qi = c]. La première étape est alors: max V = f (c1 , c2 , . . . , cT ) S.C. P P yt ct = t (1+r1 )...(1+rt−1 ) t (1+r1 )...(1+rt−1 ) où rt sont les taux d’intérêt (r0 = 0) et yt les revenus du consommateur. Les conditions de premier ordre sont: ∂L ∂v λ = − ∂cj (1+r1 )(1+r2 )...(1+rj−1 ) = 0 ∂cj P yt ∂L = ∂λ (1+r )(1+r2 )...(1+rt−1 ) P 1 ct − (1+r1 )(1+r2 )...(1+rt−1 ) = 0 (j = 1, 2, . . . , T ) De ces conditions on tire: δj = ∂v ∂cj ∂v ∂cj+1 − 1 = rj j = 1, 2, . . . , T − 1 Les taux de préférence pour le temps (δj ) doivent être égaux aux taux d’intérêt. On fait souvent l’hypothèse que l’utilité est additive par rapport au temps: PT u(ct ) v(c1 , c2 , . . . , cT ) = t=0 (1+ρ t t) où u(ct ) est la fonction d’utilité “instantanée” et ρt est le taux d’escompte subjectif. Si ce taux subjectif n’est pas constant, le consommateur ne va pas suivre le plan qu’il avait préparé. En effet, Strotz a montré que, même lorsque toutes les anticipations restent les mêmes, le consommateur trouve que son plan n’est plus optimal lorsqu’il le réexamine quelque temps plus tard. On fait alors l’hypothèse que le taux est constant et on écrit: PT 1 v = t=0 ( 1+ρ )t u(ct ) D’autre part, on préfère souvent travailler avec un temps continu et alors on a: R T −ρt v = t=0 e u(ct )dt De nombreuses enquêtes auprès des consommateurs révèlent que cet es- compte “exponentiel” ne correspond pas à la réalité. Les périodes lointaines sont escomptées à un taux plus bas que les périodes récentes. Un escompte “hyperbolique” du type φ(t) = (1 + αt)−ρ/α donne de meilleurs résultats. On obtient l’escompte exponentiel lorsque α → 0 (φ(t) = e−ρt ). Dans ce qui suit, on va néanmoins continuer à utiliser l’escompte exponentiel. La variation des actifs du consommateur (at ) est représentée par le revenu reçu, y compris l’intérêt sur les actifs, moins les dépenses. On a alors: ȧ = ra + y − c Si l’on suppose que le consommateur désire garder un actif à la fin de la période, le problème devient: R T −ρt max o e u(ct ) dt + e−ρT u(aT ) S.C. ȧ = ra + y − c C’est un problème de calcul des variations. Il existe une méthode similaire à celle de Lagrange pour résoudre ce problème. C’est la méthode de Pontryagin qui utilise la valeur courante de l’hamiltonien: H c = u(ct ) + λ[ra + y − c] où λ est une variable auxiliaire appelée la costate. Les conditions de premier ordre sont: ∂H c ∂u = ∂c ∂c − λ = 0 λ̇ = ρλ − λr = (ρ − r)λ Il faut aussi satisfaire la condition de transversalité: T) λ(T ) = ∂u(a ∂aT En éliminant λ on trouve: u′′ (c) ċ [c u′ (c) ] c = ρ − r Cette expression est appelée l’équation d’Euler. Si le temps est discret, il faut utiliser la programmation dynamique et le principe d’optimalité de Bellman. Le problème devient: P 1 t max V = t ( 1+ρ ) u(ct ) S.C. at+1 = (1 + r)at + yt − ct Supposons que nous sommes arrivés au temps to > 0. Le principe d’optimalité de Bellman dit que, quel que soit l’état initial, si les premières décisions sont celles du plan optimal, alors les décisions successives sont obtenues en cherchant le plan optimal pour le problème commençant en to avec l’état du système résultant des décisions précédentes (l’actif au temps to dépend des décisions précédentes). Soit PT 1 t−to W (a, to ) = max ( ) u(ct ) t=to 1+ρ En utilisant successivement le principe de Bellman, on peut écrire: W (at , to ) = max[u(cto ) + W (ato +1 , to+1 )] to Si l’on utilise la valeur courante de cette fonction: W c (ato , to )(1 + ρ)to on a: W c (ato , to ) = max[u(cto )+ to 1 c 1+ρ W (ato +1 , to+1 )] Cette expression est très pratique lorsqu’on introduit explicitement l’incertitude sous la forme de valeurs espérées. On a: W c (ato , to ) = max[u(cto )+ 1 c to ( 1+ρ )Eto {W (ato +1 , to+1 )}] où les anticipations sont celles de la période to . Cette maximisation est effectuée sous la contrainte ato +1 = (1 + r)ato + yto − cto Les conditions de premier ordre sont: ∂u ∂ct = λ(to ) o 1 λ(to ) = 1+ρ Eto {λ(to + 1)(1 + r)} Cette dernière relation est appelée l’équation d’Euler, comme dans le cas continu. Choix en situation d’incertitude Le consommateur doit souvent faire des choix sans connaı̂tre les conséquences de sa décision. Par exemple, il décide de prendre une assurance contre le vol sans savoir si on lui vole quelque chose; il achète des actions sans savoir si elles vont augmenter ou baisser, etc. Von Neumann et Morgenstern ont proposé un modèle pour expliquer le comportement de l’individu en cas de risque ou d’incertitude. En prenant une série d’axiomes, ils arrivent à la conclusion que l’individu maximise l’utilité espérée. Lorsqu’il y a incertitude, il faut considérer les états de la nature (vol ou pas vol, etc.). D’autre part, il faut toujours associer un bien à l’état de la nature dans laquelle ce bien est disponible. On parle alors d’un bien contingent ou d’une perspective. Il s’agit d’un complexe de bien doté d’une probabilité pi . On écrira xi = [xij ] j = 1, 2, . . . m ; i = 1, 2, . . . , N . N est le nombre d’états de la nature et m le nombre de biens. Von Neumann et Morgenstern supposent que les préférences du consommateur dépendent uniquement des utilités élémentaires u(xi ) et des probabilités avec lesquelles les vecteurs xi se réalisent. Les événements qui déterminent les probabilités pi n’ont aucune influence sur les préférences du consommateur. Prenons le cas où le complexe de biens ne comprend que 2 valeurs: la somme nette que l’on peut gagner avec un billet de loterie et le montant perdu si l’on ne gagne pas. On écrira la perspective q de la manière suivante: q = (x1 , p1 ; x2 , p2 ) où xi (i = 1, 2) est le bien et pi sa probabilité. Supposons qu’avec la loterie A, la probabilité de gagner 10’000 francs est de 0.2% et le prix du billet est de 100 francs. On représentera cette perspective en utilisant le vecteur q = (9’900 , 0.002; -100 , 0.998). Si le consommateur préfère la loterie B, décrite par le vecteur r, où il y a une probabilité de 0.1% de gagner 30’000 francs et le prix du billet est le même, on écrira r q avec r = (29’900 , 0.001 ; -100 , 0.999). Les axiomes proposés par von Neumann et Morgenstern sont les suivants: 1) Rationalité: les préférences constituent un préordre complet 2) Continuité: pour toute perspective q, r, s avec q r et r s , il existe une probabilité p telle que la perspective (q , p ; s , 1-p), composée des deux perspectives q et s, est indifférente à la perspective r. Si ces deux axiomes sont satisfaits, on peut représenter les préférences à l’aide d’une fonction d’utilité V(q). 3) Indépendance: si q r alors (q, p; s, 1 − p) (r, p; s, 1 − p). Si l’on mélange de la même manière les deux perspectives q et r avec une perspective s quelconque, alors la perspective contenant q doit toujours être préférée à celle contenant r. Les préférences sont indépendantes de la perspective s. Cet axiome d’indépendance permet de représenter les préférences de la manière suivante: P V (q) = pi u(xi ) où u(xi ) désigne l’utilité du bien xi . Les préférences du consommateur P pour la perspective q sont représentées par l’utilité espérée pi u(xi ). L’axiome 3) implique que la fonction d’utilité a une forme linéaire dans les probabilités. Les choix du consommateur sont obtenus en maximisant l’utilité espérée. Exemple La fortune d’un consommateur est constituée par sa maison dont la valeur est W . Il y a une probabilité p que la maison brûle et que la perte soit de L. Le coût d’une assurance contre l’incendie est ax où a est la prime unitaire et x le montant assuré. Ce montant est obtenu en maximisant l’utilité espérée: E(u) = pu[W − L + x − ax] + (1 − p)u[W − ax] La condition de premier ordre est: dE(u) dx = pu′ [W − L + x(1 − a)](1 − a) + (1 − p)u′ [W − ax](−a) = 0 où l’apostrophe désigne la première dérivée de la fonction d’utilité. On obtient: u′ [W −L+x(1−a)] 1−p a = ′ u [W −ax] p 1−a La valeur espérée de la fortune du consommateur est: E(W ) = p[W − L + x − ax] + (1 − p)[W − ax] Le profit espéré de la compagnie d’assurances est: −p(1 − a)x + (1 − p)ax S’il y a concurrence le profit sera nul et alors la prime sera a = p. Si le consommateur est averse au risque, sa fonction d’utilité est concave et alors u′′ (W ) < 0. Avec une prime a = p le consommateur s’assure totalement (x = L) car: u′ [W − L + x(1 − a)] = u′ [W − ax] et alors x = L. Si un consommateur est averse au risque, alors u[E(W )] > E(u). S’il aime le risque l’inégalité est renversée et s’il est neutre il y a égalité. Un consommateur qui a une fonction d’utilité convexe aime le risque. Si sa fonction est linéaire il est neutre vis-à-vis du risque. Une mesure du degré absolu d’aversion vis-à-vis du risque est donnée par l’expression suivante: u′′ (W ) − u′ (W ) = d ln u′ (W ) − dW Le degré relatif d’aversion au risque est donné par l’expression: u′′ (W )W − u′ (W ) = d ln u′ (W ) − W dW On suppose souvent que le degré d’aversion vis-à-vis du risque est décroissant par rapport à la fortune du consommateur. La fonction d’utilité u = ln (W + 1) satisfait cette condition. On utilise parfois les deux fonctions suivantes: u(W ) = − α1 e−αW ; u(W ) = W 1−γ 1−γ La première a un degré absolu d’aversion au risque constant (α) tandis que la deuxième a un degré relatif d’aversion au risque constant (γ). Ces résultats sont invariants par rapport à une transformation monotone linéaire (ou affine) de la fonction d’utilité. Dans un certain sens, l’utilité von Neumann-Morgenstern est une utilité “cardinale”. L’axiome d’indépendance, qui ne tient pas compte de la distribution des probabilités, a été critiqué par Allais. Allais critique la pertinence de la théorie de l’utilité espérée en prenant un exemple où le comportement des individus n’est pas conforme à la théorie. On doit choisir entre les deux perspectives suivantes: s1 : 100 millions certains r1 : 500 millions avec probabilité 0.10 100 millions avec probabilité 0.89 0 avec probabilité 0.01 Beaucoup d’individus préfèrent 100 millions certains: (100, 1) (500, 0.1; 100, 0.89; 0, 0.01) Par contre, si l’on doit choisir entre: s2 : 100 millions avec probabilité 0.11 0 avec probabilité 0.89 r2 : 500 millions avec probabilité 0.1 0 avec probabilité 0.9 la plupart des individus préfère r2 car les probabilités sont presque les mêmes mais r2 permet de gagner cinq fois plus que s2 . Ces choix ne sont pas compatibles avec la théorie de l’utilité espérée. On parle de l’effet de certitude ou du paradoxe de la conséquence commune. En effet, ces perspectives sont du type suivant: s = (x2 , p; x1 , 1 − p) r = (q, p; x1 , 1 − p) avec q = (x3 , λ ; 0, 1 - λ ) (0 < λ < 1). En développant la deuxième perspective, on obtient r = [x3 , λp; 0, (1 − λ)p; x1 , (1 − p)]. La conséquence commune est x1 . Selon l’axiome d’indépendance, les choix ne dépendent pas de la valeur de x1 . Le paradoxe d’Allais montre que ceci n’est pas le cas. On obtient ses valeurs en mettant x2 = 100 , 10 x3 = 500 , p = 0.11 et λ = 11 . Dans le premier cas x1 =100 et dans le deuxième x1 =0. Lorsque x1 =100 s r et lorsque x1 =0 r s. On peut représenter les préférences de l’individu en utilisant le triangle des probabilités. La pente de la courbe d’indifférence dépend de l’aversion au risque de l’individu. Elle sera forte lorsque celle-ci sera grande. Par convention, la somme la plus élevée se trouve en haut et la plus basse à droite. Par conséquent, l’utilité augmente lorsqu’on se déplace vers la gauche (voir graphique). L’axiome d’indépendance implique que les courbes d’indifférence sont des droites parallèles (droites traitillées) car sur les axes il y a les probabilités. Dans l’exemple ci-dessus, r1 s1 et r2 s2 . Si la pente est plus forte, on aurait s1 r1 et s2 r2 . Il est impossible d’avoir s1 r1 et r2 s2 comme trouvé avec le paradoxe d’Allais. Il convient de noter que l’on passe de s1 à s2 et de r1 à r2 en diminuant de 0.89 la probabilité de gagner 100 millions et en augmentant dans la même mesure la probabilité de ne rien gagner. Graphiquement, les points r1 et s1 se déplacent de manière parallèle à r2 , s2 (droite con- tinue). Par conséquent, si r1 s1 alors r2 s2 . De nombreuses expériences confirment l’importance du paradoxe d’Allais. MacCrimmon trouve qu’environ un tiers des 36 hommes d’affaires interviewés donne les réponses prévues par Allais. Le pourcentage s’élève à 44% dans l’expérience de Conlisk avec 236 individus et à plus de 80% dans celle de Kahneman et Tversky avec 72 étudiants. Cette dernière expérience est très intéressante car les sommes proposées ne correspondaient qu’à environ un mois de salaire. Un autre paradoxe, aussi proposé par Allais, est celui du rapport commun. On a les deux perspectives suivantes: s∗1 : 100 millions certains r1∗ : 500 millions avec probabilité 0.8 0 avec probabilité 0.2 La plupart des individus préfèrent s∗1 (s∗1 r∗1 ). D’autre part, si l’on doit choisir entre les deux perspectives suivantes: s∗2 : 100 millions avec probabilité 0.05 0 avec probabilité 0.95 r2∗ : 500 millions avec probabilité 0.04 0 avec probabilité 0.96 on préfère r2∗ (r∗2 s∗2 ). Il s’agit ici de perspectives de la forme suivante: s∗ = (x2 , p; 0, 1 − p) r∗ = (x3 , λp; 0, 1 − λp) Il y a un rapport commun λ entre les deux probabilités. On obtient l’exemple ci-dessus lorsque x2 =100, x3 =500 et λ = 0.8. Dans le premier cas p=1 et dans le deuxième p=0.05. Comme on peut le voir dans le graphique ci-dessus, la théorie de l’utilité espérée implique que si r∗2 s∗2 alors r∗1 s∗1 et non pas comme indiqué dans l’exemple proposé. Les préférences ne doivent pas dépendre de la valeur de p. On passe de s∗1 à s∗2 en divisant par 20 la probabilité de gagner 100 millions et de r∗1 à r∗2 en divisant par 20 la probabilité de gagner 500 millions. Graphiquement, les points r∗1 et s∗1 se déplacent de manière parallèle à r∗2 , s∗2 (droite pointillée). Par conséquent, si r∗1 s∗1 alors r∗2 s∗2 . Ce deuxième paradoxe aussi a été confirmé par de nombreuses expérien- ces. MacCrimmon et Larsson trouvent qu’une majorité des 18 étudiants interrogés ont un comportement qui n’est pas conforme à la théorie de l’utilité espérée. Toutefois, lorsque la somme proposée était réduite, les incohérences diminuent. Kahneman et Tversky obtiennent des résultats encore plus frappants. Le 82% des 72 étudiants interrogés préfèrent s∗1 lorsque x2 =3000 , x3 =4000 (lires israéliennes). Dans le deuxième cas, 65% préfèrent r∗2 lorsque p=0.25. Toutes ces expérimentations sont basées sur des questions hypothétiques car on ne peut pas payer des sommes aussi importantes. Les individus n’ont alors aucune incitation à répondre selon leurs préférences véritables. Il y aura un certain nombre de choix aléatoires. Toutefois, un pourcentage significatif des réponses confirment les affirmations des partisans des paradoxes. Par ailleurs, des expériences effectuées dans des pays où le taux de change permettait de payer des sommes correspondant à plusieurs mois de salaire montrent qu’il n’y a pas de différences fondamentales entres les deux types d’expérimentation. Le caractère peu réaliste de la théorie de l’utilité espérée a été récemment illustré par Rabin. Dans la théorie de l’utilité espérée, l’aversion au risque est le résultat de la concavité de la fonction d’utilité. Ceci signifie que si un individu a de l’aversion au risque dans le cas de petits montants en jeu, alors l’utilité marginale doit fortement diminuer. Par conséquent, cet individu doit aussi rejeter des jeux très favorables avec des montants élevés. Si un individu refuse le jeu où la probabilité de gagner 125 $ est la même que celle de perdre 100 $ (lorsque sa fortune initiale est inférieure à 300’000 $) alors il doit refuser de participer à un jeu ayant les mêmes probabilités (50%) mais avec une perte de 600 $ et un gain de 36 milliards de dollars (à partir d’une fortune initiale de 290’000 $) ! On peut tenir compte des résultats des différentes expériences sur les préférences des individus en situation d’incertitude en supposant que les courbes d’indifférence ne soient pas des droites parallèles. Il suffit de supposer que les préférences soient représentées par la fonction suivante: P V (q) = π(pi )u(xi ) où les probabilités sont pondérées selon l’expression π(pi ). Lattimore, Backer et Witte proposent la formule suivante: π(pi ) = αpβ i αpβ + i P k6=i pβ k Lorsque α = β = 1 on retrouve le modèle de l’utilité espérée. En prenant 57 individus, les auteurs trouvent que les valeurs de α et β sont inférieures à 1. Les individus cherchent le risque lorsque la probabilité est faible et l’évitent lorsqu’elle est forte. D’autre part, la théorie de l’utilité espérée n’est la meilleure explication que dans 20% des cas. Un autre paradoxe qui intrigue les chercheurs est le renversement des préférences. Lichtenstein et Slovic proposent aux participants de choisir entre les perspectives (4 , 0.99 ; -1 , 0.01) et (16, 0.33 ; -2 , 0.67). La première est appelée le P-bet, car dans ce pari la probabilité est très élevée, et la deuxième le $-bet car la somme que l’on peut gagner est plus élevée. En général, les individus préfèrent le P-bet. Ensuite, après quelques autres questions, on demande aux participants d’indiquer le prix de vente minimum de ces billets. On obtient alors des sommes plus élevées pour le $-bet. Le 73% des participants préfèrent le P-bet mais exigent un prix plus élevé pour le $-bet. Il y a donc un renversement surprenant des préférences entre la première et la deuxième question. On constate le même phénomène lorsque les choix sont réels et non pas hypothétiques. Le renversement des préférences obtenu par Grether et Plott est de 70%. Avec des sommes plus élevées, Pommerehne, Schneider et Zweifel ne trouvent que 45% des participants qui préfèrent le Pbet mais exigent un prix plus élevé pour le $-bet. Par contre Bohm n’observe aucun renversement mais, dans son expérience, il s’agit de faire des choix entre deux voitures d’occasion. En permettant les achats et les ventes des deux types de paris (P-bet et $ bet), Knez et Smith obtiennent une réduction du nombre de renversement de préférences (de 60% à 40%). Par ailleurs, il arrive souvent que les achats et les ventes effectués ne soient pas conformes aux réponses données précédemment. Cox et Grether utilisent plusieurs méthodes pour déterminer les préférences des individus, en particulier l’enchère au deuxième prix et l’enchère anglaise. Lorsque l’expérience est répétée plusieurs fois avec les mêmes participants, le nombre de renversement de préférences diminue, surtout avec ces dernières méthodes et des incitations monétaires. Le renversement des préférences montre que les réponses dépendent de comment la question est formulée. Un exemple classique est celui présenté par Tversky et Kahneman. On prévoit qu’une nouvelle maladie va causer 600 décès aux Etats-Unis. Plusieurs programmes de lutte contre cette maladie sont proposés: A: 200 personnes sauvées B: 600 personnes sauvées, probabilité 1/3; 0 personnes sauvées, probabilité 2/3 C: 400 personnes décédées D: 600 personnes décédées, probabilité 2/3; 0 personnes décédées, probabilité 1/3 On obtient en général que A B et D C. La formulation en termes de personnes sauvées ne donne pas le même résultat que celle en terme de personnes décédées. Un problème similaire est aussi rencontré dans certains sondages. En économie, on peut rencontrer un problème de ce type lorsque les gains et les pertes sont évalués selon des critères différents. La théorie de la perspective Kahneman et Tversky proposent une nouvelle théorie pour expliquer le comportement de l’individu en cas de risque ou incertitude. Leur théorie de la perspective comprend une étape préliminaire où l’individu simplifie et reformule les perspectives de manière à faciliter le choix. Il s’agit ensuite de choisir un point de référence à partir duquel les gains et les pertes sont évalués. Par exemple, le point de référence peut être la fortune actuelle de l’individu. Dans ce cas, le choix de la perspective dépendra de la variation de la fortune et non pas de la fortune finale. Les résultats des perspectives sont évalués en utilisant une fonction d’utilité centrée autour du point de référence. Cette fonction est concave en cas de gains et convexe en cas de pertes. Tversky et Kahneman proposent la fonction suivante: α x pour x ≥ 0 u(x) = −λ(−x)β pour x < 0 où x est la variation de la fortune, λ le coefficient d’aversion au risque, α et β deux paramètres inférieurs à l’unité. L’utilité espérée de la perspective q sera: V (q) = π(p)u(x1 ) + π(1 − p)u(x2 ) où la pondération des probabilités est donnée par l’expression suivante: pγ π(p) = (pγ +(1−p)γ )1/γ Benartzi et Thaler utilisent cette théorie pour expliquer le rendement excessif des actions par rapport à celui des obligations. Mehra et Prescott trouvent une différence de six points de pourcentage entre les deux rendements et ceci implique que l’indice relatif d’aversion au risque est supérieur à 30. Or, les estimations de cet indice donnent des valeurs proches de l’unité. Il y a par conséquent une énigme que la théorie de l’utilité espérée n’arrive pas à expliquer. Dans le cas d’une fonction d’utilité iso-élastique, un indice relatif d’aversion au risque de 30 signifie que l’individu est indifférent, par exemple, entre (100’000, 0.5; 50’000 , 0.5) et une somme certaine de 51209 francs. Par contre, avec un indice de 1 la somme certaine est de 70711 francs et elle est plus vraisemblable que celle de 51209 francs. Les gains et les pertes d’un investissement en actions dépendent de la longueur de la période considérée. Plus la période est longue, moins il y aura de risque de perte par rapport à l’investissement initial. En prenant des échantillons de rendement mensuel des actions et des obligations américaines, Benartzi et Thaler trouvent qu’une évaluation annuelle des deux types d’investissement donne la même utilité selon le modèle de Tversky et Kahneman (avec γ = 0.61 pour les gains et γ = 0.69 pour les pertes, α = β = 0.88 et λ = 2.255). Une analyse à court terme associée à une forte aversion des pertes conduirait à un rendement excessif des actions.