ACT 2008 Mathématiques actuarielles IARD II (Théorie de la

publicité
ACT 2008
Mathématiques
actuarielles IARD II
(Théorie de la crédibilité)
ACT 2008
Mathématiques
actuarielles IARD II
(Théorie de la crédibilité)
Vincent Goulet
École d’actuariat, Université Laval
Hiver 2010
c 2010 Vincent Goulet
Cette création est mise à disposition selon le contrat Paternité-Partage à l’identique 2.5 Canada disponible en ligne http://creativecommons.org/licenses/
by-sa/2.5/ca/ ou par courrier postal à Creative Commons, 171 Second Street,
Suite 300, San Francisco, California 94105, USA.
Table des matières
1 Introduction à la théorie de la crédibilité
1
2 Crédibilité de stabilité
2.1 Origines . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Crédibilité complète . . . . . . . . . . . . . . . . . . . . . .
2.3 Crédibilité partielle . . . . . . . . . . . . . . . . . . . . . . .
5
5
6
9
3 Crédibilité bayesienne
3.1 Quelques notes historiques . . . . . . . .
3.2 Estimation bayesienne . . . . . . . . . . .
3.3 Modélisation de l’hétérogénéité . . . . . .
3.4 Prévision . . . . . . . . . . . . . . . . . . .
3.5 Approche par la distribution prédictive .
3.6 Crédibilité bayesienne linéaire (ou exacte)
3.7 Le modèle de Jewell . . . . . . . . . . . . .
4 Le modèle de crédibilité de Bühlmann
4.1 Notation et relations de covariance
4.2 Modèle et prévision . . . . . . . . .
4.3 Approche paramétrique . . . . . .
4.4 Approche non paramétrique . . . .
4.5 Interprétation des résultats . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11
11
12
17
18
24
26
37
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
39
39
42
47
50
56
5 Le modèle de Bühlmann–Straub
5.1 Modèle et prévision . . . . . . . . . . . .
5.2 Estimation des paramètres de structure
5.3 Données manquantes . . . . . . . . . . .
5.4 Exemple numérique . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
59
59
64
67
67
Bibliographie
.
.
.
.
.
.
.
.
.
.
73
v
1
Introduction à la théorie de la
crédibilité
Théorie de la crédibilité : ensemble de techniques utilisées par les actuaires pour déterminer la prime d’un assuré/contrat dans un portefeuille hétérogène.
En faisant une tarification, un assureur cherche
1. d’abord à charger assez de primes pour poyer les sinistres ; puis
2. distribuer équitablement ces primes entre les assurés.
Plusieurs façons d’atteindre le second but :
1. d’abord par une structure de classification ; puis
2. par la tarification basée sur l’expérience (experience rating)
de la crédibilité.
ñ théorie
Définition (Experience rating). La tarification basée sur l’expérience vise
à assigner à chaque risque sa prime juste et équitable. Cette prime pour
une période dépend exclusivement de la distribution des sinistres (inconnue) de ce risque pour la période. (Bühlmann, 1969)
La tarification basée sur l’expérience exige un volume d’expérience important. Elle est donc principalement utilisée en
assurance automobile
accidents du travail.
Elle ne peut toutefois être utilisée, par exemple, en
assurance-vie (on ne meurt qu’une fois)
1
assurance habitation (fréquence trop faible)
Exemple 1.1. Un portefeuille d’assurance est composé de dix contrats.
Les contrats sont a priori considérés équivalents. Les conditions suivantes prévalent :
tout contrat ne peut avoir qu’au plus un sinistre par année ;
le montant de ce sinistre est 1 ;
la prime collective est 0,20, c’est-à-dire que l’assureur s’attend à ce
qu’en moyenne deux assurés sur 10 aient un sinistre au cours d’une
année.
Situation après une année
Voici l’expérience au sein du portefeuille après une année.
Contrat
Année
1
2
3
4
5
6
7
8
1
9
10
1
Montant de sinistre moyen par contrat = 1/10 = 0,10.
La prime collective est peut-être trop élevée.
Trop peu de données pour tirer une conclusion.
Situation après deux années
Après deux années, l’expérience est maintenant comme suit.
Contrat
Année
1
2
3
4
5
1
2
6
7
8
9
1
1
1
1
2
10
Montant de sinistre moyen par contrat = 4/20 = 0,20.
La prime collective est adéquate.
Le contrat 9 a déjà eu deux sinistres.
Situation après dix années
Observons maintenant la situation après dix années.
Contrat
Année
1
2
3
4
5
6
7
8
1
9
10
1
2
1
3
1
1
1
1
1
4
1
1
5
1
6
1
7
1
8
1
9
1
10
1
S̄i
0,6
1
1
1
1
1
1
1
1
0,3
0,2
0,2
0,2
S̄
0,1
0
0
0,23
Montant de sinistre moyen par contrat = 23/100 = 0,23.
La prime collective est raisonnablement adéquate.
Le contrat 9, avec ses 7 sinistres, est en effet plus risqué.
Les contrats 7, 8 et 10 n’ont eu aucun sinistre.
3
0,7
0
Conclusions
La prime collective, si elle est globalement adéquate, n’est en revanche
clairement pas équitable.
Contrairement à l’hypothèse de départ de l’assureur, le portefeuille
est hétérogène.
Besoin d’une technique de tarification basée sur l’expérience (expe-
rience rating) pour adéquatement distribuer les primes entre les assurés.
Deux grandes branches en théorie de la crédibilité :
1. Credibilité de stabilité, ou américaine, limited fluctuations.
L’assureur tient compte de l’expérience individuelle seulement si celleci est suffisamment stable dans le temps.
2. Crédibilité de précision, ou européenne, greatest accuracy.
L’assureur tient compte de l’expérience individuelle de façon à obtenir la meilleure estimation de l’expérience future. Le poids de l’expérience individuelle augmente avec l’hétérogénéité du portefeuille.
4
2
Crédibilité de stabilité
2.1
Origines
La théorie de la crédibilité est apparue dans le domaine des accidents
du travail au début des années 1900.
Petite histoire du gros employeur avec une meilleure expérience que le
groupe...
Première solution : Mowbray (1914) définit une prime pure «fiable» (dependable) comme «une prime pour laquelle la probabilité est forte qu’elle
ne diffère pas de la vraie prime par plus d’une limite arbitraire».
En termes mathématiques, on veut que
Pr[(1 k ) E[S] ¤ S ¤ (1 + k ) E[S]] ¥ p,
où
k est petit, habituellement 5 % ;
p est près de 1, habituellement 0,90, 0,95 ou 0,99 ;
S représente l’expérience d’un contrat, sous une forme ou une autre.
5
2.2
Crédibilité complète
En crédibilité complète, un contrat d’assurance est considéré crédible si
son expérience est stable.
La notion de portefeuille n’est pas nécessaire pour le moment.
Intuitivement, la stabilité de l’expérience va de pair avec la «taille» d’un
contrat, qu’elle soit exprimée en termes de
volume de prime ;
masse salariale ;
nombre d’employés ;
nombre de sinistres ;
nombre d’années d’expérience ;
etc.
De plus, la taille du contrat est généralement liée à la fréquence des
sinistres, et non à la sévérité de ceux-ci.
Définition (Crédibilité complète). Une crédibilité complète d’ordre (k, p)
est attribuée à l’expérience S d’un contrat si les paramètres de la distribution de S sont tels que la relation
Pr[(1 k ) E[S] ¤ S ¤ (1 + k ) E[S]] ¥ p
est vérifiée.
Exemple 2.1 (Binomiale pure). Mowbray (1914) voulait trouver le nombre
d’employés minimal pour considérer l’expérience d’un employeur pleinement crédible. On définit alors
S : nombre d’accidents par année
avec
S Binomiale(n, θ ),
où
n = nombre d’employés
θ = probabilité d’accident (connue).
6
On cherche n tel que
Pr[(1 k ) E[S] ¤ S ¤ (1 + k) E[S]] ¥ p
pour des valeurs de k et p données. Par le Théorème central limite,
S E[S] nÑ8
ÝÑ N (0, 1),
Var[S]
a
d’où
"
kE[S]
Pr a
Var[S]
¤
S E[S]
a
Var[S]
¤
kE[S]
a
Var[S]
#
Φ
= 2Φ
kE[S]
a
Var[S]
!
kE[S]
Var[S]
a
Φ akE[S]
Var[S]
!
1 ¥ p.
On a donc
kE[S]
¥ ζ ε/2 ,
Var[S]
où ε = 1 p et ζ α est le 100(1 α)e centile d’une loi N (0, 1).
a
Avec E[S] = nθ et Var[S] = nθ (1 θ ) et en isolant n dans l’inégalité, on
obtient
ζ ε/2 2 1 θ
n¥
.
k
θ
Exemple 2.2 (Poisson composée). La taille d’un contrat est souvent exprimée en termes du nombre espéré de sinistres dans une période —
typiquement une année. La distribution la plus populaire pour S dans
un tel cas est alors la Poisson composée, c’est-à-dire
S = X1 + + X N
où N Poisson(λ) et la distribution de X1 , X2 , . . . est FX (). On a
E[S] = E[ N ] E[ X ]
= λE[ X ]
Var[S] = Var[ N ] E[ X ]2 + E[ N ]Var[ X ]
= λE[ X ]2 + λVar[ X ]
= λE[ X 2 ].
7
!
En suivant le même cheminement qu’à l’exemple précédent, on trouve
ζ ε/2 2
Var[ X ]
λ¥
1+
k
E [ X ]2
2
ζ ε/2
=
(1 + CV( X )2 ),
k
où
a
Var[ X ]
.
E[ X ]
CV( X ) =
Remarques.
1. Plus CV( X ) augmente, plus λ augmente.
2. Si k = 0,05 et p = 0,90, alors ζ 0,05 = 1,645 et
Var[ X ]
λ ¥ 1 082,41 1 +
.
E [ X ]2
3. Si, en plus, X est dégénérée (c’est-à-dire Pr[ X = M ] = 1 pour M quelconque), alors
λ ¥ 1 082,41,
un nombre célèbre.
4. Si X est dégénérée en 1 on a en définitive S Poisson(λ).
Exemple 2.3. Dans les deux exemples précédents, on détermine si un
contrat est pleinement crédible une période à la fois. On pourrait aussi
fixer le seuil de crédibilité complète en fonction du nombre d’années
d’expérience. Pour cela, on définit simplement
S1 + + Sn
,
n
où S1 , . . . , Sn sont des variables aléatoires indépendantes et identiquement distribuées et St est l’expérience de l’année t = 1, . . . , n.
S S̄ =
On a alors
E [ S ] = E [ St ]
Var[St ]
Var[S] =
,
n
8
d’où l’expérience d’un contrat est considérée pleinement crédible après
n¥
ζ ε/2
k
2
Var[St ]
E [ St ]2
périodes.
Remarques.
1. De manière générale, le seuil de crédibilité complète est tel que
E[S] ¥
ζ ε/2
k
b
Var[S].
2. La distribution de S n’est en général pas symétrique. Est-il alors correct d’utiliser le Théorème central limite (TCL) ? Le critère de crédibilité complète exige que la distribution de S soit très concentrée autour
de sa moyenne, donc presque symétrique. Le TCL est donc bien assez
précis.
3. Il y a en fait très peu d’applications légitimes de la crédibilité de stabilité. Un bon exemple : seuil d’admissibilité à un régime rétrospectif.
2.3
Crédibilité partielle
Le besoin de tenir compte en partie de l’expérience individuelle d’un
contrat se trouvant sous le seuil de crédibilité complète apparait rapidement.
Whitney (1918) propose de pondérer l’expérience individuelle (S) et la
prime collective (m) par un facteur de crédibilité (0 ¤ z ¤ 1) en une prime
de la forme
π = zS + (1 z)m.
9
Plusieurs formules différentes ont été proposées pour z. Soit n0 le seuil
de crédibilité complète. Les formules les plus populaires sont
"c
*
n
,1 ,
z = min
n0
#
2/3 +
n
z = min
,1 ,
n0
et la formule de Whitney
z=
n
,
n+K
où K est une constante déterminée au jugement de façon à limiter les
fluctuations dans la prime d’une année à l’autre (swing).
Remarques.
1. But de cette approche : incorporer autant d’expérience individuelle
possible sans trop affecter la stabilité de la prime.
2. La distribution des primes est basée uniquement sur la taille des assurés. La tarification n’est donc pas nécessairement précise et équitable.
10
3
Crédibilité bayesienne
3.1
Quelques notes historiques
Whitney (1918) est le premier auteur à proposer l’approche de pré-
cision de par «la nécessité, par équité envers le risque individuel,
de pondérer l’expérience du groupe d’une part et l’expérience individuelle d’autre part.»
Modèle mal reçu parce que Whitney utilise la règle de Bayes.
Défenseur de l’approche bayesienne : Bailey (1945, 1950). Bailey établit
que la minimisation de l’erreur quadratique moyenne résulte en une
prime bayesienne linéaire de la forme
π = zS + (1 z)m
avec
z=
z
z+K
pour certaines combinaisons de distributions.
Véritable essor de la crédibilité de précision : Bühlmann (1967, 1969).
Son idée : forcer la prime bayesienne à être linéaire.
11
3.2
Estimation bayesienne
3.2.1
Cas continu
Supposons que l’on souhaite estimer le paramètre inconnu θ d’une distribution continue avec f.d.p. f ( x; θ ) (une loi normale avec moyenne inconnue θ et variance connue σ2 , par exemple) à partir d’un échantillon
aléatoire X1 , . . . , Xn .
Les statisticiens classiques développeront des estimateurs à partir d’un
critère quelconque : absence de biais, maximum de vraisemblance, etc.
On remarquera qu’aucune hypothèse a priori n’est faite sur θ, on «laisse
parler les données».
Dans l’approche bayesienne, l’opinion a priori d’un individu sur la valeur du paramètre θ est prise en compte dans l’estimation de ce dernier.
On considère alors le paramètre comme une simple réalisation d’une
variable aléatoire Θ avec f.d.p. u(θ ). Au fur et à mesure que les données de l’échantillon aléatoire (l’information) s’accumulent, l’opinion a
priori sur la valeur possible de θ est révisée et améliorée. On calcule
alors u(θ |x1 , . . . , xn ), la distribution a posteriori de Θ, à l’aide de la régle
de Bayes :
u ( θ | x1 , . . . , x n ) =
f ( x1 , . . . , x n , θ )
f ( x1 , . . . , x n )
f ( x1 , . . . , x n |θ ) u ( θ )
=
.
f ( x1 , . . . , x n )
Par la loi des probabilités totales,
»
f ( x1 , . . . , x n ) =
et donc
8
8
f ( x1 , . . . , xn |θ )u(θ ) dθ,
f ( x1 , . . . , x n |θ ) u ( θ )
.
8 f ( x1 , . . . , xn |θ )u(θ ) dθ
u ( θ | x1 , . . . , x n ) = ³ 8
Le dénominateur du côté droit de l’expression ci-dessus n’est qu’une
constante de normalisation et, par conséquent, est souvent omise dans
les calculs.
12
Enfin, un estimateur ponctuel θ̂ = g( X1 , . . . , Xn ) du paramètre θ est obtenu en minimisant l’espérance a posteriori d’une fonction de perte. La
fonction de perte la plus fréquemment employée est l’erreur quadratique, c’est-à-dire
L(θ̂, θ ) = (θ̂ θ )2 .
Dans un tel cas l’estimateur bayesien minimisant
E[ L(θ̂, θ )|X1 , . . . , Xn ] = E[(θ̂ θ )2 |X1 , . . . , Xn ]
est
θ̂ = E[Θ|X1 , . . . , Xn ]
»
=
8
8
θ u(θ |x1 , . . . , xn ) dθ,
soit l’espérance de Θ calculée par rapport à la distribution a posteriori.
3.2.2
Cas discret
Les idées expliquées ci-dessus demeurent exactement les mêmes dans
le cas discret, seule la notation change légèrement. Pour simplifier la
notation, soit X = ( X1 , . . . , Xn ) et x = ( x1 , . . . , xn ).
Si la variable aléatoire Θ ne prend que des valeurs discrètes, la distribution a priori est exprimée sous forme d’une fonction de probabilité
Pr[Θ = θ ]. La fonction de probabilité conjointe de X1 , . . . , Xn peut toujours être calculée par la loi des probabilités totales :
8̧
Pr[ X = x] =
θ =8
Pr[ X = x|Θ = θ ] Pr[Θ = θ ].
La règle de Bayes permet de calculer la distribution a posteriori de Θ :
Pr[ X = x|Θ = θ ] Pr[Θ = θ ]
Pr[ X = x]
Pr[ X = x|Θ = θ ] Pr[Θ = θ ]
= °8
.
θ =8 Pr[ X = x|Θ = θ ]Pr[ Θ = θ ]
Pr[Θ = θ |X = x] =
13
Enfin, l’estimateur bayesien minimisant l’erreur quadratique moyenne
demeure inchangé :
θ̂ = E[Θ|X1 , . . . , Xn ]
8̧
=
3.2.3
θ =8
θ Pr[Θ = θ |X = x].
Cas mixtes
Il est simple de dériver les formules des cas mixtes ou, par exemple, la
distribution de X |Θ est discrète et celle de Θ est continue.
Exemple 3.1. Un portefeuille d’assurance automobile est composé de
75 % de bons conducteurs et de 25 % de mauvais conducteurs. Les bons
1
d’avoir un accident, alors que la
conducteurs ont une probabilité de 15
1
probabilité est de 10 pour les mauvais conducteurs. On suppose que le
coût d’un accident est de 1 000 et qu’au plus un accident peut survenir
dans une année.
a) On choisit un assuré au hasard. Quelle est la probabilité que cet assuré ait un accident dans l’année qui suit ?
Soit les événements :
A : avoir un accident
B : être un bon conducteur.
On cherche Pr[ A] sachant
Pr[ A| B] =
1
15
1
Pr[ A| B̄] =
10
3
Pr[ B] =
4
1
Pr[ B̄] = .
4
14
Par la loi des probabilités totales,
Pr[ A] = Pr[ A| B] Pr[ B] + Pr[ A| B̄] Pr[ B̄]
1
3
1
1
+
=
15
4
10
4
3
= .
40
b) Quelle est la prime pure de cet assuré la première année ?
Soit S le montant total des sinistres de cet assuré. On cherche E[S].
On peut procéder de deux façons.
1. À partir de la réponse en a), on a
#
Pr[S = x ] =
3
40 ,
37
40 ,
x = 1 000
ailleurs.
Par conséquent,
3
E[S] = 1 000
40
= 75.
2. De l’énoncé on peut établir
#
Pr[S = x| B] =
1
15 ,
14
15 ,
x = 1 000
ailleurs
1
10 ,
9
10 ,
x = 1 000
ailleurs,
et
#
Pr[S = x| B̄] =
d’où
E [ S| B ] =
E[S| B̄] = 100.
200
3
Ainsi, on a
E[S] = E[ E[S|type de conducteur]]
= E[S| B] Pr[ B] + E[S| B̄] Pr[ B̄]
200 3
1
=
+ 100
3
4
4
= 75.
15
c) L’assuré choisi en a) a eu un accident dans la première année. Quelle
est la probabilité qu’il s’agisse d’un bon conducteur ?
On cherche Pr[ B| A]. Par la règle de Bayes,
Pr[ B| A] =
=
=
Pr[ A| B] Pr[ B]
Pr[ A]
1
)( 14 )
( 15
3
40
2
3
34 .
d) Quelle est la prime pure de cet assuré pour la seconde année ?
On cherche E[S| A]. Encore ici, on peut procéder de deux façons différentes, mais équivalentes.
1. On trouve la fonction de masse de probabilité de la variable aléatoire S| A. On a
Pr[ A| A] = Pr[ A| B] Pr[ B| A] + Pr[ A| B̄] Pr[ B̄| A]
2
1
1
1
+
=
15
3
10
3
7
= ,
90
d’où
#
Pr[S = x| A] =
et
7
90 ,
83
90 ,
7
E[S| A] = 1 000
90
x = 1 000
ailleurs.
=
700
.
9
2. On a
E[S| A] = E[S| B] Pr[ B| A] + E[S| B̄] Pr[ B̄| A]
200 2
1
=
+ 100
3
3
3
700
=
.
9
16
3.3
Modélisation de l’hétérogénéité
On utilise le modèle classique de crédibilité de précision tel qu’établi
par Bühlmann (1967, 1969).
On a un portefeuille (groupe) hétérogène de I contrats. Le niveau de
risque du contrat i = 1, . . . , I est inconnu, mais des données Si1 , . . . , Sin
sont disponibles pour fins de tarification.
Soit Θi une variable aléatoire représentant le niveau de risque du contrat
i. Cette variable aléatoire est
supposée constante dans le temps ;
non observable (facile sinon).
*
*
*
Dans l’exemple 3.1, la variable aléatoire a deux valeurs pos1
1
et θ = 10
.
sibles : θ = 15
*
*
*
On note U (θ ) la fonction de répartition de Θ, aussi appelée la fonction
de structure du portefeuille, et u(θ ) la fonction de densité (ou masse) de
probabilité de Θ.
*
*
*
Dans l’exemple 3.1, on a
$
θ 1
15
θ=
θ=
1
15
1
10 .
0,
U (θ ) = 34 ,
'
%
1,
'
&
#
Pr[Θ = θ ] =
*
3
4,
1
4,
*
On fait les hypothèses suivantes.
17
¤ θ 101
1
θ ¥ 10
1
15
*
1. Les observations du contrat i sont conditionnellement indépendantes
et identiquement distribuées avec fonction de répartition F ( x|θi ).
Conséquence : phénomène de contagion apparente. [Explication]
2. Les variables aléatoires Θ1 , . . . , Θ I sont identiquement distribuées avec
fonction de répartition U (θ ).
Conséquence : les contrats sont différents (chacun son niveau de risque),
mais suffisamment similaires (les niveaux de risque proviennent tous
du même processus) pour justifier de les regrouper.
3. Les contrats sont indépendants.
Conséquence : le dossier d’un contrat n’a pas d’influence sur les autres
contrats.
On a un modèle «urne d’urne» à deux étapes :
1. choisir d’abord un niveau de risque selon U (θ ) ;
2. obtenir des montants de sinistres selon F ( x|θi ).
3.4
Prévision
Le but en crédibilité de précision consiste à calculer la «meilleure» prévision du montant total des sinistres (ou toute autre quantité d’intérêt)
de la prochaine année, Si,n+1 pour i = 1, . . . , I.
On utilise l’erreur quadratique moyenne comme mesure de distance.
3.4.1
Prime de risque
Si le niveau de risque du contrat i est connu, alors la meilleure prévision
est l’espérance
µ(θi ) = E[Sit |Θ = θi ] =
»
8
0
x f ( x|θi ) dx.
Cette fonction est appelée la prime de risque. Or,
le niveau de risque et, donc, la prime de risque sont inconnus ;
prévoir Si,n+1 et prévoir µ(θi ) deviennent donc des problèmes équivalents.
18
3.4.2
Prime collective
Comme première approximation de la prime de risque, on peut utiliser
la moyenne pondérée de toutes les primes de risque possibles :
»
m = E[µ(Θ)] =
8
8
µ(θ )u(θ ) dθ.
Cette approximation sera la même pour tous les contrats ; c’est la prime
collective.
Remarque. On a
m = E[µ(Θ)] = E[ E[Sit |Θ]] = E[Sit ],
soit le montant moyen des sinistres dans le portefeuille.
3.4.3
Prime bayesienne
On l’a vu, la prime collective est globalement adéquate, mais pas nécessairement équitable. En termes statistiques, cela signifie qu’il existe une
meilleure approximation des primes de risque lorsque des données sont
disponibles.
La meilleure approximation (ou estimation, ou prévision) de la prime de
risque µ(θi ) est la fonction des observations g (Si1 , . . . , Sin ) minimisant
l’erreur quadratique moyenne
E[(µ(Θ) g(Si1 , . . . , Sin ))2 ],
où g() est une fonction quelconque.
On peut démontrer (voir un livre de statistique mathématique) que la
fonction g (Si1 , . . . , Sin ) est la prime bayesienne
Bi,n+1 g (Si1 , . . . , Sin )
= E[µ(Θ)|Si1 , . . . , Sin ] =
19
»
8
8
µ(θ )u(θ |Si1 , . . . , Sin ) dθ,
où u(θ |x1 , . . . , xn ) est la distribution a posteriori des niveaux de risque.
En d’autres mots, U (θ |x1 , . . . , xn ) est la fonction de structure révisée
après l’observation de l’expérience Si1 = x1 , . . . , Sin = xn .
Or, par la règle de Bayes et étant donné l’indépendance conditionnelle
des observations,
f ( x , . . . , x n |θ i ) u ( θ i )
dθ
u ( θ i | x1 , . . . , x n ) = ³ 8 1
8 f ( x1 , . . . , xn |θ )u(θ )
|
±
= ³8
8
9 u ( θi )
n
t =1 f ( x t θ i ) u ( θ i )
n
t=1 f ( xt θ ) u ( θ ) dθ
n
¹
±
|
f ( x t |θ i ).
t =1
Remarques.
1. La prime bayesienne est la meilleure prévision de Si,n+1 que l’on
puisse calculer.
2. Comme la prime collective, la prime bayesienne est une moyenne
pondérée des primes de risque, mais utilisant la distribution a posteriori de Θ plutôt que la distribution a priori ; comparer
»
m=
8
8
µ(θ )u(θ ) dθ
et
»
Bi,n+1 =
8
8
µ(θ )u(θ |Si1 , . . . , Sin ) dθ.
3. À l’inverse, on peut interpréter la prime collective comme la prime
bayesienne de première année, lorsque aucune expérience n’est disponible.
4. L’ordre des sinistres n’est pas pris en compte dans les calculs puisque
f ( x1 , . . . , x n |θ i ) =
n
¹
t =1
20
f ( x t |θ i ).
Exemple 3.2. Soit
St |Θ Poisson(Θ)
et
$
0,3,
Pr[Θ = θ ] = 0,5,
'
%
0,2,
'
&
θ = 12
θ=1
θ = 2.
a) Calculer les primes de risque.
On a E[St |Θ = θ ] = θ, d’où
µ( 12 ) = 12
µ (1) = 1
µ(2) = 2.
b) Calculer la prime collective.
On a
m = E[µ(Θ)]
= E[Θ]
1
= (0,3) + 1(0,5) + 2(0,2)
2
= 1,05.
On ne peut calculer la prime collective avec la formule m = E[St ]
puisque la distribution marginale est inconnue.
c) Calculer la prime bayesienne pour la troisième année si S1 = 2 et
S2 = 1.
1. Calculer la distribution a posteriori de Θ :
Pr[Θ = θ |S1 = 2, S2 = 1] =
Pr[S1 = 2, S2 = 1|Θ = θ ] Pr[Θ = θ ]
θ Pr[ S1 = 2, S2 = 1|Θ = θ ] Pr[ Θ = θ ]
°
21
Or,
Pr[S1 = 2, S2 = 1|Θ = θ ] = Pr[S1 = 2|Θ = θ ] Pr[S2 = 1|Θ = θ ]
θ 2 eθ θeθ
2!
1!
3
2θ
θ e
=
2
=
et donc
$
0,1245,
Pr[Θ = θ |S1 = 2, S2 = 1] = 0,6109,
'
%
0,2646,
'
&
θ = 12
θ=1
θ = 2.
2. Calculer la prime bayesienne :
B3 = E[µ(Θ)|S1 = 2, S2 = 1]
= E[Θ|S1 = 2, S2 = 1]
1
= (0,1245) + 1(0,6109) + 2(0,2646)
2
= 1,20.
Dans le cas présent, 1,05 = m B3 S̄ = 1,5. Il importe de noter que
ce n’est pas toujours le cas avec la prime bayesienne.
Exemple 3.3. Considérer le portefeuille simplifié de l’exemple 1.1. Un
contrat ne peut avoir au maximum qu’un seul sinistre de montant 1 par
année. (En d’autres termes, l’expérience consiste en une suite de 1 et de
0 selon qu’il y a eu un sinistre dans une année ou non.) La probabilité
d’avoir un sinistre est toutefois inconnue et potentiellement différente
pour chaque contrat.
On a donc
St |Θ = θ Bernoulli(θ ),
où le paramètre θ est une réalisation d’une variable aléatoire Θ. On
suppose une distribution bêta de paramètres α et β pour Θ. Ainsi, on a
f ( x|θ ) = θ x (1 θ )1x ,
22
x = 0, 1
et
u(θ ) =
Γ ( α + β ) α 1
θ ( 1 θ ) β 1 ,
Γ(α)Γ( β)
0 θ 1.
a) Calculer la prime de risque.
On a E[St |Θ = θ ] = θ.
b) Calculer la prime collective.
On a
m = E[µ(Θ)]
= E[Θ]
α
=
.
α+β
c) Calculer la prime bayesienne après n années.
Tout d’abord, la distribution a posteriori de Θ après n années d’expérience est, à une constante de proportionnalité près,
u ( θ | x1 , . . . , x n )9u ( θ i )
n
¹
f ( x t |θ i )
t =1
9θ
α 1
=θ
(1 θ )
°
α+ n
t =1 x t
β 1
n
¹
θ x t ( 1 θ ) 1 x t
1 (1 θ ) β+n°nt=1 xt 1 .
t =1
La distribution de Θ|S1 = x1 , . . . , Sn = xn est donc
toujours une bêta,
°
n
mais
avec
de
nouveaux
paramètres
α̃
=
α
+
t=1 xt et β̃ = β + n °
n
t=1 xt . Par conséquent, la prime bayesienne pour l’année n + 1 est
Bn+1 = E[µ(Θ)|S1 , . . . , Sn ]
= E [ Θ | S1 , . . . , S n ]
α̃
=
α̃ + β̃
°
α + nt=1 St
=
.
α+β+n
23
Exemple 3.4. On reprend le modèle de l’exemple 3.3, soit
St |Θ = θ Bernoulli(θ ),
mais en changeant la distribution de la variable Θ pour une uniforme
sur l’intervalle ( a, b).
°
Soit nS̄ = nt=1 St le montant total des sinistres d’un contrat. Norberg
(1979) démontre que la prime bayesienne avec ce modèle est
°
Bn+1 =
°
nnS̄
j =1 (
1) j (nbnS̄j)!j!a(nS̄+j+2)
.
nnS̄
b
a
j
(
1
)
j =1
(nnS̄ j)! j! (nS̄+ j+1)
nS̄+ j+2
nS̄+ j+2
nS̄+ j+1
nS̄+ j+1
Cette prime bayesienne n’est pas linéaire et, de plus, elle ne se trouve pas
nécessairement entre l’expérience individuelle S̄ et la prime collective m.
3.5
Approche par la distribution prédictive
On a déjà vu à la section 3.4.2 que
m = E[µ(Θ)] = E[Sit ].
De manière similaire, on peut démontrer que
Bi,n+1 = E[µ(Θ)|Si1 , . . . , Sin ] = E[Si,n+1 |Si1 , . . . , Sin ].
La distribution de Sn+1 |S1 , . . . , Sn avec fonction de densité de probabilité
f ( x|x1 , . . . , xn ) est appelée la distribution prédictive de la variable aléatoire
S n +1 .
Théorème 3.1. La fonction de densité de probabilité de la distribution prédictive de Sn+1 est
f ( x | x1 , . . . , x n ) =
»
8
8
f ( x|θ )u(θ |x1 , . . . , xn ) dθ.
24
Démonstration.
f ( x | x1 , . . . , x n ) =
f ( x, x1 , . . . , xn )
f ( x1 , . . . , x n )
³
8 f ( x, x , . . . , x |θ )u(θ ) dθ
n
1
8
8 f ( x , . . . , x |θ )u(θ ) dθ
n
1
8
»
8
f ( x1 , . . . , x n |θ ) u ( θ )
f ( x |θ ) ³ 8
=
dθ
f ( x1 , . . . , xn |θ )u(θ ) dθ
8
8
»
8
=
=
³
8
f ( x|θ )u(θ |x1 , . . . , xn ) dθ.
Remarque. Puisque
»
f (x) =
8
8
f ( x|θ )u(θ ) dθ,
alors la seule différence entre l’expression de f ( x ) et celle de f ( x|x1 , . . . , xn )
réside dans l’utilisation de la distribution a priori de Θ pour la première
et de la distribution a posteriori pour la seconde. Par conséquent,
u(θ |x1 , . . . , xn ) du même
type que u(θ )
f ( x|x1 , . . . , xn ) du même
type que f ( x ).
ñ
Du théorème 3.1, on a
E[µ(Θ)|Si1 = x1 , . . . , Sin = xn ] =
=
»
8
µ(θ )u(θ |x1 , . . . , xn ) dθ
x f ( x|θ ) dx u(θ |x1 , . . . , xn ) dθ
8 »
»
8
8
8 » 0
8 8
»
=
=
x
0
»
=
x f ( x|θ )u(θ |x1 , . . . , xn ) dx dθ
f ( x|θ )u(θ |x1 , . . . , xn ) dθ dx
8 0 »
»
8
8
8
0
8
x f ( x|x1 , . . . , xn ) dx
= E[Si,n+1 |Si1 = x1 , . . . , Sin = xn ].
25
Avec cette approche, la prime collective et la prime bayesienne s’interprètent toutes deux comme le montant moyen des sinistres dans le portefeuille, mais avec des pondérations différentes.
3.6
Crédibilité bayesienne linéaire (ou exacte)
La prime bayesienne de l’exemple 3.3 peut se réécrire sous la forme
°
α + nt=1 St
Bn+1 =
α+β+n
n
α+β
α
=
S̄ +
n+α+β
n+α+βα+β
= zS̄ + (1 z)m,
où
z=
n
,
n+K
K = α + β.
Une prime de la forme
πn+1 = zS̄ + (1 z)m
est appelée prime de crédibilité et 0 ¤ z ¤ 1 est le facteur de crédibilité.
Whitney (1918) et Bailey (1950) furent les premiers à démontrer que la
prime bayesienne est une prime de crédibilité pour certaines combinaisons de distributions.
Exemple 3.5 (Cas Poisson/gamma). Soit
St |Θ = θ Poisson(θ )
Θ Gamma(α, λ),
c’est-à-dire
θ x e θ
, x = 0, 1, . . .
x!
λα α1 λθ
u(θ ) =
θ e
, θ ¡ 0.
Γ(α)
f ( x |θ ) =
26
a) Calculer la prime de risque.
On a
µ(θ ) = E[St |Θ = θ ] = θ.
On calcule également, pour usage futur,
σ2 (θ ) = Var[St |Θ = θ ] = θ.
b) Calculer la prime collective.
On a
α
m = E[µ(Θ)] = E[Θ] = .
λ
c) Calculer la prime bayesienne à partir de la distribution a posteriori
de Θ.
Tout d’abord, on a
u ( θ | x1 , . . . , x n )9u ( θ )
n
¹
f ( x t |θ )
t =1
9θ α1 eλθ
=θ
α+
°n
d’où Θ|S1 , . . . , Sn Gamma(α̃ = α +
quent, la prime bayesienne est
n
¹
t =1
1
t =1 x t
°
θ x t e θ
e ( λ + n ) θ ,
n
t=1 St , λ̃
= λ + n). Par consé-
Bn+1 = E[µ(Θ)|S1 , . . . , Sn ]
= E [ Θ | S1 , . . . , S n ]
α̃
=
λ̃ °
α + nt=1 St
=
λ+n
n
λ α
=
S̄ +
n+λ
n+λλ
= zS̄ + (1 z)m
avec
n
.
n+λ
La prime bayesienne est donc linéaire dans le cas Poisson/gamma.
z=
27
d) Calculer la distribution marginale de St .
On a
»
f (x) =
8
0
f ( x|θ )u(θ ) dθ
8
λα
=
θ x eθ θ α1 eλθ dθ
Γ(α) x! 0
»
8
λα
=
θ α+ x1 e(λ+1)θ dθ
Γ ( α ) Γ ( x + 1) 0
λα
Γ(α + x )
=
Γ ( α ) Γ ( x + 1) ( λ + 1) α + x
α x
λ
1
Γ(α + x )
=
Γ ( α ) Γ ( x + 1) λ + 1
λ+1
α+x1 α
=
p (1 p) x , x = 0, 1, . . . ,
α1
»
d’où St Binomiale négative(r = α, p =
λ
λ +1 ).
Par conséquent,
α
r (1 p )
= .
p
λ
m = E [ St ] =
Astuce : on peut obtenir le même résultat par les fonctions génératrices des moments :
MS (t) = E[etS ]
= E[ E[etS |Θ]]
= E[ MS|Θ (t)]
= E [ e Θ ( e 1 ) ]
t
= MΘ ( e t 1 )
α
λ
=
λ + 1 et
!α
λ
=
λ +1
1 t
λ +1 e
1
,
ce qui est la fonction génératrice des moments d’une binomiale néλ
gative de paramètres α et λ+
1.
28
e) Calculer la prime bayesienne à partir de la distribution prédictive.
Puisque
Θ Gamma(α, λ)
et
Θ|S1 = x1 , . . . , Sn = xn Gamma(α̃, λ̃),
alors
Sn+1 |S1 = x1 , . . . , Sn = xn Binomiale négative(r̃, p̃)
avec
ņ
r̃ = α̃ = α +
xt
t =1
p̃ =
λ̃
λ+n
.
=
λ̃ + 1 λ + n + 1
Par conséquent,
Bn+1 = E[Sn+1 |S1 , . . . , Sn ]
α̃
=
λ̃ °
α + nt=1 St
=
.
λ+n
f) Calculer Var[S].
On peut procéder de deux façons.
1. En conditionnant sur Θ :
Var[S] = E[Var[S|Θ]] + Var[ E[S|Θ]]
= E[σ2 (Θ)] + Var[µ(Θ)]
= E[Θ] + Var[Θ]
α
α
= + 2
λ λ
α ( λ + 1)
=
.
λ2
29
2. Directement depuis la marginale :
r (1 p )
p2
α ( λ + 1)
=
.
λ2
Var[S] =
g) Calculer la prime bayesienne pour les dix prochaines années si a
priori Θ Gamma(3, 3) et que les montants de sinistres au cours
de ces années sont les suivants : 5, 3, 0, 1, 1, 2, 0, 2, 0, 2.
La prime bayesienne dans le cas Poisson/gamma est
°
α + nt=1 xt
.
Bn+1 =
λ+n
On a donc le tableau suivant :
n
xn
0
1
2
3
4
5
6
7
8
9
10
–
5
3
0
1
1
2
0
2
0
2
°
xt
α+
–
5
8
8
9
10
12
12
14
14
16
°
xt
3
8
11
11
12
13
15
15
17
17
19
λ+n
Bn+1
3
1
4
2
5
2,2
6 1,83
7 1,71
8 1,625
9 1,667
10
1,5
11 1,54
12 1,42
13 1,46
Conclusions :
La distribution a posteriori de Θ est de plus en plus concentrée au-
tour de sa moyenne au fur et à mesure que l’expérience s’accumule
(voir les figures 3.1–3.4).
La précision de la prime bayesienne s’améliore (la vraie valeur de
θ est 1,48 dans cet exemple).
30
Après 1 année
0.0
0.0
0.1
0.2
0.2
0.4
0.3
0.4
0.6
0.5
0.8
0.6
A priori
0
1
2
3
4
0
1
2
3
4
Figure 3.2: Distribution gamma
avec α = 8 et λ = 4. L’espérance
est égale à 2.
Après 5 années
Après 10 années
0.0
0.0
0.2
0.2
0.4
0.4
0.6
0.6
0.8
1.0
0.8
1.2
Figure 3.1: Distribution gamma
avec α = 3 et λ = 3. L’espérance
est égale à 1.
0
1
2
3
4
0
Figure 3.3: Distribution gamma
avec α = 13 et λ = 8. L’espérance
est égale à 1,625.
1
2
3
4
Figure 3.4: Distribution gamma
avec α = 19 et λ = 13. L’espérance est égale à 1,46.
31
Exemple 3.6 (Cas exponentielle/gamma). Soit
St |Θ = θ Exponentielle(θ )
Θ Gamma(α, λ).
La prime de risque est
µ(θ ) =
1
θ
et la variance conditionnelle est
σ2 ( θ ) =
1
.
θ2
La prime collective est
1
m=E
Θ
»
8
α
λ
=
θ α11 eλθ dθ
Γ(α) 0
λ α Γ ( α 1)
=
Γ ( α ) λ α 1
λ
.
=
α1
La distribution a posteriori de Θ est
u ( θ | x1 , . . . , x n )9θ
α 1
=θ
n
¹
eλθ
θeθxt
α+n1
°n
e ( λ + t =1 x t ) θ ,
t =1
d’où Θ|S1 , . . . , Sn Gamma(α̃ = α + n, λ̃ = λ +
32
°
n
t =1 S t ).
Quant aux distributions marginale et prédictive, on a
λα 8 θ α1 λθ
θe θ e
dθ
Γ(α) 0
»
λα 8 α+11 (λ+ x)θ
θ
e
dθ
Γ(α) 0
λ α Γ ( α + 1)
Γ ( α ) ( λ + x ) α +1
αλα
, x ¡ 0,
( λ + x ) α +1
»
f (x) =
=
=
=
d’où St Pareto(α, λ) et
Sn+1 |S1 = x1 , . . . , Sn = xn Pareto(α̃ = α + n, λ̃ = λ +
La prime bayesienne est donc
Bn+1 = E[Θ1 |S1 , . . . , Sn ]
= E [ S n + 1 | S1 , . . . , S n ]
λ̃
α̃ 1°
λ + nt=1 St
=
α+n1
n
α1
λ
=
S̄ +
n+α1
n+α1α1
= zS̄ + (1 z)m
=
avec
z=
n
.
n+α1
La prime bayesienne est donc linéaire.
Exemple 3.7 (Cas normale/normale). Soit
St |Θ Normale(Θ, σ22 )
Θ Normale(µ, σ12 ).
33
°
n
t =1 x t ).
Alors,
µ(Θ) = Θ
σ2 (Θ) = σ22
(constante)
et
m = E[Θ] = µ.
Trouver la distribution a posteriori n’est toutefois pas une sinécure. Tout
d’abord,
u ( θ | x 1 , . . . , x n )9 e ( θ µ )
2 /2σ2
1
e
°n
t =1 ( x t
θ )2 /2σ22 .
En développant l’exposant tout en laissant de côté tous les termes non
fonction de θ, on obtient
"
#
ņ
1 θ 2 2θµ
2θxt + θ 2
Exposant = + cte
+
2
2
σ12
σ
2
t =1
!
#
"
°
1 2 1
2θµ 2θ nt=1 xt
n
= θ
σ2 + cte
+
2
σ12 σ22
σ22
1

!
°
n
2
2
2θµ/σ1
2θ t=1 xt /σ2 + cte
1 1
n
=
+ 2 θ 2 1
2
n
2 σ1
σ2
( σ2 + σ2 )
( σ12 + σn2 )
loooooomoooooon
1
2
°
n
2
t=1 xt /σ2
2
1
φ
"
µ/σ12 +
1
= φ θ 2 2θ
2
φ
°
n
2
µ
t =1 x t
θ
+
2
2
1
φσ1
φσ2
=
+ cte.
2
1/φ
!
#
+ cte
Par conséquent,
Θ|S1 = x1 , . . . , Sn = xn Normale(µ̃, σ̃12 )
34
avec
σ̃12 =
1
φ
σ12 σ22
= 2
σ2 + nσ12
σ12
=
1 + nσ12 /σ22
σ12
et
°
n
t =1 x t
φσ22
°
µσ22 + σ12 nt=1 xt
.
σ22 + nσ12
µ
µ̃ =
+
φσ12
=
La distribution marginale de S est plus aisée à trouver à l’aide des fonctions génératrice des moments. En effet,
MS (t) = E[ E[etS |Θ]]
= E[eΘt+σ2 t /2 ]
h i
2 2
= eσ2 t /2 E eΘt
2 2
2 2 /2
= eσ2 t
2 2 /2
eµt+σ1 t
2
2
= eµt+(σ1 +σ2 )t
et donc
2 /2
S Normale(µ, σ12 + σ22 ).
Puisque la distribution a posteriori de Θ est du même type que la distribution a priori, on peut immédiatement conclure que
Sn+1 |S1 , . . . , Sn Normale(µ̃, σ̃12 + σ̃22 ).
35
La prime bayesienne est donc, en utilisant indifféremment l’approche de
la distribution a posteriori ou de la prédictive,
Bn+1 = µ̃
=
nσ12
σ22
S̄
+
µ
nσ12 + σ22
nσ12 + σ22
= zS̄ + (1 z)m
où
z=
n
.
n + σ22 /σ12
Il y a en fait cinq combinaisons de distributions qui résultent en une
prime bayesienne linéaire (plus leurs convolutions) :
1. Poisson/gamma
2. Exponentielle/gamma
3. Normale/normale
4. Bernoulli/bêta
5. Géométrique/bêta.
Les formules de crédibilité exacte pour les combinaisons de distributions issues de la famille exponentielle sont rassemblées dans l’annexe
A du recueil d’exercices. Les commentaires suivants se rapportent à ces
résultats.
1. Dans le cas normale/normale, on a
σ̃12
=
σ12
σ2
n 12
σ2
¤ σ12 ,
+1
avec égalité seulement lorsque σ12 = 0 (le cas σ22 = 8 ne présentant
aucun intérêt). Cette inégalité s’interprète comme une baisse de l’incertitude quant au niveau de risque d’un contrat au fur et à mesure
que l’expérience s’accumule.
36
2. Le cas normale/normale est celui considéré par Whitney (1918), mais
aussi celui dont les formules sont les plus complexes. Cela explique
sans doute en partie qu’il ait éventuellement recommandé de fixer K
au jugement.
3. Dans tous les cas, z Ñ 1 lorsque n Ñ 8. Le poids accordé à la prime
individuelle d’un contrat va donc croissant avec le nombre d’années
d’expérience disponible.
4. De plus, z = n/(n + K ) Ñ 1 lorsque K Ñ 0 et z Ñ 0 lorsque K Ñ 8.
Dans le cas Poisson/gamma, où K = λ, une petite valeur de λ correspond à une grande incertitude quant au niveau de risque θ (la courbe
gamma sera très évasée, voir la figure 3.5). On accorde donc peu de
poids à la prime collective, d’où un grand facteur de crédibilité.
5. Dans le cas normale/normale, K est grand si σ22 est également grand
ou alors si σ12 est petit. Respectivement, cela signifie que ou bien l’expérience est potentiellement si volatile que l’on ne peut s’y fier, ou
bien que le niveau de risque θ est presque connu avec certitude. Dans
un cas comme dans l’autre, il convient de charger la prime collective.
On peut répéter une telle analyse pour chacun des autres cas.
6. À un haut niveau de risque ne correspond pas nécessairement une
grande valeur de θ, comme en fait foi le cas exponentielle/gamma.
3.7
Le modèle de Jewell
Le modèle de crédibilité exacte de Jewell unifie les résultats des cinq cas
spéciaux étudiés précédemment.
|
En analyse bayesienne, si u(θ x1 , . . . , xn ) appartient à la même famille
que u(θ ), on dit de u(θ ) et f ( x|θ ) qu’elles sont des conjuguées naturelles.
Les lois de Poisson, exponentielle, normale, Bernouilli et géométrique
appartiennent toutes à la famille exponentielle univariée, c’est-à-dire que
leur fonction de densité (ou de probabilité) peut s’écrire sous la forme
f ( x |θ ) =
37
p( x )eθx
.
q(θ )
0.8
0.0
0.2
0.4
0.6
Gamma(3, 3)
Gamma(3, 1/2)
0
2
4
6
8
10
Figure 3.5: Distributions gamma avec différents paramètres d’échelle λ.
Jewell (1974) démontre que lorsqu’une fonction de vraisemblance est
combinée avec sa conjuguée naturelle, alors la prime bayesienne est
toujours une prime de crédibilité exacte.
Goel (1982) conjecture que ceci n’arrive qu’avec les membres de la
famille exponentielle :
– il ne peut le prouver ;
– il ne peut non plus donner de contre-exemple.
38
4
Le modèle de crédibilité de
Bühlmann
On a deux problèmes pratiques en crédibilité bayesienne :
1. la prime bayesienne est une prime de crédibilité dans certains cas
seulement ;
2. la prime repose sur des hypothèses très subjectives pour les distributions de Θi et Sit |Θi .
Pour pallier au premier problème, Bühlmann (1967) restreint l’approximation de la prime de risque aux fonctions linéaires des observations,
c’est-à-dire de la forme
ņ
c0 +
ct Sit .
t =1
On verra que la meilleure approximation est une prime de crédibilité.
Quant au second problème, il sera contourné en utilisant une approche
non paramétrique pour calculer la prime de crédibilité, tel que proposé
par Bühlmann (1969).
4.1
Notation et relations de covariance
On définit la notation suivante :
s2 = E[Var[Sit |Θi ]]
= E[σ2 (Θi )]
= EVPV de la CAS
39
a = Var[ E[Sit |Θi ]]
= Var[µ(Θi )]
= VHM de la CAS.
Théorème 4.1. Soit X, Y et Θ des variables aléatoires dont la densité conjointe
existe. Alors
Cov( X, Y ) = Cov( E[ X |Θ], E[Y |Θ]) + E[Cov( X, Y |Θ)].
Démonstration. En premier lieu, noter qu’une espérance conditionnelle
est une variable aléatoire. Nous utiliserons également ces deux propriétés : pour toute variable aléatoire Y,
E[Y ] = E[ E[Y |Θ]]
et
E[Y E[Y ]] = 0.
Or,
Cov( X, Y ) = E[( X E[ X ])(Y E[Y ])]
= E[( X E[ X |Θ] + E[ X |Θ] E[ X ])
(Y E[Y|Θ] + E[Y|Θ] E[Y ])]
= E[ E[( X E[ X |Θ])(Y E[Y|Θ])|Θ]]
+ E[ E[( X E[ X |Θ])( E[Y|Θ] E[Y ])|Θ]]
+ E[ E[( E[ X |Θ] E[ X ])(Y E[Y|Θ])|Θ]]
+ E[( E[ X |Θ] E[ X ])( E[Y|Θ] E[Y ])]
= E[ E[( X E[ X |Θ])(Y E[Y|Θ])|Θ]]
+ E[( E[Y|Θ] E[Y ]) E[ X E[ X |Θ]|Θ]]
+ E[( E[ X |Θ] E[ X ]) E[Y E[Y|Θ]|Θ]]
+ E[( E[ X |Θ] E[ X ])( E[Y|Θ] E[Y ])]
= E[Cov( X, Y|Θ)] + 0 + 0 + Cov( E[ X |Θ], E[Y|Θ]).
40
Corollaire 4.1. En posant X Y dans le théorème 4.1, on obtient
Var[ X ] = E[Var[ X |Θ]] + Var[ E[ X |Θ]].
Théorème 4.2. Soit S1 , . . . , Sn des variables aléatoires conditionnellement indépendantes sachant la variable aléatoire Θ et
E [ St |Θ ] = µ ( Θ ) ,
Var[St |Θ] = σ (Θ),
t = 1, . . . , n
2
t = 1, . . . , n.
Alors
#
Cov(St , Su ) =
a,
a + s2 ,
= a + δtu s2 ,
Cov(µ(Θ), St ) = a,
tu
t=u
t, u = 1, . . . , n
où δtu est le delta de Kronecker :
#
δtu =
1,
0,
t=u
t u.
Démonstration. Pour le premier résultat, on a
Cov(St , Su ) = Cov( E[St |Θ], E[Su |Θ]) + E[Cov(St , Su |Θ)]
= Cov(µ(Θ), µ(Θ)) + E[δtu Var[St |Θ]]
= Var[µ(Θ)] + δtu E[σ2 (Θ)]
= a + δtu s2 .
De plus,
Cov(µ(Θ), St ) = Cov(µ(Θ), E[St |Θ]) + E[Cov(µ(Θ), St |Θ)]
= Var[µ(Θ)] + E[0]
= a.
41
4.2
Modèle et prévision
Le modèle pour portefeuille hétérogène est similaire à celui utilisé en
crédibilité bayesienne, mais on relâche légèrement les hypothèses.
Schématiquement, on a
Variables non
observables
1
Θ1
..
.
S11
..
.
...
S1t
...
S1n
..
.
Si1
..
.
...
Sit
...
Sin
..
.
S I1
...
S It
...
S In
Θi
..
.
ΘI
Observations
... t ...
n
Chaque contrat est donc caractérisé par
1. un niveau de risque θi réalisation d’une variable aléatoire Θi ;
2. des observations (Si1 , . . . , Sin ) Si .
Les hypothèses du modèle de Bühlmann sont les suivantes (version la
moins restrictive).
(B1) Les contrats (Θi , Si ), i = 1, . . . , I sont indépendants, les variables
aléatoires Θ1 , . . . , Θ I sont identiquement distribuées et les variables
aléatoires Sit ont une variance finie.
(B2) Les variables aléatoires Sit , sont telles que
E[Sit |Θi ] = µ(Θi )
i = 1, . . . , I
Cov(Sit , Siu |Θi ) = δtu σ (Θi ),
2
t, u = 1, . . . , n.
Remarques.
1. L’hypothèse d’indépendance entre les contrats peut ne pas être réaliste, mais a) elle simplifie les calculs ; et b) c’est une bonne approximation dans plusieurs cas.
2. Hypothèse (B1) : indépendance inter contrats (between).
42
3. Hypothèse (B2) : homogénéité temporelle et «indépendance» intra
contrats (within), c’est-à-dire :
µ(Θi ) constante dans le temps ;
observations conditionnellement non corrélées.
Théorème 4.3. Pour un portefeuille tel qu’illustré précédemment et sous les
hypothèses (B1) et (B2), la meilleure approximation linéaire non homogène de
la prime de risque µ(Θi ) est
B
πi,n
+1 = z S̄i + (1 z ) m
où
1
S̄i =
n
z=
ņ
Sit
t =1
n
,
n+K
K=
s2
.
a
Démonstration. On se restreint aux approximations de la prime de risque
°
°
de la forme c0i + jI=1 nt=1 cijt S jt . Il faut donc trouver les constantes
i , . . . , ci minimisant
c0i , c11
kn
E
µ ( Θi ) c0i
I̧
ņ
cijt S jt
2 .
j =1 t =1
Par indépendance entre les contrats, on sait déjà que la prime de crédibilité du contrat i sera une fonction de ses observations seulement.
On peut donc réduire le problème à trouver les constantes c0 , c1 , . . . , cn
minimisant
ņ
2 E µ ( Θ i ) c0 ct Sit
.
t =1
43
En calculant les dérivées partielles, d’abord par rapport à c0 , puis par
rapport à cu , u = 1, . . . , n, on obtient
c0 = E[µ(Θi )] ņ
ct E[Sit ]
(4.1)
t =1
ņ
Cov(µ(Θi ), Siu ) =
ct Cov(Sit , Siu ).
t =1
Or, l’équation (4.2) peut se réécrire
ņ
ct ( a + δtu s2 )
a=
t =1
ņ
c t + c u s2 .
=a
t =1
Par symétrie, on peut conclure que
c1 = c2 = = cn = c =
a
.
an + s2
De l’équation (4.1), on obtient
c0 = (1 nc)m
et donc
ņ
B
πi,n
+1 = c 0 +
ct Sit
t =1
ņ
an
Sit
an
=
+ 1
m
an + s2 t=1 n
an + s2
= zS̄i + (1 z)m
avec z = n/(n + s2 /a).
Remarques.
44
(4.2)
1. Remplacer µ(Θi ) dans le théorème par Si,n+1 ne change rien puisque
E[µ(Θi )] = E[Si,n+1 ] = m
et
Cov(µ(Θi ), Sit ) = Cov(Si,n+1 , Sit ) = a
pour t = 1, . . . , n.
2. La prime de crédibilité a deux belles propriétés :
a) elle est sans biais, c’est-à-dire que
B
E[πi,n
+1 ] = zE [ S̄i ] + (1 z ) m = m.
En moyenne, l’assureur perçoit donc suffisamment de primes pour
payer les sinistres ;
b) puisque S̄i
nÑ8
Ñ8 1 alors π B nÝÑ
Ñ8 µ(Θ ).
ÝÑ µ(Θi ) et z nÝÑ
i
i,n+1
B
3. Puisque πi,n
+1 est sans biais, une mauvaise estimation du facteur de
crédibilité n’a pas d’impact négatif sur le montant des primes perçu
par l’assureur.
4. À cause de l’indépendance des contrats, les données collatérales, les
données des autres contrats, n’entrent pour le moment pas dans l’estimation de µ(Θi ) (cijt = 0 pour j i).
5. Une approximation linéaire homogène de µ(Θi ) est de la forme
I̧
ņ
cijt S jt .
j =1 t =1
Il est facile de démontrer que l’approximation est alors
z X̄i + (1 z)S̄,
1
S̄ =
I
I̧
S̄i .
i =1
6. La prime de crédibilité peut aussi s’écrire sous la forme
B
πi,n
+1 = m + z ( S̄i m ).
45
Il est intéressant de constater que la meilleure approximation linéaire de
la prime de risque est également la meilleure approximation linéaire de
la prime bayesienne.
B
Théorème 4.4. Si πi,n
+1 est la combinaison linéaire des observations minimisant
ņ
2 E µ ( Θ i ) c0 ct Sit
,
t =1
B
alors πi,n
+1 minimise également
E
ņ
Bi,n+1 c0 ct Sit
2 ,
t =1
où Bi,n+1 = E[µ(Θi )|Si ].
Démonstration. On a
ņ
2 ct Sit
E µ ( Θ i ) c0 t =1
=E
µ(Θi ) Bi,n+1
2 h
+ 2E E µ(Θi ) Bi,n+1 Bi,n+1 c0 ņ
i ct Sit Si
t =1
+E
ņ
Bi,n+1 c0 ct Sit
2 t =1
=E
Bi,n+1 c0 ņ
ct Sit
2 + 0 + constante.
t =1
Corollaire 4.2. On a
B
2
2
E[(µ(Θi ) πi,n
+1 ) ] ¥ E [(µ ( Θi ) Bi,n+1 ) ] ,
l’égalité survenant lorsque la prime bayesienne est une prime de crédibilité.
46
Ce résultat s’interprète comme une minimisation en deux étapes :
1. trouver la meilleure approximation de la prime de risque (prime
bayesienne) ;
2. trouver la meilleure approximation linéaire de la prime bayesienne
(prime de crédibilité).
4.3
Approche paramétrique
Dans un premier temps, on peut considérer que les distributions de
Sit |Θi et de Θi sont connues, comme en crédibilité bayesienne.
La notion de portefeuille n’est alors pas nécessaire puisque l’on détermine les distributions pour chaque contrat. On peut laisser tomber l’indice i dans les formules.
Il est maintenant très simple de calculer la prime de crédibilité de Bühlmann pour n’importe quelle combinaison de distributions.
Exemple 4.1 (Bernoulli/uniforme). On a vu à l’exemple 3.4 que si
St |Θ = θ Bernoulli(θ )
Θ U ( a, b),
alors la prime bayesienne est très compliquée. Ici, µ(θ ) = θ et σ2 (θ ) =
θ (1 θ ), d’où
m = E[µ(Θ)]
= E[Θ]
a+b
=
2
2
s = E[σ2 (Θ)]
= E [ Θ ] E [ Θ2 ]
=
a + b a2 + ab + b2
+
2
3
47
a = Var[µ(Θ)]
= Var[Θ]
=
( b a )2
,
12
donc
s2
a
6( a + b) 4( a2 + ab + s2 )
=
( b a )2
K=
et
πnB+1
n
n
a+b
=
S̄ + 1 .
n+K
n+K
2
Exemple 4.2 (Poisson/gamma). On a
St |Θ = θ Poisson(θ )
Θ Gamma(α, λ).
On sait déjà que µ(θ ) = σ2 (θ ) = θ. Par conséquent,
α
λ
α
s2 = E [ Θ ] =
λ
m = E[Θ] =
a = Var[Θ] =
α
,
λ2
d’où
K=
s2
=λ
a
et
πnB+1 =
n
λ α
S̄ +
.
n+λ
n+λλ
48
Exemple 4.3. Soit
St |Θ = θ Exponentielle(θ )
Θ Gamma(α, λ).
Alors,
1
,
Θ
1
σ2 ( Θ ) = 2
Θ
µ(Θ) =
et donc
1
s =E 2
Θ
2
1
1
a=E 2 E
.
Θ
Θ
2
Or, pour k P Z,
»
λα 8 α+k1 λθ
E[Θ ] =
θ
e
dθ
Γ(α) 0
k
λα Γ (α + k ) 8 λα+k
=
θ α+k1 eλθ dθ
α
+
k
Γ(α) λ
0 Γ(α + k)
Γ(α + k)
=
Γ(α)λk
$
' α ( α + 1) ( α + k 1)
'
,
k¥1
'
'
λk
&
k=0
= 1,
'
|
k
|
'
λ
'
'
%
, k ¤ 1, |k| α.
(α 1)(α 2) (α |k|)
»
On a donc
E [ Θ 1 ] =
E [ Θ 2 ] =
λ
α1
λ2
(α 1)(α 2)
49
et ainsi
λ2
(α 1)(α 2)
λ2
λ2
a=
(α 1)(α 2) (α 1)2
λ2
.
=
( α 1)2 ( α 2)
s2 =
Finalement,
K=
s2
=α1
a
et le facteur de crédibilité dans la prime de Bühlmann est donc
z=
n
,
n+α1
tel qu’obtenu à l’exemple 3.6.
4.4
Approche non paramétrique
En pratique, l’approche paramétrique est d’un intérêt limité puisqu’elle
nécessite toujours de déterminer les distributions de Sit |Θi et Θi .
Avec l’approche non paramétrique, nous délaissons l’approche bayesienne pure pour l’approche bayesienne empirique.
Nous avons plusieurs réalisations de la variable aléatoire Θ.
U (θ ) est la fonction de structure du portefeuille :
– avant : opinion a priori de l’assureur sur le niveau de risque d’un
contrat ;
– maintenant : proportion de contrats avec un niveau de risque inférieur ou égal à θ, distribution des niveaux de risque entre les
contrats.
50
Homogénéité du portefeuille : à quel point les moyennes des contrats
sont semblables.
Nous devons estimer les paramètres de structure du portefeuille :
1. m = E[µ(Θ)], moyenne du portefeuille ;
2. s2 = E[σ2 (Θ)], variabilité moyenne du portefeuille, homogénéité
temporelle ;
3. a = Var[µ(Θ)], variance entre les moyennes des contrats, homogénéité du portefeuille.
Nous développons des estimateurs sans biais des paramètres.
4.4.1
Estimation de m
Intuitivement,
1
m̂ = S̄ =
In
I̧
ņ
Sit .
i =1 t =1
L’estimateur est effectivement sans biais :
E[m̂] =
=
1
In
1
In
I̧
ņ
E[Sit ]
i =1 t =1
I̧ ņ
m
i =1 t =1
= m.
4.4.2
Estimation de s2
Un estimateur sans biais de la variance du contrat i = 1, . . . , n est
1
n1
ņ
(Sit S̄i )2 ,
t =1
51
n ¥ 2.
Pour obtenir un estimateur sans biais de s2 , on prend la moyenne de
tous ces estimateurs :
ŝ2 =
I̧
1
I ( n 1)
ņ
(Sit S̄i )2 .
i =1 t =1
Pour démontrer l’absence de biais, on note d’abord que
E[(Sit S̄i )2 |Θi ] = Var[Sit S̄i |Θi ]
= Var[Sit |Θi ] + Var[S̄i |Θi ] 2Cov(Sit , S̄i |Θi )
σ2 ( Θi )
n
= σ2 ( Θi ) +
=
n1 2
σ ( Θ i ).
n
2 σ (nΘi )
2
Par conséquent,
E[(Sit S̄i )2 ] = E[ E[(Sit S̄i )2 |Θi ]]
n1
=
E[σ2 (Θi )]
n
n1 2
=
s
n
et
E[ŝ2 ] =
I̧
1
I ( n 1)
ņ
i =1 t =1
n1 2
s
n
2
=s .
4.4.3
Estimation de a
Un estimateur intuitif de a = Var[µ(Θ)] est
1
I1
I̧
(S̄i S̄)2 .
i =1
52
Or, cet estimateur est biaisé. En effet, on a
E[(S̄i S̄)2 ] = Var[S̄i S̄]
= Var[S̄i ] + Var[S̄] 2Cov(S̄i , S̄).
Par indépendance entre les contrats, on a
1
Cov(S̄i , S̄) =
I
=
I̧
Cov(S̄i , S̄ j )
j =1
1
Var[S̄i ]
I
et
Var[S̄] =
d’où
Var[S̄i ]
,
I
E[(S̄i S̄)2 ] =
et
"
E
I̧
1
I1
I1
Var[S̄i ].
I
#
(S̄i S̄)2 = Var[S̄i ].
i =1
Or,
Var[S̄i ] = Var[ E[S̄i |Θi ]] + E[Var[S̄i |Θi ]]
2
σ ( Θi )
= Var[µ(Θi )] + E
n
2
s
=a+ .
n
Un estimateur sans biais de a est donc
â =
1
I1
I̧
(S̄i S̄)2 i =1
1 2
ŝ .
n
Problème : l’estimateur â peut être négatif. En pratique, on posera
â1 = max( â, 0),
qui est un estimateur biaisé.
53
4.4.4
Prime de crédibilité
On estime la prime de crédibilité en remplaçant chaque paramètre inconnu par son estimateur :
B
π̂i,n
+1 = ẑ S̄i + (1 ẑ ) m̂
n
.
ẑ =
n + ŝ2 / â
Bien que tous les estimateurs soient sans biais, on ne peut conclure que
E[K̂ ] = K et donc que E[ẑ] = z. Par conséquent, l’estimateur de la prime
de crédibilité est fort probablement biaisé.
Exemple 4.4. Soit le portefeuille de I = 3 contrats suivant après n = 6
années d’expérience.
Années
Contrat
1
2
3
4
5
6
1
2
3
0
3
3
1
4
3
2
2
2
1
1
1
2
4
2
0
4
1
Calculer la prime de crédibilité pour la septième année pour chacun des
contrats.
Tout d’abord, on a
S̄1 = 1
S̄2 = 3
S̄3 = 2
et S̄ = 2. On doit par la suite calculer les estimateurs des paramètres de
54
structure :
m̂ = S̄ = 2
1
ŝ =
I
I̧
ņ
1
2
i =1
n1
(Sit S̄i )2
t =1
1 4 8 4
16
=
+ +
=
3 5 5 5
15
â =
I̧
1
I1
(S̄i S̄)2 i =1
1 2
ŝ
n
2 1 16 37
= = .
2 6 15 45
Par conséquent, K̂ = 48/37 1,30 et
ẑ =
6
= 0,82,
6 + 1,30
d’où
B
π̂1,7
= 0,82(1) + 0,18(2) = 1,18
B
π̂2,7
= 2,82
B
π̂3,7
= 2.
On peut obtenir les mêmes résultats avec la fonction cm de actuar (Dutang et collab., 2008).
# ##
# ##
# ##
# ##
# ##
# ##
# ##
# ##
# ##
# ##
# ##
# ##
ACT 2008
Mathématiques actuarielles IARD II
Vincent Goulet
École d ’ actuariat , Université Laval
FICHIER
exemple _ 4.4. R
CONTENU
55
# ## Calculs de l ’ exemple 4.4 avec la fonction cm () de actuar
## Charger le package actuar en mémoire
library ( actuar )
##
##
##
(x
Les données doivent se trouver dans un data frame ou une matrice ,
avec une colonne pour identifier le " numéro " du contrat . Les
colonnes doivent être étiquetées .
<- data . frame ( contract = 1:3 ,
matrix (c(0 , 3, 3,
1, 4, 3,
2, 2, 2,
1, 1, 1,
2, 4, 2,
0, 4, 1) , nrow = 3)))
## Ajustement du modèle de Bühlmann aux données . Par défaut , la
## fonction considérera que toutes les colonnes ( autres que celles
## présentes dans la formule ) contiennent des données .
( fit <- cm (~ contract , x ))
# appel simple
( fit <- cm (~ contract , x , ratios = X1 : X6 )) # équivalent ici
## Calcul des primes de crédibilité .
predict ( fit )
## Résultats détaillés .
summary ( fit )
4.5
Interprétation des résultats
On s’attarde principalement au facteur de crédibilité
z=
n
,
n+K
K=
s2
E[σ2 (Θ)]
=
.
a
Var[µ(Θ)]
56
Le facteur de crédibilité augmente — un plus grand poids est donné à
l’expérience individuelle — dans les situations suivantes :
1. le nombre d’années d’expérience est grand, n Ñ 8. À long terme,
l’expérience d’un contrat représente exactement son niveau de risque.
C’est la même situation qu’en crédibilité de stabilité, c’est-à-dire que
le niveau de crédibilité augmente avec le volume d’expérience ;
2. le paramètre s2 est petit, s2 Ñ 0, l’expérience est globalement stable
dans le temps. Les moyennes S̄i représentent alors bien les niveaux
de risque des contrats, ce qui réduit l’utilité de la prime collective.
3. le paramètre a est grand, a Ñ 8, le portefeuille est hétérogène. Dans
un tel cas, les moyennes individuelles sont de meilleures approximations des primes de risque que la prime collective. On notera au
passage que a est en général le paramètre le plus intéressant et celui
qui fluctue le plus d’un portefeuille à un autre.
Les figure 4.1 et 4.2 illustrent les points 2 et 3 ci-dessus. Chaque courbe
représente l’expérience d’un contrat. Dans les deux cas, le facteur de
crédibilité est plus grand dans le graphique de droite.
Remarques.
1. Si s2 et a varient en des directions opposées, il devient difficile d’interpréter les résultats.
B
2. Si S̄1 = = S̄ I = S̄, alors a = 0 et la prime de crédibilité est πi,n
+1 =
S̄ = S̄i pour chaque contrat. Pourquoi alors ne pas charger tout simplement S̄i ? Parce que dans une telle situation, il n’est pas nécessaire
de faire de la tarification basée sur l’expérience.
57
0
5
10
15
20
0
5
10
15
20
Figure 4.1: Effet de s2 = E[σ2 (Θ)] sur le facteur de crédibilité. Gauche :
grand s2 , l’expérience est trop volatile pour être fiable. Droite : petit s2 ,
les moyennes individuelles sont fiables. Les moyennes sont identiques
dans les deux graphiques.
0
5
10
15
20
0
5
10
15
20
Figure 4.2: Effet de a = Var[µ(Θ)] sur le facteur de crédibilité. Gauche :
petit a, le portefeuille est homogène. Droite : grand a, le portefeuille est
hétérogène. Les variances sont identiques dans les deux graphiques.
58
5
Le modèle de Bühlmann–Straub
Le modèle de Bühlmann–Straub est une généralisation du modèle de
Bühlmann tenant compte de l’exposition au risque des contrats. Ceci est
particulièrement important dans les situations où la taille des contrats
varie beaucoup.
Par exemple, en accidents de travail, l’exposition au risque d’un employeur avec 1 000 employés au beaucoup plus grande que celle d’un
employeur avec seulement 10 employés.
5.1
Modèle et prévision
Dans la forme la plus générale du modèle de Bühlmann–Straub, on associe un poids wit à chaque donnée, qui sera maintenant notés Xit .
Schématiquement, on a maintenant
Variables non
observables
1
Θ1
..
.
X11
..
.
...
X1t
Xi1
..
.
...
X I1
...
Θi
..
.
ΘI
Observations
...
t
...
Poids
...
t
...
n
1
...
X1n
..
.
w11
..
.
...
w1t
...
w1n
..
.
Xit
...
Xin
..
.
wi1
..
.
...
wit
...
win
..
.
X It
...
X In
w I1
...
w It
...
w In
59
n
Intuitivement, on s’attend à ce que l’expérience d’un «gros» contrat soit
plus stable dans le temps que celle d’un «petit» contrat. Pour que le
modèle réflète cela, l’hypothèse de variances conditionnelles identiques
du modèle de Bühlmann est modifiée.
Les hypothèses du modèle de Bühlmann–Straub sont les suivantes.
(BS1) Les contrats (Θi , X i ), i = 1, . . . , I sont indépendants, les variables
aléatoires Θ1 , . . . , Θ I sont identiquement distribuées et les variables
aléatoires Xit ont une variance finie.
(BS2) Les variables aléatoires Xit , sont telles que
E[ Xit |Θi ] = µ(Θi )
Cov( Xit , Xiu |Θi ) = δtu
σ2 ( Θ
wit
i = 1, . . . , I
i)
,
t, u = 1, . . . , n.
On a donc
Var[ Xit |Θi ] =
σ2 ( Θi )
.
wit
Pour que cette relation soit vraie, les variables aléatoires Xit doivent être
des ratios. La définition la plus usuelle de Xit est
Xit =
Sit
wit
où, par exemple
Sit est le montant total des sinistres et wit est la prime totale payée
(loss ratio) ;
Sit est le montant total des sinistres et wit est la masse salariale ;
Sit est le nombre d’accidents dans une flotte de véhicules et wit est le
nombre de véhicules ;
etc.
60
5.1.1
Notation et relations de covariance
On définit la notation suivante :
ņ
wi Σ =
wit
t =1
I̧
wΣΣ =
I̧
ņ
wi Σ =
i =1 t =1
i =1
I̧
zΣ =
wit
zi
i =1
ņ
Xiw =
t =1
I̧
Xww =
i =1
I̧
Xzw =
i =1
wit
X
wiΣ it
wi Σ
X =
wΣΣ iw
I̧
ņ
i =1 t =1
wit
X
wΣΣ it
zi
X .
zΣ iw
Théorème 5.1. Soit Xit , i = 1, . . . I, t = 1, . . . , n des variables aléatoires satisfaisant les hypothèses (BS1) et (BS2) ci-dessus. Alors,
Cov( Xit , Xku ) = δik
s2
a + δtu
wit
Cov(µ(Θi ), Xku ) = δik a
s2
.
Cov( Xit , Xkw ) = δik a +
wi Σ
Démonstration. Tout d’abord, toutes les covariance sont nulles lorsque
i k par indépendance entre les contrats.
Les deux premiers résultats sont équivalents à ceux du théorème 4.2 à
61
la seule différence que
σ2 ( Θi )
E[Var[ Xit |Θi ]] = E
wit
s2
=
.
wit
Pour le troisième résultat, on a
ņ
wit
Cov( Xit , Xiu )
w
u =1 i Σ
ņ
wit
s2
=
a + δtu
wi Σ
wit
Cov( Xit , Xiw ) =
u =1
wit s2
wiΣ wit
s2
.
=a+
wi Σ
=a+
5.1.2
Meilleure prévision linéaire
Tout comme dans le modèle de Bühlmann, on recherche la meilleure
approximation linéaire de la prime de risque d’un contrat.
Théorème 5.2. Pour un portefeuille tel qu’illustré précédemment et sous les
hypothèses (BS1) et (BS2), la meilleure approximation linéaire non homogène
de la prime de risque µ(Θi ) — ou de Xi,n+1 — est
BS
πi,n
+1 = zi Xiw + (1 zi ) m
où
zi =
wi Σ
,
wi Σ + K
62
K=
s2
.
a
Démonstration. La démonstration est similaire à celle du théorème 4.3.
Comme précédemment, on peut se restreindre à trouver les constantes
c0 , c1 , . . . , cn minimisant
ņ
2 E µ ( Θ i ) c0 ct Xit
.
t =1
En calculant les dérivées partielles, d’abord par rapport à c0 , puis par
rapport à cu , u = 1, . . . , n, on obtient
ņ
c0 = E[µ(Θi )] ct E[ Xit ]
(5.1)
t =1
ņ
Cov(µ(Θi ), Xiu ) =
ct Cov( Xit , Xiu ).
t =1
Or, l’équation (5.2) peut se réécrire
ņ
s2
ct a + δtu
a=
wiu
t =1
= acΣ + cu
s2
.
wiu
Par symétrie, on a que
c1
c
cn
cΣ
= 2 = =
=
= Ri .
wi1
wi2
win
wi Σ
Par conséquent,
a = awiΣ Ri + Ri s2
d’où
Ri =
a
ct
=
2
wit
awiΣ + s
et donc
wit awiΣ
wiΣ awiΣ + s2
w
= it zi .
wi Σ
ct =
63
(5.2)
De l’équation (4.1), on obtient
ņ
c0 = m t =1
wit
zm
wi Σ i
= (1 z i ) m
et donc
ņ
BS
πi,n
+1
= c0 +
ct Xit
t =1
= (1 z i ) m +
ņ
t =1
wit
zX
wiΣ i it
= zi Xiw + (1 zi )m.
5.2
Estimation des paramètres de structure
Les paramètres de structure à estimer à partir des données sont les
mêmes que précédemment, soit m, s2 et a.
5.2.1
Estimation de m
Un estimateur intuitif de m est
I̧
wi Σ
X .
wΣΣ iw
Xww =
i =1
Or, on peut démontrer qu’en théorie de la crédibilité l’estimateur linéaire
à variance minimale est plutôt
I̧
m̂ = Xzw =
i =1
zi
X .
zΣ iw
Remarque. Formellement, Xzw n’est pas un estimateur puisqu’il dépend
des paramètres inconnus s2 et a. On appellera de tels estimateurs des
pseudo-estimateurs (De Vylder, 1981).
64
5.2.2
Estimation de s2
En généralisant simplement l’estimateur obtenu dans le modèle de Bühlmann, on obtient l’estimateur sans biais
ŝ2 =
5.2.3
I̧
1
I ( n 1)
ņ
wit ( Xit Xiw )2 .
i =1 t =1
Estimation de a
Du chapitre 4, on soupçonne que l’estimateur intuitif
I̧
wiΣ ( Xiw Xww )2
i =1
est biaisé. En effet, on démontre sans grande difficulté que
E[( Xiw Xww )2 ] = Var[ Xiw ] + Var[ Xww ] 2 Cov( Xiw , Xww )
!
I̧ 1
1
wi Σ
wi Σ 2
2
+s
,
= a 12
+
wΣΣ
wΣΣ
wiΣ wΣΣ
i =1
d’où
"
I̧
E
#
wiΣ ( Xiw Xww )2 = a
i =1
w2ΣΣ iI=1 wi2Σ
wΣΣ
°
!
+ ( I 1) s2 .
Un estimateur sans biais du paramètre a est donc
â =
wΣΣ
w2
ΣΣ
°
I
2
i =1 wi Σ
I̧
!
wiΣ ( Xiw Xww )2 ( I 1)ŝ2 .
i =1
Cet estimateur peut être négatif. Si l’on utilise plutôt
â1 = max( â, 0),
on a un estimateur biaisé.
65
5.2.4
Autre estimateur de a
L’estimateur de Bichsel–Straub du paramètre a est sans biais et toujours
positif :
ã =
1
I1
I̧
zi ( Xiw Xzw )2 .
i =1
Remarques.
1. Il n’y a rien de gratuit :
ã est un pseudo-estimateur ;
ã est sans biais seulement si les facteurs de crédibilité sont connus.
Sinon, l’espérance est impossible à calculer.
2. On a en fait ã = f ( ã). L’estimation est donc calculée par la méthode
du point fixe.
3. On peut démontrer que si â 0, alors ã converge vers 0.
5.2.5
Sommaire des calculs
1. Calculer wiΣ , i = 1, . . . , I et wΣΣ .
2. Calculer Xiw , i = 1, . . . , I et Xww .
3. Calculer ŝ2 .
4. Calculer â.
5. Si â ¡ 0 :
5.1 calculer ã et poser â = ã ;
5.2 calculer
ẑ =
wi Σ
;
wiΣ + ŝ2 / â
5.3 calculer
I̧
m̂ =
i =1
6. Sinon
6.1 poser â = 0 ;
66
ẑi
X .
ẑΣ iw
6.2 poser ẑi = 0, i = 1, . . . , I ;
6.3 poser m̂ = Xww .
7. Calculer les primes de crédibilité
BS
π̂i,n
+1 = ẑi Xiw + (1 ẑi ) m̂,
5.3
i = 1, . . . , I.
Données manquantes
Dans l’application du modèle de Bühlmann–Straub, il arrive fréquemment que le nombre d’observations ne soit pas le même pour tous les
contrats.
Les données et les poids sont alors disponibles pour i = 1, . . . , I et t =
1, . . . , ni (en supposant les données contiguës). On aura donc, par exemple,
n
i
¸
wi Σ =
wit
t =1
ou
n
i
¸
Xiw =
t =1
wit
X .
wiΣ it
La seule formule affectée par ce changement est celle de ŝ2 :
2
ŝ =
5.4
°
1
I
i =1 ( n i
I̧
ņ
1 ) i =1 t =1
wit ( Xit Xiw )2 .
Exemple numérique
Les résultats de cette section sont tirés de Goovaerts et Hoogstad (1987),
eux-mêmes basés sur les données de Hachemeister (1975). Ces données
67
sont composées de montants de sinistres moyens au chapitre de la responsabilité civile en assurance automobile entre juillet 1970 et juin 1973
dans cinq états américains. On a donc I = 5 contrats et n = 12 périodes
d’expérience. Les montants de sinistres moyens Xit sont présentés au tableau 5.1 (à noter que le tableau est transposé par rapport à la notation
usuelle).
Au tableau 5.2, on trouvera les poids wit associés aux données précédentes. Il s’agit ici du nombre total de sinistres dans chaque période
pour chaque état, soit le dénominateur des ratios Xit . On remarquera
que le nombre de sinistres est beaucoup plus élevé dans l’État 1 et,
quoique dans une moindre mesure, dans l’État 5.
5.4.1
Résultats avec le modèle de Bühlmann
On illustre d’abord le modèle de Bühlmann en ignorant les poids rattachés aux données. Les estimateurs des paramètres de structure sont les
suivants :
m̂ = 1 671
ŝ2 = 46 040
â = 72 310,
ce qui mène aux résultats du tableau 5.3. Le facteur de crédibilité est
plutôt élevé. Une analyse rapide des données suffit pour constater que
l’expérience des états est relativement stable dans le temps. Il en résulte
une valeur de ŝ2 petite par rapport à celle de â et, donc, un grand facteur
de crédibilité.
Pour l’État 1, dont l’expérience est la pire du portefeuille, un grand
facteur de crédibilité a pour effet de ne réduire la prime de crédibilité
(2 044) que de 1% par rapport à la prime individuelle (2 064).
5.4.2
Résultats avec le modèle de Bühlmann–Straub
Le tableau 5.2 montre que le poids relatif de chacun des cinq états (poids
mesuré en nombre de sinistres) est très différent : l’État 1 compte pour
68
t=1
t=2
t=3
t=4
t=5
t=6
t=7
t=8
t=9
t = 10
t = 11
t = 12
i=1
i=2
i=3
i=4
i=5
1738
1642
1794
2051
2079
2234
2032
2035
2115
2262
2267
2517
1364
1408
1597
1444
1342
1675
1470
1448
1464
1831
1612
1471
1759
1685
1479
1763
1674
2103
1502
1622
1828
2155
2233
2059
1223
1146
1010
1257
1426
1532
1953
1123
1343
1243
1762
1306
1456
1499
1609
1741
1482
1572
1606
1735
1607
1573
1613
1690
Table 5.1: Montants de sinistres moyens (ratios Xit ) dans le portefeuille
de Hachemeister
t=1
t=2
t=3
t=4
t=5
t=6
t=7
t=8
t=9
t = 10
t = 11
t = 12
i=1
i=2
i=3
i=4
i=5
7861
9251
8706
8575
7917
8263
9456
8003
7365
7832
7849
9077
1622
1742
1523
1515
1622
1602
1964
1515
1527
1748
1654
1861
1147
1357
1329
1204
998
1077
1277
1218
896
1003
1108
1121
407
396
348
341
315
328
352
331
287
384
321
342
2902
3172
3046
3068
2693
2910
3275
2697
2663
3017
3242
3425
Table 5.2: Nombres totaux de sinistres (poids wit ) dans le portefeuille
de Hachemeister
69
i=1
Prime individuelle X̄i
B
Prime de crédibilité πi,13
Facteur de crédibilité z
i=2
i=3
i=4
i=5
2 064 1 511 1 822 1 360 1 599
2 044 1 519 1 814 1 376 1 602
0,95 0,95 0,95 0,95 0,95
Table 5.3: Résultats avec le modèle de Bühlmann pour le portefeuille de
Hachemeister
i=1
Prime individuelle Xiw
BS
Prime de crédibilité πi,13
Facteur de crédibilité z
i=2
i=3
i=4
i=5
2 061 1 511 1 806 1 353 1 600
2 053 1 529 1 790 1 468 1 605
0,98 0,90 0,86 0,66 0,94
Table 5.4: Résultats avec le modèle de Bühlmann-Straub pour le portefeuille de Hachemeister
57,5% des sinistres du portefeuille, alors qu’à l’opposé l’État 4 ne compte
que pour 2,4%. Dans une telle situation, il convient d’utiliser le modèle
de Bühlmann–Straub dans la tarification afin de tenir compte des volumes très différents d’un contrat à un autre.
Les estimateurs des paramètres de structure sont les suivants :
m̂ = Xzw = 1 689
ŝ2 = 139 120 026
â = 89 639
ã = 64 367.
On notera que l’estimateur Xzw de la moyenne collective ainsi que les
primes de crédibilité du tableau 5.4 ont été calculés avec l’estimateur ã
de la variance entre les moyennes.
C’est pour l’État 4 que les différences entre les résultats des tableaux 5.3
et 5.4 sont les plus marquées. La prime de crédibilité de cet état augmente en effet de 1 376 à 1 468. Ceci est en partie dû à l’augmentation de
l’estimateur de la prime collective, mais surtout à la forte baisse de son
facteur de crédibilité. Le modèle de Bühlmann–Straub permet donc de
70
reconnaître le rôle minime joué par cet état dans les résultats du portefeuille. C’est pourquoi on y accorde peu de poids lors de la répartition
des primes.
5.4.3
Limitations des modèles précédents
L’examen des données de l’État 1 montre que le montant moyen des
sinistres va en augmentant d’une période à l’autre. Or la prime de crédibilité calculée avec le modèle de Bühlmann–Straub se trouve environ
au niveau de la période 8. Il semble donc évident que la prime de crédibilité s’avèrera trop peu élevée.
C’est afin de pouvoir traiter de tels cas que Hachemeister (1975) a proposé son modèle de crédibilité avec régression. L’utilisation d’un tel modèle est particulièrement indiquée dans des situations de forte inflation
ou d’augmentation ou diminution structurelle des coûts.
71
Bibliographie
Bailey, A. L. 1945, «A generalized theory of credibility», Proceedings of
the Casualty Actuarial Society, vol. 32, p. 13–20.
Bailey, A. L. 1950, «Credibility procedures, Laplace’s generalization of
Bayes’ rule and the combination of collateral knowledge with observed data», Proceedings of the Casualty Actuarial Society, vol. 37, p.
7–23.
Bühlmann, H. 1967, «Experience rating and credibility», ASTIN Bulletin,
vol. 4, p. 199–207.
Bühlmann, H. 1969, «Experience rating and credibility», ASTIN Bulletin,
vol. 5, p. 157–165.
De Vylder, F. 1981, «Practical credibility theory with emphasis on parameter estimation», ASTIN Bulletin, vol. 12, p. 115–131.
Dutang, C., V. Goulet et M. Pigeon. 2008, «actuar: An R package for
actuarial science», Journal of Statistical Software, vol. 25, no 7. URL
http://www.jstatsoft.org/v25/i07.
Goel, P. K. 1982, «On implications of credible means being exact
bayesian», Scandinavian Actuarial Journal, p. 41–46.
Goovaerts, M. J. et W. J. Hoogstad. 1987, Credibility Theory, no 4 dans Surveys of actuarial studies, Nationale-Nederlanden N.V., Netherlands.
Hachemeister, C. A. 1975, «Credibility for regression models with application to trend», dans Credibility, theory and applications, Proceedings
73
of the Berkeley actuarial research conference on credibility, Academic
Press, New York, p. 129–163.
Jewell, W. S. 1974, «Credible means are exact bayesian for exponential
families», ASTIN Bulletin, vol. 8, p. 77–90.
Mowbray, A. H. 1914, «How extensive a payroll exposure is necessary
to give a dependable pure premium?», Proceedings of the Casualty Actuarial Society, vol. 1, p. 25–30.
Norberg, R. 1979, «The credibility approach to ratemaking», Scandinavian Actuarial Journal, vol. 1979, p. 181–221.
Whitney, A. W. 1918, «The theory of experience rating», Proceedings of
the Casualty Actuarial Society, vol. 4, p. 275–293.
74
Téléchargement