Méthodes nouvelles et simples de détection des unités atypiques

publicité
Gestion des sinistres graves
Plan
Approche globale (écrêtage sur l’ensemble du portefeuille)


Méthodes de détection : algébriques, graphiques,
probabilistes
Théorie des valeurs extrêmes
Approche locale

Dans les classes de risque (ou cases tarifaires) à
partir de la prime pure
Approches globales (1)
Rappels sur les méthodes
Approches déterministes
 Méthodes algébriques
 Méthodes graphiques
Approches probabilistes
 La loi de probabilité
 Théorie des valeurs extrêmes
 Méthodes Bayesiennes
Approches globales (2)
Méthodes algébriques
Soit X la variable aléatoire du montant des sinistres.
La distance relative d’une unité au centre de la distribution X, Tsay
(1983), Hadi (1994).
Si m (moyenne, médiane,...) désigne un paramètre de tendance
centrale et s (variance, Median Absolute Deviation, intervalle
interquartile,...) un paramètre de dispersion, la distance relative
d’une unité au centre est définie par :
di 
xi  m
s

MADmedian
x

median
(
x
)
 i
j 
i
j


Approches globales (3)
Méthodes graphiques
Graphique Boxplot (Grubbs, 1969, Goldberg, Iglewicz, 1992 , Gnanadesikan, 1997).
Le graphique Boxplot présente l’avantage d’être simple et facilement
compréhensible.
Pour Tukey (1975, 1977) les outliers se trouvent comme étant,
x X / x  LF
ou x  LU 
où LF  Q1  kl (Q3  Q1 ) - limite inférieure
et LU  Q3  ku (Q3  Q1 ) - limite supérieure.
Les paramètres kl et ku
peuvent être déterminés empiriquement ou à partir de la
connaissance de la fonction de répartition de X et d’un seuil fixé dépendant du
nombre d’observations dans l’échantillon.
Pour une distribution asymétrique, comme le montant des sinistres - définir à droite
deux bornes en changeant le seuil, Davis, Gather (1993), Iglewicz, Banerjee
(2001) Zani, Riani, Corbellini (1998). On a une borne inférieure en dessous de
laquelle aucune unité n’est pas atypique, une borne supérieure au-dessus de
laquelle toutes les unités sont atypiques et entre les deux, la question reste posée.
Approches globales (4)
Méthodes graphiques
20000
c
o
10000
u
t
0
v1
v2
v3
av
v4
Méthodes usuelles (5)
Approches probabilistes
La connaissance a priori de la loi de probabilité de X
peut être utilisée pour détecter les unités typiques en
fixant un seuil, mais ceci n’est pas souvent le cas en
pratique.
La distribution X étant fortement asymétrique, on la
transforme par le logarithme (ou fonction concave) en
se restreignant aux valeurs non nulles.
On peut alors fixer une valeur de la loi normale centrée
réduite au-delà de laquelle une unité sera déclarée
atypique.
Gestion des sinistres graves
Plan
Approche globale (écrêtage sur l’ensemble du portefeuille)

Méthodes de détection : algébriques, graphiques,
probabilistes
 Théorie
Approche locale

des valeurs extrêmes
Dans les classes de risque (ou cases tarifaires) à
partir de la prime pure
Théorie des Valeurs Extrêmes (1)
Objectif
Trouver (ou estimer) un seuil au delà duquel une observation sera déclarée
comme atypique (sinistre grave) en approximant la loi de probabilité
des extrêmes.
Deux approches
Théorie classique basée sur la distribution des valeurs extrêmes (Generalized
Extreme Value Distribution)
Méthode à dépassement de seuil (POT=Peaks Over Threshold) basée sur la
loi de Pareto Généralisée (GPD)
Et trois méthodes (valeurs record, fonction moyenne des excès, fonction
GPD) peuvent être proposées pour déterminer ce seuil.
Grun-Rehomme M., Vasechko O., Benlagha N. (2008) Les sinistres graves
en assurance automobile : une nouvelle approche par la théorie des
valeurs extrêmes (2008), revue Modulad, n.39, 47-80, Décembre 2008
Théorie des Valeurs Extrêmes (2)
X une variable aléatoire,
FX ( x)  P( X  x)
M n  max( X i )1in
0 si x  xF
lim FM n ( x)  lim FX ( x)  
n 
n 
1 si x  xF
n
Où x F  supx  R : FX ( x)  1 est le point terminal à
droite (right-end point).
On s’intéresse alors à la distribution asymptotique du
maximum.
Théorie des Valeurs Extrêmes (3)
Première approche
Théorème 1 (Fisher, Tippett, 1928, Gnedenko,1943)
Soit une suite (Xn) de n variables aléatoires réelles iid de loi
M n  max( X 1 ,..., X. n )
continue
S’il existe deux suites constantes normées an et bn>0, et une
fonction de répartition non dégénérée G telle que
M n  an d
G
bn
,
lorsque n tend vers l’infini, alors il G est nécessairement de l’un
des trois types suivant : Fréchet, Weibull or Gumbel
Théorie des Valeurs Extrêmes (4)
GEV (Generalized Extreme Value Distribution)
   x    1/  
G , , ( x)  exp  1   
 
     
Fréchet
Gumbel
Weibull
 0
 0
 0
Théorie des Valeurs Extrêmes (5)
Deuxième approche : La méthode POT
Fu ( y)  P( X  u  y X  u ) 
F (u  y)  F (u )
where 0  y  xF  u
1  F (u )
Theorem 2 (Pickands, 1975; Balkema, De Haan, 1974)
lim
Sup
u  xF 0 y  xF u
Fu ( y)  FGPD
, ( u ) ( y )  0,
GPD
ou F , est une Generalized Pareto Distribution (GPD)
GPD
 ,
F
1  (1   y  ) 1/ 
( y)  
1  exp(  y  )
if   0,
if   0,
Théorie des Valeurs Extrêmes(6)
Comment estimer un seuil u suffisamment grand?
3 méthodes:
-
Les valeurs records (Einmahl, Magnus, 2006)
La fonction moyenne des excès
La fonction GPD et l’estimation de la queue de
distribution
Théorie des Valeurs Extrêmes(7)
- La fonction moyenne des excès
Pour un seuil fixé: u<xF
en (u)  E X  u / X  u 
est nommée la fonction moyenne des excès de X.
Une approche, utilisée dans la pratique, est basée sur la
linéarité de la fonction moyenne des excès pour GPD.
Si X suit la loi GPD de paramètres   1 et 
La fonction moyenne des excès empirique s’écrit, pour u<xF,
comme suit ,
  u , avec    u  0
en (u ) 
1 
Théorie des Valeurs Extrêmes (8)
Théorie des Valeurs Extrêmes(9)
La fonction GPD
A partir du théorème 2,
qˆ GPD ,n
ˆ n  np n

 uˆ n 
ˆn  mn




ˆn

 1


Le nombre d’excès mn est un entier fixé; il
doit tendre vers l’infini avec la taille de
l’échantillon mais rester petit devant
pour que le seuil soit suffisamment
grand
Théorie des Valeurs Extrêmes(10)
Nouvelle approche (1)
Choisir entre différentes stratégies?
Théorème
p
(U i )1i  p
Soient
et
(combinaison
Z  i U i
i 1
convexe)
  (1 , ..., p )
Vi  Var (U i )
On note :
Hypothèses
1. Les variables (U i )1in ont toutes des moments
d’ordre 1 et 2
2. V (matrice de variance-covariance) est inversible
Théorie des Valeurs Extrêmes(11)
Nouvelle approche (2)
Conclusion
Var (Z) est alors minimale pour :  
V 1
p
1
v
 ij
A
i , j 1
1
1
Où V est l’inverse de la matrice V, de terme général vij
A est la matrice uni-colonne d’ordre p dont tous
les coefficients sont égaux à 1 (p,1)
Estimation de V par Bootstrap
Théorie des Valeurs Extrêmes(12)
Nouvelle approche (3)
X   U1  (1   )U 2
Où
0  1
V2  cov(V1 ,V2 )

V1  V2  2 cov(V1 ,V2 )
Conclusions(1)
1. Ces différentes méthodes paramétriques ou non
paramétriques ne permettent pas de trancher sur
le seuil à partir duquel un sinistre sera considéré
comme grave.
2. Le point de vue de l’expert peut être utile dans les
cas litigieux, mais il est trop coûteux dans sa
généralisation au niveau de la production des
données.
Conclusions(2)
3. La théorie des valeurs extrêmes classique ou
basée sur la loi de Pareto généralisée ne résout
pas ces difficultés d’un coup. Elle est intéressante
dans une optique de prévision, mais plus difficile à
utiliser dans la pratique. Il en est de même de notre
technique, basée sur une minimisation de la
variance, même si elle semble être un bon
compromis empirique de qualité entre la méthode
de la fonction moyenne des excès et celle utilisant
la loi de Pareto généralisée.
Conclusions(3)
4. L’approche doit être ouverte et multiforme et en
ce sens, il n’y a pas une méthode pour un
problème. Les méthodes doivent être utilisées
de façon souple, en restant pragmatique.
Gestion des sinistres graves
Plan
Approche globale (écrêtage sur l’ensemble du portefeuille)


Méthodes de détection : algébriques, graphiques,
probabilistes
Théorie des valeurs extrêmes
Approche locale
 Dans les classes de risque (ou cases
tarifaires) à partir de la prime pure
Introduction (1)
Dans l’approche globale, on a des outliers
Dans l’approche locale (classes de risque ou cases tarifaires),
on a des inliers (Winkler, 1997)
Pourquoi une approche locale?
Stabilité temporelle de la prime pure
Stabilité de la hiérarchisation des classes de risque
Adéquation entre sinistralité et cotisation
Homogénéité des cases tarifaires
Introduction (2)
Comment ?
Quel est le seuil, à partir duquel un sinistre sera
considéré grave dans une case tarifaire ?
Idée
Estimation de la variance de la prime pure
Référence
Une approche locale de la gestion des sinistres graves en
assurance automobile (2007), Revue Assurances et gestion des
risques, octobre 2007, 75(3), HEC Montréal, avec O. Vasechko & N.
Benlagha
Introduction (3)
Dans chaque classe k, la prime est
définie par:
nk
Pk 
c
i 1
nk
k, i
w
i 1
k, i
où c k , i (coûts), wk , i (poids)
Introduction (4)
Un sinistre sera considéré comme grave (ou atypique) pour
une classe de risque donnée si son montant engendre une
modification de la hiérarchie des classes établie avec la
prime pure
Le seuil à partir duquel un sinistre sera considéré comme
grave localement dépend :
 de la taille n k de la classe k,
 de la variance de l’indicateur (prime pure),
 de la précision souhaitée :  k
 du risque d’erreur fixé :  k
Méthode (1)
Estimation de la variance de la prime:
Var ( Pk ) 
nk
nk
( wk , i ) 2
Var ( z k )
i 1
Où
z k , i  ck , i  Pk wk , i
D’après l’inégalité de Bienaymé-Tchebychev:
( wk , i ) 2
Var ( Pk )   k   k2
Var ( z k )  i
  k   k2
nk
Méthode (2)
On suppose que les classes sont ordonnées selon la valeur de la prime
pure :
Pk  Pk 1
 k   0,05 ou 0,1
On fixe, par exemple, un risque d’erreur
On peut fixer
 k  Pk 2  Pk
 k  ( Pk  2  Pk )  z / 2
ou
 k  Pk 1  Pk
Var ( z k  2 )
nk  2
Méthode (3)
On ordonne également dans chaque classe k, la
variable, z k
z k , i  z k , i 1


Posons V (i) Var z k , j / j  i
(variance pour les i premières observations de la
classe k)


( wk , j ) 2


j
qk  Arg min Var (i ) / Var (i) 
  k   k2 
nk
iN




Application (1)
Classes
Prime pure
( wi ) 2 / n
( wk , i ) 2
i
nk
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
Total
45,63
58,02
60,96
78,92
93,10
108,66
121,96
130,53
136,80
149,85
163,86
168,23
187,32
195,05
207,85
227,01
232,96
243,62
263,89
275,21
280,68
291,54
305,93
321,11
331,49
367,48
455,72
211,20
1015
1701
755
2377
2539
1109
2311
1377
1061
1437
2364
923
2282
1465
1603
1812
1897
1239
1262
3492
1437
2937
3132
870
3422
1148
1168
48135
  k   k2
23853
74301
77990
210238
211473
53043
50894
51398
77691
48545
130108
66393
96182
149641
101071
49992
181479
123643
35576
93121
91618
256807
204618
187065
5281204
2803811
.
Nombre
d’ «inliers »
1
1
0
0
2
1
3 (*)
5
1
0
2
1
0
2
1
1
2
3
18 (**)
0
2
1 (*)
1
1
1 (*)
1 (*)
2 (*)
Conclusions
Trois raisons principales peuvent expliquer une variance
importante dans une classe de risque:
- La présence d’un ou de quelques « inliers » dans cette
classe,
- La présence d’une sous population plus risquée, d’une
niche dans ce segment qu’il est donc nécessaire de
suivre avec attention,
- Un manque d’homogénéité structurelle de la classe qui
peut provenir de variables non retenues ou
inobservées (inobservables).
Téléchargement