Gestion des sinistres graves Plan Approche globale (écrêtage sur l’ensemble du portefeuille) Méthodes de détection : algébriques, graphiques, probabilistes Théorie des valeurs extrêmes Approche locale Dans les classes de risque (ou cases tarifaires) à partir de la prime pure Approches globales (1) Rappels sur les méthodes Approches déterministes Méthodes algébriques Méthodes graphiques Approches probabilistes La loi de probabilité Théorie des valeurs extrêmes Méthodes Bayesiennes Approches globales (2) Méthodes algébriques Soit X la variable aléatoire du montant des sinistres. La distance relative d’une unité au centre de la distribution X, Tsay (1983), Hadi (1994). Si m (moyenne, médiane,...) désigne un paramètre de tendance centrale et s (variance, Median Absolute Deviation, intervalle interquartile,...) un paramètre de dispersion, la distance relative d’une unité au centre est définie par : di xi m s MADmedian x median ( x ) i j i j Approches globales (3) Méthodes graphiques Graphique Boxplot (Grubbs, 1969, Goldberg, Iglewicz, 1992 , Gnanadesikan, 1997). Le graphique Boxplot présente l’avantage d’être simple et facilement compréhensible. Pour Tukey (1975, 1977) les outliers se trouvent comme étant, x X / x LF ou x LU où LF Q1 kl (Q3 Q1 ) - limite inférieure et LU Q3 ku (Q3 Q1 ) - limite supérieure. Les paramètres kl et ku peuvent être déterminés empiriquement ou à partir de la connaissance de la fonction de répartition de X et d’un seuil fixé dépendant du nombre d’observations dans l’échantillon. Pour une distribution asymétrique, comme le montant des sinistres - définir à droite deux bornes en changeant le seuil, Davis, Gather (1993), Iglewicz, Banerjee (2001) Zani, Riani, Corbellini (1998). On a une borne inférieure en dessous de laquelle aucune unité n’est pas atypique, une borne supérieure au-dessus de laquelle toutes les unités sont atypiques et entre les deux, la question reste posée. Approches globales (4) Méthodes graphiques 20000 c o 10000 u t 0 v1 v2 v3 av v4 Méthodes usuelles (5) Approches probabilistes La connaissance a priori de la loi de probabilité de X peut être utilisée pour détecter les unités typiques en fixant un seuil, mais ceci n’est pas souvent le cas en pratique. La distribution X étant fortement asymétrique, on la transforme par le logarithme (ou fonction concave) en se restreignant aux valeurs non nulles. On peut alors fixer une valeur de la loi normale centrée réduite au-delà de laquelle une unité sera déclarée atypique. Gestion des sinistres graves Plan Approche globale (écrêtage sur l’ensemble du portefeuille) Méthodes de détection : algébriques, graphiques, probabilistes Théorie Approche locale des valeurs extrêmes Dans les classes de risque (ou cases tarifaires) à partir de la prime pure Théorie des Valeurs Extrêmes (1) Objectif Trouver (ou estimer) un seuil au delà duquel une observation sera déclarée comme atypique (sinistre grave) en approximant la loi de probabilité des extrêmes. Deux approches Théorie classique basée sur la distribution des valeurs extrêmes (Generalized Extreme Value Distribution) Méthode à dépassement de seuil (POT=Peaks Over Threshold) basée sur la loi de Pareto Généralisée (GPD) Et trois méthodes (valeurs record, fonction moyenne des excès, fonction GPD) peuvent être proposées pour déterminer ce seuil. Grun-Rehomme M., Vasechko O., Benlagha N. (2008) Les sinistres graves en assurance automobile : une nouvelle approche par la théorie des valeurs extrêmes (2008), revue Modulad, n.39, 47-80, Décembre 2008 Théorie des Valeurs Extrêmes (2) X une variable aléatoire, FX ( x) P( X x) M n max( X i )1in 0 si x xF lim FM n ( x) lim FX ( x) n n 1 si x xF n Où x F supx R : FX ( x) 1 est le point terminal à droite (right-end point). On s’intéresse alors à la distribution asymptotique du maximum. Théorie des Valeurs Extrêmes (3) Première approche Théorème 1 (Fisher, Tippett, 1928, Gnedenko,1943) Soit une suite (Xn) de n variables aléatoires réelles iid de loi M n max( X 1 ,..., X. n ) continue S’il existe deux suites constantes normées an et bn>0, et une fonction de répartition non dégénérée G telle que M n an d G bn , lorsque n tend vers l’infini, alors il G est nécessairement de l’un des trois types suivant : Fréchet, Weibull or Gumbel Théorie des Valeurs Extrêmes (4) GEV (Generalized Extreme Value Distribution) x 1/ G , , ( x) exp 1 Fréchet Gumbel Weibull 0 0 0 Théorie des Valeurs Extrêmes (5) Deuxième approche : La méthode POT Fu ( y) P( X u y X u ) F (u y) F (u ) where 0 y xF u 1 F (u ) Theorem 2 (Pickands, 1975; Balkema, De Haan, 1974) lim Sup u xF 0 y xF u Fu ( y) FGPD , ( u ) ( y ) 0, GPD ou F , est une Generalized Pareto Distribution (GPD) GPD , F 1 (1 y ) 1/ ( y) 1 exp( y ) if 0, if 0, Théorie des Valeurs Extrêmes(6) Comment estimer un seuil u suffisamment grand? 3 méthodes: - Les valeurs records (Einmahl, Magnus, 2006) La fonction moyenne des excès La fonction GPD et l’estimation de la queue de distribution Théorie des Valeurs Extrêmes(7) - La fonction moyenne des excès Pour un seuil fixé: u<xF en (u) E X u / X u est nommée la fonction moyenne des excès de X. Une approche, utilisée dans la pratique, est basée sur la linéarité de la fonction moyenne des excès pour GPD. Si X suit la loi GPD de paramètres 1 et La fonction moyenne des excès empirique s’écrit, pour u<xF, comme suit , u , avec u 0 en (u ) 1 Théorie des Valeurs Extrêmes (8) Théorie des Valeurs Extrêmes(9) La fonction GPD A partir du théorème 2, qˆ GPD ,n ˆ n np n uˆ n ˆn mn ˆn 1 Le nombre d’excès mn est un entier fixé; il doit tendre vers l’infini avec la taille de l’échantillon mais rester petit devant pour que le seuil soit suffisamment grand Théorie des Valeurs Extrêmes(10) Nouvelle approche (1) Choisir entre différentes stratégies? Théorème p (U i )1i p Soient et (combinaison Z i U i i 1 convexe) (1 , ..., p ) Vi Var (U i ) On note : Hypothèses 1. Les variables (U i )1in ont toutes des moments d’ordre 1 et 2 2. V (matrice de variance-covariance) est inversible Théorie des Valeurs Extrêmes(11) Nouvelle approche (2) Conclusion Var (Z) est alors minimale pour : V 1 p 1 v ij A i , j 1 1 1 Où V est l’inverse de la matrice V, de terme général vij A est la matrice uni-colonne d’ordre p dont tous les coefficients sont égaux à 1 (p,1) Estimation de V par Bootstrap Théorie des Valeurs Extrêmes(12) Nouvelle approche (3) X U1 (1 )U 2 Où 0 1 V2 cov(V1 ,V2 ) V1 V2 2 cov(V1 ,V2 ) Conclusions(1) 1. Ces différentes méthodes paramétriques ou non paramétriques ne permettent pas de trancher sur le seuil à partir duquel un sinistre sera considéré comme grave. 2. Le point de vue de l’expert peut être utile dans les cas litigieux, mais il est trop coûteux dans sa généralisation au niveau de la production des données. Conclusions(2) 3. La théorie des valeurs extrêmes classique ou basée sur la loi de Pareto généralisée ne résout pas ces difficultés d’un coup. Elle est intéressante dans une optique de prévision, mais plus difficile à utiliser dans la pratique. Il en est de même de notre technique, basée sur une minimisation de la variance, même si elle semble être un bon compromis empirique de qualité entre la méthode de la fonction moyenne des excès et celle utilisant la loi de Pareto généralisée. Conclusions(3) 4. L’approche doit être ouverte et multiforme et en ce sens, il n’y a pas une méthode pour un problème. Les méthodes doivent être utilisées de façon souple, en restant pragmatique. Gestion des sinistres graves Plan Approche globale (écrêtage sur l’ensemble du portefeuille) Méthodes de détection : algébriques, graphiques, probabilistes Théorie des valeurs extrêmes Approche locale Dans les classes de risque (ou cases tarifaires) à partir de la prime pure Introduction (1) Dans l’approche globale, on a des outliers Dans l’approche locale (classes de risque ou cases tarifaires), on a des inliers (Winkler, 1997) Pourquoi une approche locale? Stabilité temporelle de la prime pure Stabilité de la hiérarchisation des classes de risque Adéquation entre sinistralité et cotisation Homogénéité des cases tarifaires Introduction (2) Comment ? Quel est le seuil, à partir duquel un sinistre sera considéré grave dans une case tarifaire ? Idée Estimation de la variance de la prime pure Référence Une approche locale de la gestion des sinistres graves en assurance automobile (2007), Revue Assurances et gestion des risques, octobre 2007, 75(3), HEC Montréal, avec O. Vasechko & N. Benlagha Introduction (3) Dans chaque classe k, la prime est définie par: nk Pk c i 1 nk k, i w i 1 k, i où c k , i (coûts), wk , i (poids) Introduction (4) Un sinistre sera considéré comme grave (ou atypique) pour une classe de risque donnée si son montant engendre une modification de la hiérarchie des classes établie avec la prime pure Le seuil à partir duquel un sinistre sera considéré comme grave localement dépend : de la taille n k de la classe k, de la variance de l’indicateur (prime pure), de la précision souhaitée : k du risque d’erreur fixé : k Méthode (1) Estimation de la variance de la prime: Var ( Pk ) nk nk ( wk , i ) 2 Var ( z k ) i 1 Où z k , i ck , i Pk wk , i D’après l’inégalité de Bienaymé-Tchebychev: ( wk , i ) 2 Var ( Pk ) k k2 Var ( z k ) i k k2 nk Méthode (2) On suppose que les classes sont ordonnées selon la valeur de la prime pure : Pk Pk 1 k 0,05 ou 0,1 On fixe, par exemple, un risque d’erreur On peut fixer k Pk 2 Pk k ( Pk 2 Pk ) z / 2 ou k Pk 1 Pk Var ( z k 2 ) nk 2 Méthode (3) On ordonne également dans chaque classe k, la variable, z k z k , i z k , i 1 Posons V (i) Var z k , j / j i (variance pour les i premières observations de la classe k) ( wk , j ) 2 j qk Arg min Var (i ) / Var (i) k k2 nk iN Application (1) Classes Prime pure ( wi ) 2 / n ( wk , i ) 2 i nk 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 Total 45,63 58,02 60,96 78,92 93,10 108,66 121,96 130,53 136,80 149,85 163,86 168,23 187,32 195,05 207,85 227,01 232,96 243,62 263,89 275,21 280,68 291,54 305,93 321,11 331,49 367,48 455,72 211,20 1015 1701 755 2377 2539 1109 2311 1377 1061 1437 2364 923 2282 1465 1603 1812 1897 1239 1262 3492 1437 2937 3132 870 3422 1148 1168 48135 k k2 23853 74301 77990 210238 211473 53043 50894 51398 77691 48545 130108 66393 96182 149641 101071 49992 181479 123643 35576 93121 91618 256807 204618 187065 5281204 2803811 . Nombre d’ «inliers » 1 1 0 0 2 1 3 (*) 5 1 0 2 1 0 2 1 1 2 3 18 (**) 0 2 1 (*) 1 1 1 (*) 1 (*) 2 (*) Conclusions Trois raisons principales peuvent expliquer une variance importante dans une classe de risque: - La présence d’un ou de quelques « inliers » dans cette classe, - La présence d’une sous population plus risquée, d’une niche dans ce segment qu’il est donc nécessaire de suivre avec attention, - Un manque d’homogénéité structurelle de la classe qui peut provenir de variables non retenues ou inobservées (inobservables).