ACT 2008 Mathématiques actuarielles IARD II (Théorie de la crédibilité) ACT 2008 Mathématiques actuarielles IARD II (Théorie de la crédibilité) Vincent Goulet École d’actuariat, Université Laval Hiver 2010 c 2010 Vincent Goulet Cette création est mise à disposition selon le contrat Paternité-Partage à l’identique 2.5 Canada disponible en ligne http://creativecommons.org/licenses/ by-sa/2.5/ca/ ou par courrier postal à Creative Commons, 171 Second Street, Suite 300, San Francisco, California 94105, USA. Table des matières 1 Introduction à la théorie de la crédibilité 1 2 Crédibilité de stabilité 2.1 Origines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Crédibilité complète . . . . . . . . . . . . . . . . . . . . . . 2.3 Crédibilité partielle . . . . . . . . . . . . . . . . . . . . . . . 5 5 6 9 3 Crédibilité bayesienne 3.1 Quelques notes historiques . . . . . . . . 3.2 Estimation bayesienne . . . . . . . . . . . 3.3 Modélisation de l’hétérogénéité . . . . . . 3.4 Prévision . . . . . . . . . . . . . . . . . . . 3.5 Approche par la distribution prédictive . 3.6 Crédibilité bayesienne linéaire (ou exacte) 3.7 Le modèle de Jewell . . . . . . . . . . . . . 4 Le modèle de crédibilité de Bühlmann 4.1 Notation et relations de covariance 4.2 Modèle et prévision . . . . . . . . . 4.3 Approche paramétrique . . . . . . 4.4 Approche non paramétrique . . . . 4.5 Interprétation des résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 11 12 17 18 24 26 37 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 39 42 47 50 56 5 Le modèle de Bühlmann–Straub 5.1 Modèle et prévision . . . . . . . . . . . . 5.2 Estimation des paramètres de structure 5.3 Données manquantes . . . . . . . . . . . 5.4 Exemple numérique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 59 64 67 67 Bibliographie . . . . . . . . . . 73 v 1 Introduction à la théorie de la crédibilité Théorie de la crédibilité : ensemble de techniques utilisées par les actuaires pour déterminer la prime d’un assuré/contrat dans un portefeuille hétérogène. En faisant une tarification, un assureur cherche 1. d’abord à charger assez de primes pour poyer les sinistres ; puis 2. distribuer équitablement ces primes entre les assurés. Plusieurs façons d’atteindre le second but : 1. d’abord par une structure de classification ; puis 2. par la tarification basée sur l’expérience (experience rating) de la crédibilité. ñ théorie Définition (Experience rating). La tarification basée sur l’expérience vise à assigner à chaque risque sa prime juste et équitable. Cette prime pour une période dépend exclusivement de la distribution des sinistres (inconnue) de ce risque pour la période. (Bühlmann, 1969) La tarification basée sur l’expérience exige un volume d’expérience important. Elle est donc principalement utilisée en assurance automobile accidents du travail. Elle ne peut toutefois être utilisée, par exemple, en assurance-vie (on ne meurt qu’une fois) 1 assurance habitation (fréquence trop faible) Exemple 1.1. Un portefeuille d’assurance est composé de dix contrats. Les contrats sont a priori considérés équivalents. Les conditions suivantes prévalent : tout contrat ne peut avoir qu’au plus un sinistre par année ; le montant de ce sinistre est 1 ; la prime collective est 0,20, c’est-à-dire que l’assureur s’attend à ce qu’en moyenne deux assurés sur 10 aient un sinistre au cours d’une année. Situation après une année Voici l’expérience au sein du portefeuille après une année. Contrat Année 1 2 3 4 5 6 7 8 1 9 10 1 Montant de sinistre moyen par contrat = 1/10 = 0,10. La prime collective est peut-être trop élevée. Trop peu de données pour tirer une conclusion. Situation après deux années Après deux années, l’expérience est maintenant comme suit. Contrat Année 1 2 3 4 5 1 2 6 7 8 9 1 1 1 1 2 10 Montant de sinistre moyen par contrat = 4/20 = 0,20. La prime collective est adéquate. Le contrat 9 a déjà eu deux sinistres. Situation après dix années Observons maintenant la situation après dix années. Contrat Année 1 2 3 4 5 6 7 8 1 9 10 1 2 1 3 1 1 1 1 1 4 1 1 5 1 6 1 7 1 8 1 9 1 10 1 S̄i 0,6 1 1 1 1 1 1 1 1 0,3 0,2 0,2 0,2 S̄ 0,1 0 0 0,23 Montant de sinistre moyen par contrat = 23/100 = 0,23. La prime collective est raisonnablement adéquate. Le contrat 9, avec ses 7 sinistres, est en effet plus risqué. Les contrats 7, 8 et 10 n’ont eu aucun sinistre. 3 0,7 0 Conclusions La prime collective, si elle est globalement adéquate, n’est en revanche clairement pas équitable. Contrairement à l’hypothèse de départ de l’assureur, le portefeuille est hétérogène. Besoin d’une technique de tarification basée sur l’expérience (expe- rience rating) pour adéquatement distribuer les primes entre les assurés. Deux grandes branches en théorie de la crédibilité : 1. Credibilité de stabilité, ou américaine, limited fluctuations. L’assureur tient compte de l’expérience individuelle seulement si celleci est suffisamment stable dans le temps. 2. Crédibilité de précision, ou européenne, greatest accuracy. L’assureur tient compte de l’expérience individuelle de façon à obtenir la meilleure estimation de l’expérience future. Le poids de l’expérience individuelle augmente avec l’hétérogénéité du portefeuille. 4 2 Crédibilité de stabilité 2.1 Origines La théorie de la crédibilité est apparue dans le domaine des accidents du travail au début des années 1900. Petite histoire du gros employeur avec une meilleure expérience que le groupe... Première solution : Mowbray (1914) définit une prime pure «fiable» (dependable) comme «une prime pour laquelle la probabilité est forte qu’elle ne diffère pas de la vraie prime par plus d’une limite arbitraire». En termes mathématiques, on veut que Pr[(1 k ) E[S] ¤ S ¤ (1 + k ) E[S]] ¥ p, où k est petit, habituellement 5 % ; p est près de 1, habituellement 0,90, 0,95 ou 0,99 ; S représente l’expérience d’un contrat, sous une forme ou une autre. 5 2.2 Crédibilité complète En crédibilité complète, un contrat d’assurance est considéré crédible si son expérience est stable. La notion de portefeuille n’est pas nécessaire pour le moment. Intuitivement, la stabilité de l’expérience va de pair avec la «taille» d’un contrat, qu’elle soit exprimée en termes de volume de prime ; masse salariale ; nombre d’employés ; nombre de sinistres ; nombre d’années d’expérience ; etc. De plus, la taille du contrat est généralement liée à la fréquence des sinistres, et non à la sévérité de ceux-ci. Définition (Crédibilité complète). Une crédibilité complète d’ordre (k, p) est attribuée à l’expérience S d’un contrat si les paramètres de la distribution de S sont tels que la relation Pr[(1 k ) E[S] ¤ S ¤ (1 + k ) E[S]] ¥ p est vérifiée. Exemple 2.1 (Binomiale pure). Mowbray (1914) voulait trouver le nombre d’employés minimal pour considérer l’expérience d’un employeur pleinement crédible. On définit alors S : nombre d’accidents par année avec S Binomiale(n, θ ), où n = nombre d’employés θ = probabilité d’accident (connue). 6 On cherche n tel que Pr[(1 k ) E[S] ¤ S ¤ (1 + k) E[S]] ¥ p pour des valeurs de k et p données. Par le Théorème central limite, S E[S] nÑ8 ÝÑ N (0, 1), Var[S] a d’où " kE[S] Pr a Var[S] ¤ S E[S] a Var[S] ¤ kE[S] a Var[S] # Φ = 2Φ kE[S] a Var[S] ! kE[S] Var[S] a Φ akE[S] Var[S] ! 1 ¥ p. On a donc kE[S] ¥ ζ ε/2 , Var[S] où ε = 1 p et ζ α est le 100(1 α)e centile d’une loi N (0, 1). a Avec E[S] = nθ et Var[S] = nθ (1 θ ) et en isolant n dans l’inégalité, on obtient ζ ε/2 2 1 θ n¥ . k θ Exemple 2.2 (Poisson composée). La taille d’un contrat est souvent exprimée en termes du nombre espéré de sinistres dans une période — typiquement une année. La distribution la plus populaire pour S dans un tel cas est alors la Poisson composée, c’est-à-dire S = X1 + + X N où N Poisson(λ) et la distribution de X1 , X2 , . . . est FX (). On a E[S] = E[ N ] E[ X ] = λE[ X ] Var[S] = Var[ N ] E[ X ]2 + E[ N ]Var[ X ] = λE[ X ]2 + λVar[ X ] = λE[ X 2 ]. 7 ! En suivant le même cheminement qu’à l’exemple précédent, on trouve ζ ε/2 2 Var[ X ] λ¥ 1+ k E [ X ]2 2 ζ ε/2 = (1 + CV( X )2 ), k où a Var[ X ] . E[ X ] CV( X ) = Remarques. 1. Plus CV( X ) augmente, plus λ augmente. 2. Si k = 0,05 et p = 0,90, alors ζ 0,05 = 1,645 et Var[ X ] λ ¥ 1 082,41 1 + . E [ X ]2 3. Si, en plus, X est dégénérée (c’est-à-dire Pr[ X = M ] = 1 pour M quelconque), alors λ ¥ 1 082,41, un nombre célèbre. 4. Si X est dégénérée en 1 on a en définitive S Poisson(λ). Exemple 2.3. Dans les deux exemples précédents, on détermine si un contrat est pleinement crédible une période à la fois. On pourrait aussi fixer le seuil de crédibilité complète en fonction du nombre d’années d’expérience. Pour cela, on définit simplement S1 + + Sn , n où S1 , . . . , Sn sont des variables aléatoires indépendantes et identiquement distribuées et St est l’expérience de l’année t = 1, . . . , n. S S̄ = On a alors E [ S ] = E [ St ] Var[St ] Var[S] = , n 8 d’où l’expérience d’un contrat est considérée pleinement crédible après n¥ ζ ε/2 k 2 Var[St ] E [ St ]2 périodes. Remarques. 1. De manière générale, le seuil de crédibilité complète est tel que E[S] ¥ ζ ε/2 k b Var[S]. 2. La distribution de S n’est en général pas symétrique. Est-il alors correct d’utiliser le Théorème central limite (TCL) ? Le critère de crédibilité complète exige que la distribution de S soit très concentrée autour de sa moyenne, donc presque symétrique. Le TCL est donc bien assez précis. 3. Il y a en fait très peu d’applications légitimes de la crédibilité de stabilité. Un bon exemple : seuil d’admissibilité à un régime rétrospectif. 2.3 Crédibilité partielle Le besoin de tenir compte en partie de l’expérience individuelle d’un contrat se trouvant sous le seuil de crédibilité complète apparait rapidement. Whitney (1918) propose de pondérer l’expérience individuelle (S) et la prime collective (m) par un facteur de crédibilité (0 ¤ z ¤ 1) en une prime de la forme π = zS + (1 z)m. 9 Plusieurs formules différentes ont été proposées pour z. Soit n0 le seuil de crédibilité complète. Les formules les plus populaires sont "c * n ,1 , z = min n0 # 2/3 + n z = min ,1 , n0 et la formule de Whitney z= n , n+K où K est une constante déterminée au jugement de façon à limiter les fluctuations dans la prime d’une année à l’autre (swing). Remarques. 1. But de cette approche : incorporer autant d’expérience individuelle possible sans trop affecter la stabilité de la prime. 2. La distribution des primes est basée uniquement sur la taille des assurés. La tarification n’est donc pas nécessairement précise et équitable. 10 3 Crédibilité bayesienne 3.1 Quelques notes historiques Whitney (1918) est le premier auteur à proposer l’approche de pré- cision de par «la nécessité, par équité envers le risque individuel, de pondérer l’expérience du groupe d’une part et l’expérience individuelle d’autre part.» Modèle mal reçu parce que Whitney utilise la règle de Bayes. Défenseur de l’approche bayesienne : Bailey (1945, 1950). Bailey établit que la minimisation de l’erreur quadratique moyenne résulte en une prime bayesienne linéaire de la forme π = zS + (1 z)m avec z= z z+K pour certaines combinaisons de distributions. Véritable essor de la crédibilité de précision : Bühlmann (1967, 1969). Son idée : forcer la prime bayesienne à être linéaire. 11 3.2 Estimation bayesienne 3.2.1 Cas continu Supposons que l’on souhaite estimer le paramètre inconnu θ d’une distribution continue avec f.d.p. f ( x; θ ) (une loi normale avec moyenne inconnue θ et variance connue σ2 , par exemple) à partir d’un échantillon aléatoire X1 , . . . , Xn . Les statisticiens classiques développeront des estimateurs à partir d’un critère quelconque : absence de biais, maximum de vraisemblance, etc. On remarquera qu’aucune hypothèse a priori n’est faite sur θ, on «laisse parler les données». Dans l’approche bayesienne, l’opinion a priori d’un individu sur la valeur du paramètre θ est prise en compte dans l’estimation de ce dernier. On considère alors le paramètre comme une simple réalisation d’une variable aléatoire Θ avec f.d.p. u(θ ). Au fur et à mesure que les données de l’échantillon aléatoire (l’information) s’accumulent, l’opinion a priori sur la valeur possible de θ est révisée et améliorée. On calcule alors u(θ |x1 , . . . , xn ), la distribution a posteriori de Θ, à l’aide de la régle de Bayes : u ( θ | x1 , . . . , x n ) = f ( x1 , . . . , x n , θ ) f ( x1 , . . . , x n ) f ( x1 , . . . , x n |θ ) u ( θ ) = . f ( x1 , . . . , x n ) Par la loi des probabilités totales, » f ( x1 , . . . , x n ) = et donc 8 8 f ( x1 , . . . , xn |θ )u(θ ) dθ, f ( x1 , . . . , x n |θ ) u ( θ ) . 8 f ( x1 , . . . , xn |θ )u(θ ) dθ u ( θ | x1 , . . . , x n ) = ³ 8 Le dénominateur du côté droit de l’expression ci-dessus n’est qu’une constante de normalisation et, par conséquent, est souvent omise dans les calculs. 12 Enfin, un estimateur ponctuel θ̂ = g( X1 , . . . , Xn ) du paramètre θ est obtenu en minimisant l’espérance a posteriori d’une fonction de perte. La fonction de perte la plus fréquemment employée est l’erreur quadratique, c’est-à-dire L(θ̂, θ ) = (θ̂ θ )2 . Dans un tel cas l’estimateur bayesien minimisant E[ L(θ̂, θ )|X1 , . . . , Xn ] = E[(θ̂ θ )2 |X1 , . . . , Xn ] est θ̂ = E[Θ|X1 , . . . , Xn ] » = 8 8 θ u(θ |x1 , . . . , xn ) dθ, soit l’espérance de Θ calculée par rapport à la distribution a posteriori. 3.2.2 Cas discret Les idées expliquées ci-dessus demeurent exactement les mêmes dans le cas discret, seule la notation change légèrement. Pour simplifier la notation, soit X = ( X1 , . . . , Xn ) et x = ( x1 , . . . , xn ). Si la variable aléatoire Θ ne prend que des valeurs discrètes, la distribution a priori est exprimée sous forme d’une fonction de probabilité Pr[Θ = θ ]. La fonction de probabilité conjointe de X1 , . . . , Xn peut toujours être calculée par la loi des probabilités totales : 8̧ Pr[ X = x] = θ =8 Pr[ X = x|Θ = θ ] Pr[Θ = θ ]. La règle de Bayes permet de calculer la distribution a posteriori de Θ : Pr[ X = x|Θ = θ ] Pr[Θ = θ ] Pr[ X = x] Pr[ X = x|Θ = θ ] Pr[Θ = θ ] = °8 . θ =8 Pr[ X = x|Θ = θ ]Pr[ Θ = θ ] Pr[Θ = θ |X = x] = 13 Enfin, l’estimateur bayesien minimisant l’erreur quadratique moyenne demeure inchangé : θ̂ = E[Θ|X1 , . . . , Xn ] 8̧ = 3.2.3 θ =8 θ Pr[Θ = θ |X = x]. Cas mixtes Il est simple de dériver les formules des cas mixtes ou, par exemple, la distribution de X |Θ est discrète et celle de Θ est continue. Exemple 3.1. Un portefeuille d’assurance automobile est composé de 75 % de bons conducteurs et de 25 % de mauvais conducteurs. Les bons 1 d’avoir un accident, alors que la conducteurs ont une probabilité de 15 1 probabilité est de 10 pour les mauvais conducteurs. On suppose que le coût d’un accident est de 1 000 et qu’au plus un accident peut survenir dans une année. a) On choisit un assuré au hasard. Quelle est la probabilité que cet assuré ait un accident dans l’année qui suit ? Soit les événements : A : avoir un accident B : être un bon conducteur. On cherche Pr[ A] sachant Pr[ A| B] = 1 15 1 Pr[ A| B̄] = 10 3 Pr[ B] = 4 1 Pr[ B̄] = . 4 14 Par la loi des probabilités totales, Pr[ A] = Pr[ A| B] Pr[ B] + Pr[ A| B̄] Pr[ B̄] 1 3 1 1 + = 15 4 10 4 3 = . 40 b) Quelle est la prime pure de cet assuré la première année ? Soit S le montant total des sinistres de cet assuré. On cherche E[S]. On peut procéder de deux façons. 1. À partir de la réponse en a), on a # Pr[S = x ] = 3 40 , 37 40 , x = 1 000 ailleurs. Par conséquent, 3 E[S] = 1 000 40 = 75. 2. De l’énoncé on peut établir # Pr[S = x| B] = 1 15 , 14 15 , x = 1 000 ailleurs 1 10 , 9 10 , x = 1 000 ailleurs, et # Pr[S = x| B̄] = d’où E [ S| B ] = E[S| B̄] = 100. 200 3 Ainsi, on a E[S] = E[ E[S|type de conducteur]] = E[S| B] Pr[ B] + E[S| B̄] Pr[ B̄] 200 3 1 = + 100 3 4 4 = 75. 15 c) L’assuré choisi en a) a eu un accident dans la première année. Quelle est la probabilité qu’il s’agisse d’un bon conducteur ? On cherche Pr[ B| A]. Par la règle de Bayes, Pr[ B| A] = = = Pr[ A| B] Pr[ B] Pr[ A] 1 )( 14 ) ( 15 3 40 2 3 34 . d) Quelle est la prime pure de cet assuré pour la seconde année ? On cherche E[S| A]. Encore ici, on peut procéder de deux façons différentes, mais équivalentes. 1. On trouve la fonction de masse de probabilité de la variable aléatoire S| A. On a Pr[ A| A] = Pr[ A| B] Pr[ B| A] + Pr[ A| B̄] Pr[ B̄| A] 2 1 1 1 + = 15 3 10 3 7 = , 90 d’où # Pr[S = x| A] = et 7 90 , 83 90 , 7 E[S| A] = 1 000 90 x = 1 000 ailleurs. = 700 . 9 2. On a E[S| A] = E[S| B] Pr[ B| A] + E[S| B̄] Pr[ B̄| A] 200 2 1 = + 100 3 3 3 700 = . 9 16 3.3 Modélisation de l’hétérogénéité On utilise le modèle classique de crédibilité de précision tel qu’établi par Bühlmann (1967, 1969). On a un portefeuille (groupe) hétérogène de I contrats. Le niveau de risque du contrat i = 1, . . . , I est inconnu, mais des données Si1 , . . . , Sin sont disponibles pour fins de tarification. Soit Θi une variable aléatoire représentant le niveau de risque du contrat i. Cette variable aléatoire est supposée constante dans le temps ; non observable (facile sinon). * * * Dans l’exemple 3.1, la variable aléatoire a deux valeurs pos1 1 et θ = 10 . sibles : θ = 15 * * * On note U (θ ) la fonction de répartition de Θ, aussi appelée la fonction de structure du portefeuille, et u(θ ) la fonction de densité (ou masse) de probabilité de Θ. * * * Dans l’exemple 3.1, on a $ θ 1 15 θ= θ= 1 15 1 10 . 0, U (θ ) = 34 , ' % 1, ' & # Pr[Θ = θ ] = * 3 4, 1 4, * On fait les hypothèses suivantes. 17 ¤ θ 101 1 θ ¥ 10 1 15 * 1. Les observations du contrat i sont conditionnellement indépendantes et identiquement distribuées avec fonction de répartition F ( x|θi ). Conséquence : phénomène de contagion apparente. [Explication] 2. Les variables aléatoires Θ1 , . . . , Θ I sont identiquement distribuées avec fonction de répartition U (θ ). Conséquence : les contrats sont différents (chacun son niveau de risque), mais suffisamment similaires (les niveaux de risque proviennent tous du même processus) pour justifier de les regrouper. 3. Les contrats sont indépendants. Conséquence : le dossier d’un contrat n’a pas d’influence sur les autres contrats. On a un modèle «urne d’urne» à deux étapes : 1. choisir d’abord un niveau de risque selon U (θ ) ; 2. obtenir des montants de sinistres selon F ( x|θi ). 3.4 Prévision Le but en crédibilité de précision consiste à calculer la «meilleure» prévision du montant total des sinistres (ou toute autre quantité d’intérêt) de la prochaine année, Si,n+1 pour i = 1, . . . , I. On utilise l’erreur quadratique moyenne comme mesure de distance. 3.4.1 Prime de risque Si le niveau de risque du contrat i est connu, alors la meilleure prévision est l’espérance µ(θi ) = E[Sit |Θ = θi ] = » 8 0 x f ( x|θi ) dx. Cette fonction est appelée la prime de risque. Or, le niveau de risque et, donc, la prime de risque sont inconnus ; prévoir Si,n+1 et prévoir µ(θi ) deviennent donc des problèmes équivalents. 18 3.4.2 Prime collective Comme première approximation de la prime de risque, on peut utiliser la moyenne pondérée de toutes les primes de risque possibles : » m = E[µ(Θ)] = 8 8 µ(θ )u(θ ) dθ. Cette approximation sera la même pour tous les contrats ; c’est la prime collective. Remarque. On a m = E[µ(Θ)] = E[ E[Sit |Θ]] = E[Sit ], soit le montant moyen des sinistres dans le portefeuille. 3.4.3 Prime bayesienne On l’a vu, la prime collective est globalement adéquate, mais pas nécessairement équitable. En termes statistiques, cela signifie qu’il existe une meilleure approximation des primes de risque lorsque des données sont disponibles. La meilleure approximation (ou estimation, ou prévision) de la prime de risque µ(θi ) est la fonction des observations g (Si1 , . . . , Sin ) minimisant l’erreur quadratique moyenne E[(µ(Θ) g(Si1 , . . . , Sin ))2 ], où g() est une fonction quelconque. On peut démontrer (voir un livre de statistique mathématique) que la fonction g (Si1 , . . . , Sin ) est la prime bayesienne Bi,n+1 g (Si1 , . . . , Sin ) = E[µ(Θ)|Si1 , . . . , Sin ] = 19 » 8 8 µ(θ )u(θ |Si1 , . . . , Sin ) dθ, où u(θ |x1 , . . . , xn ) est la distribution a posteriori des niveaux de risque. En d’autres mots, U (θ |x1 , . . . , xn ) est la fonction de structure révisée après l’observation de l’expérience Si1 = x1 , . . . , Sin = xn . Or, par la règle de Bayes et étant donné l’indépendance conditionnelle des observations, f ( x , . . . , x n |θ i ) u ( θ i ) dθ u ( θ i | x1 , . . . , x n ) = ³ 8 1 8 f ( x1 , . . . , xn |θ )u(θ ) | ± = ³8 8 9 u ( θi ) n t =1 f ( x t θ i ) u ( θ i ) n t=1 f ( xt θ ) u ( θ ) dθ n ¹ ± | f ( x t |θ i ). t =1 Remarques. 1. La prime bayesienne est la meilleure prévision de Si,n+1 que l’on puisse calculer. 2. Comme la prime collective, la prime bayesienne est une moyenne pondérée des primes de risque, mais utilisant la distribution a posteriori de Θ plutôt que la distribution a priori ; comparer » m= 8 8 µ(θ )u(θ ) dθ et » Bi,n+1 = 8 8 µ(θ )u(θ |Si1 , . . . , Sin ) dθ. 3. À l’inverse, on peut interpréter la prime collective comme la prime bayesienne de première année, lorsque aucune expérience n’est disponible. 4. L’ordre des sinistres n’est pas pris en compte dans les calculs puisque f ( x1 , . . . , x n |θ i ) = n ¹ t =1 20 f ( x t |θ i ). Exemple 3.2. Soit St |Θ Poisson(Θ) et $ 0,3, Pr[Θ = θ ] = 0,5, ' % 0,2, ' & θ = 12 θ=1 θ = 2. a) Calculer les primes de risque. On a E[St |Θ = θ ] = θ, d’où µ( 12 ) = 12 µ (1) = 1 µ(2) = 2. b) Calculer la prime collective. On a m = E[µ(Θ)] = E[Θ] 1 = (0,3) + 1(0,5) + 2(0,2) 2 = 1,05. On ne peut calculer la prime collective avec la formule m = E[St ] puisque la distribution marginale est inconnue. c) Calculer la prime bayesienne pour la troisième année si S1 = 2 et S2 = 1. 1. Calculer la distribution a posteriori de Θ : Pr[Θ = θ |S1 = 2, S2 = 1] = Pr[S1 = 2, S2 = 1|Θ = θ ] Pr[Θ = θ ] θ Pr[ S1 = 2, S2 = 1|Θ = θ ] Pr[ Θ = θ ] ° 21 Or, Pr[S1 = 2, S2 = 1|Θ = θ ] = Pr[S1 = 2|Θ = θ ] Pr[S2 = 1|Θ = θ ] θ 2 eθ θeθ 2! 1! 3 2θ θ e = 2 = et donc $ 0,1245, Pr[Θ = θ |S1 = 2, S2 = 1] = 0,6109, ' % 0,2646, ' & θ = 12 θ=1 θ = 2. 2. Calculer la prime bayesienne : B3 = E[µ(Θ)|S1 = 2, S2 = 1] = E[Θ|S1 = 2, S2 = 1] 1 = (0,1245) + 1(0,6109) + 2(0,2646) 2 = 1,20. Dans le cas présent, 1,05 = m B3 S̄ = 1,5. Il importe de noter que ce n’est pas toujours le cas avec la prime bayesienne. Exemple 3.3. Considérer le portefeuille simplifié de l’exemple 1.1. Un contrat ne peut avoir au maximum qu’un seul sinistre de montant 1 par année. (En d’autres termes, l’expérience consiste en une suite de 1 et de 0 selon qu’il y a eu un sinistre dans une année ou non.) La probabilité d’avoir un sinistre est toutefois inconnue et potentiellement différente pour chaque contrat. On a donc St |Θ = θ Bernoulli(θ ), où le paramètre θ est une réalisation d’une variable aléatoire Θ. On suppose une distribution bêta de paramètres α et β pour Θ. Ainsi, on a f ( x|θ ) = θ x (1 θ )1x , 22 x = 0, 1 et u(θ ) = Γ ( α + β ) α 1 θ ( 1 θ ) β 1 , Γ(α)Γ( β) 0 θ 1. a) Calculer la prime de risque. On a E[St |Θ = θ ] = θ. b) Calculer la prime collective. On a m = E[µ(Θ)] = E[Θ] α = . α+β c) Calculer la prime bayesienne après n années. Tout d’abord, la distribution a posteriori de Θ après n années d’expérience est, à une constante de proportionnalité près, u ( θ | x1 , . . . , x n )9u ( θ i ) n ¹ f ( x t |θ i ) t =1 9θ α 1 =θ (1 θ ) ° α+ n t =1 x t β 1 n ¹ θ x t ( 1 θ ) 1 x t 1 (1 θ ) β+n°nt=1 xt 1 . t =1 La distribution de Θ|S1 = x1 , . . . , Sn = xn est donc toujours une bêta, ° n mais avec de nouveaux paramètres α̃ = α + t=1 xt et β̃ = β + n ° n t=1 xt . Par conséquent, la prime bayesienne pour l’année n + 1 est Bn+1 = E[µ(Θ)|S1 , . . . , Sn ] = E [ Θ | S1 , . . . , S n ] α̃ = α̃ + β̃ ° α + nt=1 St = . α+β+n 23 Exemple 3.4. On reprend le modèle de l’exemple 3.3, soit St |Θ = θ Bernoulli(θ ), mais en changeant la distribution de la variable Θ pour une uniforme sur l’intervalle ( a, b). ° Soit nS̄ = nt=1 St le montant total des sinistres d’un contrat. Norberg (1979) démontre que la prime bayesienne avec ce modèle est ° Bn+1 = ° nnS̄ j =1 ( 1) j (nbnS̄j)!j!a(nS̄+j+2) . nnS̄ b a j ( 1 ) j =1 (nnS̄ j)! j! (nS̄+ j+1) nS̄+ j+2 nS̄+ j+2 nS̄+ j+1 nS̄+ j+1 Cette prime bayesienne n’est pas linéaire et, de plus, elle ne se trouve pas nécessairement entre l’expérience individuelle S̄ et la prime collective m. 3.5 Approche par la distribution prédictive On a déjà vu à la section 3.4.2 que m = E[µ(Θ)] = E[Sit ]. De manière similaire, on peut démontrer que Bi,n+1 = E[µ(Θ)|Si1 , . . . , Sin ] = E[Si,n+1 |Si1 , . . . , Sin ]. La distribution de Sn+1 |S1 , . . . , Sn avec fonction de densité de probabilité f ( x|x1 , . . . , xn ) est appelée la distribution prédictive de la variable aléatoire S n +1 . Théorème 3.1. La fonction de densité de probabilité de la distribution prédictive de Sn+1 est f ( x | x1 , . . . , x n ) = » 8 8 f ( x|θ )u(θ |x1 , . . . , xn ) dθ. 24 Démonstration. f ( x | x1 , . . . , x n ) = f ( x, x1 , . . . , xn ) f ( x1 , . . . , x n ) ³ 8 f ( x, x , . . . , x |θ )u(θ ) dθ n 1 8 8 f ( x , . . . , x |θ )u(θ ) dθ n 1 8 » 8 f ( x1 , . . . , x n |θ ) u ( θ ) f ( x |θ ) ³ 8 = dθ f ( x1 , . . . , xn |θ )u(θ ) dθ 8 8 » 8 = = ³ 8 f ( x|θ )u(θ |x1 , . . . , xn ) dθ. Remarque. Puisque » f (x) = 8 8 f ( x|θ )u(θ ) dθ, alors la seule différence entre l’expression de f ( x ) et celle de f ( x|x1 , . . . , xn ) réside dans l’utilisation de la distribution a priori de Θ pour la première et de la distribution a posteriori pour la seconde. Par conséquent, u(θ |x1 , . . . , xn ) du même type que u(θ ) f ( x|x1 , . . . , xn ) du même type que f ( x ). ñ Du théorème 3.1, on a E[µ(Θ)|Si1 = x1 , . . . , Sin = xn ] = = » 8 µ(θ )u(θ |x1 , . . . , xn ) dθ x f ( x|θ ) dx u(θ |x1 , . . . , xn ) dθ 8 » » 8 8 8 » 0 8 8 » = = x 0 » = x f ( x|θ )u(θ |x1 , . . . , xn ) dx dθ f ( x|θ )u(θ |x1 , . . . , xn ) dθ dx 8 0 » » 8 8 8 0 8 x f ( x|x1 , . . . , xn ) dx = E[Si,n+1 |Si1 = x1 , . . . , Sin = xn ]. 25 Avec cette approche, la prime collective et la prime bayesienne s’interprètent toutes deux comme le montant moyen des sinistres dans le portefeuille, mais avec des pondérations différentes. 3.6 Crédibilité bayesienne linéaire (ou exacte) La prime bayesienne de l’exemple 3.3 peut se réécrire sous la forme ° α + nt=1 St Bn+1 = α+β+n n α+β α = S̄ + n+α+β n+α+βα+β = zS̄ + (1 z)m, où z= n , n+K K = α + β. Une prime de la forme πn+1 = zS̄ + (1 z)m est appelée prime de crédibilité et 0 ¤ z ¤ 1 est le facteur de crédibilité. Whitney (1918) et Bailey (1950) furent les premiers à démontrer que la prime bayesienne est une prime de crédibilité pour certaines combinaisons de distributions. Exemple 3.5 (Cas Poisson/gamma). Soit St |Θ = θ Poisson(θ ) Θ Gamma(α, λ), c’est-à-dire θ x e θ , x = 0, 1, . . . x! λα α1 λθ u(θ ) = θ e , θ ¡ 0. Γ(α) f ( x |θ ) = 26 a) Calculer la prime de risque. On a µ(θ ) = E[St |Θ = θ ] = θ. On calcule également, pour usage futur, σ2 (θ ) = Var[St |Θ = θ ] = θ. b) Calculer la prime collective. On a α m = E[µ(Θ)] = E[Θ] = . λ c) Calculer la prime bayesienne à partir de la distribution a posteriori de Θ. Tout d’abord, on a u ( θ | x1 , . . . , x n )9u ( θ ) n ¹ f ( x t |θ ) t =1 9θ α1 eλθ =θ α+ °n d’où Θ|S1 , . . . , Sn Gamma(α̃ = α + quent, la prime bayesienne est n ¹ t =1 1 t =1 x t ° θ x t e θ e ( λ + n ) θ , n t=1 St , λ̃ = λ + n). Par consé- Bn+1 = E[µ(Θ)|S1 , . . . , Sn ] = E [ Θ | S1 , . . . , S n ] α̃ = λ̃ ° α + nt=1 St = λ+n n λ α = S̄ + n+λ n+λλ = zS̄ + (1 z)m avec n . n+λ La prime bayesienne est donc linéaire dans le cas Poisson/gamma. z= 27 d) Calculer la distribution marginale de St . On a » f (x) = 8 0 f ( x|θ )u(θ ) dθ 8 λα = θ x eθ θ α1 eλθ dθ Γ(α) x! 0 » 8 λα = θ α+ x1 e(λ+1)θ dθ Γ ( α ) Γ ( x + 1) 0 λα Γ(α + x ) = Γ ( α ) Γ ( x + 1) ( λ + 1) α + x α x λ 1 Γ(α + x ) = Γ ( α ) Γ ( x + 1) λ + 1 λ+1 α+x1 α = p (1 p) x , x = 0, 1, . . . , α1 » d’où St Binomiale négative(r = α, p = λ λ +1 ). Par conséquent, α r (1 p ) = . p λ m = E [ St ] = Astuce : on peut obtenir le même résultat par les fonctions génératrices des moments : MS (t) = E[etS ] = E[ E[etS |Θ]] = E[ MS|Θ (t)] = E [ e Θ ( e 1 ) ] t = MΘ ( e t 1 ) α λ = λ + 1 et !α λ = λ +1 1 t λ +1 e 1 , ce qui est la fonction génératrice des moments d’une binomiale néλ gative de paramètres α et λ+ 1. 28 e) Calculer la prime bayesienne à partir de la distribution prédictive. Puisque Θ Gamma(α, λ) et Θ|S1 = x1 , . . . , Sn = xn Gamma(α̃, λ̃), alors Sn+1 |S1 = x1 , . . . , Sn = xn Binomiale négative(r̃, p̃) avec ņ r̃ = α̃ = α + xt t =1 p̃ = λ̃ λ+n . = λ̃ + 1 λ + n + 1 Par conséquent, Bn+1 = E[Sn+1 |S1 , . . . , Sn ] α̃ = λ̃ ° α + nt=1 St = . λ+n f) Calculer Var[S]. On peut procéder de deux façons. 1. En conditionnant sur Θ : Var[S] = E[Var[S|Θ]] + Var[ E[S|Θ]] = E[σ2 (Θ)] + Var[µ(Θ)] = E[Θ] + Var[Θ] α α = + 2 λ λ α ( λ + 1) = . λ2 29 2. Directement depuis la marginale : r (1 p ) p2 α ( λ + 1) = . λ2 Var[S] = g) Calculer la prime bayesienne pour les dix prochaines années si a priori Θ Gamma(3, 3) et que les montants de sinistres au cours de ces années sont les suivants : 5, 3, 0, 1, 1, 2, 0, 2, 0, 2. La prime bayesienne dans le cas Poisson/gamma est ° α + nt=1 xt . Bn+1 = λ+n On a donc le tableau suivant : n xn 0 1 2 3 4 5 6 7 8 9 10 – 5 3 0 1 1 2 0 2 0 2 ° xt α+ – 5 8 8 9 10 12 12 14 14 16 ° xt 3 8 11 11 12 13 15 15 17 17 19 λ+n Bn+1 3 1 4 2 5 2,2 6 1,83 7 1,71 8 1,625 9 1,667 10 1,5 11 1,54 12 1,42 13 1,46 Conclusions : La distribution a posteriori de Θ est de plus en plus concentrée au- tour de sa moyenne au fur et à mesure que l’expérience s’accumule (voir les figures 3.1–3.4). La précision de la prime bayesienne s’améliore (la vraie valeur de θ est 1,48 dans cet exemple). 30 Après 1 année 0.0 0.0 0.1 0.2 0.2 0.4 0.3 0.4 0.6 0.5 0.8 0.6 A priori 0 1 2 3 4 0 1 2 3 4 Figure 3.2: Distribution gamma avec α = 8 et λ = 4. L’espérance est égale à 2. Après 5 années Après 10 années 0.0 0.0 0.2 0.2 0.4 0.4 0.6 0.6 0.8 1.0 0.8 1.2 Figure 3.1: Distribution gamma avec α = 3 et λ = 3. L’espérance est égale à 1. 0 1 2 3 4 0 Figure 3.3: Distribution gamma avec α = 13 et λ = 8. L’espérance est égale à 1,625. 1 2 3 4 Figure 3.4: Distribution gamma avec α = 19 et λ = 13. L’espérance est égale à 1,46. 31 Exemple 3.6 (Cas exponentielle/gamma). Soit St |Θ = θ Exponentielle(θ ) Θ Gamma(α, λ). La prime de risque est µ(θ ) = 1 θ et la variance conditionnelle est σ2 ( θ ) = 1 . θ2 La prime collective est 1 m=E Θ » 8 α λ = θ α11 eλθ dθ Γ(α) 0 λ α Γ ( α 1) = Γ ( α ) λ α 1 λ . = α1 La distribution a posteriori de Θ est u ( θ | x1 , . . . , x n )9θ α 1 =θ n ¹ eλθ θeθxt α+n1 °n e ( λ + t =1 x t ) θ , t =1 d’où Θ|S1 , . . . , Sn Gamma(α̃ = α + n, λ̃ = λ + 32 ° n t =1 S t ). Quant aux distributions marginale et prédictive, on a λα 8 θ α1 λθ θe θ e dθ Γ(α) 0 » λα 8 α+11 (λ+ x)θ θ e dθ Γ(α) 0 λ α Γ ( α + 1) Γ ( α ) ( λ + x ) α +1 αλα , x ¡ 0, ( λ + x ) α +1 » f (x) = = = = d’où St Pareto(α, λ) et Sn+1 |S1 = x1 , . . . , Sn = xn Pareto(α̃ = α + n, λ̃ = λ + La prime bayesienne est donc Bn+1 = E[Θ1 |S1 , . . . , Sn ] = E [ S n + 1 | S1 , . . . , S n ] λ̃ α̃ 1° λ + nt=1 St = α+n1 n α1 λ = S̄ + n+α1 n+α1α1 = zS̄ + (1 z)m = avec z= n . n+α1 La prime bayesienne est donc linéaire. Exemple 3.7 (Cas normale/normale). Soit St |Θ Normale(Θ, σ22 ) Θ Normale(µ, σ12 ). 33 ° n t =1 x t ). Alors, µ(Θ) = Θ σ2 (Θ) = σ22 (constante) et m = E[Θ] = µ. Trouver la distribution a posteriori n’est toutefois pas une sinécure. Tout d’abord, u ( θ | x 1 , . . . , x n )9 e ( θ µ ) 2 /2σ2 1 e °n t =1 ( x t θ )2 /2σ22 . En développant l’exposant tout en laissant de côté tous les termes non fonction de θ, on obtient " # ņ 1 θ 2 2θµ 2θxt + θ 2 Exposant = + cte + 2 2 σ12 σ 2 t =1 ! # " ° 1 2 1 2θµ 2θ nt=1 xt n = θ σ2 + cte + 2 σ12 σ22 σ22 1 ! ° n 2 2 2θµ/σ1 2θ t=1 xt /σ2 + cte 1 1 n = + 2 θ 2 1 2 n 2 σ1 σ2 ( σ2 + σ2 ) ( σ12 + σn2 ) loooooomoooooon 1 2 ° n 2 t=1 xt /σ2 2 1 φ " µ/σ12 + 1 = φ θ 2 2θ 2 φ ° n 2 µ t =1 x t θ + 2 2 1 φσ1 φσ2 = + cte. 2 1/φ ! # + cte Par conséquent, Θ|S1 = x1 , . . . , Sn = xn Normale(µ̃, σ̃12 ) 34 avec σ̃12 = 1 φ σ12 σ22 = 2 σ2 + nσ12 σ12 = 1 + nσ12 /σ22 σ12 et ° n t =1 x t φσ22 ° µσ22 + σ12 nt=1 xt . σ22 + nσ12 µ µ̃ = + φσ12 = La distribution marginale de S est plus aisée à trouver à l’aide des fonctions génératrice des moments. En effet, MS (t) = E[ E[etS |Θ]] = E[eΘt+σ2 t /2 ] h i 2 2 = eσ2 t /2 E eΘt 2 2 2 2 /2 = eσ2 t 2 2 /2 eµt+σ1 t 2 2 = eµt+(σ1 +σ2 )t et donc 2 /2 S Normale(µ, σ12 + σ22 ). Puisque la distribution a posteriori de Θ est du même type que la distribution a priori, on peut immédiatement conclure que Sn+1 |S1 , . . . , Sn Normale(µ̃, σ̃12 + σ̃22 ). 35 La prime bayesienne est donc, en utilisant indifféremment l’approche de la distribution a posteriori ou de la prédictive, Bn+1 = µ̃ = nσ12 σ22 S̄ + µ nσ12 + σ22 nσ12 + σ22 = zS̄ + (1 z)m où z= n . n + σ22 /σ12 Il y a en fait cinq combinaisons de distributions qui résultent en une prime bayesienne linéaire (plus leurs convolutions) : 1. Poisson/gamma 2. Exponentielle/gamma 3. Normale/normale 4. Bernoulli/bêta 5. Géométrique/bêta. Les formules de crédibilité exacte pour les combinaisons de distributions issues de la famille exponentielle sont rassemblées dans l’annexe A du recueil d’exercices. Les commentaires suivants se rapportent à ces résultats. 1. Dans le cas normale/normale, on a σ̃12 = σ12 σ2 n 12 σ2 ¤ σ12 , +1 avec égalité seulement lorsque σ12 = 0 (le cas σ22 = 8 ne présentant aucun intérêt). Cette inégalité s’interprète comme une baisse de l’incertitude quant au niveau de risque d’un contrat au fur et à mesure que l’expérience s’accumule. 36 2. Le cas normale/normale est celui considéré par Whitney (1918), mais aussi celui dont les formules sont les plus complexes. Cela explique sans doute en partie qu’il ait éventuellement recommandé de fixer K au jugement. 3. Dans tous les cas, z Ñ 1 lorsque n Ñ 8. Le poids accordé à la prime individuelle d’un contrat va donc croissant avec le nombre d’années d’expérience disponible. 4. De plus, z = n/(n + K ) Ñ 1 lorsque K Ñ 0 et z Ñ 0 lorsque K Ñ 8. Dans le cas Poisson/gamma, où K = λ, une petite valeur de λ correspond à une grande incertitude quant au niveau de risque θ (la courbe gamma sera très évasée, voir la figure 3.5). On accorde donc peu de poids à la prime collective, d’où un grand facteur de crédibilité. 5. Dans le cas normale/normale, K est grand si σ22 est également grand ou alors si σ12 est petit. Respectivement, cela signifie que ou bien l’expérience est potentiellement si volatile que l’on ne peut s’y fier, ou bien que le niveau de risque θ est presque connu avec certitude. Dans un cas comme dans l’autre, il convient de charger la prime collective. On peut répéter une telle analyse pour chacun des autres cas. 6. À un haut niveau de risque ne correspond pas nécessairement une grande valeur de θ, comme en fait foi le cas exponentielle/gamma. 3.7 Le modèle de Jewell Le modèle de crédibilité exacte de Jewell unifie les résultats des cinq cas spéciaux étudiés précédemment. | En analyse bayesienne, si u(θ x1 , . . . , xn ) appartient à la même famille que u(θ ), on dit de u(θ ) et f ( x|θ ) qu’elles sont des conjuguées naturelles. Les lois de Poisson, exponentielle, normale, Bernouilli et géométrique appartiennent toutes à la famille exponentielle univariée, c’est-à-dire que leur fonction de densité (ou de probabilité) peut s’écrire sous la forme f ( x |θ ) = 37 p( x )eθx . q(θ ) 0.8 0.0 0.2 0.4 0.6 Gamma(3, 3) Gamma(3, 1/2) 0 2 4 6 8 10 Figure 3.5: Distributions gamma avec différents paramètres d’échelle λ. Jewell (1974) démontre que lorsqu’une fonction de vraisemblance est combinée avec sa conjuguée naturelle, alors la prime bayesienne est toujours une prime de crédibilité exacte. Goel (1982) conjecture que ceci n’arrive qu’avec les membres de la famille exponentielle : – il ne peut le prouver ; – il ne peut non plus donner de contre-exemple. 38 4 Le modèle de crédibilité de Bühlmann On a deux problèmes pratiques en crédibilité bayesienne : 1. la prime bayesienne est une prime de crédibilité dans certains cas seulement ; 2. la prime repose sur des hypothèses très subjectives pour les distributions de Θi et Sit |Θi . Pour pallier au premier problème, Bühlmann (1967) restreint l’approximation de la prime de risque aux fonctions linéaires des observations, c’est-à-dire de la forme ņ c0 + ct Sit . t =1 On verra que la meilleure approximation est une prime de crédibilité. Quant au second problème, il sera contourné en utilisant une approche non paramétrique pour calculer la prime de crédibilité, tel que proposé par Bühlmann (1969). 4.1 Notation et relations de covariance On définit la notation suivante : s2 = E[Var[Sit |Θi ]] = E[σ2 (Θi )] = EVPV de la CAS 39 a = Var[ E[Sit |Θi ]] = Var[µ(Θi )] = VHM de la CAS. Théorème 4.1. Soit X, Y et Θ des variables aléatoires dont la densité conjointe existe. Alors Cov( X, Y ) = Cov( E[ X |Θ], E[Y |Θ]) + E[Cov( X, Y |Θ)]. Démonstration. En premier lieu, noter qu’une espérance conditionnelle est une variable aléatoire. Nous utiliserons également ces deux propriétés : pour toute variable aléatoire Y, E[Y ] = E[ E[Y |Θ]] et E[Y E[Y ]] = 0. Or, Cov( X, Y ) = E[( X E[ X ])(Y E[Y ])] = E[( X E[ X |Θ] + E[ X |Θ] E[ X ]) (Y E[Y|Θ] + E[Y|Θ] E[Y ])] = E[ E[( X E[ X |Θ])(Y E[Y|Θ])|Θ]] + E[ E[( X E[ X |Θ])( E[Y|Θ] E[Y ])|Θ]] + E[ E[( E[ X |Θ] E[ X ])(Y E[Y|Θ])|Θ]] + E[( E[ X |Θ] E[ X ])( E[Y|Θ] E[Y ])] = E[ E[( X E[ X |Θ])(Y E[Y|Θ])|Θ]] + E[( E[Y|Θ] E[Y ]) E[ X E[ X |Θ]|Θ]] + E[( E[ X |Θ] E[ X ]) E[Y E[Y|Θ]|Θ]] + E[( E[ X |Θ] E[ X ])( E[Y|Θ] E[Y ])] = E[Cov( X, Y|Θ)] + 0 + 0 + Cov( E[ X |Θ], E[Y|Θ]). 40 Corollaire 4.1. En posant X Y dans le théorème 4.1, on obtient Var[ X ] = E[Var[ X |Θ]] + Var[ E[ X |Θ]]. Théorème 4.2. Soit S1 , . . . , Sn des variables aléatoires conditionnellement indépendantes sachant la variable aléatoire Θ et E [ St |Θ ] = µ ( Θ ) , Var[St |Θ] = σ (Θ), t = 1, . . . , n 2 t = 1, . . . , n. Alors # Cov(St , Su ) = a, a + s2 , = a + δtu s2 , Cov(µ(Θ), St ) = a, tu t=u t, u = 1, . . . , n où δtu est le delta de Kronecker : # δtu = 1, 0, t=u t u. Démonstration. Pour le premier résultat, on a Cov(St , Su ) = Cov( E[St |Θ], E[Su |Θ]) + E[Cov(St , Su |Θ)] = Cov(µ(Θ), µ(Θ)) + E[δtu Var[St |Θ]] = Var[µ(Θ)] + δtu E[σ2 (Θ)] = a + δtu s2 . De plus, Cov(µ(Θ), St ) = Cov(µ(Θ), E[St |Θ]) + E[Cov(µ(Θ), St |Θ)] = Var[µ(Θ)] + E[0] = a. 41 4.2 Modèle et prévision Le modèle pour portefeuille hétérogène est similaire à celui utilisé en crédibilité bayesienne, mais on relâche légèrement les hypothèses. Schématiquement, on a Variables non observables 1 Θ1 .. . S11 .. . ... S1t ... S1n .. . Si1 .. . ... Sit ... Sin .. . S I1 ... S It ... S In Θi .. . ΘI Observations ... t ... n Chaque contrat est donc caractérisé par 1. un niveau de risque θi réalisation d’une variable aléatoire Θi ; 2. des observations (Si1 , . . . , Sin ) Si . Les hypothèses du modèle de Bühlmann sont les suivantes (version la moins restrictive). (B1) Les contrats (Θi , Si ), i = 1, . . . , I sont indépendants, les variables aléatoires Θ1 , . . . , Θ I sont identiquement distribuées et les variables aléatoires Sit ont une variance finie. (B2) Les variables aléatoires Sit , sont telles que E[Sit |Θi ] = µ(Θi ) i = 1, . . . , I Cov(Sit , Siu |Θi ) = δtu σ (Θi ), 2 t, u = 1, . . . , n. Remarques. 1. L’hypothèse d’indépendance entre les contrats peut ne pas être réaliste, mais a) elle simplifie les calculs ; et b) c’est une bonne approximation dans plusieurs cas. 2. Hypothèse (B1) : indépendance inter contrats (between). 42 3. Hypothèse (B2) : homogénéité temporelle et «indépendance» intra contrats (within), c’est-à-dire : µ(Θi ) constante dans le temps ; observations conditionnellement non corrélées. Théorème 4.3. Pour un portefeuille tel qu’illustré précédemment et sous les hypothèses (B1) et (B2), la meilleure approximation linéaire non homogène de la prime de risque µ(Θi ) est B πi,n +1 = z S̄i + (1 z ) m où 1 S̄i = n z= ņ Sit t =1 n , n+K K= s2 . a Démonstration. On se restreint aux approximations de la prime de risque ° ° de la forme c0i + jI=1 nt=1 cijt S jt . Il faut donc trouver les constantes i , . . . , ci minimisant c0i , c11 kn E µ ( Θi ) c0i I̧ ņ cijt S jt 2 . j =1 t =1 Par indépendance entre les contrats, on sait déjà que la prime de crédibilité du contrat i sera une fonction de ses observations seulement. On peut donc réduire le problème à trouver les constantes c0 , c1 , . . . , cn minimisant ņ 2 E µ ( Θ i ) c0 ct Sit . t =1 43 En calculant les dérivées partielles, d’abord par rapport à c0 , puis par rapport à cu , u = 1, . . . , n, on obtient c0 = E[µ(Θi )] ņ ct E[Sit ] (4.1) t =1 ņ Cov(µ(Θi ), Siu ) = ct Cov(Sit , Siu ). t =1 Or, l’équation (4.2) peut se réécrire ņ ct ( a + δtu s2 ) a= t =1 ņ c t + c u s2 . =a t =1 Par symétrie, on peut conclure que c1 = c2 = = cn = c = a . an + s2 De l’équation (4.1), on obtient c0 = (1 nc)m et donc ņ B πi,n +1 = c 0 + ct Sit t =1 ņ an Sit an = + 1 m an + s2 t=1 n an + s2 = zS̄i + (1 z)m avec z = n/(n + s2 /a). Remarques. 44 (4.2) 1. Remplacer µ(Θi ) dans le théorème par Si,n+1 ne change rien puisque E[µ(Θi )] = E[Si,n+1 ] = m et Cov(µ(Θi ), Sit ) = Cov(Si,n+1 , Sit ) = a pour t = 1, . . . , n. 2. La prime de crédibilité a deux belles propriétés : a) elle est sans biais, c’est-à-dire que B E[πi,n +1 ] = zE [ S̄i ] + (1 z ) m = m. En moyenne, l’assureur perçoit donc suffisamment de primes pour payer les sinistres ; b) puisque S̄i nÑ8 Ñ8 1 alors π B nÝÑ Ñ8 µ(Θ ). ÝÑ µ(Θi ) et z nÝÑ i i,n+1 B 3. Puisque πi,n +1 est sans biais, une mauvaise estimation du facteur de crédibilité n’a pas d’impact négatif sur le montant des primes perçu par l’assureur. 4. À cause de l’indépendance des contrats, les données collatérales, les données des autres contrats, n’entrent pour le moment pas dans l’estimation de µ(Θi ) (cijt = 0 pour j i). 5. Une approximation linéaire homogène de µ(Θi ) est de la forme I̧ ņ cijt S jt . j =1 t =1 Il est facile de démontrer que l’approximation est alors z X̄i + (1 z)S̄, 1 S̄ = I I̧ S̄i . i =1 6. La prime de crédibilité peut aussi s’écrire sous la forme B πi,n +1 = m + z ( S̄i m ). 45 Il est intéressant de constater que la meilleure approximation linéaire de la prime de risque est également la meilleure approximation linéaire de la prime bayesienne. B Théorème 4.4. Si πi,n +1 est la combinaison linéaire des observations minimisant ņ 2 E µ ( Θ i ) c0 ct Sit , t =1 B alors πi,n +1 minimise également E ņ Bi,n+1 c0 ct Sit 2 , t =1 où Bi,n+1 = E[µ(Θi )|Si ]. Démonstration. On a ņ 2 ct Sit E µ ( Θ i ) c0 t =1 =E µ(Θi ) Bi,n+1 2 h + 2E E µ(Θi ) Bi,n+1 Bi,n+1 c0 ņ i ct Sit Si t =1 +E ņ Bi,n+1 c0 ct Sit 2 t =1 =E Bi,n+1 c0 ņ ct Sit 2 + 0 + constante. t =1 Corollaire 4.2. On a B 2 2 E[(µ(Θi ) πi,n +1 ) ] ¥ E [(µ ( Θi ) Bi,n+1 ) ] , l’égalité survenant lorsque la prime bayesienne est une prime de crédibilité. 46 Ce résultat s’interprète comme une minimisation en deux étapes : 1. trouver la meilleure approximation de la prime de risque (prime bayesienne) ; 2. trouver la meilleure approximation linéaire de la prime bayesienne (prime de crédibilité). 4.3 Approche paramétrique Dans un premier temps, on peut considérer que les distributions de Sit |Θi et de Θi sont connues, comme en crédibilité bayesienne. La notion de portefeuille n’est alors pas nécessaire puisque l’on détermine les distributions pour chaque contrat. On peut laisser tomber l’indice i dans les formules. Il est maintenant très simple de calculer la prime de crédibilité de Bühlmann pour n’importe quelle combinaison de distributions. Exemple 4.1 (Bernoulli/uniforme). On a vu à l’exemple 3.4 que si St |Θ = θ Bernoulli(θ ) Θ U ( a, b), alors la prime bayesienne est très compliquée. Ici, µ(θ ) = θ et σ2 (θ ) = θ (1 θ ), d’où m = E[µ(Θ)] = E[Θ] a+b = 2 2 s = E[σ2 (Θ)] = E [ Θ ] E [ Θ2 ] = a + b a2 + ab + b2 + 2 3 47 a = Var[µ(Θ)] = Var[Θ] = ( b a )2 , 12 donc s2 a 6( a + b) 4( a2 + ab + s2 ) = ( b a )2 K= et πnB+1 n n a+b = S̄ + 1 . n+K n+K 2 Exemple 4.2 (Poisson/gamma). On a St |Θ = θ Poisson(θ ) Θ Gamma(α, λ). On sait déjà que µ(θ ) = σ2 (θ ) = θ. Par conséquent, α λ α s2 = E [ Θ ] = λ m = E[Θ] = a = Var[Θ] = α , λ2 d’où K= s2 =λ a et πnB+1 = n λ α S̄ + . n+λ n+λλ 48 Exemple 4.3. Soit St |Θ = θ Exponentielle(θ ) Θ Gamma(α, λ). Alors, 1 , Θ 1 σ2 ( Θ ) = 2 Θ µ(Θ) = et donc 1 s =E 2 Θ 2 1 1 a=E 2 E . Θ Θ 2 Or, pour k P Z, » λα 8 α+k1 λθ E[Θ ] = θ e dθ Γ(α) 0 k λα Γ (α + k ) 8 λα+k = θ α+k1 eλθ dθ α + k Γ(α) λ 0 Γ(α + k) Γ(α + k) = Γ(α)λk $ ' α ( α + 1) ( α + k 1) ' , k¥1 ' ' λk & k=0 = 1, ' | k | ' λ ' ' % , k ¤ 1, |k| α. (α 1)(α 2) (α |k|) » On a donc E [ Θ 1 ] = E [ Θ 2 ] = λ α1 λ2 (α 1)(α 2) 49 et ainsi λ2 (α 1)(α 2) λ2 λ2 a= (α 1)(α 2) (α 1)2 λ2 . = ( α 1)2 ( α 2) s2 = Finalement, K= s2 =α1 a et le facteur de crédibilité dans la prime de Bühlmann est donc z= n , n+α1 tel qu’obtenu à l’exemple 3.6. 4.4 Approche non paramétrique En pratique, l’approche paramétrique est d’un intérêt limité puisqu’elle nécessite toujours de déterminer les distributions de Sit |Θi et Θi . Avec l’approche non paramétrique, nous délaissons l’approche bayesienne pure pour l’approche bayesienne empirique. Nous avons plusieurs réalisations de la variable aléatoire Θ. U (θ ) est la fonction de structure du portefeuille : – avant : opinion a priori de l’assureur sur le niveau de risque d’un contrat ; – maintenant : proportion de contrats avec un niveau de risque inférieur ou égal à θ, distribution des niveaux de risque entre les contrats. 50 Homogénéité du portefeuille : à quel point les moyennes des contrats sont semblables. Nous devons estimer les paramètres de structure du portefeuille : 1. m = E[µ(Θ)], moyenne du portefeuille ; 2. s2 = E[σ2 (Θ)], variabilité moyenne du portefeuille, homogénéité temporelle ; 3. a = Var[µ(Θ)], variance entre les moyennes des contrats, homogénéité du portefeuille. Nous développons des estimateurs sans biais des paramètres. 4.4.1 Estimation de m Intuitivement, 1 m̂ = S̄ = In I̧ ņ Sit . i =1 t =1 L’estimateur est effectivement sans biais : E[m̂] = = 1 In 1 In I̧ ņ E[Sit ] i =1 t =1 I̧ ņ m i =1 t =1 = m. 4.4.2 Estimation de s2 Un estimateur sans biais de la variance du contrat i = 1, . . . , n est 1 n1 ņ (Sit S̄i )2 , t =1 51 n ¥ 2. Pour obtenir un estimateur sans biais de s2 , on prend la moyenne de tous ces estimateurs : ŝ2 = I̧ 1 I ( n 1) ņ (Sit S̄i )2 . i =1 t =1 Pour démontrer l’absence de biais, on note d’abord que E[(Sit S̄i )2 |Θi ] = Var[Sit S̄i |Θi ] = Var[Sit |Θi ] + Var[S̄i |Θi ] 2Cov(Sit , S̄i |Θi ) σ2 ( Θi ) n = σ2 ( Θi ) + = n1 2 σ ( Θ i ). n 2 σ (nΘi ) 2 Par conséquent, E[(Sit S̄i )2 ] = E[ E[(Sit S̄i )2 |Θi ]] n1 = E[σ2 (Θi )] n n1 2 = s n et E[ŝ2 ] = I̧ 1 I ( n 1) ņ i =1 t =1 n1 2 s n 2 =s . 4.4.3 Estimation de a Un estimateur intuitif de a = Var[µ(Θ)] est 1 I1 I̧ (S̄i S̄)2 . i =1 52 Or, cet estimateur est biaisé. En effet, on a E[(S̄i S̄)2 ] = Var[S̄i S̄] = Var[S̄i ] + Var[S̄] 2Cov(S̄i , S̄). Par indépendance entre les contrats, on a 1 Cov(S̄i , S̄) = I = I̧ Cov(S̄i , S̄ j ) j =1 1 Var[S̄i ] I et Var[S̄] = d’où Var[S̄i ] , I E[(S̄i S̄)2 ] = et " E I̧ 1 I1 I1 Var[S̄i ]. I # (S̄i S̄)2 = Var[S̄i ]. i =1 Or, Var[S̄i ] = Var[ E[S̄i |Θi ]] + E[Var[S̄i |Θi ]] 2 σ ( Θi ) = Var[µ(Θi )] + E n 2 s =a+ . n Un estimateur sans biais de a est donc â = 1 I1 I̧ (S̄i S̄)2 i =1 1 2 ŝ . n Problème : l’estimateur â peut être négatif. En pratique, on posera â1 = max( â, 0), qui est un estimateur biaisé. 53 4.4.4 Prime de crédibilité On estime la prime de crédibilité en remplaçant chaque paramètre inconnu par son estimateur : B π̂i,n +1 = ẑ S̄i + (1 ẑ ) m̂ n . ẑ = n + ŝ2 / â Bien que tous les estimateurs soient sans biais, on ne peut conclure que E[K̂ ] = K et donc que E[ẑ] = z. Par conséquent, l’estimateur de la prime de crédibilité est fort probablement biaisé. Exemple 4.4. Soit le portefeuille de I = 3 contrats suivant après n = 6 années d’expérience. Années Contrat 1 2 3 4 5 6 1 2 3 0 3 3 1 4 3 2 2 2 1 1 1 2 4 2 0 4 1 Calculer la prime de crédibilité pour la septième année pour chacun des contrats. Tout d’abord, on a S̄1 = 1 S̄2 = 3 S̄3 = 2 et S̄ = 2. On doit par la suite calculer les estimateurs des paramètres de 54 structure : m̂ = S̄ = 2 1 ŝ = I I̧ ņ 1 2 i =1 n1 (Sit S̄i )2 t =1 1 4 8 4 16 = + + = 3 5 5 5 15 â = I̧ 1 I1 (S̄i S̄)2 i =1 1 2 ŝ n 2 1 16 37 = = . 2 6 15 45 Par conséquent, K̂ = 48/37 1,30 et ẑ = 6 = 0,82, 6 + 1,30 d’où B π̂1,7 = 0,82(1) + 0,18(2) = 1,18 B π̂2,7 = 2,82 B π̂3,7 = 2. On peut obtenir les mêmes résultats avec la fonction cm de actuar (Dutang et collab., 2008). # ## # ## # ## # ## # ## # ## # ## # ## # ## # ## # ## # ## ACT 2008 Mathématiques actuarielles IARD II Vincent Goulet École d ’ actuariat , Université Laval FICHIER exemple _ 4.4. R CONTENU 55 # ## Calculs de l ’ exemple 4.4 avec la fonction cm () de actuar ## Charger le package actuar en mémoire library ( actuar ) ## ## ## (x Les données doivent se trouver dans un data frame ou une matrice , avec une colonne pour identifier le " numéro " du contrat . Les colonnes doivent être étiquetées . <- data . frame ( contract = 1:3 , matrix (c(0 , 3, 3, 1, 4, 3, 2, 2, 2, 1, 1, 1, 2, 4, 2, 0, 4, 1) , nrow = 3))) ## Ajustement du modèle de Bühlmann aux données . Par défaut , la ## fonction considérera que toutes les colonnes ( autres que celles ## présentes dans la formule ) contiennent des données . ( fit <- cm (~ contract , x )) # appel simple ( fit <- cm (~ contract , x , ratios = X1 : X6 )) # équivalent ici ## Calcul des primes de crédibilité . predict ( fit ) ## Résultats détaillés . summary ( fit ) 4.5 Interprétation des résultats On s’attarde principalement au facteur de crédibilité z= n , n+K K= s2 E[σ2 (Θ)] = . a Var[µ(Θ)] 56 Le facteur de crédibilité augmente — un plus grand poids est donné à l’expérience individuelle — dans les situations suivantes : 1. le nombre d’années d’expérience est grand, n Ñ 8. À long terme, l’expérience d’un contrat représente exactement son niveau de risque. C’est la même situation qu’en crédibilité de stabilité, c’est-à-dire que le niveau de crédibilité augmente avec le volume d’expérience ; 2. le paramètre s2 est petit, s2 Ñ 0, l’expérience est globalement stable dans le temps. Les moyennes S̄i représentent alors bien les niveaux de risque des contrats, ce qui réduit l’utilité de la prime collective. 3. le paramètre a est grand, a Ñ 8, le portefeuille est hétérogène. Dans un tel cas, les moyennes individuelles sont de meilleures approximations des primes de risque que la prime collective. On notera au passage que a est en général le paramètre le plus intéressant et celui qui fluctue le plus d’un portefeuille à un autre. Les figure 4.1 et 4.2 illustrent les points 2 et 3 ci-dessus. Chaque courbe représente l’expérience d’un contrat. Dans les deux cas, le facteur de crédibilité est plus grand dans le graphique de droite. Remarques. 1. Si s2 et a varient en des directions opposées, il devient difficile d’interpréter les résultats. B 2. Si S̄1 = = S̄ I = S̄, alors a = 0 et la prime de crédibilité est πi,n +1 = S̄ = S̄i pour chaque contrat. Pourquoi alors ne pas charger tout simplement S̄i ? Parce que dans une telle situation, il n’est pas nécessaire de faire de la tarification basée sur l’expérience. 57 0 5 10 15 20 0 5 10 15 20 Figure 4.1: Effet de s2 = E[σ2 (Θ)] sur le facteur de crédibilité. Gauche : grand s2 , l’expérience est trop volatile pour être fiable. Droite : petit s2 , les moyennes individuelles sont fiables. Les moyennes sont identiques dans les deux graphiques. 0 5 10 15 20 0 5 10 15 20 Figure 4.2: Effet de a = Var[µ(Θ)] sur le facteur de crédibilité. Gauche : petit a, le portefeuille est homogène. Droite : grand a, le portefeuille est hétérogène. Les variances sont identiques dans les deux graphiques. 58 5 Le modèle de Bühlmann–Straub Le modèle de Bühlmann–Straub est une généralisation du modèle de Bühlmann tenant compte de l’exposition au risque des contrats. Ceci est particulièrement important dans les situations où la taille des contrats varie beaucoup. Par exemple, en accidents de travail, l’exposition au risque d’un employeur avec 1 000 employés au beaucoup plus grande que celle d’un employeur avec seulement 10 employés. 5.1 Modèle et prévision Dans la forme la plus générale du modèle de Bühlmann–Straub, on associe un poids wit à chaque donnée, qui sera maintenant notés Xit . Schématiquement, on a maintenant Variables non observables 1 Θ1 .. . X11 .. . ... X1t Xi1 .. . ... X I1 ... Θi .. . ΘI Observations ... t ... Poids ... t ... n 1 ... X1n .. . w11 .. . ... w1t ... w1n .. . Xit ... Xin .. . wi1 .. . ... wit ... win .. . X It ... X In w I1 ... w It ... w In 59 n Intuitivement, on s’attend à ce que l’expérience d’un «gros» contrat soit plus stable dans le temps que celle d’un «petit» contrat. Pour que le modèle réflète cela, l’hypothèse de variances conditionnelles identiques du modèle de Bühlmann est modifiée. Les hypothèses du modèle de Bühlmann–Straub sont les suivantes. (BS1) Les contrats (Θi , X i ), i = 1, . . . , I sont indépendants, les variables aléatoires Θ1 , . . . , Θ I sont identiquement distribuées et les variables aléatoires Xit ont une variance finie. (BS2) Les variables aléatoires Xit , sont telles que E[ Xit |Θi ] = µ(Θi ) Cov( Xit , Xiu |Θi ) = δtu σ2 ( Θ wit i = 1, . . . , I i) , t, u = 1, . . . , n. On a donc Var[ Xit |Θi ] = σ2 ( Θi ) . wit Pour que cette relation soit vraie, les variables aléatoires Xit doivent être des ratios. La définition la plus usuelle de Xit est Xit = Sit wit où, par exemple Sit est le montant total des sinistres et wit est la prime totale payée (loss ratio) ; Sit est le montant total des sinistres et wit est la masse salariale ; Sit est le nombre d’accidents dans une flotte de véhicules et wit est le nombre de véhicules ; etc. 60 5.1.1 Notation et relations de covariance On définit la notation suivante : ņ wi Σ = wit t =1 I̧ wΣΣ = I̧ ņ wi Σ = i =1 t =1 i =1 I̧ zΣ = wit zi i =1 ņ Xiw = t =1 I̧ Xww = i =1 I̧ Xzw = i =1 wit X wiΣ it wi Σ X = wΣΣ iw I̧ ņ i =1 t =1 wit X wΣΣ it zi X . zΣ iw Théorème 5.1. Soit Xit , i = 1, . . . I, t = 1, . . . , n des variables aléatoires satisfaisant les hypothèses (BS1) et (BS2) ci-dessus. Alors, Cov( Xit , Xku ) = δik s2 a + δtu wit Cov(µ(Θi ), Xku ) = δik a s2 . Cov( Xit , Xkw ) = δik a + wi Σ Démonstration. Tout d’abord, toutes les covariance sont nulles lorsque i k par indépendance entre les contrats. Les deux premiers résultats sont équivalents à ceux du théorème 4.2 à 61 la seule différence que σ2 ( Θi ) E[Var[ Xit |Θi ]] = E wit s2 = . wit Pour le troisième résultat, on a ņ wit Cov( Xit , Xiu ) w u =1 i Σ ņ wit s2 = a + δtu wi Σ wit Cov( Xit , Xiw ) = u =1 wit s2 wiΣ wit s2 . =a+ wi Σ =a+ 5.1.2 Meilleure prévision linéaire Tout comme dans le modèle de Bühlmann, on recherche la meilleure approximation linéaire de la prime de risque d’un contrat. Théorème 5.2. Pour un portefeuille tel qu’illustré précédemment et sous les hypothèses (BS1) et (BS2), la meilleure approximation linéaire non homogène de la prime de risque µ(Θi ) — ou de Xi,n+1 — est BS πi,n +1 = zi Xiw + (1 zi ) m où zi = wi Σ , wi Σ + K 62 K= s2 . a Démonstration. La démonstration est similaire à celle du théorème 4.3. Comme précédemment, on peut se restreindre à trouver les constantes c0 , c1 , . . . , cn minimisant ņ 2 E µ ( Θ i ) c0 ct Xit . t =1 En calculant les dérivées partielles, d’abord par rapport à c0 , puis par rapport à cu , u = 1, . . . , n, on obtient ņ c0 = E[µ(Θi )] ct E[ Xit ] (5.1) t =1 ņ Cov(µ(Θi ), Xiu ) = ct Cov( Xit , Xiu ). t =1 Or, l’équation (5.2) peut se réécrire ņ s2 ct a + δtu a= wiu t =1 = acΣ + cu s2 . wiu Par symétrie, on a que c1 c cn cΣ = 2 = = = = Ri . wi1 wi2 win wi Σ Par conséquent, a = awiΣ Ri + Ri s2 d’où Ri = a ct = 2 wit awiΣ + s et donc wit awiΣ wiΣ awiΣ + s2 w = it zi . wi Σ ct = 63 (5.2) De l’équation (4.1), on obtient ņ c0 = m t =1 wit zm wi Σ i = (1 z i ) m et donc ņ BS πi,n +1 = c0 + ct Xit t =1 = (1 z i ) m + ņ t =1 wit zX wiΣ i it = zi Xiw + (1 zi )m. 5.2 Estimation des paramètres de structure Les paramètres de structure à estimer à partir des données sont les mêmes que précédemment, soit m, s2 et a. 5.2.1 Estimation de m Un estimateur intuitif de m est I̧ wi Σ X . wΣΣ iw Xww = i =1 Or, on peut démontrer qu’en théorie de la crédibilité l’estimateur linéaire à variance minimale est plutôt I̧ m̂ = Xzw = i =1 zi X . zΣ iw Remarque. Formellement, Xzw n’est pas un estimateur puisqu’il dépend des paramètres inconnus s2 et a. On appellera de tels estimateurs des pseudo-estimateurs (De Vylder, 1981). 64 5.2.2 Estimation de s2 En généralisant simplement l’estimateur obtenu dans le modèle de Bühlmann, on obtient l’estimateur sans biais ŝ2 = 5.2.3 I̧ 1 I ( n 1) ņ wit ( Xit Xiw )2 . i =1 t =1 Estimation de a Du chapitre 4, on soupçonne que l’estimateur intuitif I̧ wiΣ ( Xiw Xww )2 i =1 est biaisé. En effet, on démontre sans grande difficulté que E[( Xiw Xww )2 ] = Var[ Xiw ] + Var[ Xww ] 2 Cov( Xiw , Xww ) ! I̧ 1 1 wi Σ wi Σ 2 2 +s , = a 12 + wΣΣ wΣΣ wiΣ wΣΣ i =1 d’où " I̧ E # wiΣ ( Xiw Xww )2 = a i =1 w2ΣΣ iI=1 wi2Σ wΣΣ ° ! + ( I 1) s2 . Un estimateur sans biais du paramètre a est donc â = wΣΣ w2 ΣΣ ° I 2 i =1 wi Σ I̧ ! wiΣ ( Xiw Xww )2 ( I 1)ŝ2 . i =1 Cet estimateur peut être négatif. Si l’on utilise plutôt â1 = max( â, 0), on a un estimateur biaisé. 65 5.2.4 Autre estimateur de a L’estimateur de Bichsel–Straub du paramètre a est sans biais et toujours positif : ã = 1 I1 I̧ zi ( Xiw Xzw )2 . i =1 Remarques. 1. Il n’y a rien de gratuit : ã est un pseudo-estimateur ; ã est sans biais seulement si les facteurs de crédibilité sont connus. Sinon, l’espérance est impossible à calculer. 2. On a en fait ã = f ( ã). L’estimation est donc calculée par la méthode du point fixe. 3. On peut démontrer que si â 0, alors ã converge vers 0. 5.2.5 Sommaire des calculs 1. Calculer wiΣ , i = 1, . . . , I et wΣΣ . 2. Calculer Xiw , i = 1, . . . , I et Xww . 3. Calculer ŝ2 . 4. Calculer â. 5. Si â ¡ 0 : 5.1 calculer ã et poser â = ã ; 5.2 calculer ẑ = wi Σ ; wiΣ + ŝ2 / â 5.3 calculer I̧ m̂ = i =1 6. Sinon 6.1 poser â = 0 ; 66 ẑi X . ẑΣ iw 6.2 poser ẑi = 0, i = 1, . . . , I ; 6.3 poser m̂ = Xww . 7. Calculer les primes de crédibilité BS π̂i,n +1 = ẑi Xiw + (1 ẑi ) m̂, 5.3 i = 1, . . . , I. Données manquantes Dans l’application du modèle de Bühlmann–Straub, il arrive fréquemment que le nombre d’observations ne soit pas le même pour tous les contrats. Les données et les poids sont alors disponibles pour i = 1, . . . , I et t = 1, . . . , ni (en supposant les données contiguës). On aura donc, par exemple, n i ¸ wi Σ = wit t =1 ou n i ¸ Xiw = t =1 wit X . wiΣ it La seule formule affectée par ce changement est celle de ŝ2 : 2 ŝ = 5.4 ° 1 I i =1 ( n i I̧ ņ 1 ) i =1 t =1 wit ( Xit Xiw )2 . Exemple numérique Les résultats de cette section sont tirés de Goovaerts et Hoogstad (1987), eux-mêmes basés sur les données de Hachemeister (1975). Ces données 67 sont composées de montants de sinistres moyens au chapitre de la responsabilité civile en assurance automobile entre juillet 1970 et juin 1973 dans cinq états américains. On a donc I = 5 contrats et n = 12 périodes d’expérience. Les montants de sinistres moyens Xit sont présentés au tableau 5.1 (à noter que le tableau est transposé par rapport à la notation usuelle). Au tableau 5.2, on trouvera les poids wit associés aux données précédentes. Il s’agit ici du nombre total de sinistres dans chaque période pour chaque état, soit le dénominateur des ratios Xit . On remarquera que le nombre de sinistres est beaucoup plus élevé dans l’État 1 et, quoique dans une moindre mesure, dans l’État 5. 5.4.1 Résultats avec le modèle de Bühlmann On illustre d’abord le modèle de Bühlmann en ignorant les poids rattachés aux données. Les estimateurs des paramètres de structure sont les suivants : m̂ = 1 671 ŝ2 = 46 040 â = 72 310, ce qui mène aux résultats du tableau 5.3. Le facteur de crédibilité est plutôt élevé. Une analyse rapide des données suffit pour constater que l’expérience des états est relativement stable dans le temps. Il en résulte une valeur de ŝ2 petite par rapport à celle de â et, donc, un grand facteur de crédibilité. Pour l’État 1, dont l’expérience est la pire du portefeuille, un grand facteur de crédibilité a pour effet de ne réduire la prime de crédibilité (2 044) que de 1% par rapport à la prime individuelle (2 064). 5.4.2 Résultats avec le modèle de Bühlmann–Straub Le tableau 5.2 montre que le poids relatif de chacun des cinq états (poids mesuré en nombre de sinistres) est très différent : l’État 1 compte pour 68 t=1 t=2 t=3 t=4 t=5 t=6 t=7 t=8 t=9 t = 10 t = 11 t = 12 i=1 i=2 i=3 i=4 i=5 1738 1642 1794 2051 2079 2234 2032 2035 2115 2262 2267 2517 1364 1408 1597 1444 1342 1675 1470 1448 1464 1831 1612 1471 1759 1685 1479 1763 1674 2103 1502 1622 1828 2155 2233 2059 1223 1146 1010 1257 1426 1532 1953 1123 1343 1243 1762 1306 1456 1499 1609 1741 1482 1572 1606 1735 1607 1573 1613 1690 Table 5.1: Montants de sinistres moyens (ratios Xit ) dans le portefeuille de Hachemeister t=1 t=2 t=3 t=4 t=5 t=6 t=7 t=8 t=9 t = 10 t = 11 t = 12 i=1 i=2 i=3 i=4 i=5 7861 9251 8706 8575 7917 8263 9456 8003 7365 7832 7849 9077 1622 1742 1523 1515 1622 1602 1964 1515 1527 1748 1654 1861 1147 1357 1329 1204 998 1077 1277 1218 896 1003 1108 1121 407 396 348 341 315 328 352 331 287 384 321 342 2902 3172 3046 3068 2693 2910 3275 2697 2663 3017 3242 3425 Table 5.2: Nombres totaux de sinistres (poids wit ) dans le portefeuille de Hachemeister 69 i=1 Prime individuelle X̄i B Prime de crédibilité πi,13 Facteur de crédibilité z i=2 i=3 i=4 i=5 2 064 1 511 1 822 1 360 1 599 2 044 1 519 1 814 1 376 1 602 0,95 0,95 0,95 0,95 0,95 Table 5.3: Résultats avec le modèle de Bühlmann pour le portefeuille de Hachemeister i=1 Prime individuelle Xiw BS Prime de crédibilité πi,13 Facteur de crédibilité z i=2 i=3 i=4 i=5 2 061 1 511 1 806 1 353 1 600 2 053 1 529 1 790 1 468 1 605 0,98 0,90 0,86 0,66 0,94 Table 5.4: Résultats avec le modèle de Bühlmann-Straub pour le portefeuille de Hachemeister 57,5% des sinistres du portefeuille, alors qu’à l’opposé l’État 4 ne compte que pour 2,4%. Dans une telle situation, il convient d’utiliser le modèle de Bühlmann–Straub dans la tarification afin de tenir compte des volumes très différents d’un contrat à un autre. Les estimateurs des paramètres de structure sont les suivants : m̂ = Xzw = 1 689 ŝ2 = 139 120 026 â = 89 639 ã = 64 367. On notera que l’estimateur Xzw de la moyenne collective ainsi que les primes de crédibilité du tableau 5.4 ont été calculés avec l’estimateur ã de la variance entre les moyennes. C’est pour l’État 4 que les différences entre les résultats des tableaux 5.3 et 5.4 sont les plus marquées. La prime de crédibilité de cet état augmente en effet de 1 376 à 1 468. Ceci est en partie dû à l’augmentation de l’estimateur de la prime collective, mais surtout à la forte baisse de son facteur de crédibilité. Le modèle de Bühlmann–Straub permet donc de 70 reconnaître le rôle minime joué par cet état dans les résultats du portefeuille. C’est pourquoi on y accorde peu de poids lors de la répartition des primes. 5.4.3 Limitations des modèles précédents L’examen des données de l’État 1 montre que le montant moyen des sinistres va en augmentant d’une période à l’autre. Or la prime de crédibilité calculée avec le modèle de Bühlmann–Straub se trouve environ au niveau de la période 8. Il semble donc évident que la prime de crédibilité s’avèrera trop peu élevée. C’est afin de pouvoir traiter de tels cas que Hachemeister (1975) a proposé son modèle de crédibilité avec régression. L’utilisation d’un tel modèle est particulièrement indiquée dans des situations de forte inflation ou d’augmentation ou diminution structurelle des coûts. 71 Bibliographie Bailey, A. L. 1945, «A generalized theory of credibility», Proceedings of the Casualty Actuarial Society, vol. 32, p. 13–20. Bailey, A. L. 1950, «Credibility procedures, Laplace’s generalization of Bayes’ rule and the combination of collateral knowledge with observed data», Proceedings of the Casualty Actuarial Society, vol. 37, p. 7–23. Bühlmann, H. 1967, «Experience rating and credibility», ASTIN Bulletin, vol. 4, p. 199–207. Bühlmann, H. 1969, «Experience rating and credibility», ASTIN Bulletin, vol. 5, p. 157–165. De Vylder, F. 1981, «Practical credibility theory with emphasis on parameter estimation», ASTIN Bulletin, vol. 12, p. 115–131. Dutang, C., V. Goulet et M. Pigeon. 2008, «actuar: An R package for actuarial science», Journal of Statistical Software, vol. 25, no 7. URL http://www.jstatsoft.org/v25/i07. Goel, P. K. 1982, «On implications of credible means being exact bayesian», Scandinavian Actuarial Journal, p. 41–46. Goovaerts, M. J. et W. J. Hoogstad. 1987, Credibility Theory, no 4 dans Surveys of actuarial studies, Nationale-Nederlanden N.V., Netherlands. Hachemeister, C. A. 1975, «Credibility for regression models with application to trend», dans Credibility, theory and applications, Proceedings 73 of the Berkeley actuarial research conference on credibility, Academic Press, New York, p. 129–163. Jewell, W. S. 1974, «Credible means are exact bayesian for exponential families», ASTIN Bulletin, vol. 8, p. 77–90. Mowbray, A. H. 1914, «How extensive a payroll exposure is necessary to give a dependable pure premium?», Proceedings of the Casualty Actuarial Society, vol. 1, p. 25–30. Norberg, R. 1979, «The credibility approach to ratemaking», Scandinavian Actuarial Journal, vol. 1979, p. 181–221. Whitney, A. W. 1918, «The theory of experience rating», Proceedings of the Casualty Actuarial Society, vol. 4, p. 275–293. 74