Gestion des risques

L’utilisation de la data science, ou la fin de la mutualisation solidaire des risques ?

Créé le

04.05.2020

Les données sont à la base de la segmentation des tarifs et permettent en cela une meilleure maîtrise du risque. L’afflux de nouvelles données permettant une connaissance accrue du client et une individualisation des offres va-t-il jusqu’à remettre en cause le concept de mutualisation des risques, l’un des fondements de la théorie de l’assurance ?

L’utilisation de la data science, ou la fin de la mutualisation solidaire des risques ?

Master Enass 2019 Marsh SAS

L’émergence d’Internet et la création de nombreux objets connectés permettent aujourd’hui la collecte d’une masse de données jamais détenue par quiconque dans le passé, même récent. Or les données sont le fondement du business model des assureurs. Elles servent en effet à tarifer les risques en fonction des historiques des sinistres (les données de l’assureur) et à segmenter les tarifs, en croisant les données historiques avec les déclarations de l’assuré.

Les moines copistes n’ont pas survécu à l’invention de l’imprimerie au XVe siècle, qui a ensuite permis la démocratisation de la lecture, et donc du savoir. Aujourd’hui, notamment en France, les assureurs sont challengés par des acteurs du digital, les GAFAM notamment, mais aussi par des start-up, les AssurTechs, qui collectent également des données. La connaissance du risque est démocratisée. On évoque parfois « l’ubérisation » du marché de l’assurance.

L’assureur du XXIe siècle évolue donc dans un environnement nouveau. Aux problématiques qu’il connaissait, principalement dans sa capacité à absorber et gérer le risque, s’ajoute désormais un risque stratégique, la remise en cause de son savoir-faire et de la maîtrise de celui-ci.

Les actuaires tarificateurs de risques, par exemple, voient leur compétence remise en cause par des algorithmes réalisés par les Data Scientists. Parallèlement, l’assuré du XXIe siècle semble désormais moins sensible à la solidarité avec ses semblables et plus individualiste. Il souhaite que soient reconnus ses efforts, et ne pas payer pour les irresponsables, ou ceux qu’il considère comme tels.

Les données sont à la base de la segmentation des tarifs et permettent en cela une meilleure maîtrise du risque. Mais l’afflux de nouvelles données permettant une connaissance accrue du client et une individualisation des offres va-t-il jusqu’à remettre en cause le concept de mutualisation des risques, l’un des fondements de la théorie de l’assurance ?

1. L’assureur du XXIe siècle est appelé à utiliser de nouveaux outils de gestion des données et aura sans doute recours à des fournisseurs de données brutes

L’assureur du XXIe siècle évolue dans un nouvel environnement et, en tant que fonction support de l’économie globale, doit s’y adapter. Il est nécessaire aujourd’hui de s’intéresser aux objets connectés et aux données qu’ils peuvent fournir pour décider de souscrire un risque.

Dans un modèle économique concurrentiel, toute place laissée à un concurrent sera occupée par un concurrent. L’assureur ayant négligé de nouvelles sources de données sera à moyen terme en difficulté. Il doit donc apprendre à gérer des données désorganisées, qu’il n’a pas collectées lui-même (issues des réseaux sociaux, des objets connectés, des bases de données publiques…). Il doit utiliser ces informations afin d’éviter de posséder moins d’informations que ses confrères, et se retrouver en situation d’anti-sélection.

En plus d’apprendre à collecter les données lui-même, l’assureur doit chercher des fournisseurs, quitte à acheter des données, auprès de sociétés récoltant des données (GAFAM, constructeurs de véhicules, d’habitat connecté…). La gestion de données inorganisées en provenance de tiers requiert le développement de nouvelles compétences et une puissance informatique sans commune mesure avec celle dont disposent actuellement les assureurs.

Faute de pouvoir analyser des données, les assureurs ne pourront pas traiter les sinistres impliquant les véhicules connectés (et a fortiori autonomes). En cela, les États seront sans doute amenés à l’uniformisation des données, sous la forme de « boîtes noires » (data event record), donnant des renseignements standardisés et une exploitation par tous. Il sera sinon impossible aux assureurs et aux services d’enquêtes accident d’analyser les données d’accidents codées, selon les normes de chaque constructeur/équipementier [1] .

2. L’assureur est incité à utiliser les nouvelles données pour segmenter finement sa clientèle et contrer l’anti-sélection

La mutualisation, « the contribution of the many to the misfortune of the few », est la technique de gestion des risques où l’assureur fixe et collecte la cotisation nécessaire à la couverture d’un risque sous-jacent aléatoire (par exemple l’incendie d’une maison) auprès d’un ensemble de clients exposés à un risque aux caractéristiques similaires (probabilité de survenance et intensité). Cette contribution de chacun servira à indemniser les victimes de l’événement garanti par un système de compensation.

L’assureur est contraint de segmenter son tarif, pour éviter l’anti-sélection. La segmentation se définit comme la différenciation de tarif ou de garanties faite entre deux groupes de risques homogènes, appelés classes, en fonction de l’exposition au risque. Une personne possédant une voiture de luxe paiera plus cher qu’une personne disposant d’une voiture standard, car si sa probabilité de sinistre est similaire, le coût du sinistre sera inégalement élevé. Cette segmentation implique donc la collecte et l’analyse de données corrélées aux risques sur le portefeuille assuré et sur les prospects, pour savoir à quelle classe homogène de risque ils appartiennent, et donc, quel tarif il convient d’appliquer.

Les assureurs sont incités à segmenter les tarifs pour contrer les comportements opportunistes et les conséquences sur leur modèle de la « situation d’anti-sélection ». Les données que l’assureur peut analyser grâce à la data science permettent une meilleure segmentation, par de nouveaux critères de sélection, mais aussi par une refonte des critères actuels mal adaptés ou peu corrélés aux risques. Il est plus opportun de connaître le kilométrage effectué (variable causale du risque), que la motorisation du véhicule (variable statistiquement corrélée au risque, car selon la motorisation, on estime que le véhicule roule peu ou beaucoup).

La nouvelle segmentation permettra de ne pas subir l’anti-sélection et de réduire l’aléa moral. L’assureur pourra ainsi tarifer en fonction du prix du risque présenté par un client ou un prospect pour le placer dans un groupe de risques qui lui ressemble, et non en fonction d’une classe de risques supposés homogènes, mais plus vaste [2] .

3. Plusieurs obstacles s’opposent au développement d’une tarification fortement démutualisée et donc, à une sélection active des « bons risques »

Dans le domaine de la santé principalement, la réglementation liée au règlement général sur la protection des données (RGPD) interdit d’utiliser des informations pour sélectionner ou piloter les risques individuels. La mutualisation des risques reste identique et renforcée par la diffusion de garanties obligatoires d’entreprise couvrant les dépenses « complémentaires de santé » (ANI de 2013).

Pour les risques de dommages et de responsabilités, il peut être dangereux pour les assureurs de tarifer en fonction des données du Big Data, au moins à l’heure actuelle. Les assureurs ne disposent pas d’historique statistique sur ce type d’approche. Seules sont prévues des réductions ou majorations, avec des primes sans fondements techniques certains, mais une approche plutôt commerciale, comme le coefficient de réduction/majoration en RC Automobile dit « Bonus/malus ».

4. Plus le tarif est segmenté, plus les classes sont étroites, moins la loi des grands nombres s’applique, plus le risque d’erreur est important

En effet, ce type d’approche remodèle les critères de segmentation qui passeront d’une dizaine à une centaine (a minima) et pouvant être modifiés en courte période (l’objectif étant d’avoir un pilotage dynamique), ce qui va réduire la variance au sein d’une classe de risque : plus la segmentation est fine, moins sont réunis les risques au sein d’une même classe, car ils sont rapidement considérés comme hétérogènes. Plus les classes de risques sont larges, plus la loi des grands nombres est fiable. Le risque d’erreur est donc plus important dans des catégories très fines de risques [3] .

5. La tarification en assurance prend en compte son acceptabilité sociale

L’assureur doit prendre en compte l’acceptabilité sociale et technique du tarif.

En effet, les assurés acceptent aisément d’être solidaires dans la mesure où leur comportement n’a pas d’impact sur le risque. Il est donc possible de majorer la prime pour un conducteur de véhicule de sport, car il a choisi délibérément une exposition au risque plus forte et peut donc choisir de la réduire, mais il est socialement difficile de faire payer un tarif élevé à une personne âgée, car elle n’a pas choisi de se placer en situation aggravante De plus, au-delà de l’acceptabilité sociale, il est possible que certaines primes deviennent hors de portée financière des clients qui présentent des risques aggravés. La capacité à payer la prime étant un des critères d’assurabilité, il est parfois difficile de proposer un tarif aussi élevé que le prévoit l’approche technique [4] .

6. L’analyse prédictive des sinistres n’existe pas, car les sinistres sont la conséquence d’une corrélation de variables aléatoires et toutes les données ne sont pas des variables aggravant ou réduisant les risques

Une connaissance précise du client amène à des situations de spirale de la segmentation, voire de démutualisation, sans pour autant que les résultats s’améliorent significativement. Il existe donc un effet de seuil qu’il faut déterminer par l’expérimentation. Toutes les variables traitées par la data science ne sont pas des variables de risques ou sont très faiblement corrélées : par exemple, de quel pourcentage accélérer après un feu rouge accroît-il le risque ? En réalité, les sinistres sont dus au cumul de plusieurs événements indépendants et ils ont rarement une seule cause : le conducteur de la voiture a accéléré alors qu’une personne sortait du bus ; il regardait son téléphone et était ébloui par le soleil. Si un de ces événements ne s’était pas produit, le sinistre n’aurait pas eu lieu. Analyser toutes les causes de sinistres est donc difficile, car elles sont multiples et mouvantes. Il sera donc toujours difficile de prédire l’avenir, du moins en Dommages et Responsabilité civile, même avec des modèles ambitieux de calcul des probabilités d’accidents soutenus par des critères et donc des informations multiples.

De plus, les analyses de data viennent accroître les différences. En effet, sans raisonnement rationnel, une analyse data des interventions policières en France va démontrer qu’il y a plus d’arrestations dans certains quartiers que d’autres. Sans raisonner, les Pouvoirs Publics pourraient alors décider d’envoyer plus de policiers dans ces quartiers, au détriment des autres. Il y aura donc encore plus d’arrestations dans la première zone et les Pouvoirs Publics vont entrer dans une spirale infernale avec des résultats qui ne s’amélioreront pas. En cela, la data science est discriminante [5] .

7. Les données ne sont pas fiables

Les données de l’assureur (« données organisées ») sont parfois erronées (car mal saisies lors de la souscription ou non actualisées ou inexactes) et les données non organisées (issues des réseaux sociaux notamment) sont parasitées par des données fausses. Filteris, société canadienne spécialisée dans le traitement des données des réseaux sociaux, a été victime de ce manque de fiabilité lors des élections présidentielles françaises de 2017, alors qu’il était anticipé qu’elle marginaliserait les instituts de sondages traditionnels [6] . Concernant les assurances dites connectées – « boîtes noires » sur les véhicules et garanties « Pay how you drive » –, si les expérimentations en cours démontrent que les assurés équipés ont effectivement moins de sinistres, il est probable que cela soit dû à l’effet pédagogique des boîtiers qui responsabilisent le conducteur, qui se sait observé. Mais il est aussi probable que les personnes qui ont souscrit à ce type de service constituaient déjà de bons risques avant même la mise en place d’une « boîte noire ». Ils souscrivent à ce type de produits car ils espèrent en tirer un bénéfice. Un « mauvais » risque, se sachant peu prudent, ne souscrit pas à ce type de service, car il sait qu’il n’en tirera aucun bénéfice. Pour obtenir des données fiables et en tirer une règle probabiliste solide, il faudrait rendre l’équipement obligatoire, ce qui est une mesure de sécurité routière et non une préoccupation d’assureur. Cela dit, les assureurs utiliseront sans doute la data science dans l’avenir, afin de segmenter plus finement leurs tarifs, mais surtout pour prendre en compte le besoin de reconnaissance et de personnalisation du client et adapter leur stratégie marketing et de communication [7] .

8. Les AssurTechs révolutionnent la manière de gérer la relation client plutôt que la manière de gérer le risque

Présentées comme de véritables révolutions, les AssurTechs sont en réalité, soit des assureurs fortement réassurés, soit des courtiers en assurance. Le risque transféré par l’assuré via cette AssurTech est en fait mutualisé.

La gestion du risque est collective et ces sociétés ne remettent pas en cause le modèle de gestion du risque des assureurs. En revanche, la stratégie de communication est individuelle et vante la proximité et la personnalisation, souvent par le biais du digital [8] . En cela, plus qu’un outil de gestion des risques, la data science est un outil de gestion de la relation client, donc de marketing.

9. L’asymétrie d’informations s’inverse, le contrat de bonne foi devient obsolète

Sur l’aspect purement juridique, le concept de contrat de bonne foi à la base du contrat d’assurance est menacé d’obsolescence. Si l’assuré est « pisté » par des objets connectés dont les données sont croisées avec les données des assureurs et de l’État, il n’est plus nécessaire pour lui de décrire son risque au moyen d’un questionnaire. La start-up Luko reconnaît désormais elle-même les matériaux de toiture des maisons qu’elle assure. L’assureur en connaît plus sur le risque de l’assuré que l’assuré lui-même, l’asymétrie d’information est donc inversée. Ce concept prend tout son sens lors de la vie du contrat. En effet, l’assureur dispose traditionnellement de peu d’information sur les changements de caractéristiques des risques (baisse de la valeur du bien assuré, changement de profession, etc.) Il ne peut piloter les risques efficacement et a du mal à identifier les risques qui sortent de la classe dans laquelle ils étaient placés initialement.

Un assureur utilisant la data science pourra identifier un changement d’attitude de l’assuré : hausse du nombre de kilomètres parcourus par an, changement de zone de circulation principale, changement de situation professionnelle ou familiale, etc. Il peut donc reclasser les risques, afin de faire payer le prix le plus représentatif du risque, ce qui favorise sa conformité avec son devoir de conseil et de pilotage des produits exigé par la Directive sur la Distribution en Assurance.

10. La loi doit permettre aux assureurs d’obtenir les mêmes données que celles disponibles pour les assurés

Si la réglementation interdit aux assureurs l’utilisation de données, comme c’est le cas en santé, l’asymétrie d’information croît. Par exemple, l’assuré a désormais, en France, la possibilité de réaliser des tests génétiques pour connaître avec finesse et fiabilité sa probabilité de développer tel ou tel cancer. S’il est positif, il a tout intérêt à s’assurer. L’assureur est alors en situation d’anti-sélection, car l’asymétrie d’information est trop importante entre lui et son assuré. Pour l’heure et pour des raisons éthiques, les assureurs ne peuvent pas disposer d’informations génétiques sur leurs clients.

11. La data science contribue à l’opacité du tarif

Contrairement à une idée reçue, la data science ne contribue pas à la transparence des tarifications. En effet, s’il est possible d’expliquer à un assuré que garer sa voiture dans la rue aggrave le risque de vol par différence avec le stationnement en garage, il est difficile d’expliquer la multitude de critères pris en compte dans une approche globale data science. Il est probable aussi que le conseiller clientèle ne connaît pas lui-même tous les critères de tarification. L’assuré verra donc sa tarification changer au fil des mois, sans bénéficier d’explications. S’il comprend que telle attitude a un effet positif sur son risque, il ne saura pas l’effet sur le tarif et devra se fier aux réductions ou majorations de l’assureur qu’il peut soupçonner être supérieures ou inférieures aux variations du risque : son attitude réduit peut-être le risque de 10 % alors que sa prime ne diminue que de 5 % et vice versa.

Quant au désir de reconnaissance, il est probable que l’assurance dite télématique (type « Pay how you drive ») fasse ressortir un sentiment de frustration. En effet, l’assuré Auto, par exemple, a tendance à sous-estimer le risque qu’il représente, et à surestimer celui des autres : ce sont toujours les autres qui conduisent mal. Il aura donc toujours un sentiment de tromperie, parfois illégitime, sur le tarif qui lui est proposé.

12. L’enjeu de la data science est l’amélioration du parcours client. L’assureur sera pro-actif à défaut d’être prédictif

Utiliser la data science uniquement pour la tarification est un risque, car l’impact sur la satisfaction du client pourrait être mitigé et, à tout le moins, incertain. Les assurances télématiques occupent d’ailleurs en France une faible part de marché, car les tarifications actuelles, au niveau du marché, sont techniquement représentatives du risque et reconnues comme telles par les clients.

La data science manque de finesse au niveau de l’individu, mais les assurés reprochent moins aux assureurs une tarification trop élevée que le sentiment d’une promesse non tenue en cas de sinistre [9] . Elle doit plutôt chercher à assurer une meilleure gestion de la relation client, pour gagner en fluidité et en dextérité, notamment par la pré-gestion algorithmique des sinistres et la démocratisation de la blockchain ou encore le développement des « smart contracts ». L’assureur qui possède des données exploitables, tant sur son portefeuille – s’il le pilote efficacement – que sur chacun de ses assurés, peut anticiper les besoins des clients et proposer de nouveaux packages de garanties. Une meilleure connaissance de la vie du client permet de multiplier les opportunités commerciales. Aujourd’hui, trop peu d’assureurs assurant des habitations sont informés de la possession d’un véhicule par leur assuré, de l’âge de ses enfants ou de ses besoins patrimoniaux. Ils peuvent, par exemple, proposer une assurance Voyage à un assuré qui réserve des billets d’avion sur Internet. En cela, la data science permet de faire preuve de pro-activité.

13. L’assuré responsable est gagnant

Si l’assuré peut trouver un intérêt économique à la transmission de ses données qui rendent un risque assurable, celles-ci peuvent aussi avoir pour effet de le rendre lui-même assurable. En RC Automobile, il est souvent difficile aux jeunes conducteurs de bénéficier d’une assurance pour un prix qu’ils sont en mesure de payer. La data science est un outil permettant à l’assureur de connaître le degré de responsabilité de l’assuré. Au lieu d’attendre 13 ans pour obtenir la réduction maximale de bonus récompensant sa bonne conduite, il est envisageable que la prime de l’assuré soit corrigée dès la première année. L’assureur perd du chiffre d’affaires, mais gagne en fidélité du client.

Certains courtiers savent qu’assurer des risques présumés aggravés n’est pas impossible, car les clients acceptent alors une prime souvent très élevée, avec une probabilité calculable que le risque soit réellement aggravé. L’assureur dispose donc de plus de fonds pour financer la mutualité de risques.

Les objets connectés peuvent permettre un gain marginal de profit, par l’amélioration de la prévention, mais les risques sous-jacents restent les mêmes. Les résultats ne seront donc pas nécessairement meilleurs (plus de sélection des risques, moins de sinistres, mais moins d’aliment de primes).

14. Le Big Data donne à l’assureur une place majeure dans la prévention des sinistres

La data science peut servir à la prévention. Dans ce domaine, assurés et assureurs sont gagnants, car ils n’ont pas intérêt à ce que le risque se réalise. La data science permet une meilleure prévention, par analyse comparative de la situation de l’assuré avec des profils homogènes (d’où la nécessité de données fiables à la souscription) mais surtout par l’utilisation accrue des objets connectés.

L’habitat intelligent, par exemple, avec des capteurs d’humidité connectés permet à l’assureur et à l’assuré de détecter rapidement les fuites d’eau dans l’habitat, à proximité des canalisations. L’alerte sera donnée avant même la survenance des premiers dommages, permettant une réparation rapide. Le coût de la mise en place de ces mesures, et de leur suivi est en revanche important et l’assureur doit anticiper une répercussion de la baisse de la charge sinistre sur le financement de ces installations. Il peut également prévoir l’envoi d’alerte ou de conseils pour les profils à risques, à visée pédagogique. En cela, il devient « préventeur » de sinistre en lieu et place de régleur de sinistres. Il couvre alors des événements aléatoires, mais non encore réalisés. Il reste en revanche gestionnaire de risques, qu’il mutualise. Sa vocation demeure inchangée et son business model également. Il modifie seulement son champ d’intervention.

15. Les assureurs ne sont pas organisés pour traiter des données diverses et non organisées.

L’assureur doit prendre en charge le coût de traitement de ces données, ce qui pose un double défi organisationnel :

– au niveau des équipements et logiciels informatiques, qui manquent des puissance et dextérité nécessaires à un traitement de données en masse ;

– au niveau du personnel des sociétés d’assurance, dont le niveau de formation n’est pas encore adapté à ce type de gestion ou à la démarche commerciale.

Se pose donc la question de la rentabilité technique de ce type d’organisation. Traiter toujours plus de données, ayant une faible incidence sur le risque, et donc procurant un gain marginal, remet en question la pertinence de leur utilisation. De plus, l’entité d’assurance doit porter de front la charge de la formation de son personnel et les coûts de personnel liés à la conception et à la maintenance des algorithmes.

16. Les conséquences de l’utilisation de la data science sur le ratio combiné du marché de l’assurance sont encore difficiles à établir

Au dénominateur, les primes acquises diminuent, par un pilotage plus fin du portefeuille, par l’exclusion des mauvais risques (qui paient le plus cher), et par les mesures commerciales mises en place pour satisfaire le désir de reconnaissance de l’assuré faisant preuve de transparence et d’efforts. Au numérateur, les frais de gestion sont en augmentation, il est donc nécessaire de s’assurer d’une importante baisse de la charge Sinistre, faute de quoi, le ratio combiné risque de se dégrader.

Le concept de mutualisation des risques n’est pas remis en cause, ni par les Data Scientist, ni par les AssurTech. Les données ne serviront qu’à trouver des critères de segmentation plus fins et mieux corrélés aux risques, et donc plus juste. La gestion de la clientèle évoluera par de plus fréquents contacts, un pilotage plus fin, plus dynamique et pro-actif du portefeuille [10] .

1 Entretien avec Nicolas Marescaux, actuaire certifié, Direction de la transformation digitale, Groupama AM.

2 Chaire Act’Info Covéa : actinfo.hypotheses.org.

3 Ibid.

4 Entretien avec Etienne Arbogast, actuaire, MAAF Assurances, Groupe Covéa.

5 Cathy O’NEIL, Weapons of Math Destruction: How Big Data Increase Discrimination, Edition Les Arènes, 2018.

6 Filteris, « Les urnes ont parlé », Communiqué de presse du 23 avril 2017.

7 Entretiens avec Étienne Arbogast, actuaire, MAAF Assurances, Groupe Covéa, et Nicolas Marescaux, actuaire certifié, Direction de la transformation digitale, Groupama AM.

8 Entretien avec Florence PICARD, membre du Haut Conseil, Institut des Actuaires.

9 Ibid.

10 Ibid.

À retrouver dans la revue

Banque et Stratégie Nº391

Notes :
1 Entretien avec Nicolas Marescaux, actuaire certifié, Direction de la transformation digitale, Groupama AM.
2 Chaire Act’Info Covéa : actinfo.hypotheses.org.
3 Ibid.
4 Entretien avec Etienne Arbogast, actuaire, MAAF Assurances, Groupe Covéa.
5 Cathy O’NEIL, Weapons of Math Destruction: How Big Data Increase Discrimination, Edition Les Arènes, 2018.
6 Filteris, « Les urnes ont parlé », Communiqué de presse du 23 avril 2017.
7 Entretiens avec Étienne Arbogast, actuaire, MAAF Assurances, Groupe Covéa, et Nicolas Marescaux, actuaire certifié, Direction de la transformation digitale, Groupama AM.
8 Entretien avec Florence PICARD, membre du Haut Conseil, Institut des Actuaires.
9 Ibid.
10 Ibid.