Métiers

Banque, Finance, Assurance à l’heure de la Data Science

Créé le

28.06.2021

La conférence organisée par le Magistère Banque Finance Assurance de l’Université Paris Dauphine le 16 mars 2021 a été animée par Simon PLAYE et Pierre PROFFIT. Elle a porté sur les apports et perspectives de la Data Science dans les métiers de la finance et de l’assurance dans un monde post-Covid.

Les intervenants étaient Rim BELAOUD, Senior Data Scientist, chez PwC, Guilhem BENTOGLIO, Makerting Manager chez Allianz, Pejman GOHARI, Chief Data & Analytics Officer chez Bpifrance, Iris LUCAS, Head of Data Intelligence à l’AMF, et Jean-Claude RAZAFINDRAKOTO, Data Scientist & Community Manager de SCOR Global Life.

Alors que l'Intelligence artificielle (IA), la Data Science et le Big Data modifient en profondeur de nombreux métiers et services du quotidien, la finance et l’assurance n’échappent pas à cette révolution. Bien au contraire, les mondes de la finance et de l’assurance ont très vite su s’adapter et profiter des nouvelles opportunités offertes par ces technologies. Mais comment l’IA et le Big Data ont-ils transformé ces métiers ? Comment ces technologies sont-elles utilisées au quotidien par les professionnels ? Alors que ces technologies sont actuellement en plein essor, que pourront-elles apporter de plus à la finance et à l’assurance dans les prochaines années ? Vont-elles encore plus profondément modifier ces métiers à l’avenir ? Pour répondre à toutes ces questions, la conférence annuelle du Magistère Banque Finance Assurance de l’Université Paris Dauphine-PSL s’est tenue le 16 mars dernier dans le cadre des House of Finance Days. Elle s’organisait en deux temps principaux. Dans un premier temps, Pejman Gohari (Bpifrance) et Jean-Claude Razafindrakoto (SCOR) se sont attachés à définir dans quelles conditions l’utilisation de la data science est véritablement disruptive pour le secteur de la banque et de l’assurance, et quels sont les enjeux de son industrialisation. Dans un deuxième temps, Guilhem Bentoglio (Allianz), Rim Belaoud (PwC), et Iris Lucas (AMF) ont présenté l’usage actuel et futur de la data science en marketing, en conformité et en détection de fraudes.

En quoi la data est-elle un « game changer » ?

Dans un monde où le tournant digital n’est plus une option, mais une réalité, la donnée est l’ingrédient clé qui accentue la réussite ou l’échec d’un projet. Nous sommes désormais dans une ère d’utilisation industrielle de la donnée. Il s’agit de masses de données, qui, si elles sont cohérentes et exhaustives, constituent un actif valorisé. À l’inverse si les données sont incomplètes, biaisées, incohérentes ou corrompues et en somme de mauvaise qualité, elles constituent un passif, une perte de temps et un vrai coût sans aucune création de valeur. Pour que la donnée soit un « game changer », elle doit être traitée avec une vraie stratégie. Bien préparer la donnée, c’est comprendre son usage. La qualité d’un projet dépend souvent plus de la qualité et de la pertinence des données que de la sophistication des modèles utilisés. L’IA et les solutions d’Analytics avancées permettent certes aux entreprises dites « Data Driven » de prendre les meilleures décisions ; les plus adaptées selon les contextes et les typologies de client ; de façon rapide et flexible, afin de rester parmi les entreprises les plus compétitives du marché. Mais l’IA est devenue aujourd’hui accessible à beaucoup d’organisation, et la vraie bataille se joue sur la qualité de la donnée dont on dispose et sur la capacité à aller chercher de nouvelles données alternatives. Le Chief Data Officer a la responsabilité de piloter, de gérer et d’organiser le travail de la donnée pour qu’elle ne perde pas de sa valeur et devienne un centre de profit.

Là où les GAFA sont by design « Data-driven » et ont inscrit la donnée dans leur ADN, les organisations plus standards tendent aujourd’hui également vers ce modèle. « Know your Data » est un concept qui inscrit la donnée, peu importe sa forme, son support de stockage, sa provenance, son usage, dans les actifs de l’entreprise et exige un suivi par l’exécutif comme n’importe quel autre actif clé de l’entreprise.

« La donnée est infinie comme le sang qui circule dans l’organisation et sa fluidité est cruciale pour que tous les organes vitaux dans le corps/entreprise fonctionnent : les algos/IA sont le cerveau et les neurones, le cœur et les poumons représentent les applications critiques, core banking, marketing », nous explique Pejman Gohari, Chief Data & Analytics Officer chez Bpifrance.

Quels sont les enjeux autour de l'industrialisation des solutions ?

Évidemment la question de l’industrialisation est absolument centrale dans tous les projets de Data Science. Un projet qui n’arrive pas au stade de production n’a aucune valeur pour le métier. Pour mener à bien un projet de Data Science, une première étape consiste en l’identification des besoins du métier. Le risque est de répondre parfaitement à une mauvaise question. L’objectif est de déterminer quels sont les indicateurs business que le projet de Data Science a pour objet d’améliorer. Il s’agit de trouver une bonne métrique pour valoriser le projet en termes de business. L’équipe de Data Science doit ensuite rassembler des données qui respectent un certain nombre de contraintes notamment en matière de Data Privacy et de RGPD avec une attention particulière apportée au fait que les données soient convenablement anonymisées. Un point crucial avant d’aller plus loin est d’explorer la donnée et de dégager des intuitions, un premier aperçu pour évaluer la valeur de la data par rapport à la problématique. Enfin, l’explicabilité du modèle implémenté par les Data Scientists est primordiale : il faut que le métier puisse comprendre et adopter le modèle comme une véritable aide à la décision. Pour installer le projet dans la durée, il est nécessaire que les Data Scientists fournissent du « Production ready code » qui respecte un certain nombre de standards pour en faciliter la compréhension et la maintenance.

Tous ces aspects liés à la mise en place de projets de Data Science constituent le quotidien des équipes de Data Science. Pour résumer, selon Jean-Claude Razafindrakoto, Data Scientist & Community Manager chez SCOR, c’est en général dans la capacité à traduire une problématique métier en une problématique « data » puis à convertir la solution « data » en une solution métier que réside véritablement la valeur ajoutée du travail d’un Data Scientist.

Quels sont les usages de la Data Science en marketing assurantiel ?

Les cas d’usages de la Data Science en marketing dans le domaine de l’assurance sont nombreux et de nature très variée. La lutte contre l’attrition aussi appelée lutte « anti-churn » constitue un des sujets sur lesquels la Data Science est de plus en plus utilisée. L’émergence ces dernières années de modèles de Machine Learning utilisant des centaines de variables permet de tirer parti de la quantité conséquente et croissante de données disponibles sur les clients.

Plus généralement, la Data Science est très largement utilisée en marketing dans les banques et les compagnies d’assurance pour le profilage des clients. De nombreux nouveaux acteurs (essentiellement des start-up) gravitent et se développent autour de ces institutions pour proposer des services innovants en matière de segmentation des clients. Des start-up peuvent ainsi proposer aux entreprises d’étudier le comportement des internautes qui visitent leur site internet : en fonction du comportement des clients (temps passé sur la page, mouvement de la souris…), un profil psychologique est établi (profil de risque, appétence pour le produit…). L’entreprise peut alors choisir d’adapter l’apparence du site et afficher différemment le contenu de celui-ci selon le profil détecté. « Un site est un discours, et il s’agit d’adapter ce discours au public tel que les données nous permettent de le percevoir » nous rappelle Guilhem Bentoglio, Marketing Manager chez Allianz et enseignant au sein du Magistère BFA.

L’amélioration de l’expérience client et l’automatisation sont au cœur des préoccupations des institutions. Elles comptent parmi les thématiques les plus avancées en Data Science en assurance et en banque : analyse automatisée de document, développement de « chatbots », génération automatisée de réponses, orientation vers la bonne solution… Les sujets d’automatisation apportent beaucoup de valeur en assurance puisqu’elle permet d’une part de faciliter le travail des équipes, de repositionner les effectifs sur les tâches à plus forte valeur ajoutée et d’autre part d’améliorer l’expérience client, notamment via un traitement plus rapide des demandes (remboursements…).

Comment utilise-t-on la Data Science et l'IA en conformité, notamment pour lutter contre le blanchiment d'argent ?

Depuis quelques années, les banques sont confrontées à une augmentation des amendes et des sanctions pour non-conformité, notamment dans le cadre de la Lutte contre le blanchiment de capitaux et le financement du terrorisme (LCB-FT).

Comme nous l’indique Rim Belaoud, Senior Data Scientist chez PwC, les banques peinent parfois à construire des modèles résilients, capables d'identifier les transactions suspicieuses. Leurs modèles peu flexibles sont basés sur des approches déterministes, générant un nombre important d'alertes non pertinentes.

Introduire l’IA dans les dispositifs LCB-FT permet de les rendre plus agiles et dynamiques.

Plusieurs cas d’usages et opportunités sont d’ores et déjà identifiés :

– l’optimisation de l’onboarding client à distance grâce aux techniques de reconnaissance optique de caractères et reconnaissance d’images ;

– la segmentation dynamique, visant à regrouper les clients en groupes homogènes facilitant l’identification d’atypismes ;

– la détection de nouveaux schémas de criminalité à travers des approches non supervisées ou de détection d’anomalies ;

– la hiérarchisation des alertes générées par les TMS (transaction monitoring systems), à travers un score indiquant la probabilité qu'elles se transforment en une transaction suspecte, pour pouvoir prioriser et adapter son traitement

Si l'IA est porteuse, elle reste souvent au stade d'étude ou de “Proof Of Concept” sans passer en production. Les barrières à son implémentation sont nombreuses : la difficulté d'accès aux données disséminées dans plusieurs systèmes d’information, la qualité des données, les exigences de confidentialité et de sécurité, les besoins de compétences humaines et techniques, et enfin, l'explicabilité des algorithmes. En effet, il est crucial, vis-à-vis des métiers, des différentes lignes de défense et des régulateurs d'assurer une explicabilité des modèles développés et leurs résultats, ainsi qu'une traçabilité de leurs évolutions et une garantie de l’absence de biais. Répondre à ces enjeux n'est possible qu'avec l'intervention d'humains : ces derniers devront valider le modèle, les données avec lesquelles il est entraîné, ainsi que les résultats qu'il génère à chaque évolution qui vient l’impacter.

Comment la Data Science devient-elle un outil de premier plan pour détecter les abus de marché ?

Les régulateurs sont désormais à la croisée des secteurs de la finance et de la data science, et les applications de ces nouveaux outils sont légion dans ce secteur. C’est en tout cas l’avis que partage Iris Lucas, Head of Data Intelligence à l’Autorité des marchés financiers (AMF) et professeur au Magistère BFA.

En effet, les mouvements sur les marchés financiers produisent des millions de données et il faut pouvoir trouver dans cette botte de foin l’aiguille qu’est la fraude financière. Utiliser des outils d’IA est donc nécessaire pour pouvoir discerner ces comportements irréguliers. Mais plusieurs problèmes se posent. Les algorithmes fonctionnent en apprentissage automatique, mais comment alors les entraîner à reconnaître des fraudes que l’humain lui-même n’a pas encore détectées ? Comment savoir si un algorithme est efficace ou non lorsqu’il n’est pas possible de rapporter tous les délits qu’il a mis en évidence à l’ensemble de ceux qui existent réellement ? Quel seuil faut-il fixer pour être sûr de détecter suffisamment de fraudes tout en évitant les faux positifs (un faux positif est un comportement que l’algorithme considère à tort comme une fraude) ?

Si les algorithmes actuels ne sont pas parfaits, loin de là, ils permettent tout de même de réduire le travail des humains en levant des alertes sur d’éventuels cas suspects. Certains algorithmes, notamment de « clustering » permettent aussi de cibler des paquets de transaction particuliers pour mettre en évidence un seul type de fraude et n’ont pas ces problématiques de seuils. Plutôt que de chercher directement des fraudes, ils peuvent aussi servir à classifier des informations et à mettre en évidence des corrélations jusqu’alors inconnues. À partir de là, l’observateur humain pourra découvrir des comportements qu’il ne connaissait pas ou même reconnaître directement une fraude. Mais d’autres applications existent encore : automatisation de l’analyse des rapports financiers émis par les entreprises, reconnaissance des sites d’investissement frauduleux… les perspectives d’application de la data science à l’AMF sont encore nombreuses.

Le secteur financier n’est pas pionnier dans le domaine de la Data Science et reste sans doute encore loin des GAFA. Pour autant, il est déjà très développé en back-office, et son utilisation ne cesse de croître. Mme Rim Belaoud nous rappelle que 9 dirigeants sur 10 considèrent désormais l’IA comme une opportunité.