Anticiper les risques ne se résume pas à la question de la prédiction. Dans un monde instable, prédire peut en outre devenir mission impossible. Face à la complexité des systèmes en jeu (modèle économique, climatique, social...), il est présomptueux de miser sur un scénario unique, fût-il le plus probable. La gestion des risques repose sur l’étude d’un éventail de situations, que celles-ci soient considérées dans une logique de stress-test (sommes-nous capables de résister à de possibles futurs états du monde ?) ou dans un but de prise de décisions préparant la venue d’un nouvel environnement (adaptation).
Le secteur bancaire et assurantiel a depuis longtemps recours à l’utilisation de générateurs de scénarios stochastiques pour effectuer cette analyse. L’aspect stochastique permet de prendre en compte l’instabilité des systèmes complexes, leur variabilité liée à un environnement mouvant où les comportements humains jouent un rôle important. Cette dimension aléatoire permet d’échapper à la rigidité d’un cadre déterministe et d’envisager des configurations que l’esprit analytique humain peineraient à produire en grand nombre.
Les outils d’intelligence artificielle générative apparaissent aujourd’hui comme de prometteuses alternatives pour pousser un cran plus loin notre capacité à générer des scénarios crédibles en gestion des risques.
Génération d’un phénomène aléatoire
Les démonstrations de force spectaculaires de l’IA le feraient presque oublier : l’apport de ces méthodes ne se résume pas à la production de deepfakes ou de simulations d’interactions humaines via le langage. Les modèles de l’IA générative sont avant tout des méthodes pour imiter un phénomène aléatoire. Il s’agit « d’estimer » un objet de nature complexe – une distribution de probabilité – et de l’utiliser pour simuler de nouvelles réalisations de ce phénomène aléatoire. On poursuit donc le même but que le générateur stochastique traditionnel.
Dans la génération de scénarios prospectifs, l’idée n’est pas de reproduire le passé, mais de prendre en compte des évolutions futures. L’imitation s’adapte aux variables de contexte fournies au générateur, lesquelles influeront sur ce qu’il produit. Les interactions avec les modèles de langages ne font pas autre chose : ils répondent et s’adaptent à la sollicitation du « prompt ».
Modèles physiques et modèles IA
Prenons l’exemple du générateur de scénarios climatiques. En banque ou en assurance, la finalité est d’envisager les conséquences de l’évolution du climat sur un certain nombre d’actifs. Ainsi l’accroissement des catastrophes naturelles peut entraîner des défauts de crédit. La survenance de désastres climatiques peut faire exploser l’indemnisation en assurance. Dans ces deux cas, le recours aux scénarios permet de déterminer stratégies de prévention et d’adaptation.
Le but n’est pas de modéliser le climat dans son ensemble. Les scénarios d’évolutions proposés par les climatologues, basés sur une compréhension fine des phénomènes, répondent à une ambition plus vaste que celle de modéliser un impact sectoriel. Mais ces modèles physiques sont à la fois extrêmement lourds à manipuler, et pas toujours adaptés au problème spécifique considéré par le financier ou l’assureur.
Dans des travaux récents1, nous étudions l’apport des modèles génératifs pour l’étude de la sécheresse, péril lié, en assurance, au phénomène de « retrait-gonflement des argiles » (affaissement des habitations sur sol argileux suite au stress hydrique). Un indice publié par Météo-France, le SWI2 uniforme, caractérise la sévérité de l’épisode. Il conditionne la reconnaissance en état de catastrophe naturelle, préalable nécessaire à l’indemnisation par l’assurance dans le cadre du régime public-privé français. Simuler cet indice de sécheresse des sols est possible via des modèles physiques. C’est ce qu’a fait notamment le DRIAS3 : considérant les différents scénarios RCP fournis par le GIEC. Des simulations fournissent des cartes nationales à horizon 2100. Mais la complexité, et le temps de calcul rédhibitoire limitent le nombre de simulations. Seules dix ont été effectuées par le DRIAS dans le scénario RCP 4.5. Bien peu pour estimer des Value-at-Risk (supposant de considérer des événements de période de retour bicentenaire).
L’apport de l’IA générative se comprend en miroir de cette situation. Là où le modèle physique nécessite une réflexion approfondie dans sa conception, le modèle génératif privilégie une sorte de « force brute ». La richesse du réseau de neurones permet de s’adapter à de nombreuses situations (propriété dite d’approximation universelle), la puissance algorithmique fait le reste en parcourant les possibles jusqu’à identifier une combinaison de paramètres qui rende compte de façon satisfaisante de la réalité. Contrairement au modèle physique, on ne cherche pas la compréhension des phénomènes à l’œuvre, mais un tâtonnement qui aboutit à leur reproduction la plus fidèle possible. La mise en place est donc facilitée. Nul besoin d’indiquer au réseau que l’existence d’une forêt modifie localement l’effet des périodes de sécheresse, il retrouvera cette caractéristique (sans en comprendre pour autant la cause).
La seconde différence importante est la vitesse d’exécution. Une fois le modèle entraîné, on obtient en quelques secondes, des milliers de simulations d’années de sécheresse, qui pourront être utilisées pour évaluer pertes moyennes, volatilité, Value-at-risk...
Ouvrir la boîte noire
Il faut donc démystifier l’usage de ces méthodes : l’intelligence artificielle n’est pas plus « intelligente » que les modèles physiques ou économiques développés à partir d’une analyse fine des phénomènes à l’œuvre, c’est tout le contraire puisqu’elle fait l’économie de la compréhension. De ce fait, elle n’est pas plus précise, mais beaucoup plus rapide. En revanche cette rapidité est un atout clé qui lui permet d’être utile pour des tâches difficiles à accomplir sans elle : estimer une Value-at-Risk à partir de dix valeurs, fussent-elles obtenues avec un modèle parfait, n’est pas raisonnable, là où des milliers de simulations (plus grossières) peuvent être produites en un délai très court.
Se pose bien entendu la question de la fiabilité de telles approches. C’est le procès habituel fait à l’IA. L’aspect « boîte noire » effraie. Cette obscurité est-elle pour autant plus difficile à percer que celle de modèles dits interprétables, reposant sur un nombre d’hypothèses tel que leur vérification pose question ? L’utilisation de solutions privées et opaques ne subit pas les critiques qu’on réserve aux modèles génératifs, alors même que leur calibration – souvent sur données américaines dont la pertinence pour un cadre européen ne va pas de soi – pose question.
En revanche, il est exact que le cadre d’audit des méthodes d’IA doit être défini, ce qui est courant pour des méthodologies nouvelles. Cet objectif nécessite notamment des efforts de recherche, qui augmentent la compréhension du fonctionnement de telles méthodes, tout en permettant leur amélioration. L’analyse des événements rares, à faible période de retour mais clés dans une perspective de gestion des risques, est par exemple un domaine où la force brute n’est souvent pas suffisante. Les approches que commence à dessiner la recherche actuarielle contemporaine tendent à accélérer l’apprentissage des méthodes d’IA via une meilleure compréhension de la géométrie, de l’architecture des réseaux de neurones impliqués dans les modèles génératifs. C’est aussi par cet effort de recherche va d’ailleurs de pair avec le développement d’une IA plus frugale, maîtrisée plus facilement par ses utilisateurs.