Le deep learning réinvente
détection et prévision des risques

Créé le

19.02.2024

-

Mis à jour le

22.02.2024

La gestion des risques financiers est en pleine mutation grâce à l’intégration des méthodes d’apprentissage profond. Trois cas d’application sont à cet égard particulièrement probants.

Au sein du secteur financier, l’intégration croissante du machine learning et du deep learning, ou apprentissage profond, est en train de transformer significativement la gestion des risques : risque de marché, le risque de crédit, le risque de taux et les risques opérationnels.

Des recherches récentes ont mis en lumière l’efficacité accrue et la pertinence croissante des modèles de deep learning, pour leur capacité à traiter des ensembles de données complexes et à modéliser les relations non linéaires qui sous-tendent les systèmes financiers. Ces caractéristiques font d’eux des outils de prédiction et de modélisation puissants.

Les réseaux de neurones à convolution (Convolutional Neural Network, CNN) se sont ainsi avérés une solution prometteuse pour détecter des schémas subtils et des tendances dans les données des marchés financiers, conduisant à la création de stratégies de trading novatrices, qui surpassent les performances des modèles traditionnels et méthodes d’analyse testés.

Trois cas d’applications du deep learning retiennent l’attention : la prévision du risque de faillite, l’utilisation en risque de crédit et la détection du risque de fraude à la carte bancaire.

Prévoir les faillites d’entreprises

C’est un domaine critique de la gestion des risques financiers. La prévision des faillites d’entreprises est essentielle car elle permet de prendre des décisions éclairées en matière de crédit, d’investissement et de gestion des risques.

L’article « Bankruptcy Prediction Using Imaged Financial Ratios and Convolutional Neural Networks »1 a fait la lumière sur le potentiel du deep learning dans ce domaine. Il se concentre sur les entreprises cotées en bourse au Japon, en analysant les données financières entre 2002 et 2016, et met en évidence la supériorité des réseaux CNN dans la prédiction des faillites. Les ratios financiers sont transformés en images, qui permettent d’identifier des motifs et des structures complexes dans les données.

Le modèle utilisant les réseaux CNN a été comparé dans l’étude aux modèles classiques tels que les arbres de décisions, l’analyse discriminante linéaire, la machine à vecteurs de support et AdaBoost. Les résultats obtenus reflètent l’avantage des réseaux CNN dans la détection des patterns complexes et non linéaires (voir graphique).

Hosaka a testé son approche sur les données de 10 000 entreprises japonaises. Les résultats montrent une capacité à prédire la faillite d’entreprises avec une précision de 90 %.

La transformation de données financières en images 2D est utilisée en R&D pour affiner la précision des prédictions des prix des actions. Ce type de modèle peut être encore amélioré via la méthode de création d’image, une étape décisive, en testant plusieurs configurations basées sur l’homogénéité des ratios financiers utilisés, une architecture innovante des réseaux CNN pour le traitement des images à taille réduite (d’environ 20x20 pixels), plus adaptée pour les données financières, l’introduction de modifications à la fonction de perte afin de donner plus d’importance aux entreprises ayant déclaré faillite lors de l’entraînement des réseaux CNN, au lieu d’inclure des données synthétiques. Le réseau devient alors plus précis.

Une révolution de l’évaluation du risque de crédit

Une autre avancée majeure est le développement du modèle hybride CNN-LSTM-ATT, qui vise à évaluer le risque de crédit des petites et moyennes entreprises (PME). Cet effort est illustré par l’article « The Evaluation on the Credit Risk of Enterprises with the CNN-LSTM-ATT Model »2. L’auteur présente une approche combinant les réseaux CNN, les réseaux de neurones récurrents à mémoire à long terme (LSTM) et un mécanisme d’attention (voir schéma).

Ce modèle est conçu pour surmonter les limites des modèles traditionnels tels que la régression linéaire et les forêts aléatoires, qui rencontrent des difficultés lorsque le nombre de variables explicatives est élevé. Les CNN sont réputés pour leur capacité à détecter des motifs complexes, tandis que les LSTM excellent dans le traitement de données séquentielles. L’ajout du mécanisme d’attention renforce la capacité à identifier les informations pertinentes, en réduisant l’impact des variables moins significatives.

Le modèle proposé est comparé à plusieurs alternatives, dont les CNN, les LSTM et les CNN-LSTM classiques. Les résultats montrent l’avantage du modèle CNN-LSTM-ATT, qui se distingue par une précision supérieure, améliorant considérablement l’évaluation du risque de crédit.

Dans le modèle composé d’un réseau CNN et d’un réseau LSTM proposé par Zhang, le CNN est utilisé pour extraire des caractéristiques des données de comportement de l’entreprise, et le LSTM pour apprendre les dépendances à long terme entre les caractéristiques. Le mécanisme d’attention est utilisé pour se concentrer sur les caractéristiques les plus importantes pour la prédiction du risque de crédit.

Des expériences ont été menées sur trois ensembles de données d’entreprises différents, afin de comparer les performances du modèle CNN-LSTM-ATT à d’autres modèles d’apprentissage automatique traditionnels, dont la régression logistique (LR), la random forest (RF), le CNN et le LSTM. Le modèle CNN-LSTM-ATT a obtenu les meilleures performances en termes de précision et de robustesse.

Ce modèle apparaît prometteur pour l’évaluation du risque de crédit des entreprises. Il est capable d’apprendre des caractéristiques complexes à partir des données de comportement de l’entreprise et de capturer les dépendances à long terme entre les caractéristiques. Le mécanisme d’attention améliore ses performances en se concentrant sur les caractéristiques les plus importantes.

Le modèle de deep learning présenté précédemment démontre une précision supérieure à celle des modèles CNN, LSTM ou CNN-LSTM (voir tableau). Cette précision peut encore être renforcée en introduisant une méthodologie utilisée en conception d’outil de deep learning en trading, à savoir :

– la transformation des données d’entrée en image pour utiliser des kernels de convolution multidimensionnels et capter les patterns plus complexes et moins évidents ;

– l’ajout d’une zone de rejet afin d’obtenir une précision supérieure et de réduire le risque des faux positifs ;

– la conversion de ce classifieur en un modèle « régresser » pour obtenir comme sortie du modèle la probabilité de défaut de l’entreprise, qui sera utilisée à la fin pour la gestion du risque de crédit.

La lutte contre la fraude par carte de crédit

La fraude à la carte de crédit est un problème croissant. Il coûte chaque année des milliards de dollars aux institutions financières. Ses méthodes traditionnelles de détection sont souvent inefficaces en raison du déséquilibre des classes, c’est-à-dire du fait que les transactions frauduleuses sont rares.

L’article « Credit Card Fraud Detection Using Convolutional Neural Networks »3 met en évidence l’efficacité des réseaux CNN dans la détection de cette fraude. Les CNN sont des réseaux de neurones particulièrement adaptés au traitement d’images. Ils sont capables d’apprendre des caractéristiques complexes à partir de celles-ci, même si ces caractéristiques sont non linéaires ou non évidentes.

Les CNN surpassent d’autres modèles tels que le SVM, le random forest et les réseaux de neurones non convolutifs dans la détection de la fraude. L’approche novatrice consiste à transformer les données de transaction en images 2D, permettant aux CNN d’identifier des modèles complexes et cachés dans les données.

L’approche proposée par Chen, Fu, Tu et Zhang consiste à transformer les données de transactions de carte de crédit en images, ensuite traitées par un CNN pour extraire des caractéristiques. Ces caractéristiques sont alors classées par un algorithme pour prédire si la transaction est frauduleuse ou non.

Les auteurs ont testé leur approche sur un ensemble de données de transactions. Elle est capable de détecter la fraude à la carte de crédit avec une précision de 99 %.

Pour en améliorer l’efficacité, des optimisations sont envisageables :

– la création d’images plus cohérentes en regroupant les métriques les plus corrélées ;

– l’ajustement des paramètres de rejet pour minimiser les faux négatifs ;

– l’adaptation des fonctions de perte pour accorder une plus grande importance à la détection des transactions frauduleuses.

Ces optimisations sont autant de pistes pour renforcer la performance des modèles de détection de cette fraude.

L’intégration du deep learning dans la gestion des risques financiers est en train de redéfinir la manière dont les institutions financières abordent celle-ci. Elle est à la fois plus précise et sophistiquée. Grâce aux réseaux de neurones convolutifs et aux modèles hybrides, les acteurs du secteur sont en mesure de prédire plus efficacement la faillite d’entreprises, d’évaluer le risque de crédit et de détecter la fraude par carte de crédit. Ces avancées promettent des bénéfices considérables en termes de réduction des pertes financières, de prise de décision éclairée et de protection contre les pratiques frauduleuses.

À retrouver dans la revue
Revue Banque Nº890
Réseaux CNN : Une classification plus précise
$!Le deep learning réinvente détection et prévision des risques
La structure du modèle hybride CNN-LSTM-ATT
$!Le deep learning réinvente détection et prévision des risques
De meilleures performances avec le modèle hybride CNN-LSTM-ATT
$!Le deep learning réinvente détection et prévision des risques
Notes :
1 Hosaka T. (2019), « Bankruptcy Prediction Using Imaged Financial Ratios andConvolutional Neural Networks », Expert Systems with Applications, volume 117, 1er mars, pp. 287-299.
2 Zhang L. (2022) « The Evaluation on the Credit Risk of Enterprises with the CNN-LSTM-ATT Model », Computational Intelligence and Neuroscience, sept., 6826573.
3 Chen D., Fu K., Tu Y. et Zhang L. (2016), « Credit Card Fraud Detection Using Convolutional Neural Networks », septembre, Lecture Notes in Computer Science, vol. 9949.