Portrait de Data Scientists

Créé le

26.09.2016

-

Mis à jour le

29.09.2016

Qui sont les Data Scientists ? Spécialistes de la donnée et de sa manipulation, ces « moutons à cinq pattes » ont des parcours très différents. En voici deux, travaillant tous deux chez deux grands éditeurs en collaboration fréquente avec le monde financier, qui nous expliquent en quoi consiste leur métier et comment ils peuvent être utilisés dans les banques.

« Qu’est-ce que la science des données ? C’est une combinaison d’ingénierie logicielle et de statistiques avec une base solide en mathématiques. Il est difficile de trouver un bon ingénieur logiciel, et un bon mathématicien, et encore plus difficile de trouver la personne qui soit les deux. Dans la banque de détail, le problème principal est le client : comment l’attirer et comment le conserver ? Le rôle du Data Scientist sera alors d’utiliser les données pour comprendre les besoins des clients, et déterminer les différentes sortes de clients. Dans la banque d’investissement en revanche, le Data Scientist utilisera les données pour faire des prédictions et optimiser les opérations de change. Enfin, le Data Scientist peut aussi jouer un rôle dans la sécurité opérationnelle, en analysant le flux des transactions à la recherche d’anomalies et de fraudes potentielles. Dans les banques, les deux piliers essentiels (développement logiciels et connaissances statistiques) sont déjà présents, et plutôt que chercher une personne sachant tout faire, une bonne solution pourrait être de former son Data Scientist en interne, en donnant au statisticien une formation logicielle ou à l’informaticien une base en modèles mathématiques et statistiques. Dans mon expérience, la deuxième solution est la plus efficace, car la majeure partie du travail consiste à manipuler des données. »

Sean Owen, directeur Data Science pour Cloudera, éditeur open source dédié à l’environnement Hadoop

 

« Chez Teradata, nous intervenons sur toutes les questions métier qu’un client se pose et qui peuvent trouver des réponses à travers l’analyse des données disponibles. Nous devons être curieux, comprendre la question métier formulée par le client et savoir de quelles données nous disposons pour y répondre (nature, volumétrie, qualité). Dans mon histoire personnelle, j’ai une formation de statisticien, puis j’ai travaillé dans les données structurées dans la banque sur les clients, pour établir des comportements clients et des cibles marketing. Aujourd’hui, nous travaillons de moins en moins dans des données structurées et de plus en plus sur des données non structurées. Le Data Scientist doit mixer les deux. Il faut être à l’aise à la fois avec les mathématiques et avec les langages informatiques. »

Éric Gagnier, Data Scientist de Teradata, éditeur de solutions informatiques spécialisées en matière d’entrepôt de données et d’applications analytiques.

À retrouver dans la revue
Revue Banque Nº800