Sélectionner une page

DataLab Groupe

Le DataLab Groupe de Crédit Agricole utilise DataGalaxy pour standardiser, organiser et structurer la documentation des données de ses projets d’IA et data à destination de l’ensemble du groupe Crédit Agricole.
Je recommanderais DataGalaxy pour trois raisons principales. La simplicité d’utilisation, l’adaptabilité à différents cas d’usage et les équipes de support efficaces et disponibles.

Matthieu Capron - Data and AI Project Manager

Overview

Groupe bancaire proposant des services financiers aux entreprises, institutionnels et particuliers, le groupe Crédit Agricole possède le plus grand réseau de banques coopératives et mutualistes au monde. Il emploie 145 000 collaborateurs au service de 53 millions de clients à l’échelle internationale. Créé en 2016 et employant 50 personnes, le DataLab Groupe de Crédit Agricole a pour mission de développer des solutions industrielles d’intelligence artificielle destinées à l’interne, d’accompagner les entités du groupe dans la création de solutions Data & IA et d’acculturer le groupe Crédit Agricole à ces technologies en phase d’évolution accélérée

Contexte du projet

À l’origine, l’objectif du DataLab Groupe était d’explorer le potentiel de la data et de l’IA pour les métiers du Crédit Agricole et de mener des tests pour en évaluer la faisabilité. Tout en conservant son ADN recherche et développement, afin de mieux convaincre de la pertinence de la Data et de l’IA, depuis 2018 plusieurs transformations ont été menées afin de devenir un pôle de référence en création de solutions internes data et IA innovantes, nativement industrielles, dignes de confiance et responsables.

Les méthodes de travail ont donc évolué, pour se placer dans une démarche globale « IA de confiance et responsable », éprouvée sur de nombreux projets menés en lien avec les entités du Groupe Crédit Agricole. Ces travaux ont été concrétisés début 2022 par la certification et la labellisation des processus de construction, déploiement et maintien en condition opérationnelle de ses solutions.

Le DataLab Groupe traite une variété de cas d’utilisation de l’IA basés sur différents types de données, y compris :

  • IA analytique : utilisation de données structurées ou semi-structurées pour anticiper les difficultés des clients, leur proposer des offres pertinentes ou détecter des tentatives de fraude ou des cyberattaques.
  • IA documentaire : utilisation de données non structurées pour faciliter la reconnaissance et le contrôle des documents utilisés dans tous les processus bancaires.
  • IA textuelle : exploitation de données non structurées pour classer des courriels, extraire des intentions de rapports, reconnaître des émotions dans un texte, etc.

Tous les systèmes d’IA sont basés sur des données, et la maîtrise des systèmes d’IA nécessite au préalable la maîtrise des données.

Démarche d’implémentation du Data Knowledge Catalog

Le DataLab Groupe avait besoin d’un outil pour centraliser les données de tous les projets sur lesquels il travaillait, notamment les différentes sources de données provenant des différentes entités du Groupe ou de l’Open Data, les liens entre elles, les transformations appliquées, et les liens avec les cas d’usage développés.

Le DataLab Groupe avait quelques critères principaux dans le choix d’un catalogue de données pour répondre à ses besoins : pouvoir répondre à tous les cas d’utilisation, traiter les données structurées (données bancaires présentes en base de données), semi-structurées (logs de navigation), mais également des données non structurées (documents et textes). Ils ont choisi DataGalaxy car l’outil permettait cette flexibilité.

Le DataLab Groupe a commencé à travailler sur son catalogue de données par une phase pilote impliquant la documentation de trois projets sur ses principales familles de cas d’usage : L’IA analytique, l’IA documentaire, et l’IA pour extraire des informations à partir d’un texte.

Ensuite, pour chacun de ces types de cas d’usage, des modèles ont été définis en structurant les éléments du dictionnaire et les traitements dans DataGalaxy afin de répondre aux spécificités de chacun de ces types de cas d’usage. L’application de ces modèles permet aujourd’hui de gagner en homogénéité, et en efficacité.

Utilisation et solutions apportées par DataGalaxy

Création de l’Open Data Mart,

qui propose des données ouvertes récupérées, retravaillées et mises à disposition de l’ensemble du DataLab Groupe pour l’ensemble de leurs projets.

Une documentation et une communication internes

pour l’utilisation et le partage des données ouvertes.

Une source unique de vérité

pour tous les projets de données futurs, y compris ceux qui impliquent l’IA et une immense documentation.

Les + de DataGalaxy selon DataLab Groupe

  • Une solution complète et simple d’utilisation pour organiser toutes les données exploitées par le DataLab Groupe dans ses différents projets.
  • Les équipes de DataGalaxy qui sont très réactives, toujours disponibles avec une solution pour chaque question qui se posait.
Nous sommes dans la phase de la généralisation de l’outil à l’ensemble de nos projets au DataLab Groupe. Nous menons beaucoup de projets IA qui suivent méthode, projet labellisé et certifiés, qui inclut désormais la documentation des projets dans l’outil DataGalaxy.

Yulia Koloskova - Infolinguiste et Lead Chapter Data

Découvrez nos autres success stories