Accueil > Data Science / IA > Comprendre l'IA et la Data Science > RAG : Enrichir les IA génératives avec les données de l’entreprise

Comprendre l'IA et la Data Science

RAG : Enrichir les IA génératives avec les données de l’entreprise

6 février 2024 Modifié le 6 février 2024

Mick Levy

RAG est l’acronyme incontournable pour tous ceux qui veulent créer de la valeur avec les iA génératives sur les données de leur organisation. Retour sur ce concept-clé et sur les meilleures approches en entreprise pour faire la différence, en mode interview 😉

Voir aussi

#Data / #IA : 7 sujets chauds pour 2024

Que signifie RAG et dans quel cadre s’utilise-t-il ?

Mick Levy : RAG est l’acronyme anglais pour « retrieval augmented generation », soit dit en français « génération augmentée par extraction de données ». C’est le moyen le plus pragmatique pour optimiser les résultats des IA génératives en se basant sur des données propres à son entreprise.

Par ailleurs, les IA génératives, en particulier les large language models (LLM), sont conçues pour apporter une réponse plausible à toute question qui leur est posée, sur tous les domaines, mais pas forcément une réponse vraie. C’est ce qu’on appelle les hallucinations, et elles constituent le problème numéro 1 à la généralisation des IA dans les organisations.

En effet, dès lors que l’on souhaite utiliser les IA génératives dans une organisation publique ou une entreprise, il est indispensable que le modèle soit capable de répondre de manière fiable aux questions spécifiquement utiles pour cette organisation-là. Pour cela, il faut resserrer ces modèles très larges sur les besoins et les données spécifiques de l’organisation. Et c’est cela que permet de faire la RAG.

RAG : Enrichir les IA génératives avec les données de l'entreprise

Comment ? En adossant un ou plusieurs documents de référence au LLM et en lui demandant d’orienter ses réponses prioritairement sur cette base de connaissance. On donne ainsi un poids plus important aux données de l’organisation qu’à toutes les autres données générales acquises par le LLM.

LIVRE BLANC

IA générative : visa pour un futur numérique plus interactif

Pourquoi la RAG est-elle l’approche la plus intéressante pour optimiser les résultats fournis par les IA génératives ?

Mick Levy : La RAG n’est effectivement pas la seule méthode pour personnaliser les réponses des LLM. Il en existe en réalité quatre :

Le prompt engineering, en affinant la façon dont on parle au LLM et en lui donnant des exemples de réponses attendues afin qu’il puisse s’en inspirer. On parle alors de one shot ou few shots.
L’approche RAG, où l’on fournit au LLM des documents et on lui demande de formuler des réponses en se basant en priorité sur les informations contenues dans ces documents.
Le fine tuning, consistant à aller plus en profondeur dans le fonctionnement du LLM pour revoir notamment la pondération des différents paramètres qui guident son fonctionnement.
Créer son propre modèle d’IA générative : une solution qui n’est accessible qu’à quelques acteurs dans le monde, hors de portée et inutile pour la plupart des organisations.

Pour les entreprises qui veulent tirer le meilleur parti de leur patrimoine de données et créer une valeur spécifique, l’approche RAG est clairement la meilleure.

Pour les entreprises qui veulent tirer le meilleur parti de leur patrimoine de données et créer une valeur spécifique, l’approche RAG est clairement la meilleure. Elle à la fois la plus efficace, la plus rapide et la plus fiable : en quelque sorte la plus ROIste.

Des exemples d’application de la RAG ?

Mick Levy : Les exemples sont très nombreux. Il faut regarder partout où il y a des activités qui nécessitent de s’appuyer sur des bases de connaissance ou de documents. Par exemple, pour le service support dans lequel les conseillers ont besoin d’un accès simplifié aux informations de la base de connaissance et de tous les tickets support précédemment résolus.

Dans le marketing, où on pourra assister la rédaction de nouveaux contenus en s’appuyant sur tous les contenus précédents. Dans les directions produit où on pourra assister la rédaction des fiches produit en s’appuyant sur toutes celles déjà rédigées. Les usages sont infinis !

Replay

Data / IA : nos experts décryptent les 7 sujets chauds pour 2024

Pourquoi la RAG est-elle si importante pour se démarquer sur son domaine ?

Mick Levy : C’est la question qu’il faut se poser avant tout. Pourquoi est-ce que je veux optimiser le modèle que j’utilise, dans quel but, pour obtenir quoi ? Les iA génératives, augmentées par la RAG, sont un remarquable outil pour créer de la valeur, à partir du moment où l’on a clairement identifié les usages et les raisons qui ont permis de les choisir.

Pour prendre un avantage compétitif grâce aux iA génératives, il faut s’orienter vers des cas d’usages spécifiques à l’organisation, qui tient compte de ses manières de travailler, de ses processus, de ses besoins, de ses clients, de ses missions. Cela ne sera possible qu’en exploitant les données de l’organisation, et la RAG est la première étape pour rendre cela possible.

Quels sont les défis à relever pour avoir une approche RAG optimale ?

Mick Levy : Il y a d’abord des questions d’architecture IT à résoudre afin de permettre une bonne communication entre le LLM et les bases documentaires. Des solutions existent, tant dans le cloud que sur site.

Si le défi technologique est loin d’être insurmontable, le véritable enjeu porte sur les données, les documents fournis à la RAG. Elles doivent être maîtrisées et de bonne qualité. Cela signifie que les informations sont avérées, vérifiées, à-propos, fraiches et, autant que faire se peut non contradictoires…

C’est un vrai défi qui appelle la mise en place d’une gouvernance spécifique de ces données non structurées. La difficulté vient du fait que cela fait des dizaines d’années que toutes les entreprises et organisations travaillent essentiellement leurs données structurées (principalement des nombres, organisés en lignes et colonnes dans les bases données de l’entreprise).

En dépit de cette expérience acquise, de très nombreux problèmes de qualité de données existent encore sur ces données structurées. Or, dès lors que l’on recourt aux LLM, il faut en plus ajouter les données non structurées, qui, selon une étude IDC, représentent 90% des données disponibles. Le défi est donc colossal. Mais la création de valeur potentielle l’est aussi et la RAG est la première étape pour en tirer parti.

👉 Retrouvez toute notre actu en temps réel en nous suivant sur LinkedIn 👈

✍️ Interview réalisée avec Frédéric Escudier – Les Echos Publishing.

Directeur de l'Innovation Business Business & Decision

20 ans d’expérience dans la valorisation du capital des données de l’entreprise. Conférencier et auteur du livre « Sortez vos données du frigo ». Acteur engagé, Mick conseille de nombreuses organisations sur leur stratégie Data et IA.

Votre adresse de messagerie est uniquement utilisée par Business & Decision, responsable de traitement, aux fins de traitement de votre demande et d’envoi de toute communication de Business & Decision en relation avec votre demande uniquement. En savoir plus sur la gestion de vos données et vos droits.

Sécurité des données

Identités numériques : tout comprendre sur ce domaine en pleine évolution

L'identité numérique est au cœur des interactions en ligne, des transactions commerciales, des processus administratifs et de la protection des données personnelles. Elle englobe non seulement la manière dont les...

Premium

Innovations Cloud

REPLAY | FinOps : Comment un grand groupe a réduit de 70% la facture d’un projet cloud ?

La maîtrise des coûts liés au cloud représente un enjeu crucial pour les entreprises en 2025. Cette vidéo, réalisée sous forme de webinar, met en lumière l'expérience d'un client ayant...

IoT et objets connectés

[Data Rider] REX Collecte de données IoT – Étape 1 : Initier la collecte

Vous êtes-vous déjà dit que la partie « collecte de données » d’une chaîne de données était une partie relativement simple d’un projet ? Dans cette série d’articles, nous expliquons pourquoi, selon nous,...

Actualités Data et IA

Revue de presse Data & IA – Mai 2025

Quelles sont les actualités qu’il ne fallait pas manquer dans les secteurs de la Data et de l’Intelligence artificielle ? Au programme : Salesforce s’offre Informatica, Meta va entraîner ses systèmes d'IA...

Premium

Innovation

REPLAY | Accessibilité numérique, secteur privé et évolution de la législation : cap sur la mise en conformité

Dans un monde de plus en plus digitalisé, l’accessibilité numérique est devenue un impératif. Elle garantit que chacun, quels que soient ses capacités ou ses outils, puisse accéder aux contenus...

Premium

Transformation digitale

REPLAY | Réinventez vos parcours métiers grâce à l’IA, au Low-Code et au Cloud Native

Les attentes des clients et des collaborateurs évoluent de plus en plus vite. Ainsi, pour rester compétitif, il ne suffit plus d’innover, il faut le faire vite, bien et en...

Solutions technologiques

Copilotage Intelligent avec Microsoft Azure : Approche d’architecture pilotée par les indicateurs de performance

Les avancées en intelligence artificielle générative, notamment via les LLMs (Large Language Models), ouvrent des perspectives inédites d’amplification des capacités humaines dans les entreprises. Comme l’ont souligné Brynjolfsson et McAfee...

Stratégie Data

Présent et futur de l’IA : quelle trajectoire pour les entreprises ?

L’ascension de ChatGPT a été fulgurante, et a propulsé l'intelligence artificielle, notamment l'IA générative, sur le devant de la scène. Jamais une technologie n’est allée aussi vite dans son adoption...

Premium

Solutions technologiques

REPLAY | Azure Arc ou comment optimiser vos usages Microsoft on premise

Comment maximiser la sécurité et l'efficacité de votre infrastructure ? Azure Arc peut transformer la gestion de vos serveurs SQL et Windows tout en restant sur site. Nos explications en...

Premium

Solutions technologiques

REPLAY | Liferay : accélérez le développement de vos applications digitales avec une plateforme low-code souveraine

Dans un marché en constante évolution, la rapidité de déploiement des expériences et applications digitales est essentielle pour garder une longueur d’avance. 70% des entreprises considèrent l’accélération du Time to...

Actualités Data et IA

Revue de presse Data & IA – Avril 2025

Quelles sont les actualités qu’il ne fallait pas manquer dans les secteurs de la Data et de l’Intelligence artificielle ? Au programme : l'entreprise Bleu franchit la première étape vers la qualification...

Stratégie Data

Les enjeux IA & Data 2025 : entre course à l'IA générale et réalité terrain

Alors que la course vers une IA générale mobilise des ressources considérables, les entreprises sont confrontées à des enjeux beaucoup plus concrets. Loin des effets d’annonce, il est impératif de...

Premium

Transformation digitale

REPLAY | CSRD : Les secrets d'une approche Data ESG performante

La CSRD, récemment bousculée par l’Omnibus de la Commission Européenne, continue de transformer le reporting extra-financer. Il devient alors essentiel pour les entreprises d’intégrer l’ESG au cœur de leur stratégie....

Premium

Migration vers le cloud

REPLAY | Réussissez votre migration vers le cloud : Stratégie et Retour d'expérience avec Bleu

Les entreprises et administrations publiques sont soumises à de fortes exigences en matière de confidentialité. Comment allier innovation et maîtrise des données ? Retour d’expérience pour réussir votre migration vers le...

RAG : Enrichir les IA génératives avec les données de l’entreprise

Que signifie RAG et dans quel cadre s’utilise-t-il ?

Pourquoi la RAG est-elle l’approche la plus intéressante pour optimiser les résultats fournis par les IA génératives ?

Des exemples d’application de la RAG ?

Pourquoi la RAG est-elle si importante pour se démarquer sur son domaine ?

Quels sont les défis à relever pour avoir une approche RAG optimale ?

Découvrez aussi

Identités numériques : tout comprendre sur ce domaine en pleine évolution

REPLAY | FinOps : Comment un grand groupe a réduit de 70% la facture d’un projet cloud ?

[Data Rider] REX Collecte de données IoT – Étape 1 : Initier la collecte

Revue de presse Data & IA – Mai 2025

REPLAY | Accessibilité numérique, secteur privé et évolution de la législation : cap sur la mise en conformité

REPLAY | Réinventez vos parcours métiers grâce à l’IA, au Low-Code et au Cloud Native

Copilotage Intelligent avec Microsoft Azure : Approche d’architecture pilotée par les indicateurs de performance

Présent et futur de l’IA : quelle trajectoire pour les entreprises ?

REPLAY | Azure Arc ou comment optimiser vos usages Microsoft on premise

REPLAY | Liferay : accélérez le développement de vos applications digitales avec une plateforme low-code souveraine

Revue de presse Data & IA – Avril 2025

Les enjeux IA & Data 2025 : entre course à l'IA générale et réalité terrain

REPLAY | CSRD : Les secrets d'une approche Data ESG performante

REPLAY | Réussissez votre migration vers le cloud : Stratégie et Retour d'expérience avec Bleu

Informations sur la gestion de vos données et vos droits