RAG est l’acronyme incontournable pour tous ceux qui veulent créer de la valeur avec les iA génératives sur les données de leur organisation. Retour sur ce concept-clé et sur les meilleures approches en entreprise pour faire la différence, en mode interview 😉
Matinale Data & IA
Que signifie RAG et dans quel cadre s’utilise-t-il ?
Mick Levy : RAG est l’acronyme anglais pour « retrieval augmented generation », soit dit en français « génération augmentée par extraction de données ». C’est le moyen le plus pragmatique pour optimiser les résultats des IA génératives en se basant sur des données propres à son entreprise.
Par ailleurs, les IA génératives, en particulier les large language models (LLM), sont conçues pour apporter une réponse plausible à toute question qui leur est posée, sur tous les domaines, mais pas forcément une réponse vraie. C’est ce qu’on appelle les hallucinations, et elles constituent le problème numéro 1 à la généralisation des IA dans les organisations.
En effet, dès lors que l’on souhaite utiliser les IA génératives dans une organisation publique ou une entreprise, il est indispensable que le modèle soit capable de répondre de manière fiable aux questions spécifiquement utiles pour cette organisation-là. Pour cela, il faut resserrer ces modèles très larges sur les besoins et les données spécifiques de l’organisation. Et c’est cela que permet de faire la RAG.
Comment ? En adossant un ou plusieurs documents de référence au LLM et en lui demandant d’orienter ses réponses prioritairement sur cette base de connaissance. On donne ainsi un poids plus important aux données de l’organisation qu’à toutes les autres données générales acquises par le LLM.
Pourquoi la RAG est-elle l’approche la plus intéressante pour optimiser les résultats fournis par les IA génératives ?
Mick Levy : La RAG n’est effectivement pas la seule méthode pour personnaliser les réponses des LLM. Il en existe en réalité quatre :
- Le prompt engineering, en affinant la façon dont on parle au LLM et en lui donnant des exemples de réponses attendues afin qu’il puisse s’en inspirer. On parle alors de one shot ou few shots.
- L’approche RAG, où l’on fournit au LLM des documents et on lui demande de formuler des réponses en se basant en priorité sur les informations contenues dans ces documents.
- Le fine tuning, consistant à aller plus en profondeur dans le fonctionnement du LLM pour revoir notamment la pondération des différents paramètres qui guident son fonctionnement.
- Créer son propre modèle d’IA générative : une solution qui n’est accessible qu’à quelques acteurs dans le monde, hors de portée et inutile pour la plupart des organisations.
Pour les entreprises qui veulent tirer le meilleur parti de leur patrimoine de données et créer une valeur spécifique, l’approche RAG est clairement la meilleure.
Pour les entreprises qui veulent tirer le meilleur parti de leur patrimoine de données et créer une valeur spécifique, l’approche RAG est clairement la meilleure. Elle à la fois la plus efficace, la plus rapide et la plus fiable : en quelque sorte la plus ROIste.
Des exemples d’application de la RAG ?
Mick Levy : Les exemples sont très nombreux. Il faut regarder partout où il y a des activités qui nécessitent de s’appuyer sur des bases de connaissance ou de documents. Par exemple, pour le service support dans lequel les conseillers ont besoin d’un accès simplifié aux informations de la base de connaissance et de tous les tickets support précédemment résolus.
Dans le marketing, où on pourra assister la rédaction de nouveaux contenus en s’appuyant sur tous les contenus précédents. Dans les directions produit où on pourra assister la rédaction des fiches produit en s’appuyant sur toutes celles déjà rédigées. Les usages sont infinis !
Pourquoi la RAG est-elle si importante pour se démarquer sur son domaine ?
Mick Levy : C’est la question qu’il faut se poser avant tout. Pourquoi est-ce que je veux optimiser le modèle que j’utilise, dans quel but, pour obtenir quoi ? Les iA génératives, augmentées par la RAG, sont un remarquable outil pour créer de la valeur, à partir du moment où l’on a clairement identifié les usages et les raisons qui ont permis de les choisir.
Pour prendre un avantage compétitif grâce aux iA génératives, il faut s’orienter vers des cas d’usages spécifiques à l’organisation, qui tient compte de ses manières de travailler, de ses processus, de ses besoins, de ses clients, de ses missions. Cela ne sera possible qu’en exploitant les données de l’organisation, et la RAG est la première étape pour rendre cela possible.
Quels sont les défis à relever pour avoir une approche RAG optimale ?
Mick Levy : Il y a d’abord des questions d’architecture IT à résoudre afin de permettre une bonne communication entre le LLM et les bases documentaires. Des solutions existent, tant dans le cloud que sur site.
Si le défi technologique est loin d’être insurmontable, le véritable enjeu porte sur les données, les documents fournis à la RAG. Elles doivent être maîtrisées et de bonne qualité. Cela signifie que les informations sont avérées, vérifiées, à-propos, fraiches et, autant que faire se peut non contradictoires…
C’est un vrai défi qui appelle la mise en place d’une gouvernance spécifique de ces données non structurées. La difficulté vient du fait que cela fait des dizaines d’années que toutes les entreprises et organisations travaillent essentiellement leurs données structurées (principalement des nombres, organisés en lignes et colonnes dans les bases données de l’entreprise).
En dépit de cette expérience acquise, de très nombreux problèmes de qualité de données existent encore sur ces données structurées. Or, dès lors que l’on recourt aux LLM, il faut en plus ajouter les données non structurées, qui, selon une étude IDC, représentent 90% des données disponibles. Le défi est donc colossal. Mais la création de valeur potentielle l’est aussi et la RAG est la première étape pour en tirer parti.
👉 Retrouvez toute notre actu en temps réel en nous suivant sur LinkedIn 👈
✍️ Interview réalisée avec Frédéric Escudier – Les Echos Publishing.
Votre adresse de messagerie est uniquement utilisée par Business & Decision, responsable de traitement, aux fins de traitement de votre demande et d’envoi de toute communication de Business & Decision en relation avec votre demande uniquement. En savoir plus sur la gestion de vos données et vos droits.