Accueil > Data Science / IA > Comprendre l'IA et la Data Science > RAG : Enrichir les IA génératives avec les données de l’entreprise

Comprendre l'IA et la Data Science

RAG : Enrichir les IA génératives avec les données de l’entreprise

6 février 2024 Modifié le 6 février 2024

Mick Levy

RAG est l’acronyme incontournable pour tous ceux qui veulent créer de la valeur avec les iA génératives sur les données de leur organisation. Retour sur ce concept-clé et sur les meilleures approches en entreprise pour faire la différence, en mode interview 😉

J-52

Salon de la Data et de l’IA

17 Sep 2024 |08h30 – 18h00 Nantes

S'inscrire

Que signifie RAG et dans quel cadre s’utilise-t-il ?

Mick Levy : RAG est l’acronyme anglais pour « retrieval augmented generation », soit dit en français « génération augmentée par extraction de données ». C’est le moyen le plus pragmatique pour optimiser les résultats des IA génératives en se basant sur des données propres à son entreprise.

Par ailleurs, les IA génératives, en particulier les large language models (LLM), sont conçues pour apporter une réponse plausible à toute question qui leur est posée, sur tous les domaines, mais pas forcément une réponse vraie. C’est ce qu’on appelle les hallucinations, et elles constituent le problème numéro 1 à la généralisation des IA dans les organisations.

En effet, dès lors que l’on souhaite utiliser les IA génératives dans une organisation publique ou une entreprise, il est indispensable que le modèle soit capable de répondre de manière fiable aux questions spécifiquement utiles pour cette organisation-là. Pour cela, il faut resserrer ces modèles très larges sur les besoins et les données spécifiques de l’organisation. Et c’est cela que permet de faire la RAG.

RAG : Enrichir les IA génératives avec les données de l'entreprise

Comment ? En adossant un ou plusieurs documents de référence au LLM et en lui demandant d’orienter ses réponses prioritairement sur cette base de connaissance. On donne ainsi un poids plus important aux données de l’organisation qu’à toutes les autres données générales acquises par le LLM.

LIVRE BLANC

IA générative : visa pour un futur numérique plus interactif

Pourquoi la RAG est-elle l’approche la plus intéressante pour optimiser les résultats fournis par les IA génératives ?

Mick Levy : La RAG n’est effectivement pas la seule méthode pour personnaliser les réponses des LLM. Il en existe en réalité quatre :

Le prompt engineering, en affinant la façon dont on parle au LLM et en lui donnant des exemples de réponses attendues afin qu’il puisse s’en inspirer. On parle alors de one shot ou few shots.
L’approche RAG, où l’on fournit au LLM des documents et on lui demande de formuler des réponses en se basant en priorité sur les informations contenues dans ces documents.
Le fine tuning, consistant à aller plus en profondeur dans le fonctionnement du LLM pour revoir notamment la pondération des différents paramètres qui guident son fonctionnement.
Créer son propre modèle d’IA générative : une solution qui n’est accessible qu’à quelques acteurs dans le monde, hors de portée et inutile pour la plupart des organisations.

Pour les entreprises qui veulent tirer le meilleur parti de leur patrimoine de données et créer une valeur spécifique, l’approche RAG est clairement la meilleure.

Pour les entreprises qui veulent tirer le meilleur parti de leur patrimoine de données et créer une valeur spécifique, l’approche RAG est clairement la meilleure. Elle à la fois la plus efficace, la plus rapide et la plus fiable : en quelque sorte la plus ROIste.

Des exemples d’application de la RAG ?

Mick Levy : Les exemples sont très nombreux. Il faut regarder partout où il y a des activités qui nécessitent de s’appuyer sur des bases de connaissance ou de documents. Par exemple, pour le service support dans lequel les conseillers ont besoin d’un accès simplifié aux informations de la base de connaissance et de tous les tickets support précédemment résolus.

Dans le marketing, où on pourra assister la rédaction de nouveaux contenus en s’appuyant sur tous les contenus précédents. Dans les directions produit où on pourra assister la rédaction des fiches produit en s’appuyant sur toutes celles déjà rédigées. Les usages sont infinis !

Replay

Data / IA : nos experts décryptent les 7 sujets chauds pour 2024

Pourquoi la RAG est-elle si importante pour se démarquer sur son domaine ?

Mick Levy : C’est la question qu’il faut se poser avant tout. Pourquoi est-ce que je veux optimiser le modèle que j’utilise, dans quel but, pour obtenir quoi ? Les iA génératives, augmentées par la RAG, sont un remarquable outil pour créer de la valeur, à partir du moment où l’on a clairement identifié les usages et les raisons qui ont permis de les choisir.

Pour prendre un avantage compétitif grâce aux iA génératives, il faut s’orienter vers des cas d’usages spécifiques à l’organisation, qui tient compte de ses manières de travailler, de ses processus, de ses besoins, de ses clients, de ses missions. Cela ne sera possible qu’en exploitant les données de l’organisation, et la RAG est la première étape pour rendre cela possible.

Quels sont les défis à relever pour avoir une approche RAG optimale ?

Mick Levy : Il y a d’abord des questions d’architecture IT à résoudre afin de permettre une bonne communication entre le LLM et les bases documentaires. Des solutions existent, tant dans le cloud que sur site.

Si le défi technologique est loin d’être insurmontable, le véritable enjeu porte sur les données, les documents fournis à la RAG. Elles doivent être maîtrisées et de bonne qualité. Cela signifie que les informations sont avérées, vérifiées, à-propos, fraiches et, autant que faire se peut non contradictoires…

C’est un vrai défi qui appelle la mise en place d’une gouvernance spécifique de ces données non structurées. La difficulté vient du fait que cela fait des dizaines d’années que toutes les entreprises et organisations travaillent essentiellement leurs données structurées (principalement des nombres, organisés en lignes et colonnes dans les bases données de l’entreprise).

En dépit de cette expérience acquise, de très nombreux problèmes de qualité de données existent encore sur ces données structurées. Or, dès lors que l’on recourt aux LLM, il faut en plus ajouter les données non structurées, qui, selon une étude IDC, représentent 90% des données disponibles. Le défi est donc colossal. Mais la création de valeur potentielle l’est aussi et la RAG est la première étape pour en tirer parti.

👉 Retrouvez toute notre actu en temps réel en nous suivant sur LinkedIn 👈

✍️ Interview réalisée avec Frédéric Escudier – Les Echos Publishing.

Directeur de l'Innovation Business Business & Decision

20 ans d’expérience dans la valorisation du capital des données de l’entreprise. Conférencier et auteur du livre « Sortez vos données du frigo ». Acteur engagé, Mick conseille de nombreuses organisations sur leur stratégie Data et IA.

Votre adresse de messagerie est uniquement utilisée par Business & Decision, responsable de traitement, aux fins de traitement de votre demande et d’envoi de toute communication de Business & Decision en relation avec votre demande uniquement. En savoir plus sur la gestion de vos données et vos droits.

Tendances Data

Le Dashboard Design relève-t-il du niveau olympique ? Réponse en Dataviz

« On peut faire dire ce qu’on veut aux chiffres » Vous avez déjà sûrement entendu cette phrase, et vous vous dites peut-être que ce n’est pas possible, que non, un chiffre...

Premium

Intégrer l'IA et la Data Science

REPLAY | Comment LVMH a réussi à déployer une IA de confiance ?

LVMH a bâti sa stratégie Data & IA autour des solutions DataGalaxy et Dataiku, eux-mêmes accompagnés par Orange. Cap sur un retour d’expérience inspirant présenté au cours d’une table-ronde dédiée...

Premium

Intégrer l'IA et la Data Science

REPLAY | IA génératives : la puissance des technologies Microsoft pour votre entreprise

Comment appréhender concrètement toutes les facettes de la révolution technologique des intelligences artificielles ? Réponses avec Microsoft et nos experts Orange Business / Business & Decision. L’occasion de revivre la Matinée...

Tutoriels outils et langages data

Snowflake : pourquoi et comment coder directement en Python ?

Snowflake, la plateforme d’hébergement de données dans le cloud est reconnue pour sa puissance, sa flexibilité et sa sécurité. Elle offre un large éventail de services pour stocker, analyser, partager...

Actualités Data et IA

Revue de presse Data & IA – Juin 2024

Quelles sont les actualités qu’il ne fallait pas manquer ce mois-ci dans les secteurs de la Data et de l’Intelligence artificielle ? Au programme : le mode d’emploi de la...

Premium

Transformation digitale

REPLAY | Captcha invisible : se protéger des attaques de robots malveillants tout en préservant la fluidité du parcours digital

En s'appuyant sur des algorithmes d'intelligence artificielle et d'apprentissage automatique, le Captcha Invisible d’Orange Business analyse les comportements des utilisateurs (utilisation de la souris ou du clavier, réputation de l'adresse...

Tutoriels outils et langages data

Snowflake : les Dynamic Tables peuvent-elles remplacer les ETL/ELT ?

Après toutes les annonces de Snowflake lors du Summit et Snow Day de l'année dernière, les nouvelles fonctionnalités arrivent progressivement en General Availibility. C’est désormais au tour des Dynamic Tables,...

Actualités Data et IA

Revue de presse Data & IA – Mai 2024

Quelles sont les actualités qu’il ne fallait pas manquer ce mois-ci dans les secteurs de la Data et de l’Intelligence artificielle ? Au programme : ce qu'il faut retenir (ou...

Tendances Data

L'Eurovision : concours de la chanson et géopolitique ? Réponse en Dataviz

Qui a déjà vécu des débats enflammés, sur des sujets variés du quotidien ou d’actualité, lors de repas du dimanche en famille ? Où chacun avance des affirmations sans pouvoir complètement...

Premium

Solutions technologiques

REPLAY | Une plateforme pour réunir tous vos portails : Liferay, la solution de vos expériences digitales

Marketplace & e-Commerce, Intranet & Extranet, Partenaires & Fournisseurs, modules de Marketing Analytics ou Relationnels… Orange Business a placé Liferay au cœur de sa stratégie Digitale et réalisé de nombreux...

Actualités Data et IA

Revue de presse Data & IA – Avril 2024

Quelles sont les actualités qu’il ne fallait pas manquer ce mois-ci dans les secteurs de la Data et de l’Intelligence artificielle ? Au programme : l'opportunité pour l'Europe de devenir...

Parcours client

IA et Expérience utilisateur : stratégies, défis et opportunités

L’évolution du rapport entre l’homme et la machine a connu une accélération spectaculaire ces dernières années. De l’avènement des ordinateurs encombrants aux dispositifs personnels tels que les smartphones et les...

Premium

Parcours client

REPLAY | Retour d'expérience : le projet de relation usager de la Région Bretagne

La région Bretagne a développé son projet de relation usager avec Orange et a présenté lors d’une conférence dédiée avec les experts Orange Business comment ce projet a été préparé....

Tutoriels outils et langages data

Certification éditeur : vos projets, vos clients et vous avez tout à y gagner

« J’ai le plaisir de vous annoncer que j’ai obtenu une nouvelle certification XX (insérer ici un éditeur ;) ) » est devenu un post récurent sur les réseaux sociaux comme LinkedIn....

RAG : Enrichir les IA génératives avec les données de l’entreprise

Salon de la Data et de l’IA

Que signifie RAG et dans quel cadre s’utilise-t-il ?

Pourquoi la RAG est-elle l’approche la plus intéressante pour optimiser les résultats fournis par les IA génératives ?

Des exemples d’application de la RAG ?

Pourquoi la RAG est-elle si importante pour se démarquer sur son domaine ?

Quels sont les défis à relever pour avoir une approche RAG optimale ?

Découvrez aussi

Le Dashboard Design relève-t-il du niveau olympique ? Réponse en Dataviz

REPLAY | Comment LVMH a réussi à déployer une IA de confiance ?

REPLAY | IA génératives : la puissance des technologies Microsoft pour votre entreprise

Snowflake : pourquoi et comment coder directement en Python ?

Revue de presse Data & IA – Juin 2024

REPLAY | Captcha invisible : se protéger des attaques de robots malveillants tout en préservant la fluidité du parcours digital

Snowflake : les Dynamic Tables peuvent-elles remplacer les ETL/ELT ?

Revue de presse Data & IA – Mai 2024

L'Eurovision : concours de la chanson et géopolitique ? Réponse en Dataviz

REPLAY | Une plateforme pour réunir tous vos portails : Liferay, la solution de vos expériences digitales

Revue de presse Data & IA – Avril 2024

IA et Expérience utilisateur : stratégies, défis et opportunités

REPLAY | Retour d'expérience : le projet de relation usager de la Région Bretagne

Certification éditeur : vos projets, vos clients et vous avez tout à y gagner

Informations sur la gestion de vos données et vos droits

Newsletter