ChatGPT en porte-étendard, mais aussi MidJourney ou Dall-e, ont vulgarisé l’usage de l’intelligence artificielle générative auprès du grand public, tout en suscitant des confusions. Les technologies d’IA générative englobent ainsi un large périmètre d’outils et d’usages dont les entreprises doivent se saisir. Décryptage et démystification.
Fin 2022, ChatGPT était lancé par OpenAI, permettant à un grand nombre d’utilisateurs de se familiariser avec l’intelligence artificielle et ses possibilités. L’outil conversationnel réussit là où les applications précédentes du Deep Learning ou du Machine Learning restent encore souvent complexes à appréhender ou simplement invisibles du grand-public.
ChatGPT, mais aussi DALL-E et Midjourney pour la génération d’image, ont donc largement participé à la démocratisation de l’intelligence artificielle, et plus spécifiquement encore d’une catégorie de l’intelligence artificielle, à savoir l’IA générative.
Une nouvelle étape a été franchie avec le passage d’une IA qu’on pourrait qualifier de silencieuse à une IA tonitruante car omniprésente, médiatisée, compréhensible et exploitable par le plus grand nombre.
Mais qui dit tonitruante dit aussi parfois assourdissante. Et la large médiatisation de ces modèles d’intelligence artificielle, si elle participe à la démocratisation, contribue dans le même temps à des confusions, voire à des fantasmes. Tentons donc d’éclaircir quelques concepts et de clarifier ce qu’est véritablement – et n’est pas – l’IA générative.
Qu’est-ce que l’IA générative ?
Et pourquoi ne pas poser la question à ChatGPT ?
“L’IA générative est une branche de l’intelligence artificielle qui se concentre sur la création de modèles et d’algorithmes capables de générer des données, des images, des textes ou des sons de manière autonome. Elle utilise souvent des réseaux de neurones artificiels et des techniques d’apprentissage profond pour apprendre à partir de données existantes et générer de nouvelles données qui ressemblent à celles qu’elle a apprises. L’IA générative est utilisée dans de nombreux domaines tels que la création d’art, la musique, la vidéo, la publicité, la mode, les jeux vidéo et la simulation.”
C’est donc ainsi que ChatGPT définit l’IA générative, soulignant la capacité de ce large écosystème technologique à créer du contenu, sous différents formats et depuis des sources multiples. Cette dernière caractéristique est qualifiée de multimodale. Par exemple, GPT-4 d’OpenAI est ainsi une IA générative et multimodale. Cela signifie qu’elle associe plusieurs sources de données (texte, voix, image, données) et algorithmes de traitement. Sa version précédente, GPT-3.5 se limite au texte.
Les IA génératives peuvent être spécifiques à certaines sources de données. GPT 3.5, exploitée par ChatGPT, a été entraînée uniquement grâce à du texte, une donnée non structurée. Sa réponse s’effectuera donc seulement sous forme textuelle. D’autres modèles sont en revanche spécialisés sur l’image ou la vidéo. Enfin, et c’est une rupture, l’IA multimodale a la capacité de traiter des sources multiples.
L’IA générative est pour les entreprises un levier potentiel majeur d’amélioration de la productivité.
L’IA générative est-elle une révolution ou une évolution ?
ChatGPT a en fait rassemblé et démocratisé des technologies préexistantes, dont les LLM (Large Language Model), les modèles de langage de grande taille. Pour le texte, citons GPT-3 et GPT-4 d’OpenAI ou BERT de Google. En ce qui concerne GPT-3, son lancement remonte à 2020. L’IA générative n’est donc pas une nouveauté de 2022 et 2023.
Par ailleurs, ces modèles s’appuient sur des techniques testées depuis plusieurs années déjà. GPT est en effet l’acronyme de Generative Pre-trained Transformer. Les origines des Transformers, qui sont des modèles de Deep Learning, datent de fin 2017. Leur fonctionnement est présenté dans un document de recherche intitulé « Attention Is All You Need ».
On pourrait donc considérer que la révolution est d’abord celle des Transformers et des LLM, dont l’émergence a été permise par des travaux antérieurs sur le Deep Learning et les réseaux de neurones. Pour la figure éminente de l’IA qu’est Yann LeCun, « ChatGPT et d’autres grands modèles de langage ne sont pas sortis de nulle part. Ils sont le résultat de décennies de contributions de diverses personnes. »
Le chercheur, titulaire du prestigieux prix Turing, souligne que les travaux sur l’apprentissage auto-supervisé, une approche adoptée par OpenAI, sont antérieurs à la création de la startup. Il en va de même des transformers, comme du recours à un feedback humain (RLHF ou Reinforcement Learning from Human Feedback).
Si révolution il y a, celle-ci a pour origine des contributions multiples. Yann LeCun nuance l’apport d’OpenAI et l’innovation de ces solutions. En revanche, il ne minimise pas la valeur de l’intelligence artificielle générative, que son employeur, Meta, développe intensivement.
Évolution ou révolution, la question peut être débattue par les experts. Pour les entreprises et les utilisateurs de l’IA, le génératif et sa démocratisation constituent bien un bouleversement. L’IA générative est pour les entreprises un levier potentiel majeur d’amélioration de la productivité. C’est aussi l’opportunité pour elles de valoriser un patrimoine largement sous-exploité à ce jour, celui des données non structurées (texte, image, son, vidéo). Elles ont donc tout intérêt à accélérer pour passer de la veille à l’idéation en termes de cas d’usage, puis à leur mise en œuvre.
L’IA générative ne se cantonne pas au texte, même si pour la plupart des entreprises, c’est dans ce secteur que le potentiel semble le plus important.
ChatGPT, DALL-E, GPT, Midjourney, LLM, transformers… pourquoi ne pas tout confondre ?
La vulgarisation de l’IA générative est une tâche complexe tant elle englobe de mots clés, d’acronymes, d’outils et autres concepts. Commençons en distinguant ChatGPT des modèles génératifs. ChatGPT est une interface de type chatbot ou robot conversationnel. Celui-ci permet d’interagir avec un Large Language Model (LLM), un modèle d’IA génératif de texte, à savoir GPT. Ce dernier est un modèle de type Transformer reposant sur une architecture Deep Learning.
L’IA générative ne se cantonne pas au texte, même si pour la plupart des entreprises, c’est dans ce secteur que le potentiel semble le plus important. D’autres IA génératives ont été popularisées en 2022 auprès du grand public, comme DALL-E et Midjourney. Ces modèles sont des générateurs d’images. Dall-E a été conçu par OpenAI. Il permet de créer des images à partir de descriptions textuelles (prompts). Midjourney fonctionne selon le même principe.
Comment fonctionnent les modèles d’IA générative ?
Comme nous l’avons introduit, l’IA générative a pour but de générer du contenu à la demande, en fonction d’une requête, appelée prompt. Pour assurer cette fonction, elle repose sur un réseau de neurones génératif. Cette typologie de réseau mobilise un processus d’apprentissage profond qui mixe des approches non supervisées, supervisées et de renforcement. Le mix des modes d’apprentissage est l’un des éléments clés de la puissance de ces modèles.
Grâce à un large corpus de données d’entraînement (composé des données du Web public pour les modèles GPT), l’IA génère de nouvelles données. Pour cela, l’intelligence artificielle va prédire la réponse la plus probable en assemblant mot à mot des phrases complètes. Le fonctionnement des IA génératives est en effet probabiliste. Cela explique pourquoi des modèles comme GPT-3 ou 4 peuvent fournir des résultats erronés ou de pures inventions, appelées hallucinations. Ces erreurs, qui résultent du fonctionnement même des modèles sous-jacents, constituent une des limites de l’IA générative. Des précautions et des adaptations sont donc indispensables pour importer les usages de ces IA en entreprise.
Pour de nombreux cas d’usage, comme dans la banque ou la santé par exemple, des erreurs telles que celles commises par ChatGPT ne sont pas tolérables.
Quelles sont les limites et risques de l’intelligence artificielle générative ?
Les erreurs, hallucinations, représentent probablement la limite la plus tangible des modèles d’IA générative. Pour de nombreux cas d’usage, comme dans la banque ou la santé par exemple, des erreurs telles que celles commises par ChatGPT ne sont pas tolérables.
Mais l’IA générative soulève d’autres interrogations, et en particulier d’ordre juridique. Ces modèles, dont GPT, sont entraînés grâce aux données disponibles publiquement sur Internet. Ce scrapping suggère que les IA ont vraisemblablement été entraînées grâce à des données personnelles. Quid alors de la conformité avec le RGPD ? Fin mars, la Cnil italienne prononçait une interdiction temporaire à l’égard d’OpenAI. Elle a estimé qu’il existait un doute suffisant sur la conformité au RGPD de ChatGPT.
En France, ChatGPT n’est pas interdit. Le député français Éric Bothorel a cependant porté plainte devant la Cnil en raison des “fausses informations” diffusées par le chatbot. Plusieurs autres personnes ont aussi déposé des plaintes. La Cnil a récemment publié un dossier consacré à l’IA générative. Elle s’est aussi dotée d’un service de l’intelligence artificielle. Elle planche actuellement sur la manière dont le RGPD “peut venir encadrer le développement d’IA génératives et leurs usages.” Au niveau européen, l’AI Act, en cours de conception, devrait être adapté pour englober la régulation des IA génératives.
Ces modèles posent en outre des questions en matière de respect de la propriété intellectuelle. Aux États-Unis, Getty Images a déposé plainte contre Stable Diffusion pour violation du droit d’auteur. La banque d’image accuse la startup créatrice de l’IA générative d’avoir exploité ses données pour entraîner ses modèles sans autorisation, attribution, ou compensation financière.
💡 Pourquoi les entreprises doivent-elles s’intéresser à l’IA générative ?
Le mouvement autour de l’IA générative est une opportunité pour l’entreprise. Sont aujourd’hui disponibles des IA pré-entraînées sur d’importants corpus de données texte. Afin de répondre précisément aux besoins des organisations, leur apprentissage nécessite d’être complété grâce à leurs propres données, qui renferment leur savoir-faire et leur connaissance métier. Cette approche réduit les coûts d’investissement et garantit une meilleure adéquation aux besoins.
D’ailleurs, l’adoption rapide par le grand public génère des attentes dans les métiers de l’entreprise. Deux mois après son lancement, ChatGPT comptait déjà 100 millions d’utilisateurs, un record en termes d’adoption. Avec un fonctionnement porté par le cloud et des API, ces outils d’IA sont à la portée des organisations. Ils constituent en outre des atouts concurrentiels potentiels pour les pionniers de leur utilisation. L’automatisation qu’ils permettent est gage d’amélioration de la productivité. Une appropriation rapide est donc recommandée.
Comment intégrer l’IA générative dans l’entreprise ?
Rapidité ne signifie pas précipitation. L’adoption de l’IA générative passe par quatre phases principales. La première est celle de la compréhension. Acculturation et formation sont à mener à différents niveaux de l’entreprise, notamment au sein des instances dirigeantes.
Les collaborateurs doivent aussi être sensibilisés pour démystifier et faire émerger des cas d’usage correspondant à des besoins réels. Leur formalisation constitue la deuxième étape, celle de l’idéation.
Les 4 phases de l’adoption de l’IA générative
📌 Acculturation
📌 Idéation
📌 Choix technologiques
📌 Industrialisation
Viennent ensuite les choix technologiques pour lesquels les options sont multiples. Elles peuvent consister à exploiter directement les API d’OpenAI, à privilégier des environnements privés dont Microsoft Azure OpenAI Services ou ceux de GCP ou AWS, voire à recourir à des solutions open source (Llama/Alpaca initialement développés par Meta, HuggingFace Bloom, Dolly…) sur des environnements cloud privé ou on-premise.
Le volet technologique de ces projets nécessite aussi de définir une méthode d’entraînement ou de fine-tuning avec les données de l’entreprise, ainsi que d’arrêter la manière dont ces outils génératifs seront intégrés au SI et à ses applications. Il ne faut donc pas négliger les efforts d’industrialisation en adoptant une démarche MLOps.
La technique n’est pas tout dans les projets d’IA générative. La conduite du changement est en effet capitale compte tenu de l’impact sur les métiers et le quotidien des collaborateurs. Attention donc à ne pas négliger le change !
Il peut être préférable, dans le cadre d’une stratégie structurée et gouvernée d’IA générative, de se faire accompagner sur le déroulement de ces multiples étapes pour mettre en place des processus industriels de bout-en-bout, de l’idéation au déploiement.
Quels usages concrets de l’intelligence artificielle générative pour l’entreprise ?
Les cas d’usage se développent à très grande vitesse dans les entreprises. On citera par exemple la génération de synthèses de réunion, le tri automatisé de données, la génération de code pour des développeurs ou des citizen développeurs…
Le potentiel de ces cas d’usage est réel. Toutefois, la valeur réside certainement dans des applications plus spécifiques. Les métiers de la relation client et les centres de contact peuvent s’emparer de l’IA générative pour déployer des chabots et voicebots de nouvelle génération qui permettront véritablement d’automatiser et de selfcariser le traitement. A titre d’exemple, Gartner prévoit que l’IA conversationnelle réduira les coûts de main-d’œuvre des centres de contact de 80 milliards de dollars en 2026. Ce n’est cependant qu’une des applications de l’IA générative. Nous reviendrons en détail sur les possibilités dont peuvent s’emparer les entreprises dans un prochain article.
👉 Retrouvez toute notre actu en temps réel en nous suivant sur LinkedIn 👈
Cet article a été rédigé en collaboration avec Christophe Auffray.
Votre adresse de messagerie est uniquement utilisée par Business & Decision, responsable de traitement, aux fins de traitement de votre demande et d’envoi de toute communication de Business & Decision en relation avec votre demande uniquement. En savoir plus sur la gestion de vos données et vos droits.