Accueil > Data Science / IA > Comprendre l'IA et la Data Science > Data Science : les 4 obstacles à franchir pour réussir son projet

Comprendre l'IA et la Data Science

Data Science : les 4 obstacles à franchir pour réussir son projet

16 avril 2019 Modifié le 5 mai 2023

Mathieu Bruniquel

Depuis les cinq dernières années, les projets Data Science réalisés par Business & Decision connaissent une forte croissance dans des domaines très variés, tels que l’industrie pétrolière, la téléphonie, le retail et les services. Cependant, certaines difficultés doivent être dépassées pour mettre en œuvre efficacement ce type de projets. Explications.

Data Science : les 4 obstacles à franchir pour réussir son projet

Tout d’abord, rappelons que la Data Science repose sur plusieurs disciplines dont la maîtrise est essentielle pour assurer le bon déroulement et le succès d’un projet :

La préparation des données, dont l’enjeu de rassembler toute la donnée au même endroit, la recoder et la préparer pour la mettre en forme et la rendre exploitable,
La statistique, dont la compréhension des principes est fondamentale pour manipuler les données avec justesse
Le Machine Learning, l’outil indispensable pour gérer des données massives, évolutives, en flux ou encore incomplètes,
L’IA qui permet l’apprentissage intensif et l’automatisation.

Didier Gaultier, Directeur Data Science & IA (Business & Decision), identifie quatre difficultés principales auxquelles se heurtent souvent les projets Data Science, avec des pistes concrètes à mettre en œuvre pour les surmonter.

1. L’enjeu de la donnée « en silos »

Il est très fréquent aujourd’hui que les données en entreprise soient « silotées » : chaque métier dispose de son propre système d’information (SI). La donnée constituant la base du projet, il est crucial pour les entreprises de s’inscrire dans une démarche Data Centric en :

Plaçant la donnée au centre du SI : construction de datalake/datahub ;
Disposant d’une équipe dédiée ;
Mettant en place une gouvernance des données.

2. Les prérequis et l’organisation du projet

Avant de pouvoir effectuer un cadrage du projet et lancer un éventuel pilote, deux prérequis sont essentiels.

J-52

Salon de la Data et de l’IA

17 Sep 2024 |08h30 – 18h00 Nantes

S'inscrire

Comprendre les enjeux métiers

La bonne compréhension du métier et de ses problématiques doit être acquise. Cela conditionne le succès de la démarche et son adoption par les équipes internes. Tout projet Data Science doit donc être initié avec les équipes métiers au travers d’ateliers.

Diagnostic des données et de l’architecture du SI

Afin d’identifier les opportunités et les contraintes liées à la donnée, il est préférable d’organiser des ateliers « data » avec les équipes internes et la DSI. Ceux-ci permettront notamment d’anticiper sur d’éventuelles contraintes lors de la phase d’industrialisation : choix de l’architecture, des outils voire du langage de programmation.

3. La gestion de la complexité des algorithmes

Une bonne gestion de la complexité des algorithmes est nécessaire afin de bien maîtriser le compromis biais/variance régi par les données d’apprentissage. Or, dans certaines industries, des contraintes s’appliquent. Par exemple, dans la banque, les algorithmes sont contraints par une obligation de traçabilité.

4. Les difficultés d’industrialisation des modèles

La phase d’industrialisation permet le passage et la mise en production de la modélisation. Cependant elle peut s’avérer difficile, notamment dans les cas suivants :

Les données n’ont pas été « dé-silotées »
Le langage de programmation choisi ne se prête pas à l’industrialisation (privilégier Python à R par exemple)
Les outils de maintenance ne sont pas adaptés alors qu’il existe des outils spécialisés (Dataiku, Knime, Azure Machine Learning, SAS)

Découvrir

Nos offres dédiées Data Science pour les entreprises

4 exemples de projets Data Science

Chez Business & Decision, les experts s’appuient sur trois piliers de la Data Science : « expliquer, prédire et prescrire », afin d’accompagner les clients dans la valorisation de leurs données. Aujourd’hui, la Data Science peut se développer dans tous les domaines. Parmi les projets réalisés par la société :

L’industrie pétrolière : développement d’une plateforme d’analyse prédictive de la consommation, du niveau d’extraction et des capacités de raffinage du pétrole brut pour un acteur du secteur pétrolier
La téléphonie : amélioration du niveau de service client d’une entreprise de télécommunications grâce à la gestion intelligente des tickets de support par un « bot »
Le retail : mise en place d’un dispositif « anti-churn » (ou rétention) des clients d’un distributeur de produits électriques français
Les services : amélioration de l’efficacité de la distribution du courrier du Groupe La Poste, grâce à un algorithme de définition de tournées dynamiques pour les facteurs, à partir de la prédiction des livraisons à l’adresse. Ce projet a notamment permis la création de nouveaux services : « Expédition en boite aux lettres » et « Veiller sur mes parents »

Cet article a été rédigé par Mathieu Bruniquel, étudiant du Mastère Spécialisé Big Data de Télécom ParisTech, promotion 2019. Il fait suite à l’intervention de Didier Gaultier auprès des étudiants du MS Big Data de Télécom ParisTech, venu partager sa vision du métier de Data Scientist/Engineer et son expérience du terrain.

Télécom ParisTech

Après un diplôme d’ingénieur de l’Ecole centrale de Lyon, Mathieu Bruniquel devient consultant et data scientist au sein de différents cabinets, notamment dans le domaine médical, l’innovation, le marketing, la finance, l’énergie. Il rejoint le Mastère Spécialisé Big Data de Télécom ParisTech en 2018 avec…

Votre adresse de messagerie est uniquement utilisée par Business & Decision, responsable de traitement, aux fins de traitement de votre demande et d’envoi de toute communication de Business & Decision en relation avec votre demande uniquement. En savoir plus sur la gestion de vos données et vos droits.

Tendances Data

Le Dashboard Design relève-t-il du niveau olympique ? Réponse en Dataviz

« On peut faire dire ce qu’on veut aux chiffres » Vous avez déjà sûrement entendu cette phrase, et vous vous dites peut-être que ce n’est pas possible, que non, un chiffre...

Premium

Intégrer l'IA et la Data Science

REPLAY | Comment LVMH a réussi à déployer une IA de confiance ?

LVMH a bâti sa stratégie Data & IA autour des solutions DataGalaxy et Dataiku, eux-mêmes accompagnés par Orange. Cap sur un retour d’expérience inspirant présenté au cours d’une table-ronde dédiée...

Premium

Intégrer l'IA et la Data Science

REPLAY | IA génératives : la puissance des technologies Microsoft pour votre entreprise

Comment appréhender concrètement toutes les facettes de la révolution technologique des intelligences artificielles ? Réponses avec Microsoft et nos experts Orange Business / Business & Decision. L’occasion de revivre la Matinée...

Tutoriels outils et langages data

Snowflake : pourquoi et comment coder directement en Python ?

Snowflake, la plateforme d’hébergement de données dans le cloud est reconnue pour sa puissance, sa flexibilité et sa sécurité. Elle offre un large éventail de services pour stocker, analyser, partager...

Actualités Data et IA

Revue de presse Data & IA – Juin 2024

Quelles sont les actualités qu’il ne fallait pas manquer ce mois-ci dans les secteurs de la Data et de l’Intelligence artificielle ? Au programme : le mode d’emploi de la...

Premium

Transformation digitale

REPLAY | Captcha invisible : se protéger des attaques de robots malveillants tout en préservant la fluidité du parcours digital

En s'appuyant sur des algorithmes d'intelligence artificielle et d'apprentissage automatique, le Captcha Invisible d’Orange Business analyse les comportements des utilisateurs (utilisation de la souris ou du clavier, réputation de l'adresse...

Tutoriels outils et langages data

Snowflake : les Dynamic Tables peuvent-elles remplacer les ETL/ELT ?

Après toutes les annonces de Snowflake lors du Summit et Snow Day de l'année dernière, les nouvelles fonctionnalités arrivent progressivement en General Availibility. C’est désormais au tour des Dynamic Tables,...

Actualités Data et IA

Revue de presse Data & IA – Mai 2024

Quelles sont les actualités qu’il ne fallait pas manquer ce mois-ci dans les secteurs de la Data et de l’Intelligence artificielle ? Au programme : ce qu'il faut retenir (ou...

Tendances Data

L'Eurovision : concours de la chanson et géopolitique ? Réponse en Dataviz

Qui a déjà vécu des débats enflammés, sur des sujets variés du quotidien ou d’actualité, lors de repas du dimanche en famille ? Où chacun avance des affirmations sans pouvoir complètement...

Premium

Solutions technologiques

REPLAY | Une plateforme pour réunir tous vos portails : Liferay, la solution de vos expériences digitales

Marketplace & e-Commerce, Intranet & Extranet, Partenaires & Fournisseurs, modules de Marketing Analytics ou Relationnels… Orange Business a placé Liferay au cœur de sa stratégie Digitale et réalisé de nombreux...

Actualités Data et IA

Revue de presse Data & IA – Avril 2024

Quelles sont les actualités qu’il ne fallait pas manquer ce mois-ci dans les secteurs de la Data et de l’Intelligence artificielle ? Au programme : l'opportunité pour l'Europe de devenir...

Comprendre l'IA et la Data Science

Data Engineer : quelles formations privilégier ?

Dans mon précédent article, nous nous sommes demandé quelles étaient les compétences idéales pour bien démarrer en Data Science. Aux jeunes qui veulent se lancer dans la Data Science, j’avais...

Stratégie Data

Data Scientist / Data Engineer : quelles compétences pour bien démarrer en Data Science ?

Le métier de Data Scientist crée un véritable engouement et c’est tant mieux. Pour le réussir, il faut conjuguer l’acquisition des compétences techniques, l’expérience des cas concrets et surtout, un...

Intégrer l'IA et la Data Science

Intelligence artificielle, Machine Learning, Data Science : ces termes sont-ils interchangeables ?

De plus en plus d’articles apparaissent sur l'Intelligence artificielle (IA), le machine learning, (voire le deep learning), et de nombreux auteurs parlent indifféremment d’IA, de machine learning, et de Data...

Data Science : les 4 obstacles à franchir pour réussir son projet

1. L’enjeu de la donnée « en silos »

2. Les prérequis et l’organisation du projet

Salon de la Data et de l’IA

Comprendre les enjeux métiers

Diagnostic des données et de l’architecture du SI

3. La gestion de la complexité des algorithmes

4. Les difficultés d’industrialisation des modèles

4 exemples de projets Data Science

Découvrez aussi

Le Dashboard Design relève-t-il du niveau olympique ? Réponse en Dataviz

REPLAY | Comment LVMH a réussi à déployer une IA de confiance ?

REPLAY | IA génératives : la puissance des technologies Microsoft pour votre entreprise

Snowflake : pourquoi et comment coder directement en Python ?

Revue de presse Data & IA – Juin 2024

REPLAY | Captcha invisible : se protéger des attaques de robots malveillants tout en préservant la fluidité du parcours digital

Snowflake : les Dynamic Tables peuvent-elles remplacer les ETL/ELT ?

Revue de presse Data & IA – Mai 2024

L'Eurovision : concours de la chanson et géopolitique ? Réponse en Dataviz

REPLAY | Une plateforme pour réunir tous vos portails : Liferay, la solution de vos expériences digitales

Revue de presse Data & IA – Avril 2024

Data Engineer : quelles formations privilégier ?

Data Scientist / Data Engineer : quelles compétences pour bien démarrer en Data Science ?

Intelligence artificielle, Machine Learning, Data Science : ces termes sont-ils interchangeables ?

Informations sur la gestion de vos données et vos droits

Newsletter