Livres blancs Webinars

Le concept de Data Mesh repose sur 4 grands piliers, dont le premier est celui d’une organisation répartie en domaines de données. Pour être efficace, cette structuration doit être le reflet d’une réalité business de l’entreprise et des interactions entre ses différentes entités. Elle impose donc une forte proximité métiers.

📝 Dossier Spécial Data Mesh – Le sommaire
1 – Data Mesh : le modèle ultime des entreprises data-driven ?
2 – Domaines de données : le Data Mesh donne des super-pouvoirs aux métiers
3 – Data Mesh : la donnée est un produit qui vaut de l’or
4 – L’infrastructure Data self-service, moteur technologique du Data Mesh
5 – Data Mesh : une gouvernance fédérée pour garantir l’efficacité
6 – Data Mesh : Exemples et retours d’expérience concrets
7 – Data Mesh : un modèle data-driven total par essence

Domaines de données : Mode d’emploi

L’exploitation des données au sein des processus métiers et de la prise de décision est un véritable vecteur de changement pour une création de valeur à tous les niveaux de l’entreprise. Et, en la matière, le Data Mesh constitue une opportunité pour que les métiers pilotent leur propre transformation et améliorent toutes leurs prises de décision grâce à l’analytique.

La structuration en domaine de données au plus près de l’organisation et des processus de l’entreprise présente un double avantage. Le Data Mesh participe à la démocratisation de la Data au-delà des cercles d’experts, composés par exemple des Data Scientists, Data Engineers, Data Architects,… C’est aussi une orientation en faveur d’une pleine appropriation des données par les opérationnels, au plus près des besoins. Or, c’est justement ce que cherchent à atteindre les organisations dans leur quête de maturité data-driven.

Domaines de données : Mode d’emploi

Lire aussi

Pénurie de compétences en Data & IA : quelles solutions ?

Lire la suite

Avec le Data Mesh, la responsabilité des données, leur connaissance comme leurs usages, reviennent pleinement aux métiers, acteurs clés de la valorisation des données. Il s’agit du principe de « Domain Ownership » dont les motivations trouvent leur source dans :

  • La capacité à faire évoluer le partage de données en alignement avec les axes de croissance organisationnelle (nombre de sources de données, nombre de consommateurs…),
  • Les cycles de changement rapides et continus des données,
  • L’agilité à réduire les synchronisations inter-équipes et à supprimer les goulots d’étranglement d’une gouvernance centralisée,
  • L’amélioration de la qualité des données et de la résilience des analyses (BI, IA) en rapprochant les producteurs des consommateurs (suppression de la complexité des pipelines de données intermédiaires).

L’approche par domaines de données du Data Mesh est directement inspirée du concept « Domain Driven Design (DDD) », appliqué lui-même au design de solutions logicielles.

Que signifie concrètement une organisation en domaines de données ?

L’approche par domaines de données du Data Mesh est directement inspirée du concept « Domain Driven Design (DDD) », appliqué lui-même au design de solutions logicielles, entre autres. Cet axe du Data Mesh consiste donc en un découpage des données (et des usages) selon une segmentation par domaine.

C’est une notion fondamentale, au cœur du concept de Data Mesh. Aussi, il faudra porter la plus grande attention au découpage et à la répartition des domaines de données. Dans certaines entreprises, ce choix sera évident et se calquera sur les grandes fonctions de l’organigramme (RH, opérations, marketing, etc.). Dans d’autres contextes, le découpage pourra se faire par ligne business, par canal de diffusion ou selon des spécificités propres à chaque entité. Les domaines d’une même organisation peuvent combiner des périmètres étroits, ou au contraire larges et transverses.

Quel qu’il soit, le découpage fera l’objet d’un soin particulier. La granularité des domaines et leur structuration nécessitent un examen approfondi pour chaque entreprise afin notamment de tenir compte de leurs spécificités et du niveau de maturité des différents départements. Dans tous les cas, il est essentiel que le découpage par domaine de données soit le reflet d’une réalité business de l’entreprise. Il ne doit en aucun cas être le résultat d’une approche purement technique ou trop éloignée de la réalité terrain.

Une organisation en domaines de données

L’approche méthodologique consiste à cartographier et décrire les différents types de domaine de données :

  • Les domaines de données alignés sur la source (source aligned domain data) qui concentrent les données analytiques reflétant les faits métiers générés par les systèmes opérationnels et appelées produits de données natifs.
  • Les domaines de données agrégées (aggregate domain data) qui concentrent les données analytiques résultant d’opérations de corrélation et d’enrichissement de données issues à l’origine de plusieurs domaines de données alignés sur la source (ex : construction de vision 360).
  • Les domaines de données alignés sur le consommateur (consumer aligned domain data) qui concentrent les données analytiques transformées pour répondre aux besoins d’un ou plusieurs cas d’usage métiers.

Une fois mis en place, les domaines sont les moteurs de la distribution et de la valorisation des données. Ils participent plus fortement à redonner le pouvoir (sinon des super-pouvoirs) aux métiers, à même de devenir pleinement autonomes dans l’exploitation des données. Pour y parvenir, les domaines sont responsables de TOUTES les données de leur périmètre. Cela inclut les données opérationnelles (ERP, outils des processus…) bien sûr, mais aussi les données analytiques.

Dans cette optique, les domaines se conforment à un ensemble de rôles et de responsabilités :

  • Producteurs de données et responsables de l’ensemble du patrimoine de données (analytiques et opérationnelles),
  • Co-pilotes de la gouvernance des données, par application des règles et standards communs définis au niveau de l’organisation,
  • Concepteurs des Data Products selon des principes communs pour en permettre l’exposition (via des APIs par exemple) et la consommation par les différents domaines.
  • Acteurs du partage des données avec les autres domaines. La valeur générée s’accroît grâce au passage à l’échelle, via par exemple la création d’une bourse d’échange de données ou data marketplace. C’est un aspect fondamental du Data Mesh sur lequel nous reviendrons plus en détail.

Gartner estime qu’une mauvaise qualité des données coûte en moyenne 12,9 millions de dollars par an et par entreprise.

Des domaines autonomes et agiles

Le Data Mesh représente indubitablement un changement de paradigme, tant au niveau de la distribution des compétences que des responsabilités. Avec l’organisation par domaine, le savoir-faire data n’est plus centralisé (au sein de l’IT ou dans une data factory), mais au contraire réparti.

Les avantages de cette approche sont multiples :

  • Surmonter les limites du goulot d’étranglement que constitue une équipe centralisée et développer des produits Data répondant immédiatement aux priorités business.
  • Améliorer drastiquement la qualité des données en rapprochant à la fois la production et l’exploitation des données des métiers. Ces derniers sont plus aptes aussi à les documenter dans un catalogue unifié. A la clé : des économies d’échelle. Gartner estime qu’une mauvaise qualité des données coûte en moyenne 12,9 millions de dollars par an par entreprise.
  • Encourager les échanges de données inter-domaines pour casser les silos et créer de la valeur à l’échelle de l’entreprise.
  • Favoriser une culture de la collaboration en interne et la montée en compétences sur la Data.

Data Mesh et Data Domains : la bonne recette pour enfin impliquer les métiers ?

Passer d’un monde où la Data est pilotée en central par le Data Office et l’IT à un monde où les rôles sont distribués et partagés avec les domaines nécessite de revoir en profondeur l’organisation et donc un sponsoring de très haut niveau.

Le Data Mesh suppose en effet d’affecter des compétences expertes en Data dans les domaines, au plus près des métiers, afin notamment de constituer des équipes pluridisciplinaires compatibles avec un mode de delivery agile.

Cette couverture en termes de compétences est aussi essentielle pour traiter les différents sujets liés à la gestion de bout-en-bout des données et des produits Data. Cela nécessitera une revue des fiches de poste pour intégrer ces nouvelles activités.  

Data Mesh et Data Domains : la bonne recette pour enfin impliquer les métiers ?

Le déploiement de l’organisation par domaines de données se réalise selon un mode itératif en démarrant a minima avec un domaine producteur (aligné sur la source) et un domaine consommateur (aligné sur le consommateur). Cette initiation s’appuie sur un métier moteur, motivé et mature.

Des métiers moins matures pourront être accompagnés et conseillés par le Data Office, qui fournira méthodologie et ressources. Les domaines de données pourront alors être mis en œuvre avec un transfert d’activité et de responsabilité progressive. La décentralisation sera ensuite accentuée au fur et à mesure de la progression de la maturité.

🔎 Michelin & Data Mesh : de la plateforme aux domaines de données

Joris Nurit, architecte en chef des données et de l’analytique chez Michelin, découvre le concept de Data Mesh en 2019. Ce dernier pilotait alors la stratégie Data Lake de l’industriel. A cette même période, Michelin menait déjà depuis 5 ans le déploiement d’une architecture distribuée. Et ce n’est pas le seul pan de son SI auquel l’entreprise a appliqué une approche distribuée.

Michelin a ainsi mis en application un des grands principes du Data Mesh en se fixant l’objectif suivant : un seul mesh pour gouverner tous les domaines de données. Le fabricant de pneumatiques s’est aussi intéressé aux autres piliers. Une des priorités du CDO était ainsi de mettre en place une gouvernance globale couvrant et connectant l’ensemble des domaines.

Cette gouvernance fédérée repose sur différents rôles que sont le Data Owner, le Data Steward et le Data Administrator. Les Data Owners des domaines ont notamment pour mission d’assurer la bonne gestion des produits sources et agrégés.

Des Data domains indépendants, mais communicants

Les entreprises se heurtent très souvent à des obstacles, notamment la difficulté à faire émerger des cas d’usage pertinents et créateurs de valeur. Cela s’explique fréquemment par la faible appétence ou acculturation des métiers en matière de données.

Avec le Data Mesh, les métiers, ou plutôt les domaines de données, deviennent plus que jamais des acteurs de la stratégie Data mise en œuvre dans l’entreprise. De plus, cette appropriation s’effectue dans un mode fédéré. Chaque domaine participe ainsi à la gestion et à la valorisation du patrimoine global de données à l’échelle de l’entreprise grâce à un partage standardisé des données entre les domaines et à une gouvernance commune.

Replay

Acculturation : 3 façons d’accélérer la transformation Data & IA

Lire la suite

La vision des rôles et responsabilités des métiers dans le traitement de bout-en-bout des données et la création de produits Data telle que le conceptualise le Data Mesh implique donc une rupture. En effet, les métiers ne sont, jusqu’à présent, pas parvenus à prendre le pouvoir sur la Data. Pour ceux-ci, cet actif relève de la technologie et donc de l’IT. La DSI, de son côté, adopte une attitude défensive en ce qui concerne la redistribution des rôles et responsabilités, perçue comme source de risque en matière de cybersécurité et de gouvernance. 

Ces positionnements respectifs et la culture en vigueur freinent la volonté des organisations d’ouvrir plus largement les données pour en démocratiser l’accès et faire émerger des usages. Un état des lieux sincère suppose d’introduire quelques nuances cependant. D’un métier à l’autre, les niveaux de maturité sont très hétérogènes. Certains, tel que ceux du marketing ou de la logistique, sont souvent cités comme précurseurs en termes d’usages.

C’est pour rompre avec ces pratiques qu’intervient le Data Mesh. Par son approche globale, il favorise les échanges de données entre les silos. Sa solution : la création de domaines de données à la fois indépendants et en interaction. La valeur intrinsèque des produits de données (autre pilier du Data Mesh) exposés et partagés par les domaines alignés sur la source a pour objectif d’être démultipliée au travers des usages qui seront mis en œuvre par les domaines alignés sur le consommateur.

💡 Ce qu’il faut retenir
📌 Une refonte nécessaire de l’organisation grâce à un sponsoring de très haut niveau
📌 Une structuration par domaine de données au plus proche des métiers
📌 Des compétences Data expertes dans les domaines
📌 Un Data Office facilitateur et chef d’orchestre du Data Mesh

👉 Retrouvez toute notre actu en temps réel en nous suivant sur LinkedIn 👈

Cet article a été rédigé en collaboration avec Christophe Auffray.

Senior Manager au sein du Pôle Expertise et Conseil Business & Decision

Philippe est expert en Data Intelligence et Stratégie. Il travaille depuis plus de 25 ans chez Business & Decision et s’intéresse tout particulièrement aux sujets portant sur les enjeux et les modalités de la transformation des Organisations autour d’une approche orientée Data Centric dans des…

En savoir plus >

Commentaire (1)

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Votre adresse de messagerie est uniquement utilisée par Business & Decision, responsable de traitement, aux fins de traitement de votre demande et d’envoi de toute communication de Business & Decision en relation avec votre demande uniquement. En savoir plus sur la gestion de vos données et vos droits.

Gérard Rougier Le 19 octobre 2022 à 11h47
Cet article est très intéressant car il passe en revue les différents aspects (extrêmement positifs) du Data Mesh, et il les développe pertinemment avec par exemple les différentes couches de données ou encore une bonne pratique pour commencer l'aventure.
Et en même temps, une petite faiblesse de l'article peut être de laisser penser au lecteur que tout est simple, il suffit d'appliquer ... et toutes les difficultés connues dans le passé disparaitront.
En fait, Non ! Ces difficultés peuvent même être positionnées sur chacun des items abordés.
Et c'est sans doute un apport de ce framework: Fournir un cadre pour traiter pas à pas toutes les difficultés (attention aux limites du message: renforcer un domaine de données aligné sur la source, c'est prendre le risque que les faiblesses de la source soient propagées. Renforcer un domaine de données aligné sur le consommateur, c'est prendre le risque d'avoir des données mono-usage).
Il faut sans aucun doute laisser une place à l'arbitrage, et parler d'architectes de données qui vont équilibrer ces différentes vues dans l'intérêt de l'entreprise.