La gouvernance des données est à la stratégie Data ce que le change management est au projet : à la fois indispensable et pourtant trop souvent sous-estimée et/ou mal organisée. Elle est pourtant un facteur indispensable de réussite.
Cette gouvernance interagit de deux manières avec la stratégie Data :
- lors de sa définition, où elle détermine le « pourquoi » de la stratégie et le cadre de sa mise en place
- puis lors de sa réalisation où elle garantit le succès de sa mise en œuvre.
C’est pourquoi, des 5 chantiers Data-centric, c’est le premier que nous vous proposons de traverser.
Indispensable… et pourtant encore flou
Il est savoureux de remarquer que, bien qu’indispensable, la notion de gouvernance est floue par sa définition même :
« La gouvernance est une notion parfois controversée, car définie et entendue de manière diverse et parfois contradictoire » (Wikipédia).
Indispensable et contradictoire… Bienvenue dans le monde complexe de la stratégie Data ! Ce flou dans la définition nous montre pourquoi de nombreuses structures échouent dans la mise en place d’une stratégie Data : leur mise en œuvre nécessite bien plus que le déroulement d’un processus bien défini. Cela requiert une approche itérative autorisant l’erreur, mais dont le cap ne varie pas.
Une nécessité de gouverner et d’animer une vision commune
Alors essayons d’y voir plus clair ! Si le mot « gouvernance » est utilisé c’est, à mon sens, que deux ingrédients sont indispensables à sa bonne réalisation :
- le pilotage avec sa faculté de décision,
- le mode collaboratif permettant le partage de la vision.
En essayant de l’appliquer à la stratégie Data, nous pourrions circonscrire la gouvernance comme « la définition et la garantie des règles du jeu permettant la bonne utilisation des données ». Ou, avec une vision plus opérationnelle, comme « la gestion du cycle de vie des données leur garantissant une bonne qualité, de leur génération à leur utilisation, tout en permettant une création de valeur ».
Une importante palette de services à gouverner
Avec l’avènement de la nouvelle économie de la Data, la répartition des rôles, (schématiquement décrite sous la forme « au métier les besoins, et à la DSI les solutions ») se trouve de plus en plus chahutée.
On l’a vu, dans une stratégie Data efficace, les allers-retours entre les besoins et les moyens sont importants et incessants. De la fluidité de ce mouvement et du mode collaboratif de sa co-création de valeur viendra la réussite. La nécessité du mode collaboratif est renforcée par l’importante palette de services à fournir. Chez Business & Decision, nous les avons partagés en quatre familles :
- Le pilotage via la Business Intelligence,
- Le Data management
- L’analytics et la Data Science
- L’exposition des données
Le catalogue de services d’utilisation des données par Business & Decision :
La gouvernance doit garantir leur bonne exécution en les mettant sous contrôle.
De nouveaux rôles, de nouvelles compétences
Pour couvrir la palette de ces services, de nouveaux métiers et rôles émergent au sein des organisations. Et une organisation efficace doit permettre leur bonne interaction et la définition de leurs rôles et responsabilités.
Reprenons ensemble quelques rôles clés :
Le CDO (Chief Data Officer)
Le rôle principal du CDO est de définir et diriger la stratégie globale autour de la Data. Il est le garant de l’orientation Data-centric de la structure. Il va pour cela bâtir la vision de l’analyse des données et de leur utilisation, mais aussi et surtout définir l’axe de la création de valeur et son impact commercial. Son rôle est tel que le Gartner estime que 90 % des grandes entreprises auront un Chief Data Officer d’ici 2019.
Un indicateur très intéressant à monitorer est le niveau de responsabilité accordé par la structure au CDO. Son positionnement hiérarchique, sa responsabilité dans le P&L ainsi que le mode de relation avec les autres services sont autant d’indicateurs permettant de définir la culture Data-centrique de la structure. Nous pouvons citer à titre d’exemple une matrice de responsabilité entre la DSI et le CDO nouvellement nommé, illustrant à la fois sa collaboration avec un C-level et son influence sur la stratégie Business :
Responsibility | CDO | Shared | CIO |
Influence corporate strategy and define data management | X | ||
Be a trusted advisor on analytics / data across the enterprise | X | ||
Set and enforce data governance policy | X | ||
Be the guardian of data quality in the organization | X | ||
Mesure and manage data value and risk (including cost of poor quality data) | X | ||
Drive large, cross functional data management programm with multiple stakeholders | X | ||
Improve revenue through effective governance and use of data | X | ||
Improve profit by reducing the cost of compliance | X | ||
Planning, choosing, buying and installing a company’s computer and information processing operations | X | ||
Provide platforms and technologies to support analytics within the enterprise | X | ||
Responsible for the evaluations of technology within the organizations | X | ||
Align IT and data with the business | X |
DPO (Data Protection Officer) ou Le Délégué à la protection des données (DPD)
Le rôle du DPO a été mis en lumière par le GDPR (General Data Protection Regulation, traduit en français par RGPD pour Règlement général sur la protection des données) qui rend sa nomination obligatoire pour les structures répondant à certains critères (article 37 du GDPR). Sa connaissance spécialisée du droit et des pratiques en matière de protection des données lui permet d’informer, de conseiller et de contrôler le respect de la protection et de l’intégrité des données. Ce rôle, en plus de respecter une obligation légale, permet d’incarner l’animation de la culture des données au sein de la structure.
Les Data Owner et Data Steward
Le Data Owner est le propriétaire des données. Il est assez fréquent de voir un Data Owner par service. Dans ce cas, chaque métier est propriétaire d’une catégorie de données (Données « client » pour le département ventes, données « produit » pour le marketing…). Il définit le niveau de sécurité ou de valorisation que la donnée doit prendre. Pour réaliser sa mission, il s’appuie sur le Data Steward, qui est la main agissante et le garant de la qualité des données.
Le Data Steward est le coordinateur de l’organisation et de la gestion des données. Il gère à la fois le contenu et les métadonnées. Il vérifie ainsi que chaque donnée est correctement définie, qu’elle répond aux obligations réglementaires. Il fait également la chasse aux doublons, veille à éviter l’obsolescence des données, et enfin vérifie que tous les Dataset contiennent les bonnes informations.
Le Data Scientist et le Data Engineer
Le Data Scientist, le fameux « Sexiest Job of the 21st Century” (source : PwC) et mouton à 5 pattes de la stratégie Data, est la cheville ouvrière de la valorisation de la donnée. Il va, grâce à la mise en place d’algorithmes, transformer la Data en valeur. Pour cela, ce dernier explore les données afin d’en déterminer la valeur potentielle. Puis, créer des modèles explicatifs et prédictifs pour transformer la donnée en valeur, monitorer les performances des modèles grâce au machine learning. Enfin, il fait des recommandations pour orienter les décisions stratégiques et enfin présenter ses conclusions sous forme de graphiques pour communiquer ses résultats à tous.
Ce « nouveau » métier va aussi être en perpétuelle réinvention. En effet, plus de 40 % des tâches effectuées par un Data Scientist seront automatisées d’ici 2020, d’après la Harvard Business Review. Bien que fortement autonome, le Data Scientist, se confrontant au challenge de la qualité de données, va devoir collaborer avec le Data Engineer. Ce dernier a pour but de « préparer » la donnée et de la rendre « consommable ». Ce sont des experts de la donnée qui conçoivent, construisent et intègrent des données provenant de diverses sources. Orientés architecture et infrastructure, ils mettent en place des requêtes complexes de collecte de données sachant gérer d’importantes volumétries. Ils s’assurent de leur accessibilité et de leur bon fonctionnement. Ils veillent enfin à ce que la performance de l’écosystème des données soit optimisée.
Le fonctionnement itératif et collaboratif est la règle indispensable entre le Data Scientist et le Data Engineer.
Le rôle clé des RH et l’animation d’une nouvelle façon de travailler
La mise en œuvre de la stratégie Data nécessite donc des équipes pluridisciplinaires travaillant de manière collaborative. Nous retrouvons le même rôle déterminant des RH que celui présenté sur le sujet de la transformation digitale.
Pour assurer cette transformation, certains rôles peuvent être d’abord sollicités en externe puis, lorsque la maturité de la structure est atteinte, ré-internalisés. Dans tous les cas, une démarche RH est obligatoire afin de détecter et retenir les talents sur ces nouveaux besoins. La mise en place d’une marque employeur Data-centric est aussi garante d’une transformation en profondeur.
Animation de la culture Data
L’objectif est de développer une culture orientée Data, à tous les niveaux de la structure. Elle doit être basée sur le partage des données et sur la sensibilisation à la qualité et la fiabilité des données. Bien valoriser une donnée, c’est aussi en prendre soin. GDPR nous rappelle l’importance de la sécurité des données et du respect de la vie privée.
Nous aimons rappeler chez Business & Decision que si la Data est le pétrole de la nouvelle économie, la confiance devient alors la monnaie d’échange. L’animation de la culture Data doit s’accompagner de la mise en place du mode de fonctionnement collaboratif comme règle du jeu. La mise en place d’une stratégie Data s’accompagne aussi par le questionnement de la culture de l’entreprise.
La transformation de la DSI comme exemple de mise en place de la culture Data
J’aime prendre comme exemple le rôle et l’importance que prend la DSI dans ce nouveau modèle collaboratif. Nous encourageons les structures à mettre en place une DSI Bi Modale pour affronter les enjeux Data-centric.
Il y a toujours une forte dualité entre les réalisations industrielles et pérennes d’une architecture Data robuste et l’implémentation rapide et innovante devant répondre aux demandes ad hoc du Data Scientist par exemple.
La DSI doit savoir répondre à ces deux enjeux en même temps :
- Le mode traditionnel fournit et exploite des solutions pour des besoins connus et bien compris : systèmes robustes, fiables et évolutifs comme le Data Lake et le Datawarehouse
- Le mode « test and learn » permet le développement rapide de solutions, comme la mise en place d’une nouvelle source de données externes en one shot.
Il est intéressant de voir les nouveaux catalogues de services mis en place et ainsi la direction prise par les DSI Data-centric. Par exemple, certains se sont engagés à ce que 90 % des données (internes ou externes) concernant la structure soient intégrés par défaut dans le Data Lake, d’autres permettent la mise en place de requêtes en mode « laboratoire » où, en 24 heures, une nouvelle source de données est intégrée au Data Lake.
Mais les DSI se dotent aussi de services plus proches du business pour animer le mode collaboratif. On parle de Coaching Data quand la DSI garantit l’autonomie des utilisateurs en les guidant sur la bonne utilisation des outils, ainsi que sur l’utilisation de données brutes extraites directement du Data Lake. On parle aussi de service de veille Data quand la DSI identifie et intègre les données externes qui présentent de la valeur business.
Le modèle collaboratif comme règle du jeu de la réussite d’une stratégie Data :
Mise en place de processus, méthodes et contrôles
La gouvernance est enfin garante des processus, méthodes et contrôles. La maîtrise des processus des métiers, orientés clients ou activités internes, est indispensable pour permettre une maîtrise et une exploitation des données.
L’avènement de la BI self-service nous permet d’illustrer facilement ce propos. Certains utilisateurs devenant complètement autonomes, ils peuvent faire apparaître dans l’entreprise un Shadow IT (Systèmes d’information réalisés et mis en œuvre au sein d’organisations sans approbation de la DSI). S’ensuit une guerre des chiffres où chacun pilote avec ses propres indicateurs.
Les processus de la gouvernance évitent cet écueil et permettent à la fois aux users self-service de créer de la valeur, et, en même temps, de maintenir le traditionnel référentiel d’indicateurs qui produit les indicateurs partagés. La gouvernance permet que les indicateurs produits ne soient pas en concurrence les uns avec les autres mais en complémentarité. Encore une fois, le mode de fonctionnement collaboratif garantit un mode win win ou chaque participation des stakeholders co-construit un grand tout cohérent.
De « tout maîtriser » à « ne rien maîtriser »
La mise en place de la gouvernance étant le chapitre le plus politique de la stratégie Data, il est par définition le plus complexe. Fréquemment confronté à ces enjeux dans les structures que nous accompagnons, je vais conclure en relevant les deux écueils les plus fréquemment rencontrés.
Le premier écueil est de confondre « gouvernance » et « gouvernement ». Cette erreur nous fait songer à la maxime de Georges Clémenceau à propos de la décision : « Une décision se prend toujours en assemblée impaire, et trois, c’est trop ». La hiérarchie est très forte mais elle interdit l’autonomie et la prise de risque indispensable à la création de valeur. Le point positif est que le système d’information peut être très cohérent, intègre et sécurisé. Mais le mode de fonctionnement est souvent trop aseptisé. Il ne laisse la place qu’au reporting au détriment de la valorisation de la data (AI, machine learning…).
Le deuxième écueil est de ne compter que sur l’intelligence collective, où chacun va devenir autonome dans sa création de valeur par la Data, sans aucune coordination. Apparaissent autant de SI que de consommateurs de Data et le Data Lake se transforme en marécage. Une guerre des chiffres apparaît alors, et le temps attribué à la création de valeur est remplacée par la recherche du vrai « chiffre », ce qui décrédibilise toutes les interprétations.
Bien évidemment, la bonne gouvernance est au milieu. Elle permet à la fois le bon fonctionnement de tous les services et une collaboration efficace. Le meilleur indicateur de sa bonne mise en place est que tous les chantiers coexistent et que tous les interlocuteurs associés collaborent efficacement.
Votre adresse de messagerie est uniquement utilisée par Business & Decision, responsable de traitement, aux fins de traitement de votre demande et d’envoi de toute communication de Business & Decision en relation avec votre demande uniquement. En savoir plus sur la gestion de vos données et vos droits.