Quelque soit votre métier ou votre industrie, votre plateforme Big Data regroupe des données de sources multiples et fondamentalement hétérogènes dont notamment vos bases de données transactionnelles, CRM et autres sources en provenance du Digital Marketing (analytics, campagnes, targeting etc.).
Retour aux sources du Big Data : la collecte de données digitales
C’est cette composante marketing de la donnée qui a la vedette depuis quelques années, notamment grâce aux DMP (Data Management Platforms). C’est justement sur la capture et la qualité des données en provenance du digital que nous nous penchons aujourd’hui.
La promesse d’une DMP est de traiter des données d’acquisition de trafic payant (liens sponsorisés, bannières) et de les relier avec des données comportementales issues des digital analytics afin d’optimiser les budgets d’acquisition et de proposer la meilleure offre au meilleure moment à la bonne audience. Le Saint Graal du marketing en somme. Le seul souci dans cette méthodologie de traitement de la donnée c’est qu’on fait peu ou pas attention à comment les données sont collectées ou transformées : la qualité est très (trop?) souvent le parent pauvre d’un projet Big Data.
Un plan de marquage pour qualifier ses données à la source
Ce problème se retrouve évidemment démultiplié par le nombre de sources et par le volume de données. On envisage mal de pouvoir faire confiance aux données pour prendre des décisions stratégiques ou opérationnelles – et encore moins les laisser soumises à des algorithmes d’attribution dynamique ou d’achat automatique d’espaces publicitaires en ligne.
Prenons un exemple classique lié aux digital analytics, où un annonceur utilise un outil de marquage (tracking) tel que Google Analytics, Adobe Analytics, AT Internet ou Webtrends (pour n’en citer que certains) pour mesurer le trafic sur un site Web et la conversion des visiteurs en acheteurs. Ces outils sont devenus en 15 ans de réelles plateformes de collecte de données qui rivalisent avec les acteurs majeurs du monde de la Business Intelligence conventionnelle, et avec des interfaces plus attrayantes soit dit en passant.
Dans le monde des digital analytics, la collecte de données s’effectue dans plus de 90% des cas avec du marquage Javascript : un code de suivi se déclenche à chaque fois qu’un internaute consulte une page Web ou interagit avec la page, en cliquant sur un bouton par exemple.
Ce marquage, ou « tag » peut être très basique : 4 à 5 lignes de code Javascript qui doivent être insérées dans le code HTML de chaque page d’un site Web. Ça ne ressemble pas de prime abord à de la physique quantique, n’est-ce pas? Après tout, Javascript est une technologie qui date de 1995, on devrait la maîtriser 20 ans après. Eh bien pourtant, de nombreux annonceurs n’arrivent pas à mettre en place ce marquage de base, ce qui veut dire qu’ils se privent d’une visibilité sur le comportement des internautes sur les pages non-marquées. Si on compare cela à un annonceur dans le milieu des médias qui monétise son site à la page vue et qui “oublie” de marquer 10% de ses pages, c’est tout à coup un manque à gagner énorme en revenus publicitaires si ses marqueurs ne se déclenchent pas, car absents.
Le plan de marquage est devenu le nerf de la guerre digitale
C’est pourquoi tout digital marketer qui se respecte se doit d’avoir un plan de marquage : concrètement, un document Excel qui spécifie les marqueurs à intégrer, par type de page et par usage. Le plan de marquage est devenu le nerf de la guerre digitale car de nouvelles solutions de marketing sortent chaque jour, chacun y allant de son marqueur.
La multiplicité des marqueurs et l’évolution trop rapide des sites fait que le marquage est trop souvent négligé – même dans sa forme basique. Voici quelques retours que nous avons reçu par le passé et que nous continuons de rencontrer :
« L’intégrateur précédent a perdu le plan de marquage »
« On a oublié de mettre Google Analytics sur le nouveau mini-site, c’est grave ? »
« Ah, il fallait traquer la conversion sur le formulaire ? »
« On bien a changé les modèles de page mais on ne savait pas où mettre le tracking »
« Ah, il fallait vérifier le marquage sur toutes les pages du site ? »…
Et la liste est encore longue. Malheureusement, ces retours nous montrent le manque d’éducation qui persiste encore en 2015 quand il s’agit de marquage.
Des solutions de marquage pour en simplifier la gestion et favoriser son utilisation
Si les mentalités commencent à évoluer grâce à l’arrivée depuis 2010 de solutions de “tag management” qui permettent de centraliser et de fluidifier la mise en place de marquages, on n’a toujours pas le réflexe de valider le plan de marquage de manière exhaustive.
Si on procède à de l’échantillonnage (examen manuel de quelques pages seulement), on finira toujours avec une vision tronquée de la partie émergée de l’iceberg. Sauf qu’en réalité, on procède à de l’échantillonnage car on sait très bien que pour les gros sites, l’assurance qualité du marquage (même basique) est une activité hautement chronophage se chiffrant en jours et en semaines/homme. Ces délais d’assurance qualité explosent dès lors qu’on passe à des plans de marquage avancés. Ceux-ci permettent une grande richesse de capture de données, impliquant des dizaines (voire des centaines) de variables contenant des valeurs métier qui doivent être validées par rapport à des jeux de valeurs autorisées. En somme, il faut s’assurer qu’on capture la bonne donnée dans le bon format au bon moment – d’où l’importance suprême d’un plan de marquage.
La solution Saas Hub’Scan
C’est justement pour répondre à cette problématique de qualité de données que la solution SaaS Hub’Scan a été développée, afin d’automatiser les taches d’assurance qualité du marquage des différentes solutions de Digital Marketing reposant sur des marqueurs Javascript. Hub’Scan permet de créer des processus de validation qui permettent aux annonceurs de valider les données collectées sur leurs sites Web et via leurs campagnes. En validant cette collecte de données avec Hub’Scan, on assure que les briques digitales d’une DMP ou d’une plateforme Big Data ont des données certifiées conformes aux attentes. On peut donc avoir l’esprit tranquille en sachant que ses KPIs sont alimentés par des données cohérentes. De plus, on sait que le ciblage sera effectué sur base des bons paramètres visiteur. Enfin, on n’a pas non plus à s’inquiéter de qualité de taux de conversion qui ferait changer le prix des publicités.
Pour résumer, si vous ne voulez pas que « Big Data » soit synonyme de « Bad Data » préoccupez vous vite de votre qualité de données !
Votre adresse de messagerie est uniquement utilisée par Business & Decision, responsable de traitement, aux fins de traitement de votre demande et d’envoi de toute communication de Business & Decision en relation avec votre demande uniquement. En savoir plus sur la gestion de vos données et vos droits.