Accueil > Technologies > Tutoriels outils et langages data > Move2cloud : Tests de non-régression ? Arrêtez de perdre du temps !

Tutoriels outils et langages data

Move2cloud : Tests de non-régression ? Arrêtez de perdre du temps !

9 mars 2023 Modifié le 12 juillet 2023

Gaël Lemaux

De plus en plus d’entreprises migrent vers le cloud pour bénéficier de ses avantages. Elasticité, scalabilité, performances, coût à l’usage… La Data est alors extraite des bases de données On Premise et envoyée vers le nouveau socle technique (Snowflake, GCP, Azure, AWS…). Dans cet article, nous verrons comment accélérer vos tests de non-régression, étape primordiale de votre migration…

Article

Apache Kafka expliqué à mes grands-parents

Différents outils permettent d’effectuer ces transferts, mais qui dit déplacement dit nécessité de s’assurer que les données soient bien conformes à l’arrivée ! Cette étape de comparaison s’appelle les tests de non-régression (TNR) et représente une étape obligatoire avant de rendre l’accès aux utilisateurs. L’objectif est d’assurer la qualité des données en validant de manière exhaustive l’ensemble du patrimoine, sans avoir à embarquer les utilisateurs métiers dans la conception de scénarios de tests.

Ce n’est malheureusement pas magique, et en fonction du patrimoine existant, cela représente une charge qui peut s’avérer être très coûteuse en temps et en argent !

Illustration "Où sont les tests unitaires ?" - CommitStrip.com

Quand et comment faire des tests de non-régression ?

Dans un projet Move2Cloud, on trouve deux phases principales :

« Snapshot » : on copie les données dans l’environnement de destination, et on vérifie qu’elles sont bien identiques à celles de l’environnement source.
« Double Run » : les données ont été validées dans l’environnement de destination, il s’agit maintenant de s’assurer que les traitements quotidiens de type ETL/ELT fournissent les mêmes résultats que sur l’environnement source.

Les tests de non-régression s’appliquent également lors de mise à jour ou changement d’outil de transformation de données : Est-ce que cette évolution a pu altérer mes données ?

Bref, il est donc très fréquent de devoir vérifier si les données sont toujours conformes à la suite d’une modification tierce.

Comparaison entre la base Source et la base Cible

Si le principe est simple, comparer des données d’un système A à un système B, différentes approches sont envisageables pour les tests de non-régression :

Faire pointer un tableau de bord existant sur la nouvelle source de donnée et comparer le résultat
Compter le nombre de ligne par table pour chaque environnement
Faire un échantillonnage et comparer la source et la cible
Calculer des statistiques au niveau des colonnes telles que des sommes, moyennes, min, max…
Exporter les données sous fichier plat et les comparer avec un outil tiers
Utiliser des méthodes de hash ou de checksum entre les environnements.
…

Article

Cloud Data Platform : 5 choses à faire / ne pas faire dans sa mise en œuvre

Alors que privilégier et comment l’automatiser ?

Chez Business & Decision, fort de notre expérience sur les projets move2cloud, nous avons développé un outil afin d’aider et de faire gagner du temps à nos clients.

Nous avons pris le parti de garantir une comparaison à 100% et d’écarter les méthodes à base d’échantillonnages. Notre outil utilise des méthodes de hachage (ou hashs) et permet de s’adapter aux spécificités des bases de données (format de date YYYYMMDD vers du DD/MM/YYYY par exemple : la valeur est la même, mais son affichage la fait remonter comme une erreur lors de la comparaison). Les données ne sont pas déplacées, elles peuvent être sensibles et un export pourrait altérer son contenu.

Il peut s’exécuter à la demande ou se planifier via n’importe quel ordonnanceur existant, tout en lui précisant le périmètre des tables à comparer. L’outil peut donc être utilisé autant durant la phase de snapshot que durant la phase de double run.

Un bon dashboard vaut mieux qu’une longue analyse de log !

Automatiser, c’est bien, suivre et piloter, c’est encore mieux !

Nous pouvons maintenant vérifier la conformité des données, mais que faire si les données sont différentes ? Par où commencer l’analyse ?

Un bon dashboard vaut mieux qu’une longue analyse de log ! Nous avons donc réalisé un tableau de bord qui permet de suivre l’avancement de vos tests de non-régression (nombre de tables validées / nombre de tables à valider). Il permet de piloter de façon objective et de quantifier simplement la qualité et l’avancement de la migration, et de communiquer avec toutes les parties prenantes l’état du projet de migration.

Le tableau de bord apporte également des pistes de correction si les données sont différentes. En effet, en cas d’écart, l’outil lance une analyse de statistiques sur les colonnes de la table concernée. On peut rapidement identifier les erreurs « classiques » comme un champ tronqué ou un facteur de multiplication sur des colonnes numériques par exemple.

J’espère que cet article vous aura éclairé sur les tests de non-régression et de la nécessité de les automatiser. Il est important de recentrer les équipes sur des tâches à valeur ajoutée plutôt que sur des actions répétitives et automatisables.

Si vous souhaitez en savoir plus ou si vous avez une migration en cours ou à venir, n’hésitez pas à nous contacter !

Expert Conseil & Expertise Business & Decision

Après de nombreuses années à travailler sur les différents maillons de la chaîne décisionnelle, je me suis spécialisé dans les architectures cloud. C’est un terrain de jeu en constante évolution où je prends plaisir à explorer les différents recoins !

Votre adresse de messagerie est uniquement utilisée par Business & Decision, responsable de traitement, aux fins de traitement de votre demande et d’envoi de toute communication de Business & Decision en relation avec votre demande uniquement. En savoir plus sur la gestion de vos données et vos droits.

Sécurité des données

Identités numériques : tout comprendre sur ce domaine en pleine évolution

L'identité numérique est au cœur des interactions en ligne, des transactions commerciales, des processus administratifs et de la protection des données personnelles. Elle englobe non seulement la manière dont les...

Premium

Innovations Cloud

REPLAY | FinOps : Comment un grand groupe a réduit de 70% la facture d’un projet cloud ?

La maîtrise des coûts liés au cloud représente un enjeu crucial pour les entreprises en 2025. Cette vidéo, réalisée sous forme de webinar, met en lumière l'expérience d'un client ayant...

IoT et objets connectés

[Data Rider] REX Collecte de données IoT – Étape 1 : Initier la collecte

Vous êtes-vous déjà dit que la partie « collecte de données » d’une chaîne de données était une partie relativement simple d’un projet ? Dans cette série d’articles, nous expliquons pourquoi, selon nous,...

Actualités Data et IA

Revue de presse Data & IA – Mai 2025

Quelles sont les actualités qu’il ne fallait pas manquer dans les secteurs de la Data et de l’Intelligence artificielle ? Au programme : Salesforce s’offre Informatica, Meta va entraîner ses systèmes d'IA...

Premium

Innovation

REPLAY | Accessibilité numérique, secteur privé et évolution de la législation : cap sur la mise en conformité

Dans un monde de plus en plus digitalisé, l’accessibilité numérique est devenue un impératif. Elle garantit que chacun, quels que soient ses capacités ou ses outils, puisse accéder aux contenus...

Premium

Transformation digitale

REPLAY | Réinventez vos parcours métiers grâce à l’IA, au Low-Code et au Cloud Native

Les attentes des clients et des collaborateurs évoluent de plus en plus vite. Ainsi, pour rester compétitif, il ne suffit plus d’innover, il faut le faire vite, bien et en...

Solutions technologiques

Copilotage Intelligent avec Microsoft Azure : Approche d’architecture pilotée par les indicateurs de performance

Les avancées en intelligence artificielle générative, notamment via les LLMs (Large Language Models), ouvrent des perspectives inédites d’amplification des capacités humaines dans les entreprises. Comme l’ont souligné Brynjolfsson et McAfee...

Stratégie Data

Présent et futur de l’IA : quelle trajectoire pour les entreprises ?

L’ascension de ChatGPT a été fulgurante, et a propulsé l'intelligence artificielle, notamment l'IA générative, sur le devant de la scène. Jamais une technologie n’est allée aussi vite dans son adoption...

Premium

Solutions technologiques

REPLAY | Azure Arc ou comment optimiser vos usages Microsoft on premise

Comment maximiser la sécurité et l'efficacité de votre infrastructure ? Azure Arc peut transformer la gestion de vos serveurs SQL et Windows tout en restant sur site. Nos explications en...

Premium

Solutions technologiques

REPLAY | Liferay : accélérez le développement de vos applications digitales avec une plateforme low-code souveraine

Dans un marché en constante évolution, la rapidité de déploiement des expériences et applications digitales est essentielle pour garder une longueur d’avance. 70% des entreprises considèrent l’accélération du Time to...

Actualités Data et IA

Revue de presse Data & IA – Avril 2025

Quelles sont les actualités qu’il ne fallait pas manquer dans les secteurs de la Data et de l’Intelligence artificielle ? Au programme : l'entreprise Bleu franchit la première étape vers la qualification...

Stratégie Data

Les enjeux IA & Data 2025 : entre course à l'IA générale et réalité terrain

Alors que la course vers une IA générale mobilise des ressources considérables, les entreprises sont confrontées à des enjeux beaucoup plus concrets. Loin des effets d’annonce, il est impératif de...

Premium

Transformation digitale

REPLAY | CSRD : Les secrets d'une approche Data ESG performante

La CSRD, récemment bousculée par l’Omnibus de la Commission Européenne, continue de transformer le reporting extra-financer. Il devient alors essentiel pour les entreprises d’intégrer l’ESG au cœur de leur stratégie....

Premium

Migration vers le cloud

REPLAY | Réussissez votre migration vers le cloud : Stratégie et Retour d'expérience avec Bleu

Les entreprises et administrations publiques sont soumises à de fortes exigences en matière de confidentialité. Comment allier innovation et maîtrise des données ? Retour d’expérience pour réussir votre migration vers le...

Move2cloud : Tests de non-régression ? Arrêtez de perdre du temps !

Quand et comment faire des tests de non-régression ?

Alors que privilégier et comment l’automatiser ?

Automatiser, c’est bien, suivre et piloter, c’est encore mieux !

Découvrez aussi

Identités numériques : tout comprendre sur ce domaine en pleine évolution

REPLAY | FinOps : Comment un grand groupe a réduit de 70% la facture d’un projet cloud ?

[Data Rider] REX Collecte de données IoT – Étape 1 : Initier la collecte

Revue de presse Data & IA – Mai 2025

REPLAY | Accessibilité numérique, secteur privé et évolution de la législation : cap sur la mise en conformité

REPLAY | Réinventez vos parcours métiers grâce à l’IA, au Low-Code et au Cloud Native

Copilotage Intelligent avec Microsoft Azure : Approche d’architecture pilotée par les indicateurs de performance

Présent et futur de l’IA : quelle trajectoire pour les entreprises ?

REPLAY | Azure Arc ou comment optimiser vos usages Microsoft on premise

REPLAY | Liferay : accélérez le développement de vos applications digitales avec une plateforme low-code souveraine

Revue de presse Data & IA – Avril 2025

Les enjeux IA & Data 2025 : entre course à l'IA générale et réalité terrain

REPLAY | CSRD : Les secrets d'une approche Data ESG performante

REPLAY | Réussissez votre migration vers le cloud : Stratégie et Retour d'expérience avec Bleu

Informations sur la gestion de vos données et vos droits