Data lineage : principe et méthode

data lineage principe methode

Le Data représente l’ensemble des données générées par une entreprise. Ces données peuvent être internes ou externes. L’ensemble de ces éléments pourrait améliorer et optimiser le fonctionnement de l’entreprise. Le problème étant que pour la plupart, elles ne sont pas exploitées comme elles le devraient. Il existe cependant des solutions à mettre en place ; comme le data lineage.

C’est quoi le data lineage ?

Petit rappel de ce que devrait être le cycle de vie d’une donnée : celle-ci est en premier lieu collectée, elle est exploitée (ou pas) et est stockée jusqu’à ce qu’elle soit devenue obsolète.

Or, concrètement, ce travail n’est pas fait par les entreprises, faute de connaissances à ce sujet. Cela est normal, il s’agit d’une tâche complexe qui suppose de les cartographier.

Le lignage de données est un outil qui permet de répondre aux exigences de la CNIL vis-à-vis du RGPD, mais pas uniquement.

On comprend aisément qu’il ne sert à rien de posséder une foule de données si l’on n’est pas capable d’en tirer parti. Or, c’est généralement ce qui se passe. Il arrive aussi que des entreprises utilisent des données qui ne sont plus pertinentes (elles sont fausses ou obsolètes) ce qui, non seulement leur fait perdre du temps, mais parfois leur fait perdre en crédibilité ou en professionnalisme au regard de leurs concurrents.

L’émergence et l’omniprésence de l’intelligence artificielle dans de nombreux domaines, oblige les entreprises à revoir leur façon de procéder et à comprendre l’importance de la gestion de leur flux de données.

Comment tirer parti au mieux du data lineage ?

L’urbanisation et la compréhension des données est un enjeu très important pour les entreprises. Pourtant, quand on sait que pour cartographier ces informations, il faut procéder à des actions de codage, les entrepreneurs s’inquiètent : qui, dans leur équipe, peut être ainsi missionné, sachant que le risque d’erreur est important ?

Ce travail peut être sans crainte externalisé à une entreprise qui se spécialise dans le traitement des données (on parle aussi de gouvernance). Elle fait un état des lieux (audit) des besoins, en fonction de la nature de l’activité et de son secteur.

Elle se voudra de bon conseil pour orienter vers les meilleures décisions à prendre. Le chef d’entreprise souhaite-t-il plutôt un lignage de données fonctionnel ou technique ? Les différences de méthodes et les résultats seront expliqués dans un langage profane pour faciliter la prise de décision.

Il va vite apparaitre comme évident que les dysfonctionnements qui peuvent être liés aux données, en disparaissant, vont faire gagner un temps précieux aux collaborateurs.

La mise en place en automatique de la cartographie des données va simplifier leur tâche, car par la suite, ils pourront simplement glisser/déposer les nouvelles auxquelles ils auront accès, pour qu’elles soient classées, analysées et stockées de manière automatique.

Les structures spécialisées proposent en outre des mises à jour et des vérifications régulières, par le biais généralement de logiciels, afin de s’assurer que tout fonctionne correctement.

Il serait absurde de penser que les entreprises peuvent désormais faire sans exploiter les données qu’elles possèdent et qui arrivent tous les jours en flux réguliers.

Cela constitue pour elles un trésor qui peut avoir une incidence sur la productivité et donc sur le chiffre d’affaires et sur le développement de la structure à moyen terme. Des outils permettent également grâce aux données internes de réduire certains frais superflus ; ce qui offre la possibilité à l’entreprise de faire des économies et d’optimiser sa trésorerie.

Savoir se faire aider en externalisant les tâches n’est plus anecdotique et chaque entreprise ; quelle que soit sa taille ; peut avoir besoin de ce service pour optimiser son fonctionnement.