Qu’est-ce que le data swamp ?

data swamp

Si l’importance des données n’a pas échappé à un entrepreneur soucieux de se démarquer de la concurrence mais aussi d’optimiser le fonctionnement de sa structure, il doit également comprendre qu’il peut avoir parmi elles, ce que l’on appelle une partie de Data Swamp. Bonne ou mauvaise nouvelle ? C’est ce que nous allons voir ici.

Data swamp : de quoi s’agit-il exactement ?

Si l’on disait à un entrepreneur que plus de la moitié des données que son entreprise possède relève du Data Swamp, il serait légitime de se poser la question : doit-il s’en réjouir ou pas.

En fait, non, car ce que l’on appelle le Data Swamp (ou littéralement marécage de données) consiste en des données qui, du fait de leur inutilisation ou encore du fait qu’elles ne soient pas structurées ne présentent aucun intérêt pour l’entreprise. Cela peut concerner des données extraites de rapports annuels ou encore de doublons de documents. Inutilisées cependant, n’a pas la même signification qu’inutilisables.

Ce sont juste des dark data qui attendent de servir. Il faut cependant, avant cela, procéder en plusieurs étapes. Il s’agit de les ranger par catégories, voir si elles ne sont pas obsolètes  et les nettoyer avant de pouvoir les mettre dans un entrepôt dématérialisé ; ce que l’on appelle un data hub ; car elles ont été centralisées en les récupérant des différents services de l’entreprise.

Ces différentes démarches n’ont rien d’évident car généralement, les services d’une entreprise ne communiquent pas entre eux ; ne serait-ce que sur les différents problèmes métiers qu’ils peuvent rencontrer.

Cela est dommage car la solution se trouve peut-être quand même à l’interne et pourrait être donnée en sachant tirer parti des données globales ; afin d’avoir une vision holistique et donc plus précise et correspondant à la réalité de l’entreprise.

Qui appeler pour organiser et exploiter ses données professionnelles ?

Le Data Swamp n’est donc pas une fatalité. Cependant, il s’agit d’y remettre bon ordre, pour ne pas se retrouver avec des données qui non seulement peuvent devenir inutiles mais aussi obsolètes

. Une information qui ne correspond plus à une certaine réalité (suite à un développement, au départ d’une personne, au fait d’avoir ajouté ou retiré un produit) devient une source d’erreur potentielle et à ce titre peut nuire à l’entreprise par différents biais. En tout cas, elle perdrait forcément en crédibilité.

Parce que l’embauche d’un data owner qui procéderait à la gouvernance des données n’est pas toujours possible en fonction de la situation financière de l’entreprise et de sa taille (puisque la France comporte majoritairement des TPE et des PME), il est néanmoins possible d’externaliser cette tâche à une société spécialisée dans la gestion de données.

Elle peut alors procéder à un état des lieux : parfois, les entreprises n’ont pas encore compris l’importance que peuvent revêtir leurs données et comment en tirer parti.

Cela peut donc passer par une action de sensibilisation avant d’entamer une procédure pour supprimer les données qui ne peuvent pas servir, ordonnancer les autres, les classifier et les catégoriser afin de les rendre facilement accessibles et donc exploitables.

Ce travail pourtant peut s’envisager de manière régulière puisque l’entité produit et reçoit des données à longueur de journée par le biais d’échanges mails, de la production de documents et le fait d’en recevoir etc.

Des contrats peuvent être mis en place pour traiter les données et en profiter pleinement. Cela est à voir avec l’entreprise spécialisée choisie, dans le but de prendre en considération les aspirations et les besoins de chaque entité, tout en respectant bien entendu le budget qu’elle peut échoir à cette nouvelle manière de procéder.