Datalake : définition et ROI

Le datalake a-t-il un ROI ? Avant d’essayer de donner une réponse, rappelons la définition d’un datalake. Si vous vous posez les questions “qu’est-ce qu’un datalake ?” et “le datalake a-t-il un ROI ?”, alors cet article est fait pour vous.

Sommaire

Qu'est-ce qu'un datalake ?

Le datalake : nouvel outil de stockage des données permettant de faire passer l’entreprise dans le nouvel âge de la data, est souvent la réponse technologique à de nombreux espoirs.

Les promesses du Big Data, de réalisations de cas d’usages plus performants, vecteur de transformation de l’entreprise ont poussé de nombreuses entreprises à s’engager dans la dynamique de création des datalakes avec des ambitions importantes.

La communication autour de l’IA, l’automatisation des processus, le conseiller augmenté ou le marketing gonflé à l’IA a contribué à accélérer le déploiement des datalakes.

Le datalake a-t-un ROI (ou qui veut la peau des datalakes) ?

Des investissements conséquents dans les datalakes

Ces nouvelles plateformes data représentent des investissements importants, car depuis les premières années et la vision Open Source, le marché s’est structuré. Les éditeurs de plateforme ont structuré des offres adaptées et permettant d’offrir l’ensemble des éléments de sécurité.

Après des investissements de plus de 100 millions d’euros et de plusieurs mois de travail pour les équipes IT, et de nombreux rebondissements (mise en conformité RGPD, sécurité..) vient le moment tant attendu de la phase d’alimentation des données.

Dans un datalake, les données peuvent être structurées, non-structurées ou semi-structurées pour une utilisation ultérieure, au contraire d’un Data Warehouse qui possède essentiellement des données traitées et structurées

Mais pour quelle rentabilité ?

Après cette longue phase d’attente, l’urgence de rendre opérationnel le datalake fait que les pratiques de gestion de la donnée sont bien souvent oubliées, ou reléguées à « on verra plus tard ».

À ce stade, nous avons donc un espace permettant de dupliquer toutes les données de l’entreprise, pour un coût création et de gestion qui ne cesse d’augmenter.

Au-delà du surcoût immédiat et de la difficulté de gestion que pose cette duplication rapide des données de l’entreprise (nécessité de garder les informations synchrones, identifier la bonne source de données…), souvent effectué sans déploiement de pratique de gouvernance de données, il se pose avant tout la question de la rentabilité de ces plateformes.

Ces solutions technologiques ont été créées pour assurer un service, et donc assurer la continuité d’un usage existant. Il devient donc urgent de libérer les nouveaux usages tant attendus et qui ont été réfléchis durant les semaines précédentes, et c’est à ce moment que de nouvelles difficultés surviennent.

Les usages alternent entre

  • des réalisations simples, afin de valider la plateforme et les compétences, mais apportant peu de valeur
  • des usages trop complexes ne tenant pas compte de la maturité de l’entreprise, de la maîtrise du patrimoine data.

Le datalake et la tranformation des entreprises

Différentes études montrent que 80% des usages ne passent pas l’étape de la mise en production. Les usages d’IA tant attendus semblent alors bien loin et le positionnement du datalake pose ainsi question.

Il faut donc revenir aux fondamentaux et prendre une nouvelle fois du recul sur la technologie. Le datalake n’est qu’un moyen qui permet d’accompagner la transformation de l’entreprise. Cette transformation doit donc être appuyée par une réflexion sur le business model à déployer pour accompagner la transformation de l’entreprise en lien avec le datalake et le modèle opérationnel associé.

La réussite de ce type de ces transformations nécessite un alignement complet

  • de l’organisation
  • des processus
  • des collaborateurs
  • de la data.


Cet alignement est le seul moyen de valoriser ces investissements et mettre en marche l’ensemble des fonctions de l’entreprise vers un but commun et qui offre une vision précise du ROI en permettant donc d’absorber les coûts de ces nouvelles infrastructures.

On en parle ensemble ?

Si vous souhaitez en savoir plus sur nos expertises en data et échanger avec nous sur ces sujets

Pour aller plus loin sur la data

data for good

Data For Good

La Data For Good, si on devait en donner une définition simple, c’est l’apport de la data science comme leviers d’innovation for good pour la société

Lire la suite »