Retour d’expérience : Raphaël Combaud explore les promesses d’Apache Iceberg lors de l’atelier Cloudera
Interview animé par François DORLEANS et répondu par Raphaël COMBAUD. L’éditeur Cloudera organisait le 5 septembre dernier un atelier d’une…
Interview animé par François DORLEANS et répondu par Raphaël COMBAUD. L’éditeur Cloudera organisait le 5 septembre dernier un atelier d’une…
Splunk est ce qu’on appelle un “puit de données”. Il permet de regrouper les différentes données (logs) provenant de la…
Alors que les cas d’usage révolutionnaires promis par les progrès récents en machine learning, telle la voiture autonome, ou l’aide au diagnostic…
Cet article se veut pragmatique sur les questions essentielles au démarrage de la gouvernance de son datalake. Rappel sur la gouvernance…
Avant toute analyse de données en vue de créer un modèle prédictif, il faut s’assurer de la qualité des données…
Plusieurs solutions existent au sein de l’écosystème Hadoop pour gérer les ressources d’un ou plusieurs clusters : YARN introduit en novembre 2011,…
L’objet de ce billet est de vous présenter une branche parfois un peu obscure mais essentielle du Big Data. Il s’agit du Machine Learning.…