Een data lakehouse is een combinatie van een data lake en een traditioneel datawarehouse, waarbij de voordelen van beide principes & achterliggende technologieën worden gecombineerd.

Een data lakehouse wordt gebruikt om ruwe data op te slaan en te verwerken, zoals in een data lake. Echter is het ook mogelijk om de data te structureren en te organiseren op een manier die geschikt is voor analytics, zoals in een datawarehouse. Daarnaast wordt de het beheren van de data eenvoudiger aangezien zaken zoals data lineage ondersteund worden.

Een data lakehouse kan worden gebruikt door data-analisten én data scientisten om toegang te krijgen tot de data die ze nodig hebben. Dat dit zowel gestructureerde data in tabelvorm als niet-gestructureerde data kan zijn, maakt de oplossing uniek en brengt de data science & data analytics werelden dichter bij elkaar. Een ander voordeel is dat de gebruikers van de data zelf kunnen kiezen met welke query- of scripttaal ze de data raadplegen of wegschrijven.

Een data lakehouse biedt de mogelijkheid om snel te reageren op veranderende behoeften en om data te combineren uit verschillende bronnen, terwijl tegelijkertijd de structuur en organisatie van de data wordt behouden om het gemakkelijker te maken om de data te analyseren.

Een interessant artikel (in het Engels) met meer details over een data lakehouse is hier te vinden.

Terug naar overzicht

Bericht delen:

LinkedInCopy Link