Data cleansing is het proces waarmee data geschoond en verbeterd wordt zodat de datakwaliteit
omhoog gaat. Soms wordt data cleansing ook wel data cleaning of data scrubbing genoemd. Het is vaak onderdeel van een ETLofdata wrangling proces. Alle hebben ze hetzelfde doel om de bekende zin “Garbage in, Garbage out” voorgoed de deur te wijzen.

In het kader van data analytics kan data cleansing bijvoorbeeld worden gebruikt om fouten of onvolledige data te detecteren en te corrigeren, om duplicaten te verwijderen en om data te standardiseren zodat deze op een consistente manier kan worden gebruikt in analyses.

Terug naar overzicht

Bericht delen:

LinkedInCopy Link