Data Quality Automation: wat is het en hoe gebruik je het?

Carel Schrier Carel Schrier
02 september, 2021
 

In 2018 gaf een benchmark report aan dat 95% van de leidinggevenden gelooft dat data een integraal onderdeel is van hun bedrijfsstrategie. Er is geen twijfel mogelijk dat data een belangrijk bezit is van elk bedrijf. De vraag is meer of alle data wel even waardevol is? Het korte antwoord is nee.

Hoewel het verzamelen van data misschien wel het halve werk is, is de echte uitdaging om gedurende de hele lifecycle hoge normen voor datakwaliteit te handhaven.

Om het dan nog moeilijker te maken lijkt ongeveer 50% van de bedrijven het niet eens te zijn over wie verantwoordelijk is voor het beheer van gegevens. De taak is meestal verspreid over operationele teams, besluitvormers en professionals van verschillende afdelingen die dagelijks de data beheren.

Maar je moet wel weten hoe je de kwaliteit van data vervolgens kunt meten en waarborgen. Daarbij moet je ook de beschikbare tools begrijpen om je te ondersteunen met deze taak.

Wat is Data Quality?

Data Quality, ofwel datakwaliteit, meet in hoeverre data het beoogde doel dient. In de meeste gevallen is het doel van het verzamelen van gegevens om informatie te hebben om uiteindelijk beslissingen te nemen. Dus als we het hebben over kwalitatieve data, bedoelen we het type gegevens dat resulteert in informatie van hoge kwaliteit die uiteindelijk leiden tot data gedreven beslissingen.

Laten we eerst even een stap terug doen. Hoe zorgt datakwaliteit voor goede zakelijke beslissingen?

  1. 1. Je hebt data, maar deze zijn nog niet bruikbaar.
    Op dit moment heb je alleen waarden in een database of een Excel bestand staan. Deze ruwe data hebben geen praktisch nut. Je hebt bijvoorbeeld duizenden emailadressen van je klanten en eventueel interessegebieden in een CSV-bestand.
  2. 2. Je zet data om in informatie.
    Die data breng je naar een tool waar je het helder in de juiste context kunt visualiseren. Bijvoorbeeld een email lijst binnen je marketingapplicatie. Je kan dan de emailadressen filteren op basis van hun interesses.
  3. 3. Je verwerft kennis.
    De vergaarde informatie kan je analyseren om daar vervolgens inzichten uit te halen. Zo kun je bijvoorbeeld te weten komen dat veel van je klanten juist informatie over specifieke onderwerpen wilt ontvangen.
  4. 4. Datagedreven beslissingen.
    Met deze kennis kun je dus data gedreven beslissingen nemen, zoals het maken van een nieuwsbrief afgestemd op wat er uit je analyse is voortgekomen.

Wanneer je gegevens van slechte kwaliteit zijn, heb je de verkeerde informatie en ontbreekt het aan kennis om goede beslissingen te kunnen nemen.

Kenmerken van datakwaliteit

Aangezien data in alle soorten en maten bestaat, is het niet altijd simpel om de kwaliteit te bepalen. Er zijn enkele kenmerken die doorgaans worden toegeschreven aan data van hoge kwaliteit. Als je deze kenmerken in je eigen data zoekt, krijg je een idee van jouw datakwaliteit.

  1. 1. Nauwkeurigheid

Kloppen je gegevens? Weerspiegelt het de werkelijke situatie waar je naar kijkt? Om nauwkeurigheid en precisie te garanderen moet je jouw datamanagementstrategie optimaliseren. De nauwkeurigheid van je data hangt samen met de data integriteit. Over het algemeen is de beste manier om fouten in je gegevens te minimaliseren, door handmatige invoer van data zoveel mogelijk te vermijden.

  1. 2. Volledigheid

Is je data volledig? Onvolledige informatie kan onbruikbaar zijn. Hoewel het niet raadzaam is om meer te verzamelen dan nodig is, moet je er wel voor zorgen dat je de waarden hebt die verplicht zijn om op te slaan in je database. Anders krijg je namen zonder achternaam of onvolledige telefoonnummers die je niet kunt gebruiken.

  1. 3. Relevantie

Is dit de data die je nodig hebt? Niet alle gegevens die je verzamelt zullen een enorme impact maken. Wanneer er een reden is waarom je gegevens verzamelt en de waarden kunnen bijdragen aan deze reden, dan heb je een goede datakwaliteit. Als je bijvoorbeeld een geboortedatum vraagt van je klanten, maar de leeftijd blijkt geen nuttige informatie voor je te zijn, dan zijn het gegevens zonder doel. De data mag dan wel correct zijn, maar de data is niet effectief.

  1. 4. Consistent

Is je data in tegenspraak met andere bronnen? Gegevens van hoge kwaliteit mogen niet in tegenspraak zijn met de gegevens die opgeslagen zijn in andere databases. Anders zou je moeten aannemen dat één van hen fout is, maar welke is dat dan? Wanneer is inconsistenties zijn tussen verschillende databases, is het een gedoe om de nauwkeurigheid te bepalen. Er zijn integratieoplossingen beschikbaar waarmee je kunt kiezen welk stuk software ‘wint’ in het geval van een conflict.

  1. 5. Toegankelijkheid

Is de informatie toegankelijk voor de juiste personen? De meeste bedrijven communiceren met klanten, prospects, partners en werknemers via verschillende applicaties. Als gevolg hiervan zijn gegevens verspreid over verschillende tools en als er geen software integratie is, heb je een probleem met data silo’s.

Data silo’s behoren tot de belangrijkste oorzaken van slechte datakwaliteit. Zelfs met nauwkeurige, consistente en relevante gegevens. Als het team, die deze informatie zou moeten gebruiken, er geen toegang tot heeft dient het niet zijn doel. Om de toegankelijkheid te garanderen, moet je jouw systemen laten integreren.

  1. 6. Tijdigheid

Is je data up to date? Gegevens veranderen voortdurend en het probleem met verouderde data is dat deze mogelijk niet representatief zijn voor de huidige situatie. Het is natuurlijk fijn om historische data bij te houden, maar met een duidelijk tijdsbesef. Voor realtime rapportages moet je ervoor zorgen dat je gegevens voortdurend worden bijgewerkt.

 

Hoe je data van hoge kwaliteit kunt garanderen

Het zorgdragen van je datakwaliteit is niet iets eenmaligs. Het maakt deel uit van een continu proces waarin mensen, technologie en strategie op elkaar moeten worden afgestemd.

Naarmate je bedrijf groeit, worden de uitdagingen rondom datamanagement steeds complexer. Daarom is een solide basis, gericht op het voorkomen van toekomstige problemen, de sleutel om de datakwaliteit te waarborgen.

Hier zijn enkele zaken waarmee je rekening moet houden vanaf het allereerste moment dat je een strategie voor datamanagement implementeert:

Databeleid: Dit verwijst naar het bedrijfsbeleid en de regels dat de normen bepalen als het gaat om datamanagement. Dit beleid moet bekend zijn en toegepast worden door iedereen die gegevens beheert. Dit zal het startpunt zijn om gegevens van hoge kwaliteit te verkrijgen.

Dataprofilering: Dit heeft te maken met de verantwoordelijken. Data beheren is zelden afhankelijk van één team. Hoewel we geneigd zijn om de technische aspecten ervan toe te kennen aan het IT-team, wordt data door het hele bedrijf verzameld en beheerd. Daarom moeten er idealiter meerdere mensen verantwoordelijk zijn voor de datakwaliteit in het gehele bedrijf.

Dataonderhoud: Het moet een continuerend proces worden om periodieke data opschoning, preventie, detectie en reparatie van data uit te voeren. Dataonderhoud is de manier om de integriteit ervan te waarborgen.

Data integratie: Het verbinden van verschillende systemen die je gebruikt. Dit is de manier om ervoor te zorgen dat je gegevens up to date en toegankelijk blijven. Als je bovendien voor data synchronisatie hebt gekozen om te integreren, zullen je gegevens ook consistent zijn tussen de systemen en zal overeenkomende data tussen databases worden verrijkt. Wanneer je namelijk verschillende contactgegevens van dezelfde persoon hebt in verschillende databases, worden ontbrekende gegevens in de databases aangevuld met beschikbare data door de synchronisatie die twee richtingen op werkt.

Wanneer je werkt met een complexe datastructuur, waarbij de kwaliteit van je gegevens essentieel is voor de bedrijfsvoering, zijn er wellicht andere onderdelen van data waar je meer over wilt weten zoals datamatching, masterdatamanagement en datakwaliteitsrapportages.

Tools voor datakwaliteit

Ervaar je momenteel problemen met het waarborgen van één van de onderdelen van datakwaliteit die we genoemd hebben? Dan zijn daar uiteraard tools voor beschikbaar om je hierbij te helpen. Eigenlijk zijn er zoveel softwaremogelijkheden dat het soms juist moeilijk is om de juiste te kiezen. Een goede plek om je onderzoek te beginnen is door beoordelingssites zoals G2 te bezoeken.

Om je een idee te geven van het bereik en de diversiteit van de tools om datakwaliteit te verbeteren, hebben we er hieronder een aantal uitgelicht.

Insycle

Scoort hoog binnen de G2 reviews en is een HubSpot App Partner. Het is een complete oplossing voor klantdatamanagement waarmee je jouw klantgegevens kunt beheren, automatiseren en onderhouden. Het stimuleert de efficiëntie, verbetert de rapportage, brengt de teams op één lijn en verbetert het vertrouwen in gegevens.

OpenRefine

Dit is een gratis open source tool voor het beheren en opschonen van data. Het richt zich op het transformeren en opnieuw formatteren van ongelijksoortige gegevens om deze te standaardiseren. Met deze software kun je talloze extensies en plug-ins toevoegen, zodat je met veel databronnen kunt werken.

Operations Hub

Dit is een Hub binnen het HubSpot platform. Het is bedoeld voor bedrijven die al gebruik maken van de systemen van HubSpot. Het hebben van geïsoleerde contactdata is een van de meest voorkomende bedreigingen van datakwaliteit. Omdat het twee richtingen op werkt in realtime, helpt het datamanagers om consistentie, volledigheid, nauwkeurigheid en toegankelijkheid van klantdata te garanderen met een zeer eenvoudige installatie.

Het garanderen van datakwaliteit is niet altijd eenvoudig, maar de tijd en moeite die je erin steekt betaalt zich terug op het lange termijn succes van je bedrijf. Het stelt teamleiders in staat om geïnformeerde en data gedreven beslissingen te nemen.

Niet iedereen kan een dataexpert zijn, maar er zijn enkele punten die cruciaal zijn, zoals technieken en tools. Die maken het voor elke professional mogelijk om hun datakwaliteit te verbeteren.

Data Quality Automation binnen Operations Hub

We weten dat je gegevens niet altijd in de staat verkeren, zoals je dat zou willen. Het schoonmaken van je data kan daarnaast ook nog eens intensief handmatig werk zijn. Die rommelige gegevens kunnen van invloed zijn op je bedrijf en, erger nog, de ervaring van je klant.

Met de Operations Hub van HubSpot is er een gemakkelijke manier om je gegevens schoon te houden met behulp van workflows. Binnen je workflows heb je met Operations Hub de mogelijkheid om de actie ‘Format Data’ toe te voegen.

Met deze nieuwe actie kun je dingen doen, zoals het hoofdlettergebruik van tekst wijzigen, datums opnieuw formatteren in welk formaat dan ook of zelfs berekeningen uitvoeren op numerieke waarden.

Wanneer je Operations Hub gebruikt kun je simpelweg op het plusteken klikken voor een nieuwe actie en vervolgens op ‘Format Data’ klikken om je workflow en dataopschoning te automatiseren.Workflow: data quality automation

 

Start met jouw datakwaliteit

Weet je niet waar je moet beginnen om je data op te schonen? Of weet je niet welke tool geschikt is voor jouw bedrijf? Plan dan gerust een afspraak met mij in en ik vertel je graag de mogelijkheden.