Stappenplan: Zo boor je zelf data aan

Zodra je voor de uitdaging staat om data te gaan verzamelen, komt onvermijdelijk de vraag op: doe ik dit zelf, of laat ik het doen? In dit verhaal lees je waarom zelf doen leuk is, en hóe je dat dan doet.

Leestijd

15 min

Maturity

Beginner

Thema

De middelen

Doel

Bedrijfsvoering verbeteren

Er is zeker wat voor te zeggen om het verzamelen van data te laten doen door een externe specialist. Het voordeel daarvan is dat je zelf tijd over houdt om je bezig te houden met andere zaken. Het nadeel kan zitten in de hoge tarieven en de vele aanbieders waaruit je moet kiezen.

Zelf doen is echter leuk en het geeft je écht inzicht om beter datagedreven te ondernemen. Bovendien is het eenvoudig om zelf de eerste stappen te zetten in het aanboren van data. We geven hieronder een overzicht van eenvoudig zelf te gebruiken tools om interne en externe databronnen (oftewel: open en gesloten) aan te boren.

Welk type data aanboren?

In het artikel Data verzamelen hebben we het verschil tussen interne data en externe data toegelicht. Interne data is data die je zelf hebt en externe data is data die je van buitenaf moet halen.

Interne data wordt zelden volledig benut. Jouw bedrijf kan letterlijk op een goudmijn aan data zitten, zonder dat je je daar bewust van bent. Bij externe data dien je na te gaan of deze ‘open source’ (lees: gratis beschikbaar voor iedereen) of ‘gesloten’ is. In het laatste geval kun je vaak tegen een maandelijkse of eenmalige betaling toegang tot de data krijgen.

Om een goede analyse te maken verdient het aanbeveling om zowel interne als externe databronnen aan te boren. Zo geven verkoopcijfers (interne data) bijvoorbeeld goed weer wat er gebeurd is, maar om ze beter in de context te plaatsen, dien je ze te correleren aan bijvoorbeeld productkwaliteit en verkoopactiviteiten (beide interne data) én aan concurrenten, het weer en vakantieperiodes (allemaal externe data).

Opvangen en sorteren

Vanzelfsprekend is alleen het aanboren van data niet voldoende. Je moet deze ook goed sorteren en filteren om vervolgens zelf analyses te kunnen maken en beter datagedreven te werken en ondernemen. In het artikel ‘Handvatten om relevante data te vangen’ leggen we uit hoe je dat doet. In het huidige artikel focussen we op het aanboren van de data en de tools die je daarvoor kunt gebruiken.

Aanboren interne data

Het aanboren van interne data kent een vast stappenplan. Stap 1 en 2 vergt even wat denkwerk, maar is in een stevige middag goed te doen. Stap 3, 4 en 5 vragen om een halve dag onderzoekswerk en een beetje technische kennis, maar niks waar je van moet schrikken als je de juiste tooling gebruikt. Deze is vaak met enkele klikken aan te zetten en veel tooling doet alle drie de stappen automatisch voor je.

  1. Stap 1: Afbakenen. Bepaal welke interne data je nodig hebt
  2. Stap 2: Lokaliseren. Stel vast waar die data zich bevindt
  3. Stap 3: Aanboren. Maak een verbinding met de databron(nen)
  4. Stap 4: Extraheren. Zorg dat de data van de bron(nen) naar een centrale, digitale plek komen
  5. Stap 5: Organiseren. Structureer de data, zodat je deze kunt analyseren en visualiseren

Afbakenen en lokaliseren

Stap 1 en 2: ook wel de Soll-Ist GAP-analyse genoemd. Dit is een goede oefening om af te bakenen welke interne data je nodig hebt (afbakenen) en waar die zich bevindt (lokaliseren). Deze oefening gaat als volgt:

Wie: Alleen of met klein administratief team
Doel: Dataplekken bepalen
Moeilijkheidsgraad: Gemiddeld
Duur: 2 tot 3 uur
Benodigdheden: Spreadsheet of whiteboard met stiften

Stap 1:

Maak vier kolommen. Boven kolom 1 zet je ‘benodigde data’. Boven kolom 2 ‘locatie van de data nu’ (Ist) en boven kolom 3 ‘locatie van de data schoon’ (Soll). Ten slotte zet je boven kolom 4 ‘te doen’.

Stap 2:

Vervolgens denk je na over welke interne data je nodig hebt. Let op dat je duidelijk afbakent wat je wilt weten. Als je bezig bent de klantgegevens te analyseren, dan heeft het geen zin om de salarisstroken van je eigen personeel mee te nemen. Deze data-elementen zet je onder elkaar in kolom 1.

Stap 3:

Achter elk data-element zet je in de tweede kolom de locatie van die data (lokaliseren). Staat deze in papieren ordners? Is het verspreid over verschillende e-mailboxen? Zit het in iemands hoofd of in een los Excelsheet? Wellicht gebruik je al een eenvoudig CRM-systeem of is het uit de digitale boekhouding te halen. Het kan allemaal. Indien het op meerdere plekken staat, dien je vast te stellen op welke plek de originele data (ook wel ‘single source of truth’) staat.

Stap 4:

In de derde kolom schrijf je van elk element waar het zou moeten staan. Staat het al op de goede plek? Uitstekend, dan hoef je daar niks meer aan te doen. Belangrijk is te beseffen dat data digitaal en centraal moet staan en toegankelijk is. In de beginnende fase mag dat best een Excelsheet of simpele database zijn. Iets geavanceerder, maar net zo eenvoudig, is het gebruik van online tools.

Stap 5:

Schrijf in de laatste kolom de werkzaamheden op die nodig zijn om de data op de Soll-locatie te krijgen.

Als beginner in datagedreven werken betekent het vaak dat je jouw analoge administratie moet digitaliseren. Dat is een kwestie van inkloppen, op een ‘schone’ manier. Dat betekent dat jouw gegevens up-to-date moeten zijn en consistent. Dus niet de ene keer de voorletters van de klant opslaan, en de andere keer de voornaam voluit. Ook als je facturen en offertes schrijft, horen beschrijvingen zo eenduidig mogelijk te zijn. Pas dan kun je data ontsluiten en makkelijk terugvinden.

Aanboren, extraheren en organiseren

Nadat je hebt vastgesteld waar de interne data staat, is het zaak deze op de juiste manier aan te boren. In sommige gevallen betekent het dat je een koppeling moet maken naar de databron. Zorg dat je dan een tooling kiest die eenvoudig te koppelen is met die databronnen. Indien je moet overkloppen, doe dit dan meteen in de tooling die je gaat gebruiken voor je interne data.

Kijk even op deze handige lijst met vergelijkingssites voor beschikbare tools.

Aanboren externe data

Het aanboren van externe data verrijkt de inzichten die je krijgt uit interne data. Het stelt je in staat om data in de juiste context te plaatsen. Die context is belangrijk om oorzaak en gevolg goed te begrijpen en zo beter datagedreven te kunnen ondernemen.

In dit artikel laten we zien hoe jij als beginnend datagedreven ondernemer externe databronnen kunt aanboren en raadplegen. Je hoeft hiervoor dus geen ervaren growth hacker of data engineer te zijn.

Een eenvoudig voorbeeld is die van de duurzame ijssalon. Op 15 oktober had deze een van zijn beste dagen, zo blijkt uit de verkoopcijfers (interne data). Op die herfstdag was het niet alleen een vrije dag voor de scholen in de buurt, zo blijkt uit de vakantieroosters (externe data). Volgens het weerbericht was het ook nog eens 25 graden (externe data). Door ook naar de externe data te kijken, weet de ijssalon volgende keer wanneer hij meer personeel moet inzetten en meer ijs moet bereiden.

Bronnen van externe data

Externe data komt op vele plekken voor. Van het kadaster tot het KNMI en van Google tot jouw gemeente. Bedenk welke informatie jij nodig hebt en onderzoek vervolgens waar je die kunt vinden. Je zult verbaasd zijn hoeveel externe open databronnen er zijn.

Tip: Pas op de valkuil van ‘dataverslaving’. De neiging om steeds meer bronnen aan te boren kan leiden tot steeds meer irrelevantie informatie. Houd het bij de relevante kern.

Grofweg onderscheiden we vier soorten externe databronnen:

  1. Externe social media
  2. Eigen social media en eigen website
  3. Zoekmachines
  4. Overige bronnen

#1 Externe social media
Social media is een verzamelterm voor alle online platformen met een sociaal karakter – vandaar de naam. Deze platformen kenmerken zich door een minimale (of geen) tussenkomst van professionele redacties. De inhoud op social media is daarom vaak user generated content, waarbij gebruikers de interactie en dialoog via sociale media aangaan (bron: onemedia). De tien populairste social media kanalen in Nederland zijn (in 2020): WhatsApp, Facebook, YouTube, Instagram, TikTok, LinkedIn, Pinterest, Twitter, Snapchat en Tumbler. 

Deze kanalen zijn waardevol als het over doelgroep-data gaat. Op social media laten mensen zien wie ze zijn en waarin hun interesses liggen. Door na te denken over je doelgroep en waar ze zich bevinden, kun je heel gericht op het juiste social media kanaal met ze communiceren én inpluggen op hun behoeftes. Stel jezelf daarbij altijd de vraag of het ethisch is om externe data te gebruiken. Dat andere organisaties deze data verzamelen, betekent niet dat jouw bedrijf dat ook per se zou moeten doen.

Wil je meer weten over hoe je data in social media aanboort? Klik hier

#2 Eigen social media en eigen website
Als mkb-organisatie heb je waarschijnlijk eigen kanalen op relevante social media. Te denken is aan een LinkedIn- of Facebookpagina. Ook heb je vast een website. Hoewel de data die je daarop kunt verzamelen van je gebruikers lijkt op interne data,  scharen we die toch onder externe data. De reden is dat je externe tools nodig hebt om die informatie aan te boren.

De eigen kanalen op social media en je website zijn waardevol als het gaat om gebruikersdata en productdata. Je laat op social media en jouw site je eigen diensten en producten zien. Het zijn daarom je belangrijkste etalages voor de buitenwereld. Bovendien is het een primair contactpunt met je doelgroep. De kans is groot dat je er ook nog producten op verkoopt.

Wil je weten hoe je data aanboort in je eigen social media kanalen en je eigen website? Klik hier

#3 Zoekmachines
Google is natuurlijk de aller- allergrootste zoekmachine en dus houden we ons hier alleen even daarbij. Vrijwel iedereen die iets zoekt op internet gebruikt Google om dat te vinden. Door deze zoektochten te analyseren weet het bedrijf inmiddels misschien wel meer van mensen dan dat zij zelf weten. En die kennis is aan te boren. Wel wijzen we je erop dat het altijd goed is om onderzoek te doen naar de manieren waarop een bedrijf als Google data verzamelt, en of dat overeenkomt met jouw visie op ethisch datagebruik.

Google is waardevol als het over heel veel data gaat. En dat is meteen de valkuil. Google wil alle informatie ter wereld toegankelijk maken en is daarin hard op weg. Voor jouw sociale onderneming is dat wellicht wat veel data.

Wil je weten hoe je data aanboort via Google? Klik hier

#4 Overige bronnen
Ja, dit is een heel ruim begrip. Afhankelijk van de doelstellingen die jij hebt met datagedreven ondernemen, heb je andere bronnen nodig: de zogenaamde overige bronnen.

Heel veel organisaties, met name publieke organisaties, stellen hun data gratis ter beschikking via zogenaamde open source platforms. Van de Vereniging van Nederlandse Gemeenten (VNG) tot aan het kadaster en van het KNMI tot het CBS. Heel veel data is gratis, openbaar toegankelijk en wellicht relevant voor jouw sociale onderneming.

Wil je weten hoe je data aanboort in de zogeheten overige bronnen? Klik hier

Dit artikel is een bijdrage van The Next Lab