Big Data en Data Analytics
Big data

Inleiding

Eén van de meest voorkomende termen de laatste tijd in de Data Management wereld is ‘Big Data’. Te pas en te onpas valt de term maar wat is het eigenlijk? Wat kunnen we er mee? Moet iedereen er wel iets mee doen? In dit artikel proberen wij de gevleugelde term wat te laten landen.

Wat is Big Data?
In tegenstelling tot wat de term bij veel mensen doet vermoeden gaat Big Data niet alleen om de hoeveelheid data. Dat aspect speelt wel degelijk een rol maar het is meer dan dat. Om de definitie wat concreter te maken zijn er 5 V’s die Big Data kenmerken:

  • Volume – Het gaat om grote hoeveelheden data maar eigenlijk vooral om een heel snel groeiend volume aan data. De hoeveelheid aan berichten uit de verschillende social media bronnen die dagelijks wordt geproduceerd is enorm en de verwachting is dat dit alleen maar toe zal nemen. Deze data wordt niet meer op één centrale plek opgeslagen, laat staan binnen één organisatie.
  • Velocity – Zoals bij ‘Volume’ als is opgemerkt groeit de hoeveelheid data dagelijks enorm snel. Soms zo snel dat het niet eens meer mogelijk is om het in een database op te slaan. Om toch iets met deze data te kunnen doen wordt er gebruik gemaakt van nieuwe technologie, heel anders bijvoorbeeld dan in de traditionele databases en datawarehouses.
  • Variety – De vorm en structuur van de data is heel erg divers. Structuur is er eigenlijk bijna niet meer in de zin van database structuren, we hebben het bij Big Data veel meer over foto’s, berichten en conversaties, data van sensoren, video, etc.
  • Veracity – Hierbij gaat het om de betrouwbaarheid van de data. Vanwege het ontbreken van structuur en het feit dat het om niet gecontroleerde of gevalideerde data gaat is de betrouwbaarheid laag.
  • Value – Dit zegt eigenlijk alles. Het gaat om de waarde van alle data. Wat kun je er mee? En wat wil je er mee? Je moet wel de juiste verbanden tussen de gegevens leggen om er iets waardevols en zinvols van te maken. Tot zover de definitie volgens de Big Data wereld. Bij Big Data gaat het in een notendop dus vooral om veel, ongestructureerde, onbetrouwbare data die niet op één plek is vastgelegd. Dat is een mooie definitie, maar wat kun je eigenlijk met al die data?

Wat kunnen we er mee?
Big data kan veel waarde leveren aan bedrijven. Een voorbeeld hiervan is te vinden bij de Rabobank. Zij heeft het afgelopen jaar flink geëxperimenteerd met Big Data technologie. In een proof of concept omgeving is aan de hand van een twintigtal cases de relevantie van deze technologie voor de Rabobank onderzocht. Cases variërend van het analyseren van miljarden betaaltransacties om inzicht te krijgen in financiële netwerken van klanten en financiële ketens van bedrijven tot het analyseren van externe invloeden bij plofkraken. Hiermee is de Rabobank nu in staat keuzes te maken gebaseerd op een veel gedetailleerder feitelijke weergave, met dus een lager risico op de aan de keuze gebonden investeringen. Ook bij Albert Heijn wordt er al veel gebruik gemaakt van Big Data. Het resultaat daarvan vertaald zich nu voor de klanten in zes aanbiedingen die ze elke vier weken krijgen die persoonlijk en op maat gemaakt zijn. Het gaat om kortingen bovenop de reguliere aanbiedingen. Deze extraatjes zijn geselecteerd op basis van iemands koopgedrag van de afgelopen twee jaar.

Hoe weet ik of mijn bedrijf er iets mee kan?
Dat is altijd sterk afhankelijk van de reeds beschikbare data binnen het bedrijf en daarnaast vooral de mogelijkheid om daarbij externe data binnen te halen. Denk dan aan gegevens zoals kadastrale informatie, social media, gemeente informatiesystemen of andere bronnen. Dit begint bij een goed data model. Denk aan een huis, zonder fundament (in de praktijk zie je dit terug in veel Microsoft Excel gebaseerde rapportages, odbc imports, etc.) kan er moeilijk bijgebouwd of aangepast worden. Wij komen graag eens vrijblijvend van gedachten wisselen over wat daarbij komt kijken, en hoe dat goed vertaald kan worden in een kosten efficiënte aanpak.

Delen: