Big data, big deal?

Naar overzicht

‘Data’, als in big-data, data-driven of data-beveiliging: hét toverwoord van de 21e eeuw. Kennis is macht, maar dat wisten we al veel langer: filosoof en grondlegger van de moderne wetenschap, (niet overdreven) Francis Bacon zei dit rond 1550 al. Hoe meer je weet, hoe meer spullen je kunt verkopen, hoe beter je de werking van medicijnen kunt voorspellen en hoe sneller de mens op mars kan gaan wonen. 

Binnen ‘de IT’ – voor zover dat al bestaat, maar lees daarover ook mijn vorige blog - gaan eigenlijk zoveel vraagstukken over het verzamelen, bewaren, beveiligen en interpreteren van gegevens dat ik zou zeggen dat de ‘information’ belangrijker is dan de ‘technology’. En toch hadden mensen dit ruim vijfhonderd jaar geleden al door – wat is er nu anders? Ik zal je kort een omschrijving geven in waar we in deze tijd van technologie voor staan.

Als je naar big data kijkt, denk aan vier V’s. De eerste twee: Volume (hoeveelheid) en Variety (verscheidenheid). Er wordt steeds meer opgeslagen, waar niet de hoeveelheid verandert, maar de schaal. En uit een facebookpost wordt niet alleen tekst gehaald, maar ook de foto, de link, de likes, het tijdstip, de locatie, enzovoort. Daarmee is ook de derde V, Velocity (snelheid), van belang: om nuttig te zijn moet data eigenlijk direct verwerkt worden. Als ik op internet een boek bestel, heeft Bol.com maar een paar seconden om mij te overtuigen nog iets te kopen – door op basis van likes, en welke boeken ik nog meer bekijk, met een goede suggestie te komen.

Dan is er nog Veracity (waarheidsgetrouwheid): zijn de gegevens de ik nu gebruik wel ‘waar’? Dit vind ik zelf een interessant aspect, want wat zegt het als data ‘onwaar’ is? Dit gaat meer over betrouwbaarheid en volledigheid: is de set volledig genoeg om iets te betekenen? Vallen ook de likes van facebook-bots in mijn onderzoek? Zo’n like is niet ‘onwaar’, maar betekent niet dat mensen de post leuk vinden – maar dat mensen betalen om andere mensen dat te laten denken. Dat op zich is interessante informatie, maar dan komen we weer bij de andere V’s: Hoe gaan we die informatie in een nieuwe categorie indelen en verwerken? Om in het voorbeeld van Bol.com te blijven; gaan we DVD’s toevoegen naast boeken? Als Bol.com mij vier suggesties van boeken kan laten zien, wordt één daarvan vanaf nu een DVD? En als dat boek een kookboek is – is het dan ook slim om mij reclames voor borden en bestek te laten zien?   

Interessant om met deze vraagstukken bezig te zijn? Mail me voor een afspraak! 

Onze opdrachtgevers