Wat is Big Data?

Wat is Big Data?

Je hoort tegenwoordig steeds meer over big data. Dit is niet verwonderlijk, omdat er door alle apparaten die we gebruiken steeds meer informatie verzameld wordt.

Ook in het dagelijks leven zien we overal om ons heen dat bedrijven en overheden data over ons verzamelen.

Denk maar eens aan de slimme meter of aan al die klantenpassen van winkels.

Maar wat maakt dit data verzamelen op grote schaal nu zo bijzonder? En wat zijn de (potentiële) mogelijkheden?

Wat is de definitie van Big Data?

De definitie van Big Data: Big Data is een term die wordt gebruik om te verwijzen naar datasets die te groot of te complex zijn om te verwerken met traditionele software. Big Data kan je associëren met 3 kernbegrippen: volume, variatie en snelheid.

Wat zijn de eigenschappen van Big Data?

Sommigen spreken van datasets die te groot zijn om met normale databasemanagementsystemen te analyseren.

In ieder geval zijn er wel bepaalde eigenschappen waarin deze enorme datasets verschillen van normale datareeksen.

Vijf zaken over zo’n dataset zijn van belang om in te schatten hoe bruikbaar de data eigenlijk is.

1. Het volume van de data

Tegenwoordig wordt er meer informatie over uiteenlopende zaken verzameld dan ooit tevoren.

Iedere klant in een webshop wordt vaak gevraagd om allerlei informatie over zichzelf prijs te geven. Hierdoor krijgt het bedrijf achter de webshop enorm veel data in handen.

banner blog USP

2. Variatie van de data

Er kan wel veel data binnenkomen, de vraag is hoe eenvormig en gestructureerd deze is.

Door nieuwe technologie is het mogelijk om ook redelijk ongestructureerde informatie zoals afbeeldingen of e-mails toch te analyseren.

Hierdoor is er meer bruikbare data beschikbaar en dus kunnen er betere analyses gemaakt worden.

3. Snelheid

Als je op basis van een data-analyse wilt ingrijpen, is het noodzakelijk dat een analyse niet al te lang duurt. Wanneer je er bijvoorbeeld via een analyse achter komt dat er fraude gepleegd wordt, is het noodzakelijk om deze informatie zo snel mogelijk te vergaren, zodat je tijdig kunt ingrijpen.

4. De kwaliteit van de data

Je kunt wel veel data verzamelen, maar dat wil niet zeggen dat deze data ook overeenkomt met de werkelijkheid.

De data is bij deze grote datasets namelijk afkomstig uit allerlei bronnen met een verschillende betrouwbaarheid. Door verbeterde analysetechnologieën kan ook uit kwalitatief lage datasets toch betrouwbare resultaten worden verkregen.

5. De waarde/opbrengst van de data

Uiteindelijk gaat het er natuurlijk om of deze grote datasets ook echt waarde kunnen toevoegen. Door de analyse van datasets kan je voorspellingen doen.

Aan de kwaliteit en de toepasbaarheid van deze voorspellingen kan je uiteindelijk afleiden hoe waardevol een dataset is.

Bronnen

Om data-analyses uit te voeren zijn natuurlijk enorme datasets nodig. De opkomst van big data is niet alleen te danken aan de verbeterde rekenkracht van computers maar ook aan de grote hoeveelheid aan gegevens die tegenwoordig verzameld wordt.

Allerlei apparaten zijn tegenwoordig uitgerust met sensoren.

Grote techbedrijven zoals Google krijgen bijvoorbeeld via GPS-trackers in Androidtelefoons enorme datasets met de locaties van de telefoongebruikers.

Ook delen veel mensen tegenwoordig vrijwillig allerlei data van zichzelf op sociale media.

Maar ook via cookies kunnen bedrijven veel data verzamelen over het surfgedrag van potentiële klanten.

In de toekomst zullen deze datasets waarschijnlijk enorm gaan toenemen.

Als het ‘internet of things’ namelijk ingeburgerd raakt, zullen er allerlei nieuwe bronnen van data bijkomen. Allerlei alledaagse producten zoals straatlantaarns, brillen en koelkasten zullen dan met internet verbonden worden, waardoor de databerg nog extreem veel groter wordt.

Voorbeelden van Big Data

Met een grote databerg en een enorme rekenkracht kom je achter allerlei verbanden tussen zaken die je normaal nooit aan elkaar zou hebben gekoppeld.

Grote fastfoodketens kunnen bijvoorbeeld aan de hand van data van hun klanten voorspellen hoe hun lichamelijke toestand is en in welke fase van hun leven ze zitten.

Met deze enorme databerg lijkt het dus alsof je de toekomst kunt voorspellen, maar dat is niet helemaal waar. Als je een big data-analyse uitvoert, geeft deze bijvoorbeeld enkel de kans dat iets zal gaan gebeuren met een bepaalde persoon.

Op basis van veel data kun je bijvoorbeeld bepaalde typen van personen persoonlijke advertenties laten zien.

Hierdoor kunnen bedrijven veel gerichter adverteren en is het de bedoeling dat je alleen nog advertenties te zien krijgt die je echt interesseren.

Afbeelding via: socmedsean.com.

Sommige bedrijven kunnen met klantdata zelfs voorspellen of iemand zwanger is en sturen dan ook bijvoorbeeld folders over zwangerschapskleding naar die potentieel zwangere personen.

Ook in de medische wereld kan een grote hoeveelheid data in combinatie met kunstmatige intelligentie zorgen voor betere diagnoses.

Zo kan een computer op basis van heel veel hersenscans met de gestelde diagnose erbij uiteindelijk zelf een redelijk betrouwbare diagnose stellen op basis van een nieuwe hersenscan.

Ook de overheid gebruikt grote databestanden om bijvoorbeeld fraudeurs op te sporen. Dit kan door te kijken naar alle relevante informatie over bepaalde personen, door datasets van verschillende overheidsinstellingen te koppelen.

Als bepaalde combinaties van kenmerken ongewoon zijn, kan in die specifieke gevallen gekeken worden of er sprake is van fraude.

Hierdoor hoeven de fraudecontroleurs niet meer steekproefsgewijs te zoeken, maar kunnen ze een veel kleinere risicocategorie onderzoeken, waardoor de kans op succes veel groter is.

Schaduwkanten van Big Data

Het doen van voorspellingen op basis van grote hoeveelheid data is natuurlijk prima, maar het handelen op basis van deze voorspellingen kan wel bepaalde gevaren met zich meebrengen.

Je zou je bijvoorbeeld kunnen voorstellen dat uit een analyse komt, dat er een grote kans is dat een bepaalde persoon een aanslag zal gaan plegen.

Is het dan verantwoord om deze persoon op te pakken terwijl het misschien gewoon een brave burger is, die toevallig te veel overeenkomsten heeft met potentiële terroristen?

Ook met verzekeringen kan je je afvragen in hoeverre verzekeraars bepaalde inzichten mogen doorvertalen in premies.

Als bijvoorbeeld automobilisten die in een bepaald model auto rijden vaker ongelukken veroorzaken, mag je deze automobilisten dan allemaal een hogere premie laten betalen?

Dit zijn allemaal ethische vraagstukken waar we als samenleving met elkaar over moeten nadenken.

Cursus Big Data

Big data vindt nu al zijn toepassing in allerlei zaken en in de toekomst zal het analyseren van veel data steeds meer ingeburgerd raken.

Het is dan ook voor iedereen uitermate waardevol om op zijn minst de basis van Big Data te kennen, zeker als je werkzaam bent in de IT-branche.

Bij icttrainingen.nl kan je doormiddel van een cursus je kennis over dit onderwerp vergroten. En dat met het oog op de toekomst zeker nodig!

Bekijk al onze Big Data cursussen

Noot: Afbeelding in de header: Technologie vectoren designed by Freepik