Het Internet of Things bestaat uit alle verbonden (of slimme) apparaten met internettoegang die middels sensoren gegevens verzamelen, verzenden en ernaar handelen. Het IoT groeit exponentieel: er zijn steeds meer apparaten die data verzamelen, opslaan en uitwisselen. Daarnaast produceren consumenten, organisaties, overheden en bedrijven zelf steeds meer data, bijvoorbeeld op social media. Dat betekent dat de hoeveelheid data ook exponentieel groeit. We noemen deze datasets, die te groot zijn om met reguliere databasemanagementsystemen onderhouden te worden, ook wel Big Data.
Als we spreken over Big Data drukken we de omvang van de verzamelde data uit. Anders gezegd: Big Data gaat om grote hoeveelheden data. Steeds geavanceerder hard- en software maakt het mogelijk om steeds meer data te verzamelen, te bewerken en te bewaren. Kenmerkend is dat het bij Big Data gaat om ongestructureerde, gevarieerde data uit verschillende soorten bronnen die realtime verwerkt worden. Een echte definitie omvat ook de statistiek die het mogelijk maakt om in een verzameling losse data betekenis te vinden. Big Data verwijst daarom ook naar onze mogelijkheden om de steeds toenemende hoeveelheid data te analyseren en gebruiken. Het gaat in de kern om het realiseren van toegevoegde waarde, afkomstig van de bewerking en analyse van data.
Big Data bevat een schat aan informatie voor verschillende doeleinden, zoals marketing, wetenschappelijk onderzoek of preventief onderhoud. Om de toenemende hoeveelheid data werkelijk te benutten, is een goede en slimme analyse van de data nodig. Big Data-analyse is het proces van het onderzoeken van Big Data – om verborgen patronen, onbekende correlaties, markttendenzen, klantvoorkeuren en andere nuttige informatie te ontdekken om beter geïnformeerde beslissingen te nemen. Het voordeel van data-analyse is dat beslissingen gebaseerd kunnen worden op kennis gewonnen uit feiten en zo minder afhankelijk worden van subjectieve intuïtie en ervaringen. Met deze kennis kunnen onder meer kosten verlaagd worden, processen gestroomlijnd worden en de kwaliteit van producten en diensten verhoogd worden. Door data slim te combineren en te interpreteren/vertalen ontstaan nieuwe inzichten die kunnen worden ingezet voor nieuwe diensten, toepassingen en markten. Deze informatie kan ook nog gecombineerd worden met data afkomstig uit diverse externe bronnen, zoals gegevens over het weer of demografie.
Tekst gaat verder onder de afbeelding.
Dankzij Big Data krijgen gegevenswetenschappers ongehinderd toegang tot enorme gegevenssets. In plaats van te vertrouwen op representatieve gegevensvoorbeelden, kunnen gegevenswetenschappers nu vertrouwen op de gegevens zelf. Dit is de reden waarom veel organisaties zijn overgestapt van een op hypothesen gebaseerde benadering naar een ‘data first’-benadering. We kunnen data de richting laten bepalen en het verhaal vertellen. Big Data maakt een omgeving mogelijk die het ontdekken van gegevens door middel van iteratie stimuleert. Als gevolg hiervan kunnen we sneller leren.
Dit artikel is onderdeel van een serie.
Lees meer:
Deel 2 – Big Data verwerken middels Cloud computing
Deel 3 – Big Data-analyse met Artificial Intelligence (AI)
Bronnen – Big Data