In dit artikel vertellen we je alles dat je moet weten over big data. We geven je onder meer een definitie van de term, vertellen je wat je met big data kunt en geven je een aantal concrete voorbeelden.
Zoals de naam al doet vermoeden, drukken we met de term big data de omvang van data uit. We noemen datasets, die te groot zijn om met reguliere systemen onderhouden te worden, ook wel big data. Als we over big data spreken, hebben we het dus over een grote hoeveelheid data. Met andere woorden: we drukken er de omvang van een dataset mee uit. Soms wordt beargumenteerd dat het specifiek om gevarieerde data uit verschillende soorten bronnen gaat, maar meestal wordt de term gebruikt voor allerlei grote dataverzamelingen.
We zien een explosieve groei in het volume en de verscheidenheid van data. De data kan afkomstig zijn uit allerlei bronnen, zoals het Internet of Things (IoT) en social media. We zijn steeds beter in staat om grote datasets te verzamelen en te bewaren. Gegevens verzamelen is op zichzelf echter niet zo nuttig. Je verzamelt data om er vervolgens ‘iets’ mee te kunnen doen. De toegevoegde waarde zit in de mogelijkheden om deze gegevens te gebruiken. Het gaat bij data dus vooral om het realiseren van toegevoegde waarde, gecreëerd door de analyse van data.
Om de toenemende hoeveelheid data te benutten, is analyse nodig. Data-analyse is het onderzoeken van gegevens om verborgen patronen, onbekende correlaties en andere nuttige informatie te vinden. Het doel is om beter geïnformeerde beslissingen te nemen. Deze beslissingen zijn doordat ze gebaseerd zijn op data minder afhankelijk van subjectieve zaken als intuïtie. Steeds meer bedrijven nemen beslissingen op basis van data, of vertalen de gegevens in ieder geval naar bruikbare zakelijke inzichten. Het gaat dan bijvoorbeeld om streamingdiensten die data over kijkgedrag inzetten om klanten te behouden. Of denk aan risico-inschattingen van verzekeringsmaatschappijen, die daarvoor onder meer data over de regio inzetten.
Maar hoe moet je die grote hoeveelheden gegevens analyseren? Het is simpelweg te tijdrovend of zelfs onmogelijk om datasets handmatig te analyseren. Dit wordt ook wel het big data-probleem genoemd. De analyses vragen daarom om nieuwe verwerkingsvormen, zoals met Artificial Intelligence (AI), of specifieker: machine learning. Met machine learning kunnen systemen zichzelf (door middel van ervaring) verbeteren bij het uitvoeren van taken. We noemen dat trainen. Hoe meer je het algoritme laat trainen, hoe beter de uitkomsten zullen zijn.
Om van toegevoegde waarde te zijn, kan data dus niet zonder analyse. Het omgekeerde is echter ook waar: big data is onmisbaar bij het trainen van machine learning-algoritmes. Om de algoritmes te trainen is data nodig. Heel veel data. Hoe meer je het algoritme laat trainen, hoe beter de voorspellingen zullen zijn. En juist dat maakt de combinatie met big data zo interessant.
Machine learning kan ingezet worden voor verwerking van gegevens naderhand, zoals het zoeken naar patronen in gegevens. Er zit echter ook toegevoegde waarde het in real-time analyseren van data. Hoe sneller je gegevens analyseert, hoe sneller je de resultaten hebt en hoe groter de voorspellende waarde van data.
We drukken de voordelen van big data-analyse graag uit via drie concrete voorbeelden.
Laten we eens wat dieper inzoomen op dat eerste hierboven besproken voordeel: voorspellend onderhoud, ook wel predictive maintenance genoemd. Door data (afkomstig van machines, omgevingen, etc.) te analyseren, kunnen we trends herkennen, zoals een oplopende temperatuur. Aan de hand van die trends kunnen er voorspellingen gedaan worden, bijvoorbeeld over onderhoud. Dat is voorspellend onderhoud: wanneer we problemen beter kunnen voorspellen, dan kunnen we onderhoud plegen op het juiste moment, bijvoorbeeld vlak voordat een onderdeel versleten is.
Het grote voorbeeld van het gebruik van data is de slimme stad, oftewel een smart city. In een smart city wil je zoveel mogelijk data verzamelen. Deze gegevens kunnen uit vele bronnen komen, waaronder instanties, burgers en het Internet of Things (IoT). In een smart city wordt deze voortdurend aanzwellende stroom gegevens die de stad continu genereert intelligent benut. Slimme steden vertrouwen op deze gegevens om goed te functioneren. Met deze juiste gegevens kun je geluidsoverlast, criminaliteit, vervuiling en verkeersopstoppingen verminderen.
We nemen het verkeer als voorbeeld. Om verkeer in goede banen te leiden, is het belangrijk om te weten hoeveel mensen zich waar en wanneer bevinden. De verzamelde gegevens over verkeersstromen kunnen vervolgens ingezet worden voor apps die automobilisten helpen een parkeerplek te vinden, voor slimme verkeerslichten die de doorstroom verbeteren en voor het aanraden van de beste routes. We kunnen door data te verzamelen en te analyseren de hoeveelheid verkeersongevallen verminderen, evenals vervuiling en de tijd die mensen (onnodig) in het verkeer doorbrengen.
Wil je meer weten over wat 3Bplus kan betekenen op het gebied van grote datasets en machine learning? We hebben ons in de afgelopen jaren gespecialiseerd in de nieuwste innovaties, onder meer in de zorg en op het gebied van smart homes. Wij laten je graag de mogelijkheden en de voordelen zien. Neem gerust contact met ons op voor meer informatie.