In dit artikel kijken we naar twee bekende problemen bij de inzet van machine learning. Het gaat specifiek om het zorgen voor kwalitatief goede data en het durven vertrouwen op de inzichten die machine learning kan leveren. Voordat we ingaan op deze problemen doen we eerst echter een stapje terug door kort uit te leggen wat machine learning ook alweer is.
Machine learning is een onderzoeksveld binnen Artificial Intelligence (AI), dat zich bezighoudt met de ontwikkeling van technieken waarmee computers kunnen leren. Machine learning doet dat met algoritmen die iteratief leren van data. Dat betekent dat de prestatie van een machine bij het uitvoeren van een taak beter wordt door meer ervaring op te doen in het uitvoeren van die taak. Met andere woorden: machine learning bestaat uit algoritmes die leren dankzij data. Belangrijk om te begrijpen dat het ‘lerend’ effect in principe tweeledig is: het leren van data (bekende observaties) en het leren van nieuwe gebeurtenissen (nieuwe observaties).
Het doel van machine learning is beslissingen en voorspellingen te automatiseren op basis van zelflerende algoritmen (dus zonder menselijke interventie). Wat machine learning juist nu zo interessant maakt, is dat er een explosie van data heeft plaatsgevonden. Het Internet of Things (IoT), social media, zoekmachines en foto’s; allemaal databronnen om machine learning-algoritmen mee te voeden. De hoeveelheid gegevens is zo groot dat het tientallen jaren kan duren voordat mensen deze geanalyseerd hebben. Met machine learning kunnen we veel sneller waarde uit data halen. En bijkomend voordeel: hoe meer data we voeren, hoe beter de algoritmen presteren. Dat is immers het zelflerend effect!
Tekst gaat verder onder de afbeelding.
Bovenstaande klinkt simpel. Je voert data in het machine learning-algoritme in en er komen handige voorspellingen uitrollen. In de praktijk is het toepassen van machine learning natuurlijk echter niet zo simpel. In een blog op Computable vonden we wat interessante inzichten over dit onderwerp.
Het toepassen van machine learning vraagt om te beginnen om data. Het verzamelen van data is tegenwoordig simpel genoeg. Neem enkel de data die verzameld wordt door het eerder genoemde Internet of Things (IoT). Het is de vervolgstap die lastig is: het intelligent en betrouwbaar analyseren van die data.
Om machine learning-algoritmes goed te trainen heb je veel data nodig. Net zo belangrijk is echter de kwaliteit en de geschiktheid van de data. Anders zijn de gemaakte voorspellingen niet betrouwbaar. Met andere woorden: kwalitatief goede data is van cruciaal belang om met machine learning tot betrouwbare inzichten te komen. Een van de belangrijkste beperkingen bij de kwaliteit van data is dat veel gegevens afkomstig zijn uit verschillende gescheiden systemen. Het samenbrengen van data kan mogelijk de betrouwbaarheid in gevaar brengen.
Een tweede probleem is het vertalen van de patronen en relaties die machine learning uit de enorme hoeveelheden gegevens opdiept naar bruikbare inzichten. Of nou ja, veel organisaties hebben nog onvoldoende vertrouwen in de inzichten die machine learning oplevert. En als je de inzichten niet vertrouwt, dan ga je ze logischerwijs ook niet gebruiken bij (belangrijke) beslissingen. Er is zodoende nog veel te winnen bij het uitbreiden van kennis over machine learning.
Meer lezen over dit onderwerp?
Misschien vind je deze artikelen ook interessant:
Machine learning, neurale netwerken en deep learning uitgelegd
Dit waren de belangrijkste AI-ontwikkelingen van 2019
Het ethische belang van uitlegbare Artificial Intelligence