In deze serie artikelen bespreken we machine learning. Vervolgens werken we via neurale netwerken naar deep learning toe. Om deep learning goed te doorgronden, is volgens ons namelijk kennis nodig van neurale netwerken en machine learning. We blijven eerst nog even bij machine learning. In eerdere artikelen gaven we een definitie van machine learning en bespraken we machine learning-toepassingen. Aansluitend gaan we nu in op methoden van machine learning: supervised learning, unsupervised learning, semi-supervised learning en reinforcement learning.
De meest gebruikte methoden van machine learning zijn supervised learning, unsupervised learning, semi-supervised learning en reinforcement learning. Hoewel al deze methoden hetzelfde doel hebben – het komen tot inzichten, patronen en relaties die kunnen worden gebruikt om beslissingen te nemen – gebruiken ze verschillende benaderingen.
Bij machine learning wordt een machine getraind om verbanden te zien. Dit gebeurt vaak middels supervised leren, oftewel gecontroleerd leren. Bij supervised learning in het kader van machine learning krijgt de computer voorbeeldinput, waarbij de gewenste output eveneens gepresenteerd wordt. Het doel is een algemene regel te leren die de gegeven input vertaalt naar deze gewenste output. Het systeem leert hiermee verbanden te zien tussen de input en de output. Als het machine learning-proces goed wordt doorlopen, maakt het systeem steeds minder fouten en kan deze uiteindelijk op basis van nieuwe input de juiste output produceren.
Supervised learning-algoritmen worden getraind met behulp van gelabelde voorbeelden: input waarvan de gewenste output bekend is. Het algoritme leert door te vergelijken met de juiste output, zodat het model waar nodig aangepast wordt. Dit model wordt vervolgens ingezet om de output (de waarde van het label) te voorspellen voor niet-gelabelde input. Oftewel: supervised algoritmen kunnen hetgeen in het verleden is geleerd toepassen op nieuwe gegevens. Supervised leren wordt dan ook veelal gebruikt bij toepassingen waar historische gegevens toekomstige gebeurtenissen kunnen voorspellen, zoals bij frauduleuze creditcardtransacties.
Tekst gaat verder onder de afbeelding.
Bij de toepassing van unsupervised learning bij machine learning worden er geen labels gegeven aan de input van het het leeralgoritme. Het gaat hier dus om ongecontroleerd leren, waarbij geen sturing wordt geboden door voorbeelden in te voeren met een gewenste output. Bij unsupervised learning zal het algoritme op den duur zelf een structuur ontdekken in de input. Het leeralgoritme is door het ontbreken van labels op zichzelf aangewezen om structuur te vinden in de input en met de juiste output komen. Anders gezegd: het algoritme moet er zonder labels (de juiste output) achter komen wat er wordt getoond. Tijdens dit proces zal de computer zelf de input verdelen in categorieën. Hierin worden dan elementen geplaatst met gegevens die sterk op elkaar lijken.
Unsupervised leren wordt zodoende gebruikt bij gegevens die geen historische labels hebben, zoals bij transactiegegevens. Het kan met deze gegevens bijvoorbeeld klantsegmenten identificeren met vergelijkbare eigenschappen, hetgeen nuttig is voor marketingcampagnes. Deze algoritmen worden ook gebruikt om items aan te bevelen.
Semi-supervised learning in machine learning wordt in principe voor dezelfde toepassingen als supervised learning gebruikt. Semi-supervised learning maakt echter gebruik van zowel gelabelde als niet-gelabelde data voor training – meestal een kleine hoeveelheid gelabelde data met een groot aantal niet-gelabelde data. Er wordt hiervoor gekozen omdat niet-gelabelde data minder duur is en minder moeilijk is om te verwerven. Semi-supervised learning is zodoende nuttig als de kosten verbonden aan het labelen etikettering te hoog zijn om een volledig gelabeld trainingsproces mogelijk te maken.
Reinforcement learning in machine learning kent drie hoofdcomponenten: de agent (de leerder of de beslisser), de omgeving (alles waar de agent mee interacteert) en acties (wat de agent kan doen). De agent navigeert in een dynamische omgeving waarin het een bepaald doel moet uitvoeren, zoals het spelen van een spel. Het doel is om de agent acties te laten kiezen die de verwachte beloning over een bepaalde tijd maximaliseren. De agent bereikt het doel veel sneller door een goed beleid te volgen. Oftewel: het doel bij reinforcement learning is om het beste beleid te leren. De agent wordt zodoende feedback gegeven (beloningen en straffen), terwijl het binnen zijn probleemruimte navigeert. Met reinforcement learning ontdekt het algoritme door trial and error welke acties de grootste beloningen opleveren. Reinforcement leren wordt vaak gebruikt voor robotica, gaming en navigatie.
Dit artikel is onderdeel van een serie.
Lees meer:
Deel 1 – Machine learning, neurale netwerken en deep learning uitgelegd
Deel 2 – Wat is machine learning: een introductie
Deel 3 – Toepassingen van machine learning in zorg, retail en meer
Deel 5 – Hoe werkt machine learning – machine learning uitgelegd
Infographic – Machine learning is leren door ervaring
Bronnen – Bronnen 3Bplus artikelen deep learning