Machine learning: zelfrijdende rolstoel leert navigeren

We vonden afgelopen week een mooi voorbeeld van een toepassing van reinforcement learning. Via Computable lezen we dat een team wetenschappers van de Vrije Universiteit Brussel (VUB) een nieuw Artificial Intelligence-algoritme heeft uitgewerkt voor een zelfrijdende rolstoel. Het algoritme leert op basis van trial-and-error, oftewel middels reinforcement learning. We leggen je graag uit hoe dat precies werkt.

Wat zijn Artificial Intelligence en machine learning?

Voordat we dieper ingaan op reinforcement learning, doen we een klein stapje terug. Om een goede uitleg te geven, is het belangrijk eerst te kijken naar Artificial Intelligence (AI).

AI is intelligentie tentoongesteld door machines. De vraag is waar die intelligentie vandaan komt. Aangezien het (vrijwel) onmogelijk is om formele regels met voldoende complexiteit op te stellen die onze wereld accuraat beschrijven, is het zaak machines zelf kennis te laten vergaren, oftewel: patronen uit data te halen. Deze vaardigheid staat bekend als machine learning.

Machine learning verwijst naar systemen waar de prestatie van een machine bij het uitvoeren van een taak beter wordt door meer ervaring op te doen in het uitvoeren van die taak. Machine learning bestaat uit algoritmes die leren dankzij data.

De tekst gaat verder onder de afbeelding.

e-health zorg gezondheid gezondheidszorg

Wat is reinforcement learning?

De meest gebruikte methoden van machine learning zijn supervised learning, unsupervised learning, semi-supervised learning en reinforcement learning. Hoewel al deze methoden hetzelfde doel hebben – het komen tot inzichten, patronen en relaties die kunnen worden gebruikt om beslissingen te nemen – gebruiken ze verschillende benaderingen.

Reinforcement learning kent drie hoofdcomponenten: de agent (in dit geval de rolstoel), de omgeving (alles waar de rolstoel mee interacteert) en acties (wat de rolstoel kan doen). De agent navigeert in een omgeving waarin het een bepaalde taak moet uitvoeren, zoals het vermijden van obstakels. Als de agent zijn doel behaald, wordt hij beloond. Doet hij iets fout dan volgt straf. Het doel is om de agent acties te laten kiezen die de verwachte beloning maximaliseren. Met andere woorden: met reinforcement learning ontdekt het algoritme door trial-and-error welke acties de grootste beloningen opleveren – en dus met welke acties het doel behaald wordt.

Nieuw succes met reinforcement learning

Kort gezegd, experimenteert de computer bij reinforcement learning in de omgeving waarbinnen hij actief moet zijn. Bij gedrag waarmee het doel behaald wordt, volgt een beloning. Het probleem is echter dat klassiek reinforcement learning veel interacties vraagt, waardoor het leerproces dus lang duurt. Met dit nieuwe algoritme van de VUB kan de leertijd echter verkort worden tot één tot twee uur.

De zelfrijdende rolstoel is zodoende veel meer dan slechts een toffe proef! Het algoritme kan echt ingezet worden in het dagelijks leven om zelfrijdende rolstoelen comfortabeler en veiliger te maken. Kijk maar naar onderstaand filmpje.

Benieuwd naar dit project? Lees er meer over op de website van de VUB.

Meer lezen over dit onderwerp?

Misschien vind je deze artikel ook interessant:

Machine learning, neurale netwerken en deep learning uitgelegd
De keten van slimme oplossingen: sensoren, IoT, Big Data en AI
Wat zijn predictive en prescriptive analytics en wat is het verschil?
Waarom we moeten investeren in AI (voor de zorg)

Volgsystemen

Energie

Domotica

Slimme camera's

TV/Internet

Hotels en recreatie

Gezondheidszorg

Logistiek

Overheid

Agrarische sector

Bedrijven

Industrie

Machine learning: zelfrijdende rolstoel leert navigeren

Wat zijn Artificial Intelligence en machine learning?

Wat is reinforcement learning?

Nieuw succes met reinforcement learning

Related articles

Popular articles