AI-onderzoek: machinaal leren, diep leren en bekrachtigingsleren

//AI-onderzoek: machinaal leren, diep leren en bekrachtigingsleren

AI-onderzoek: machinaal leren, diep leren en bekrachtigingsleren

De huidige staat van AI-onderzoek – deel 1

In deze serie artikelen wordt gekeken naar AI (Artificial Intelligence; of Kunstmatige Intelligentie, KI). In het vorige artikel gingen we in op de huidige staat van AI. In dit artikel wordt specifiekere aandacht aan de eerste drie (deel)gebieden waarop de ontwikkeling van AI-onderzoek zich op dit moment voornamelijk richt. Namelijk: machinaal leren, diep leren en bekrachtigingsleren.

AI-onderzoek: machinaal leren

Machinaal leren (of automatisch leren) houdt zich bezig met de ontwikkeling van algoritmes en technieken. Hiermee kunnen computers leren zonder dat dit expliciet geprogrammeerd is. Deze algoritmen nemen afscheid van het volgen van strikte, statische programma-instructies. Zij maken data-gedreven voorspellingen en nemen beslissingen door een model te bouwen van voorbeeldinput. Leren zonder toezicht vereist het vermogen om patronen en relaties te herkennen in grote hoeveelheden gegevens, oftewel data mining. Machinaal leren wordt gebruikt in een scala van taken waarbij het ontwerpen en programmeren van expliciete algoritmes onhaalbaar is. Zoals bij spamfilters, optische karakterherkenning, zoekmachines en computervisie. De wiskundige analyse van de algoritmen van machinaal leren wordt vaak aangeduid als computationele leertheorie.

Grootschalig machinaal leren betreft het ontwerpen van leeralgoritmen, alsmede het opschalen bestaande algoritmen, om te kunnen werken met extreem grote datasets. Veel van de fundamentele problemen in machinaal leren (zoals bewaakt en onbewaakt leren) worden goed begrepen. Een belangrijk aandachtspunt van huidige inspanningen is om de bestaande algoritmen op te schalen om te werken met zeer grote datasets. Bijvoorbeeld: terwijl traditionele methoden zich het kunnen veroorloven om een aantal passages over de dataset te maken, worden moderne methoden ontworpen om slechts een passage te maken.

AI-onderzoek: diep leren

Diep leren is een tak van machinaal leren op basis van een set algoritmen die proberen om op hoog niveau abstracties te modelleren in data. In een eenvoudig geval zijn er twee sets neuronen. Een set die inputsignalen ontvangt en een die een uitgangssignaal verstuurt. Wanneer de inputlaag input ontvangt, verstuurt deze een gemodificeerde versie van de input naar de volgende laag. In een diep netwerk zijn er vele lagen tussen de input en output. Hierdoor gebruikt het algoritme meerdere verwerkingseenhedenlagen.

Diep leren is onderdeel van een bredere familie van methoden van machinaal leren gebaseerd op het leren van representaties van data. Een observatie (bijvoorbeeld een beeld) kan op vele manieren worden weergegeven. Zoals een vector met intensiteitswaarden per pixel, of als een set randen, gebieden met een specifieke vorm, etc. Sommige representaties zijn beter dan anderen in het vereenvoudigen van de leertaak (bijvoorbeeld gezichtsherkenning of gezichtsuitdrukkingsherkenning. Een belofte van diep leren betreft efficiënte algoritmen voor het leren zonder toezicht en hiërarchische feature-extractie.

Onderzoek op dit gebied probeert betere representaties te maken en modellen te creëren die deze representaties van grootschalige niet-gelabelde data leren. Verschillende diep leerarchitecturen zijn toegepast op gebieden als computervisie (objectherkenning, video-labelen, activiteitherkenning), automatische spraakherkenning, natuurlijke taalverwerking en audioherkenning.

AI-onderzoek: bekrachtigingsleren

Bekrachtigingsleren is een gebied van machinaal leren geïnspireerd door behavioristische psychologie. De tak van machinaal leren houdt bezig met hoe softwarematige agenten actie zouden moeten ondernemen in een omgeving om (cumulatieve) beloning te maximaliseren. Bekrachtigingsleren verschilt van het standaard onder toezicht leren in dat de juiste input-outputparen nooit worden gepresenteerd, noch suboptimale acties expliciet worden gecorrigeerd. Bekrachtigingsleren is een raamwerk dat de focus van machinaal leren verschuift van patroonherkenning naar door ervaring gedreven sequentiële besluitvorming. Het belooft AI-toepassingen verder te helpen in de richting van het ondernemen van acties in de echte wereld.

Traditioneel machinaal leren heeft zich vooral gericht op patroon mining. Bekrachtigingsleren verschuift de focus naar besluitvorming. Het is een technologie die AI zal helpen in het leren over de wereld en het uitvoeren van acties erin. Vooral de opkomst van diep leren heeft bekrachtigingsleren vooruitgeholpen. Het verslaan van de menselijke Go-kampioen was grotendeels te danken aan bekrachtigingsleren. Deze AI werd opgeleid door een geautomatiseerde agent te initialiseren met een menselijke expertdatabase. Maar deze werd vervolgens verfijnd door het spelen van een groot aantal wedstrijden tegen zichzelf en het toepassen van bekrachtigingsleren.

Dit artikel is onderdeel van een serie.

Lees meer:

Deel 1 – Wat is Artificial Intelligence (AI): een introductie

Deel 2 – De huidige staat van AI

Deel 4 – Onderzoek AI: computervisie, natuurlijke taalverwerking, robotica en collaboratieve systemen

Deel 5 – AI research: crowdsourcing, algoritmische speltheorie, IoT en neuromorfische computing

By | 2018-06-20T14:05:35+00:00 February 5th, 2017|Artificial Intelligence|