In deze serie artikelen bespreken we machine learning. Eerdere artikelen stonden in het teken van het geven van een definitie van machine learning. Ook bespraken we methoden en toepassingen van machine learning. In dit laatste artikel in deze serie gaan we in op het laatste puzzelstukje: hoe werkt machine learning precies?
Normaal gesproken voert een computer een taak uit door stap voor stap alle instructies van de software te volgen. Maar voor complexe en grote hoeveelheden data is het onmogelijk om in elke situatie de correcte handeling te definiëren. Denk bijvoorbeeld aan autonome auto’s waarbij dit zou betekenen dat elke verkeerssituatie herkend moet worden en de correcte handeling vooraf vastgelegd moet zijn. Machine learning biedt een manier om grote hoeveelheden data te onderzoeken naar patronen en een code te genereren waarmee je die patronen kunt herkennen in nieuwe gegevens.
Tekst gaat verder onder de afbeelding.
Machine learning is ontwikkeld op basis van het vermogen om computers te gebruiken om data op patronen te onderzoeken, zelfs als we geen theorie hebben van hoe die patronen eruit ziet. Bij machine learning worden de algoritmes dan ook getraind in plaats van geschreven. Tijdens het trainen krijgt een algoritme data (de input) aangeboden en zoekt het zelfstandig naar een manier om tot een correct antwoord (de output) te komen. Machine learning past statistische technieken toe in de zoektocht naar het beste patroon. Denk hierbij aan (lineaire) regressie, samen met meer complexe benaderingen. Het genereert vervolgens een code die dat patroon kan herkennen. Deze gegenereerde code wordt aangeduid als een model. Een model is dus code; het is de implementatie van een algoritme voor het herkennen van een patroon, bijvoorbeeld om te bepalen of een creditcard transactie frauduleus is.
We leggen middels een voorbeeld uit hoe het model tot stand komt. Je kunt huizenprijzen beschouwen als een stoofpot met als ingrediënten het aantal slaapkamers, de oppervlakte en de omgeving. Als je zou kunnen achterhalen hoeveel elk ingrediënt de uiteindelijke prijs beïnvloedt, is er misschien een exacte verhouding van ingrediënten om de uiteindelijke prijs te maken. In machine learning zijn dat de gewichten. Als we de perfecte gewichten zouden kunnen berekenen die voor elk huis werken, zou ons model huisprijzen kunnen voorspellen. We schatten de vergelijking voor een lijn die past bij alle huisgegevens.
Een soort algoritme is bijvoorbeeld een classificatie-algoritme, waarmee gegevens in verschillende groepen ingedeeld worden. Hetzelfde classificatie-algoritme dat gebruikt wordt om handgeschreven getallen te herkennen, kan ook gebruikt worden om e-mails als spam te classificeren, zonder iets te wijzigen. Het is hetzelfde algoritme, maar het wordt gevoed met verschillende trainingsgegevens, zodat het met een verschillende model komt.
Het model kan het gevonden patroon vervolgens doortrekken om voorspellingen te doen. In de praktijk zal er vaak nieuwe data bijkomen waardoor het model zijn voorspelling kan aanpassen. Stel je geeft een computer een trainingsset met foto’s, waarvan sommige gelabeld zijn met kat en andere niet. Na de training kun je de computer een reeks nieuwe foto’s laten zien en begint het te identificeren welke foto’s katten bevatten. Machine learning gaat dan verder met het toevoegen aan de trainingset: elke foto die het identificeert, wordt toegevoegd aan de trainingsset. Zodoende wordt het programma effectiever en beter in zijn taak; het is aan het leren.
Dit artikel is onderdeel van een serie.
Lees meer:
Deel 1 – Machine learning, neurale netwerken en deep learning uitgelegd
Deel 2 – Wat is machine learning: een introductie
Deel 3 – Toepassingen van machine learning in zorg, retail en meer
Deel 4 – Methoden van machine learning – supervised en unsupervised learning
Infographic – Machine learning is leren door ervaring
Bronnen – Bronnen 3Bplus artikelen deep learning