Belangrijke uitdagingen in het tijdperk van Big Data
We zitten momenteel midden in een Artificial Intelligence-renaissance, aangedreven door big data en doorbraken in machine learning en deep learning. Deze doorbraken bieden kansen en uitdagingen voor bedrijven, afhankelijk van de snelheid waarmee ze zich aanpassen aan deze veranderingen. In dit artikel zet Makeen een aantal uitdagingen (en de bijbehorende oplossingen!) op een rijtje.
Vijf uitdagingen voor AI-implementatie
Omgaan met een veelheid aan systemen voor bronnen: De gemiddelde Fortune 500-onderneming gebruikt soms wel een paar honderd IT-systemen. Het probleem is dat al deze systemen verschillende gegevensformaten opleveren.
Integratie en contextualisering van gegevens: Dankzij vooruitgangen als 5G vindt de instroom van gegevens veelal in real-time plaats. Dat levert nieuwe uitdagingen op.
Grote hoeveelheden data opslaan: Het opslaan van grote hoeveelheden (uiteenlopende) gegevens op één locatie, maakt de verwerking van de gegevens niet minder complex dan wanneer je de datastromen apart opslaat.
Zorgen voor consistentie van gegevens: Een vierde big data-uitdaging heeft te maken met het op een uniforme manier behandelen van gegevens. Data wordt op verschillende snelheden aangeleverd, het format van de gegevens is vaak niet hetzelfde, en data komt niet netjes op volgorde binnen, bijvoorbeeld als gevolg van netwerkvertragingen.
Nieuwe instrumenten en vaardigheden: IT-afdelingen moeten werknemers (met verschillende vaardigheden) de tools bieden om te kunnen werken met grote gegevenssets, bijvoorbeeld om zelf voorspellende analyses uit te kunnen voeren.
Tekst gaat verder onder de afbeelding.
Hoe implementeer je een AI-toepassing?
Laten we in de tweede helft van dit artikel eens kijken naar wat er komt kijken bij het ontwikkelen en implementeren van AI-toepassingen:
Gegevensassemblage en -voorbereiding: De eerste stap is het identificeren van de vereiste en relevante gegevenssets en het assembleren ervan.
Functie-engineering: Hiermee doelt Makeen op het doorlopen van de gegevens om te beoordelen welke relevant zijn voor de taak in kwestie. Neem voorspellend onderhoud: welke data heb je nodig en gemeten over welke periode?
Labelen van de resultaten: Deze stap omvat het labelen van de resultaten die het model probeert te voorspellen. Bij voorspellend onderhoud moet een fout bijvoorbeeld gelabeld worden op basis van temperaturen, foutcodes en werkorders van technici.
Vaststelling van de trainingsdata: Om het AI-systeem te trainen moet de data voorzien worden van labels. Ook moet je zorgen voor voldoende evenwichtige gegevens; het systeem moet getraind worden met positieve en negatieve voorbeelden. Ten slotte is het zaak om te zorgen dat de data geen bias bevat.
Het kiezen en trainen van het algoritme: Er zijn tegenwoordig tal van bibliotheken vol met algoritmes om uit te kiezen.
Het algoritme implementeren: AI-algoritmen moeten – eenmaal geïmplementeerd – gevoed worden met nieuwe data. Op basis daarvan wordt een output gegenereerd, waarmee acties uitgevoerd of beslissingen genomen worden. Neem een algoritme dat bepaalt of voorspellend onderhoud nodig is om daarmee onderhoudsmedewerkers te ondersteunen. Dit is waar de werkelijke waarde van een AI-systeem wordt gecreëerd.
Continue verbetering: Algoritmen moet je (meestal) frequent blijven trainen. Bijvoorbeeld wanneer de omstandigheden veranderen of nieuwe gegevensbronnen bijkomen. Organisaties moeten in staat zijn om snel nieuwe modellen te ontwikkelen, te trainen en te implementeren als de omstandigheden veranderen.