Hoe we input beter kunnen begrijpen en output leren voorspellen?

Datacadabra ondersteunt bedrijven met data science en artificial intelligence voor geautomatiseerde processen en verlichting van de werkdruk, zodat bedrijven zich kunnen blijven ontwikkelen. Daarbij focussen we ons op de doelmarkten semi-overheid, infra en zorg. Deze doelgroepen proberen we stapsgewijs mee te nemen in het proces.

Het stappenplan van Datacadabra

In vorige blogs hebben we het gehad over waarnemen en structureren als de eerste 2 van de in totaal 4 stappen waaruit het AI-stappenplan van Datacadabra bestaat. In dit blog leggen we uit hoe je de informatie die je uit data haalt, kunt leren begrijpen en analyseren. Dit doen we aan de hand van een speciaal hiervoor ontwikkeld model. Daar komen we later in dit blog op terug. 

Herkennen van patronen

In stap 3 van ons stappenplan zijn we zo ver dat we het model kunnen trainen op basis van een aangelegde gelabelde dataset. Dit wil zeggen dat we het model dingen kunnen laten herkennen aan de hand van bepaalde waarnemingen. Bijvoorbeeld of het om een afbeelding van een hond of een kat gaat. De training bestaat dan uit de input van een grote hoeveelheid plaatjes waarop honden of katten staan afgebeeld. Aan de hand van de input leert het model bepaalde patronen herkennen.

Door een model te blijven trainen, kun je het model objecten nauwkeuriger laten detecteren en beter laten presteren. Voldoet de uitkomst, oftewel is het percentage positieve waarnemingen voldoende? Dan kunnen we het model implementeren in een productieomgeving. Zo niet, dan voegen we nieuwe data toe aan de dataset, gaan we opnieuw trainen en evalueren. Net zo lang tot we een passende output hebben.

Ingevoerde data beter leren begrijpen

In ons vorige blog hebben we verteld over het Digital Intelligence Framework (DIF), een blokkendoos van technologieën en tools, dat ons in staat stelt om digitale intelligentie, zoals kunstmatige intelligentie (AI) en machine learning (ML), effectief te ontwikkelen, implementeren en beheren. Aan de hand van die tools en technologieën komen we tot de ontwikkeling van een model waarmee we de ingevoerde data beter kunnen analyseren en begrijpen. Maar ook een model dat, wanneer het aan de verwachtingen beantwoord, kan worden hergebruikt om hiermee kosten te besparen  

Drie modellen

Bij de keuze van het model waarmee je gaat werken, zijn rekenkracht, nauwkeurigheid, snelheid en kosten de belangrijkste factoren die je tegen elkaar moet afwegen. Er zijn binnen computer vision 3 hoofdsoorten modellen waarmee je kunt trainen:

 

Classificatiemodel

Classificatiemodellen worden gebruikt om beslissingen te nemen of om items toe te wijzen aan categorieën. Een classificatiemodel geeft bijvoorbeeld een zogenaamde booleaanse uitvoer (waar of onwaar) of categorische beslissingen, zoals “kat” of “hond”.

 

Objectdetectiemodel

Dit soort modellen wordt meestal getraind om de aanwezigheid van specifieke objecten te detecteren, bijvoorbeeld een hond of een kat. 

 

Segmentatiemodel

Welke pixel behoort tot welke categorie? Dus, welke pixels vormen een kat of een hond? Een segmentatiemodel is uiterst nauwkeurig en heeft meer rekentijd nodig. Hoe meer eisen je stelt aan de rekenkracht, nauwkeurigheid en snelheid van het model, hoe meer invloed dat uiteindelijk heeft op de uiteindelijke kosten van het te ontwikkelen model.

Welke pixel behoort tot welke categorie? Dus, welke pixels vormen een kat of een hond? Een segmentatiemodel is uiterst nauwkeurig en heeft meer rekentijd nodig. Hoe meer eisen je stelt aan de rekenkracht, nauwkeurigheid en snelheid van het model, hoe meer invloed dat uiteindelijk heeft op de uiteindelijke kosten van het te ontwikkelen model. 

Het voordeel van de hierboven genoemde modellen is dat ze allemaal kunnen worden toegepast in afbeeldingen, video’s of realtime bewerkingen. De modellen die wij ontwikkelen, zijn met name gericht om mens en AI beter te leren samenwerken in arbeidsintensieve omgevingen. Door hier slimme AI-technologie toe te passen, kan er sneller, beter en kostenefficiënter geproduceerd worden. Zonder dat dit ten koste gaat van de werkgelegenheid. De toepassingsmogelijkheden van AI in een van oorsprong arbeidsintensief proces zijn onuitputtelijk. 

Benieuwd of AI ook aansluit op jouw bedrijfsomgeving? En wil je meer lezen over ons unieke stappenplan? Over de eerste twee stappen hebben we eerder al een blog op onze website gepubliceerd. En binnenkort delen we de vierde en laatste stap, over de implementatie van modellen in een productieomgeving, met je.

Het whitepaper DIF in je mailbox?

Datacadabra heeft een whitepaper gemaakt waarin we vertellen hoe het DIF werkt. Aan de hand van een voorbeeld nemen we je stapsgewijs mee in het proces om het waarnemen van data te structureren en te begrijpen, zodat modellen hierop getraind kunnen worden.

Benieuwd naar het whitepaper? Vul hieronder je gegevens in en je ontvangt ons whitepaper over het DIF in je e-mail