De grootste kennisbank van het HBO

Inspiratie op jouw vakgebied

Vrij toegankelijk

Terug naar zoekresultatenDeel deze publicatie

Hoe kan het algoritme voor documentanalyse verbeterd worden zodat deze de algehele structuur van een document beter herkent?

Open access

Hoe kan het algoritme voor documentanalyse verbeterd worden zodat deze de algehele structuur van een document beter herkent?

Open access

Samenvatting

Moneybird biedt bonnetjes- en factuurherkenning aan om het verwerken van bonnetjes en inkoopfacturen te vereenvoudigen. Veel velden, zoals de factuurregels, worden niet correct herkend. Bovendien worden de velden waarvoor wel een voorspelling wordt gedaan, in 71% van de gevallen verkeerd voorspeld, waardoor het proces van de ondernemer vertraagt wordt.
Het doel van dit onderzoek is om in een tijdsbestek van 5 maanden het huidige algoritme voor documentanalyse te verbeteren, zodat de ondernemer minder interacties nodig heeft om een inkoopfactuur of bonnetjes in te boeken. Hiervoor is de volgende onderzoeksvraag opgesteld: Hoe kan het algoritme voor documentanalyse verbeterd worden, zodat deze de algehele structuur van een document beter herkent? Met document wordt zowel een bonnetje als ook een inkoopfactuur bedoeld.
Om het antwoord op de hoofdvraag te vinden, is gebruikgemaakt van de onderzoeksfases van het HBO-I framework (HBO-I, n.d.). Het onderzoek bestaat uit drie fasen: voorbereiding en prototyping, benchmarking en realisatie. Elk van deze fasen maakt gebruik van specifieke onderzoekspatronen om uiteindelijk tot het eindproduct te komen.
In het onderzoek zijn de frameworks eerst theoretisch vergeleken en vervolgens is een benchmark opgesteld om de nauwkeurigheid van de algoritmes in een realistische omgeving te meten en onderling te vergelijken. Uit de resultaten is gebleken dat Microsoft Azure Form Recognizer zowel het meest nauwkeurig de onderdelen op de documenten herkent, als ook een kosteneffectieve oplossing is. 
Na het onderzoek is het vernieuwde algoritme voor documentherkenning geïmplementeerd. Het maakt gebruik van een classificatiemodel om het documenttype vast te stellen en de Microsoft Azure Form Recognizer API is gebruikt als basis voor het ophalen van de voorspellingen. Het algoritme is beschikbaar gesteld als bèta-functie en zal geleidelijk worden uitgerold naar de klanten van Moneybird. 
Het vernieuwde algoritme voorspelt de onderdelen op de documenten nauwkeuriger dan het oorspronkelijke algoritme. Bovendien is het in staat om de documentregels te herkennen, wat een significante vermindering van het aantal benodigde interacties bij het boeken van een document oplevert in vergelijking met het oorspronkelijke algoritme.

Toon meer
OrganisatieSaxion
OpleidingHBO-ICT
Datum2023-07-01
TypeBachelor
TaalNederlands

Op de HBO Kennisbank vind je publicaties van 26 hogescholen

De grootste kennisbank van het HBO

Inspiratie op jouw vakgebied

Vrij toegankelijk