Gentse start-up Paperbox brengt orde in ongestructureerde documenten

De Gentse start-up Paperbox introduceert een nieuw document intelligence-platform dat bedrijven helpt hun chaos van documenten te herstructureren. op basis van de inhoud onderscheidt de oplossing documenten als facturen, transportdocumenten of contracten van elkaar en sorteert ze. Paperbox is een spin-off van Skyhaus, het moederbedrijf van AI-specialist ML6. 

Naast het sorteren van documenten maakt de oplossing het mogelijk om data-elementen zoals het btw-nummer, productomschrijvingen en clausules op een automatische manier te lezen en op te slaan uit de documenten. De oplossing draagt in eerste instantie bij aan significante verbeteringen in efficiënt gebruik van tijd en kosten. Ook past de oplossing perfect in de huidige tijd waarin we menselijk contact zoveel mogelijk vermijden. 

Paperbox kan gekoppeld worden met systemen voor documentbeheer, zoals Microsoft SharePoint. Dankzij deze koppeling brengt de tool dagelijks nieuwe en waardevolle businessinzichten naar boven. 

De noodzaak

Veel bedrijven in verschillende branches, zoals de logistieke en bankensector, hebben te kampen met een wildgroei aan documenten die enorm veel tijd en budget opslorpt”, vertelt Maarten Callaert, ex-ML6 en Product Lead bij Paperbox. Jaarlijks stapelen duizenden tot miljoenen documenten zich op. Veel medewerkers zien door de bomen het bos niet meer. Grote gebeurtenissen zoals de brexit en COVID-19 maken het er ook niet makkelijker op. 

Om deze reden heeft Paperbox een document intelligence platform ontwikkeld dat alle bedrijfsdocumenten samenbrengt in één document data warehouse. De start-up wil bedrijven, vooral in de logistieke en financiële sector, helpen om hun ongestructureerde documenten om te zetten in concrete inzichten. 

Hoe werkt het?

Paperbox wordt aangeboden als een Software-as-a-Service platform en bestaat uit drie modules. De ‘Classify’-module neemt alle documenten van klanten, partners en leveranciers automatisch via een API in bulk op in het Paperbox-platform. Vervolgens klassificeert het platform de documenten per type in verschillende mappen (‘boxes’ genoemd in het platform). Via een online dashboard heeft de gebruiker toegang tot één bron met alle bedrijfsdocumenten, gesorteerd op soort. 

De ‘Extract’-module haalt met natural language processing verschillende entiteiten, zoals btw-nummer, datum afzender, productomschrijving en clausules uit contracten en algemene voorwaarden. De onderliggende algoritmes zijn zelflerend. Bij elke detectie ziet de gebruiker hoe zeker het algoritme is. Als deze onder een bepaalde drempel valt, kan de gebruiker tussenkomen om data te bevestigen of corrigeren.

De “Integratie’-module met Microsoft SharePoint geeft de gebruiker extra inzicht in zijn documenten. Een gebruiker kan bijvoorbeeld eenvoudig alle facturen oproepen met een bedrag dat lager is dan 50 euro. Ook kan een gebruiker snel inzien of en bepaalde clausule ontbreekt en checken of een contract wel compliant is.