Skip to content
PixEdit webbhuvud (2)

Extrahering av data

Extrahera data för registrering i systemapplikationer

Med en dataextraktionsmodul för PixEdit® Desktop kan data extraheras från befintliga filer eller i samband med dokumentskanning. Både en- och flersidiga dokument, med eller utan färg, kan bearbetas.

Datamodell

Arbetet inleds med att definiera en datamodell. Datamodellen innehåller vilken typ av information som ska extraheras från dokumenten och i vilken ordning. Datamodellen kan användas för att extrahera data från strukturerade dokument (formulär) och ostrukturerade dokument. Uppgifterna kan t.ex. vara namn, avtalsnummer, personnummer och liknande.

Export till XML eller CSV

De skannade dokumenten sparas i PDF-format och de tillhörande datautdragen sparas som datafiler i ett standardiserat utbytesformat (XML eller CSV). Filnamn och lagringsplats kan definieras under processen. Datautdragen kan sedan användas i andra system eller importeras till Microsoft Excel.

Strukturerade dokument (formulär)

När dokument har ett standardiserat utseende och de data som ska extraheras alltid finns på samma plats i dokumentet kan dataextraktionen automatiseras genom att skapa formulärmallar. I formulärmallarna definieras vart ifrån data ska hämtas och vilka egenskaper som krävs för att upptäcka avvikelser.

Genom att definiera en formulärmall för varje formulärtyp kommer PixEdit automatiskt att identifiera formulärtypen så att du kan skanna olika formulär i samma stack. Data extraheras i enlighet med de olika formulärmallarna.


*) Funktionaliteten är tillgänglig som en add-on/extension-modul till PixEdit Desktop.

Ostrukturerade dokument

När dokument är ostrukturerade är det inte möjligt att automatiskt identifiera vilken typ av dokument det är. Det är därför en manuell uppgift att avgöra vilken typ av information som dokumentet innehåller och vilka datautdrag som är relevanta.

Datautdrag görs genom att data registreras (skrivs eller kopieras) i ett separat registreringsfönster med definierade fält. Extraktet kan sedan exporteras till XML eller CSV.