Skip to content
PixEdit web header (2)

Datauttrekk

Trekk ut data for registrering i systemapplikasjoner

Med en datauttrekksmodul til PixEdit® Desktop hentes data ut fra eksisterende filer eller i forbindelse med dokumentskanning. Både enkeltsidige og flersidige dokumenter, med eller uten farge, kan behandles.

Datamodell

Arbeidet starter med å definere en datamodell. Datamodellen inneholder type informasjon som ønskes hentet ut av dokumentene og i hvilken rekkefølge. Datamodellen kan benyttes til å trekke ut data fra strukturerte dokumenter (skjemaer) og ustrukturerte dokumenter. Dataene kan eksempelvis være navn, avtalenummer, personnummer og lignende.

Eksport til XML eller CSV

De skannede dokumentene lagres til PDF og de tilhørende datauttrekk lagres som datafiler i et standard utvekslingsformat (XML eller CSV). Filnavn og lagringssted kan defineres i prosessen. Datauttrekkene kan så benyttes i andre systemer eller importeres i Microsoft Excel.

Strukturerte dokumenter (skjemaer)

Når dokumentene har standard utseende og data som skal trekkes ut alltid befinner seg på samme plassering i dokumentet, kan datauttrekk automatiseres ved å opprette skjema-maler. I skjema-malene defineres dataenes plassering og eventuelle påkrevde egenskaper for å oppdage avvik.

Ved å definere en skjema-mal for hver skjematype, så vil PixEdit automatisk identifisere skjematype slik at du kan skanne ulike skjema i samme bunke. Dataene trekkes ut i henhold til de ulike skjema-malene.
 

*) Funksjonaliteten er tilgjengelig som en tilleggs/utvidelsesmodul til PixEdit Desktop.

Ustrukturerte dokumenter

Når dokumentene er ulike, kan det ikke automatisk identifiseres hva slags dokument dette er. Det blir derfor en manuell oppgave å bestemme hva slags informasjon dokumentet inneholder og hvilke datauttrekk som er relevante.

Datauttrekket gjøres ved å registrere (taste eller kopiere) inn data i et eget registreringsvindu med definerte felter. Uttrekket kan så eksporteres til XML eller CSV.