Slik digitaliserer NAV historiske papirarkiver med PixEdit skanneapplikasjoner
NAV har et stort fysisk fagarkiv fra tiden før man begynte med digitale arkiver. For resultatområdet NAV Arbeid og ytelser, med ansvar for bl.a. sykepenger, dagpenger og uføretrygd, er dette snakk om rundt 7000 hyllemeter plassert hos enheter rundt omkring i landet.
NAV Arbeid og ytelser Styringsenhet har etablert en egen skanningsenhet for å digitalisere hele det fysiske fagarkivet for dette resultatområdet.
Ove Hildrum er avdelingsdirektør/prosjektleder og forteller at målet for arbeidet er å både lette saksbehandlernes tilgang til disse dokumentene, og redusere etatens behov for arkivplass. Løsningen for digitalt arkiv skal også lette etatens arbeid med kassasjon eller avlevering av arkivmateriale til arkivverket. Arbeids- og Velferdsdirektoratet har etablert en egen digital arkivløsning, HistArk, for etatens historiske fagarkiv.
Effektiv produksjonslinje for skanningen
Med flere hylle-kilometer med papirarkiv som skal digitaliseres, kreves en godt planlagt produksjon og nøyaktige rutiner for vellykket prosjekt.
Mads Bjørkli, prosjektmedarbeider hos NAV Arbeid og ytelser, forteller at papirarkivet inneholder alt av dokumentasjon rundt stønader fra før 2012. Dette er søknader, dokumentasjon og vedtak for blant annet uføretrygd, barnetrygd, sykepenger og dagpenger. I alt 66 ulike typer stønader registreres hos NAV.
Ulike typer stønadsdokumenter har ulike kassasjonsregler når det gjelder krav til oppbevaringstid, men ved å digitalisere kan hele papirarkivet gå til kassasjon. Dermed frigjøres massevis av hylle- og lagerplass!
Mads Bjørkli er sammen med Jan Breivoll ansvarlig for skanneproduksjonen. De sørger for at programvare og maskinvare virker på lag og at rutinene for skanning, dokumentbehandling og arkivering fungerer slik det skal. De beskriver et godt samarbeid med utviklingsavdelingen hos PixEdit som avgjørende for at løsningen har kommet på plass.
«Vi startet med en teknisk beskrivelse som ikke dekket behovet vårt helt, men sammen med PixEdit har vi kommet frem til en velfungerende produksjonsflyt som effektiviserer arbeidet med skanning og datauttrekk. Underveis i prosessen har vi satt stor pris på rask respons og utmerket service fra PixEdit»
Mads Bjørkli, NAV
Anders Alvsåker, leder av utviklingsavdelingen til PixEdit, bekrefter at det også har vært viktig for PixEdit å utvikle modellen for datauttrekk fra skannede dokumenter i samspill med NAV. Det er viktig å bli kjent med kundens mål for å lage tekniske løsninger som gir ønsket resultat. Alvsåker beskriver digitaliseringsavdelingen hos NAV Arbeid og Ytelser som nytenkende, kunnskapsrik og svært målrettet mot et best mulig digitalt arkiv for fremtidig bevaring.
Sparer 1-2 årsverk med automatisk dokumentbehandling
I produksjonslinjen som er satt opp, finner vi 6 skannestasjoner med kraftige dokumentskannere tilknyttet PC med PixEdit Desktop. PixEdit Desktop kontrollerer skanneren og behandler de skannede dokumentene fortløpende.
Automatisk behandling i PixEdit sørger blant annet for
- Fjerning av blanke sider
- Oppretting av skjeve dokumenter
- Opprensing, fjerning av visuell «støy»
- Oppdeling av mappen/bunken som skannes ved skilleark mellom sakene
Neste trinn i planen er å sette opp en kraftig server med PixEdit Serverløsning. Her skal all tung dokumentbehandling utføres som en servertjeneste, slik at arbeids-PC avlastes og behandlingen går raskere. Bjørkli estimerer 1-2 årsverk spart tid ved å sette opp dokumentflyten på denne måten.
Alle foto: Mads Bjørkli, NAV
Kvalitetssikring og automatisering av gjentakende oppgaver
Papirdokumentene er i svært ulik forfatning, og noen krever litt mer behandling enn andre. Mye kan reddes med litt manuell finjustering, så når den automatiske dokumentbehandlingen er gjennomført, kommer dokumentet til saksbehandler for kontroll. Her gjøres nødvendige justeringer for å bevare informasjon best mulig.
Ved å benytte makroer i PixEdit, spares mye tid på oppgaver som ellers ville vært tidkrevende manuelle operasjoner. Makroer er «opptak» av en serie oppgaver som skal gjentas ofte. Disse lagres og kan så «avspilles» når det trengs.
Eksempel: Når papiret som skannes i utgangspunktet er i så dårlig forfatning at det er uleselig, må dokumentet merkes med dette i det digitale arkivet. I stedet for å utføre 4-5 ulike operasjoner, trenger saksbehandleren bare spille av makroen «Stemple som uleselig papirdokumentasjon»
«Med mange muligheter for effektiv automatisering av enkeltoppgaver, blir summen av spart tid svært stor»
Mads Bjørkli, NAV
Datauttrekk: Fra ustrukturerte til strukturerte data
For å systematisere og indeksere personmapper med tilhørende saker i HistArk, må metadata trekkes ut fra dokumentene.
Data som skal trekkes ut hos NAV er:
- Antall ark i PDF-filen
- Enhetsnummer: Nummerkoden til NAV-enheten som har ansvar for arkivet i dag
- NAV Enhet: Navnet på denne NAV-enheten
- Stønad: Hvilke/n type(r) stønad det gjelder. Forskjellige stønader har forskjellige koder
- Personnummer til mottaker
- År fra: årstallet de første dokumentene i saken begynner
- År til: årstallet til de siste dokumentene i saken
- Tidspunkt for skanning
- Skannernavn
- Skannerenhet: Nummerkoden til NAV enheten som har skannet saken
- Filnavn: Navnet på PDF filen
- Klage: Ja/Nei avhengig av om saken inneholder en klage eller ikke. Ved klage gjelder andre kassasjonsregler for enkelte ytelser
NAV bruker modulen for datauttrekk i PixEdit Desktop hvor disse feltene for metadata defineres i et skjema. Skjemaet brukes så til registrering. Noen av metadataene trekkes ut automatisk, andre kopieres fra dokumentet ved å bruke OCR/tekstgjenkjenning. Hvor mye som hentes automatisk og hvor mye som hentes manuelt, avhenger av om dokumentene i utgangspunktet er like (skjema/strukturerte data) eller ustrukturerte.
Skjermbilde fra PixEdit - modul for datauttrekk
«Det er svært enkelt å designe registreringsskjema med oppsett av den informasjonen vi ønsker å hente ut. Denne fleksibiliteten er kostnadsbesparende for oss siden vi enkelt kan gjøre endringer selv uten ekstern hjelp»
Mads Bjørkli, NAV
Lagring i arkivsystem
Det skannes en arkivmappe pr person, med personnummer som identifiseringsnøkkel. De ulike sakene i mappen separeres med PixEdit skilleark. Når mappen er ferdig skannet, dokumentene digitalt forbedret og metadata registrert, står man igjen med en PDF-fil med det skannede dokumentet og en tilknyttet CSV fil med metadata. Filene legges inn i HistArk og det er dermed enkelt å søke opp alle saker tilknyttet et bestemt personnummer ved innsyn i arkivet.
Gevinst:
Større produksjon • Økt brukervennlighet • Mindre feil
Bjørkli oppsummerer med å fortelle at løsningen er enkel å bruke. Det er en stor fordel å kunne tilpasse brukergrensesnittet slik at verktøy som ikke skal benyttes slås av for brukeren. Brukeren trenger bare å forholde seg til de verktøyene hen har bruk for, og opplever et likt grensesnitt uansett hvilken skanner som benyttes.
I starten av prosjektet ble alle metadataene registrert manuelt i et regneark. Det nye oppsettet med bruk av PixEdit til skanning og datauttrekk ga en kraftig økning i produksjonen, samtidig som mulighetene for feil så å si forsvant.
Vi i PixEdit har satt stor pris på samarbeidet med NAV, som har ført til nye ideer og løsningsforslag rundt optimalisering av produksjonsskanning. Dette er helt i tråd med vår visjon om å øke verdien på dokumentene på veien fra papir til digital versjon.
Skal dere i gang med å digitalisere et papirarkiv?
PixEdit-løsningen for produksjonsskanning og datauttrekk som er tatt i bruk hos NAV, kan tilpasses de fleste dokumenter og arkivsystemer.