Skip to content

Från pappersarkiv till strukturerad digital data hos NAV

Så digitaliserar NAV historiska pappersarkiv med PixEdit skanningsprogram

Den norska arbets- och välfärdsförvaltningen (NAV) har ett stort fysiskt tekniskt arkiv från tiden innan de digitala arkiven introducerades. För resultatområdet NAV Arbete och Förmåner, som ansvarar för sjukpenning, arbetslöshetsersättning och sjukersättning, handlar det om cirka 7.000 hyllmeter som finns på enheter runt om i landet.

NAV Arbete och Förmåners förfaltningsenhet har etablerat en egen skanningsenhet för att digitalisera hela det fysiska arkivet för detta resultatområde.


Ove Hildrum, avdelningsdirektör/projektledare, förklarar att syftet med arbetet är att underlätta för handläggarna att få tillgång till dessa dokument och att minska myndighetens behov av arkivutrymme. Den digitala arkivlösningen kommer också att göra det lättare för myndigheten att kassera eller överlämna arkivmaterial till Riksarkivet. Norska Arbeids- og velferdsdirektoratet har etablerat en egen digital arkivlösning, HistArk, för myndighetens historiska yrkesarkiv.

 

Effektiv produktionslinje för skanning

Med flera hyllkilometer pappersarkiv som ska digitaliseras krävs en välplanerad produktion och exakta rutiner för att projektet ska bli framgångsrikt.

Mads Bjørkli, projektmedarbetare på NAV Arbete och Förmåner, förklarar att pappersarkivet innehåller all dokumentation som rör förmåner från före 2012. Det handlar om ansökningar, dokumentation och beslut om sjukpenning, barnbidrag, sjukersättning och arbetslöshetsersättning. Totalt finns 66 olika typer av förmåner registrerade hos NAV.

Olika typer av förmånsdokument har olika gallringsregler när det gäller krav på lagringstid, men genom att digitalisera kan hela pappersarkivet gallras. Det frigör en hel del hyll- och lagringsutrymme!

Mads Bjørkli är tillsammans med Jan Breivoll ansvarig för skanningsproduktionen. De ser till att mjukvara och hårdvara fungerar tillsammans och att rutinerna för skanning, dokumenthantering och arkivering fungerar som de ska. De beskriver det goda samarbetet med utvecklingsavdelningen på PixEdit som avgörande för att få lösningen på plats.

"Vi utgick från en teknisk beskrivning som inte helt täckte våra behov, men tillsammans med PixEdit tog vi fram ett väl fungerande produktionsflöde som effektiviserar arbetet med skanning och datauttag. Genom hela processen har vi uppskattat den snabba responsen och den utmärkta servicen från PixEdit."

Mads Bjørkli, NAV

 

Anders Alvsåker, chef för PixEdits utvecklingsavdelning, bekräftar att det också har varit viktigt för PixEdit att utveckla modellen för datauttag från skannade dokument i samarbete med NAV. "Det är viktigt att lära känna kundens mål för att kunna skapa tekniska lösningar som ger önskat resultat. Alvsåker beskriver digitaliseringsavdelningen på NAV Arbeid og Ytelser som innovativ, kunnig och mycket fokuserad på att skapa bästa möjliga digitala arkiv för framtida bevarande.

 

Sparar 1-2 års arbete med automatisk dokumenthantering

I den produktionslinje som har satts upp hittar vi 6 skanningsstationer med kraftfulla dokumentskannrar som är anslutna till en PC med PixEdit programvara. PixEdit styr skannern och bearbetar de skannade dokumenten kontinuerligt.

Den automatiska bearbetningen i PixEdit säkerställer bland annat

  • Borttagning av tomma sidor
  • Skapande av skeva dokument
  • Rengöring, borttagning av visuellt "brus"
  • Uppdelning av den mapp/hög som skannas med hjälp av separationsark mellan ärendena

Nästa steg i planen är att sätta upp en kraftfull server med PixEdit Server-lösning. Här kommer all tung dokumentbearbetning att utföras som en servertjänst, vilket avlastar arbetsdatorn och påskyndar bearbetningen. Bjørkli uppskattar att 1-2 manår kommer att sparas in genom att dokumentflödet läggs upp på detta sätt.

P1010015

Alla foton: Mads Bjørkli, NAV

 

Kvalitetssäkring och automatisering av repetitiva uppgifter

Pappersdokumenten är i mycket varierande skick, och vissa kräver lite mer bearbetning än andra. Mycket kan sparas med lite manuell finjustering, så när den automatiska dokumenthanteringen har slutförts skickas dokumentet till handläggaren för kontroll. Här görs nödvändiga justeringar för att bevara informationen så bra som möjligt.

Genom att använda makron i PixEdit sparar du mycket tid på uppgifter som annars skulle vara tidskrävande manuella operationer. Makron är "inspelningar" av en serie uppgifter som ska upprepas ofta. Dessa lagras och kan sedan "spelas upp" när det behövs.

Exempel: När papperet som skannas från början är i så dåligt skick att det är oläsligt måste dokumentet märkas som sådant i det digitala arkivet. Istället för att utföra 4-5 olika operationer behöver handläggaren bara spela upp makrot "Stämpla som oläslig pappersdokumentation"

"Med många möjligheter till effektiv automatisering av enskilda uppgifter är summan av den tid som sparas mycket stor"

Mads Bjørkli, NAV

 

Extrahering av data: Från ostrukturerad till strukturerad data

För att kunna systematisera och indexera personliga mappar med tillhörande ärenden i HistArk måste metadata extraheras från dokumenten.

Data som ska extraheras hos NAV är:

  • Antal ark i PDF-filen
  • Enhetens nummer: Nummerkoden för den NAV-enhet som ansvarar för arkivet idag
  • NAV-enhet: Namnet på denna NAV-enhet
  • Förmån: Typ(er) av förmån som det är fråga om. Olika förmåner har olika koder
  • Socialförsäkringsnummer för mottagaren
  • År från: det år då de första handlingarna i ärendet börjar
  • År till: Året för de sista handlingarna i ärendet
  • Tidpunkt för skanning
  • Skannerns namn
  • Skanningsenhet: Nummerkoden för den NAV-enhet som har skannat ärendet
  • Filens namn: Namnet på PDF-filen
  • Klagomål: Ja/Nej beroende på om ärendet innehåller ett överklagande eller inte. Vid ett överklagande gäller andra kassationsregler för vissa förmåner

NAV använder sig av modulen för datauttag i PixEdit där dessa fält för metadata definieras i ett formulär. Formuläret används sedan för registrering. En del av metadatan extraheras automatiskt, medan andra kopieras från dokumentet med hjälp av OCR/textigenkänning. Hur mycket som extraheras automatiskt och hur mycket som extraheras manuellt beror på om dokumenten i grunden är likadana (formulär/strukturerad data) eller ostrukturerade.

"Det är mycket enkelt att utforma registreringsformulär med layouten för den information vi vill extrahera. Denna flexibilitet är kostnadsbesparande för oss, eftersom vi enkelt kan göra ändringar själva utan extern hjälp."

Mads Bjørkli, NAV

 

Lagring i arkivsystem

En arkivmapp skannas in för varje person, med personens ID-nummer som identifikationsnyckel. De olika ärendena i mappen separeras med hjälp av PixEdit-skiljeark. När mappen är skannad, dokumenten digitalt förstärkta och metadata registrerade, återstår en PDF-fil med det skannade dokumentet och en tillhörande CSV-fil med metadata. Filerna läggs till i HistArk, vilket gör det enkelt att söka efter alla ärenden som är kopplade till ett visst personnummer när man går in i arkivet.

Fördelar:

Större produktion - Ökad användarvänlighet - Färre fel

Bjørkli sammanfattar med att säga att lösningen är enkel att använda. "Det är en stor fördel att kunna anpassa användargränssnittet så att verktyg som inte ska användas stängs av för användaren. Användaren behöver bara förhålla sig till de verktyg som behövs och upplever samma gränssnitt oavsett vilken skanner som används.

I början av projektet registrerades all metadata manuellt i ett kalkylblad. Det nya upplägget med användning av PixEdit för skanning och datauttag resulterade i en kraftig produktionsökning samtidigt som risken för fel i princip försvann.

Vi på PixEdit har verkligen uppskattat samarbetet med NAV, som har lett till nya idéer och förslag på lösningar för att optimera produktionsskanningen. Detta ligger helt i linje med vår vision om att öka värdet på dokumenten på vägen från papper till digital version.

Står du inför att digitalisera ett pappersarkiv?

Den PixEdit-lösning för produktionsskanning och datautvinning som NAV använder kan anpassas till de flesta dokument och arkivsystem.