Publisering av skanna arkivmateriale uten indeksering
I vinter har vi startet arbeidet med å oppgradere våre programvarer for indeksering av skanna arkivmateriale. Arbeidet er ikke på langt nær ferdig, men nå i mars har vi kommet så langt at en viktig ny mulighet har åpnet seg: Vi kan publisere skanna arkivmateriale uten indeksering.
Fram til nå har indeksering vært en forutsetning for å kunne publisere, og siden vi ikke har hatt effektive verktøy for å berike og forbedre noe som allerede er indeksert, har vi i praksis vært nødt til å indeksere "perfekt" før publisering. Når vi i tillegg har hatt begrenset kapasitet til indeksering over en del år, har det oppstått en flaskehals: Vi har for øyeblikket omkring 15 millioner skanna bilder som ikke er publisert i Digitalarkivet, og brorparten av disse bildene viser arkivmateriale som egner seg for Digitalarkivet.
Publisering uten indeksering betyr at bildene registreres i indekseringstabellen i Digitalarkivets database med en kilde-ID som angir hvilken kilde bildene tilhører, samt et nummer som angir hvilken rekkefølge bilder tilhørende samme kilde skal vises i. Med vår nye programvare kan dette gjøres med noen få tastetrykk, hvorpå kilden kan publiseres umiddelbart. Når vi ikke indekserer bildene, registrerer vi derimot ikke spesifikke opplysninger om hva hvert enkelt bilde viser, sidetall osv.
Konsekvensen av å publisere uten indeksering, er at vi ikke kan tilby innholdssider eller filterfunksjon. Som bruker må du starte på første bilde og navigere i bildesekvensen uten den hjelpa som indekseringa vanligvis gir, omtrent som å snurre en mikrofilm "i gamle dager". Når kilden består av et begrenset antall bilder, vil nok dette oftest gå greit. Når kilden derimot består av flere hundre bilder, blir behovet for indeksering og hjelp til framfinning internt i kilden større.
Det er ikke noe poeng for Arkivverket å publisere skanna arkivmateriale som ingen finner fram i, så vi vil ikke publisere hvilke som helst kilder uten indeksering. Kirkebøker vil for eksempel alltid bli indeksert på vanlig måte, noe som også er nødvendig for at vi skal kunne sperre de bildene som vi er nødt til å sperre.
Hovedpoenget er at vi nå enklere kan publisere på kort varsel, ettersom vi kan gå tilbake og indeksere på et senere tidspunkt. Men en god del skanna arkivmateriale vil vi neppe få kapasitet til å indeksere, i alle fall ikke veldig detaljert. Når den nye programvaren for indeksering er ferdig, vil vi faktisk kunne invitere brukerne våre til å bidra til indekseringsarbeidet. Kanskje ønsker nettopp du å "finindeksere" ei tingbok, slik at tingbokas innholdsside får lenke til hver enkelt tingsamling?
Kilder som blir publisert uten indeksering, vil ha tomme innholdssider, slik som denne. Kommer du til en slik side, må du tilbake til trefflista og heller velge "Første side". Ved neste oppdatering av visningsprogramvaren vil vi deaktivere lenker til tomme innholdssider, slik at forhåpentlig ingen skal bli forvirret av dette. Inntil denne oppdateringa er på plass, vil også "bla"-lenker i Finn kilde feile, når den aktuelle kilden ikke er indeksert.
Pr. 15.3.2017 er det i hovedsak deler av arkivene Lassens samlinger og Generaltollkammeret, tollregnskaper som er publisert uten indeksering.











