Elektronisk arkivering ( digital bevaring ) er et sæt praksisser, strategier og arbejdsgange til at beskytte elektroniske dokumenter mod forældelse og tab af information. Digitale arkiveringsaktiviteter har til formål at skabe, vedligeholde og bevare integriteten af digital information. For at henvise til praksis med elektronisk arkivering bruges flere begreber - digital bevaring (bogstaveligt talt - elektronisk eller digital bevaring), digital arkivering (elektronisk eller digital arkivering) eller digital forvaltning (digital datahåndtering). Disse begreber bruges ofte i flæng, men brugen af individuelle udtryk varierer fra land til land.
Praksisen med elektronisk arkivering begyndte at dukke op i midten af 1990'erne, da med udviklingen af informationsteknologi og nye typer digitale medier blev spørgsmålet om behovet for langtidslagring af digitale objekter i stigende grad rejst. Behovet for dette opstod på grund af de digitale mediers relativt korte levetid - for eksempel er pålideligheden af informationslagring på disketter og hukommelseskort kun få år, og for optiske diske - fra 3 til 20 år. Magnetbånd betragtes som de mest stabile måder at opbevare information på, hvor data kan opbevares pålideligt fra 15 til 30 år. Indtil begyndelsen af 1990'erne blev digital information duplikeret i papirkopier. Men ikke alt materiale blev arkiveret på denne måde - da de var lukket for offentligheden, var mange elektroniske dokumenter ikke genstand for arkivering.
Elektronisk arkiveringsaktiviteter er reguleret gennem en række accepterede internationale standarder og arbejdsgrupperapporter, herunder Open Archival Information System (OAIS) modellen, Trusted Digital Repository, Digital Preservation Network (DPN), InterPARES Project , PRONOM og andre. Processen med at arkivere digitale materialer udføres gennem konserveringsstrategier ( arbejde med materialer i originale formater og på originale medier, ved brug af den originale teknologi eller tidligere brugt hardware og software), emulering (gengivelse af funktionaliteten af et forældet system for at sikre arbejde med forældet dataformater), indkapsling (inkludering af en teknisk beskrivelse af dokumentet i selve det digitale objekt, hvilket reducerer dets afhængighed af det eksterne miljø, da denne information giver dig mulighed for enten at reproducere det originale miljø eller overføre dokumentet til et nyt) , migration (overførsel af elektroniske dokumenter til andre medier eller til et andet styresystem - for eksempel fra magnetbånd til cd), digital arkæologi (en metode til arkivering af materialer, som består i at gemme de digitale objekter, der er blevet utilgængelige på grund af teknologisk forældelse og/eller fysisk nedbrydning), fornyelsesstrategier (overførsel information fra et varigt medie til et andet) eller webarkivering ( processen med at indsamle, bevare og udtrække websteder og materialer fra internettet for at placere dem i et elektronisk arkiv til adgang for fremtidige generationer).
De første forsøg på at automatisere handlinger kan spores tilbage til det 14. århundrede, hvor klokkespil blev opfundet - mekaniske klokketårne styret af en pedalmekanisme, der bragte håndtagene i den ønskede rækkefølge, mens de roterede på grund af fastgørelse til en metalcylinder med stifter [1] . Dette princip om tromleautomatisering blev efterfølgende introduceret i tekstilindustrien - i det 18. århundrede blev det første hulkort eller papirbånd med huller skabt, hvorigennem der passerede skyttel [2] . Snart begyndte hulkort at blive brugt til at automatisere beregninger, de dannede grundlaget for Charles Babbages analytiske motor [3] , og senere - tabulatorer og computere af den første generation [4] [5] .
Indtil 1970'erne blev hulkort i vid udstrækning brugt til lagring og indtastning af data - op til 80 tegn kunne kodes på dem. Den hurtige udvikling af computere har dog ført til fremkomsten af alternative måder at lagre og automatisere data på [6] . I 1954 blev det første magnetiske medie IBM 350 skabt , og i 1956 en harddisk [7] . Allerede i 1960'erne blev hulkortet erstattet af magnetbånd , som blev den førende metode til optagelse og automatiseret informationsbehandling [8] [9] . Med udviklingen og introduktionen af magnetiske diske og flashhukommelse til lagring og registrering af information er deres kapacitet og ydeevne øget markant. Imidlertid dukkede problemet med skrøbeligheden af lagringsmedier op, hvilket negativt påvirkede datasikkerheden. Således er pålideligheden af informationslagring på magnetiske diske og flash-kort kun et par år - disse medier er ustabile både over for temperaturer over 100 ℃ og stærke elektromagnetiske felter . Oplysninger om optiske diske slettes gradvist under påvirkning af 50-70 ℃, de er i stand til at gemme data fra 3 til 20 år. De mest pålidelige måder at opbevare information på er magnetbånd, hvorpå data kan lagres fra 15 til 30 år [10] .
Med udviklingen af informationsteknologi og nye typer digitale medier er spørgsmålet om langtidslagring af elektronisk information blevet mere relevant. Indtil begyndelsen af 1990'erne blev de fleste digitale oplysninger duplikeret på papirkopier. Imidlertid blev ikke alt materiale arkiveret på denne måde, og mange elektroniske dokumenter blev ikke underlagt papirarkivering på grund af lukket for offentligheden [11] [12] . De første elektroniske arkiveringsprojekter begyndte at dukke op i anden halvdel af 1990'erne. Så i 1996 modtog det australske projekt Preserving Access to Digital Information (PADI) statsstøtte. Dens udførelse blev overdraget til National Library of Australia . PADI har publiceret projektrapporter og tidsskriftsartikler om en lang række emner, og har også set dannelsen af et fagligt fællesskab inden for digital bevaring [13] . Samme år blev lanceringen af webarkiveringsprojektet Internet Archive [14] grundlagt af Brewster Keil , projekterne fra Sveriges Nationalbibliotek (Kulturarw Heritage Project) og National Library of Australia (PANDORA Project) [15] . I 1998 dannede en række europæiske nationale biblioteker Networked European Deposit Library (NEDLIB) for at bevare elektroniske objekter i bibliotekssystemet [16] . Samtidig begyndte projekter til at udvikle effektive arkiveringsstrategier at udvikle sig - Arts and Humanities Data Service (1999) og Project CAMiLEON (1999). Siden 2000'erne er elektroniske databevaringsmetoder blevet indført overalt. I 2000 indledte Library of Congress således Minerva Initiative for at indsamle og arkivere elektronisk information, og det hollandske Digital Preservation Testbed-projekt blev en del af det nationale program for bevaring af digital information. I 2001 blev Digital Preservation Coalition dannet - en koalition af organisationer til at implementere elektronisk arkiveringspraksis i Storbritannien og andre lande. I 2006 blev et lignende projekt grundlagt - Digital Preservation Europe [17] [18] .
E-arkiveringsstrategier, der implementeres over hele verden, har ændret rollerne for biblioteker, arkiver og udgivere, der traditionelt er ansvarlige for arkivering af information. Siden 2000'erne har private organisationer, videnskabelige datacentre, non-profit organisationer også været involveret i bevarelsen af elektroniske optegnelser [19] .
I 2003 forsøgte UNESCO at samle internationale bestræbelser på at skabe en systematisk tilgang til elektronisk arkivering ved at udgive det digitale bevaringscharter, der opfordrede verdenssamfundet til at implementere strategier til at bevare truede elektroniske genstande. I 2012, på konferencen for UNESCO Memory of the World -programmet, blev behovet for en samlet international indsats for at bevare og give adgang til elektronisk arv gentaget. Som et resultat blev PERSIST-programmet oprettet i 2013, med det formål at bevare verdens dokumentarv [20] [21] .
Formålet med at bevare den digitale arv er at gøre den tilgængelig for offentligheden. Derfor bør adgang til digitalt arvsmateriale, især dem, der er i det offentlige domæne, være fri for urimelige restriktioner. Samtidig skal der ydes beskyttelse mod enhver form for krænkelse af informationssikkerheden af fortrolig og privat karakter.[...]
Der er fare for, at verdens digitale arv kan gå uigenkaldeligt tabt for fremtidige generationer. Faktorer, der bidrager til dette, omfatter forældelse af udstyr og programmer, der giver adgang til digitale materialer, usikkerheden i spørgsmål om ressourceforsyning, ansvar og metoder til at sikre bevaring og bevaring, fraværet af passende retsakter.[...]
I tilfælde af undlader man at træffe foranstaltninger, der sigter mod at forhindre fremherskende trusler, vil der ske et hurtigt og uundgåeligt tab af den digitale arv. Vedtagelsen af foranstaltninger af juridisk, økonomisk og teknisk karakter med henblik på bevarelse af kulturarven vil gavne medlemsstaterne. Der er et presserende behov for at øge bevidstheden og øge fortalervirksomheden, henlede beslutningstagernes opmærksomhed og stimulere offentlighedens interesse for både potentialet i digitale medier og de praktiske forhold omkring digital bevaring.
Flere termer bruges til at betegne praksis for elektronisk arkivering - digital bevaring (fra engelsk - "elektronisk / digital bevaring"), digital arkivering (fra engelsk - "elektronisk / digital arkivering") eller digital forvaltning (fra engelsk - "styring af elektronisk / digitale data"). Disse begreber bruges ofte i flæng, men brugen af individuelle udtryk varierer fra land til land. For eksempel i USA bruges udtrykket "digital bevaring" ( digital bevaring ) oftere og dækker som udgangspunkt alle aktiviteter til forvaltning af elektroniske arkiver fra det øjeblik, de er oprettet. Udtrykket "digital bevaring" blev første gang brugt i 1992 i en Theater Crafts magasinartikel om nye typer digital bevaring. I Storbritannien bruges udtrykket "digital data management" ( digital management ) tværtimod til at henvise til praksis for styring af elektroniske dokumenters livscyklus og digital bevaring - for de handlinger, der har til formål at sikre deres tilgængelighed i fremtiden. Samtidig bruges begrebet bevaring eller ”bevaring” på engelsk oftere end begrebet arkivering eller ”arkivering”, da sidstnævnte indebærer bevaring af fysiske dokumenter i eksisterende materialelagre. Af denne grund omtales konservering oftere som elektroniske objekter [23] [24] [25] .
Etableret i 2007 definerede American Library Association Working Group elektronisk arkivering som en kombination af strategier, principper og praksis, der sigter mod trofast at gengive autentificeret indhold over tid, uanset medieproblemer og ændringer i lagringsteknologier. Begrebet gælder både for dokumenter, der oprindeligt er oprettet i elektronisk format, og for digitaliseret materiale [26] . Med andre ord er dette aktiviteten med at udvælge, lagre og bevare information for at give adgang til den for fremtidige generationer [27] [28] . Cornell University Library definerer elektronisk arkivering som en bred vifte af aktiviteter rettet mod at forlænge levetiden af maskinlæsbare computerfiler og beskytte dem mod mediefejl, fysisk tab og forældelse [27] [29] .
Elektronisk arkivering søger at beskytte og bevare information til fremtidige generationer [30] [31] [29] . Elektroniske bevaringsaktiviteter fokuserer på skabelse, vedligeholdelse og bevarelse af integriteten af digital information. Oprettelse indebærer specifikation af komplette og klare specifikationer af filerne, produktion af pålidelige masterfiler og tilstrækkelige beskrivende, administrative og strukturelle metadata til at sikre fremtidig adgang. Vedligeholdelse er dokumentation af alle handlinger udført på filer og fuld sporing af ændringer. Bevarelse af information indebærer skabelsen af en pålidelig computer- og netværksinfrastruktur, der tillader lagring og synkronisering af materialer på tværs af flere websteder, samt løbende overvågning og udvikling af strategier til at forhindre tab af data [26] [32] .
Afhængig af målet kan elektronisk arkivering være langsigtet (adgang gives på ubestemt tid), mellemlang (adgang i et vist tidsrum) og kortsigtet (adgang til digitale materialer i et vist tidsrum og / eller indtil det bliver utilgængeligt - for eksempel på grund af ændringer i teknologien) [28] [33] . Der er tre hovedinfrastrukturkomponenter i elektronisk arkivering [24] :
Samtidig kan de teknologiske aspekter af elektronisk arkivering opdeles i følgende grupper [34] :
Beslutninger om behovet for at arkivere digitale genstande er baseret på en vurdering af deres varige værdi . Evaluering er kun en af strategierne, arkivarer bruger også statistiske stikprøver og risikoanalysemetoder til at udvælge materialer til bevaring. Statistisk stikprøve er baseret på statistiske metoder til at skabe et repræsentativt udsnit og passende udvælge papir- og digitale dokumenter til bevaring eller digitalisering. Risikoanalysemetoden skal vurdere de potentielle vanskeligheder, der kan opstå ved arbejde med digitale ressourcer, samt deres potentielle konsekvenser - for eksempel risikoen for forældelse af fil- og medieformater, risikoen for tab forbundet med manglende bevarelse af digitale ressourcer , og så videre. Som regel udføres risikoanalyse sammen med andre udvælgelseskriterier, såsom omkostningsoverslag [35] .
I 1980'erne begyndte flere og flere arkivarer at være opmærksomme på, at oprettelsen af digitale genstande og eventuelle elektroniske arkivalier blev udført uden at tage hensyn til kravene til deres langtidsbevaring. I begyndelsen af 1990'erne blev problemet med softwareforældelse og følgelig umuligheden af pålidelig arkivering af information skabt med dens hjælp indlysende. Med indførelsen af elektronisk arkivering dukkede de første forsøg på at regulere processen op. Der blev således oprettet en arbejdsgruppe under InterPARES-projektet, som var engageret i udviklingen af en model for udvælgelse af elektroniske objekter, der skulle arkiveres [36] [37] .
Tildel makro- og mikrovurdering. Ved makroevaluering forstås udvælgelsen af dokumenter til arkivering på baggrund af kontekstens betydning - alle ressourcer skabt af bestemte organisationer, aktører eller i en given tidsperiode vil blive betragtet som vigtige og værdifulde [35] . Ifølge modellen udviklet af InterPARES består evalueringen af konteksten af elektroniske optegnelser af fire hovedtrin:
Beslutningen om at arkivere filer kan træffes på baggrund af den juridisk-administrative kontekst (det juridiske og administrative system, hvori materialet blev oprettet), den økonomiske kontekst (det skabende organ, dets beføjelser, struktur og funktioner), den proceduremæssige kontekst (den forretningsprocedure, under hvilken registreringerne oprettes ), dokumentarisk kontekst (struktur og relationer til andre dokumenter) eller teknologisk kontekst (tekniske komponenter i elektroniske systemer, hvori digitale objekter skabes) [36] .
Arkivarer indsamler også data om den vedvarende værdi og ægthed af elektroniske materialer. Et objekts varige værdi bestemmes af optegnelsernes evne til at tjene skabernes og samfundets interesser eller behov. Der kan sættes spørgsmålstegn ved det i tilfælde, hvor bevaringen af materialer kan krænkes. Hvis evaluatoren har god grund til at formode, at optegnelserne har mistet deres ægthed og adskiller sig fra deres originale version, så sættes der spørgsmålstegn ved arkivering af dem [36] .
Ifølge anbefalingerne fra InterPARES-arbejdsgruppen udføres fastlæggelsen af muligheden for bevaring i flere faser. Først bestemmer eksperten indholdet af materialerne og de tekniske elementer, der skal bevares i overensstemmelse med kravene til ægthed. Evaluatoren tilpasser derefter disse bevaringskrav til kompetencerne hos den organisation, der er ansvarlig for permanent bevaring af arkiverede optegnelser [36] .
Baseret på tidligere kriterievurderinger anvendes en beslutning om at beholde dokumentet [36] .
Mikrovurdering skal bestemme værdien af individuelle dokumenter. Dets vigtigste kriterium er dokumentets overensstemmelse med depotbankens indsamlingspolitik - på grund af manglende overholdelse af disse kriterier kan anmodningen om elektronisk arkivering blive afvist, selv i tilfælde af værdifulde ressourcer. For eksempel nægtede Earth Resources Observation and Science (EROS) adgang til Apollo-rumprogrammets datasæt af tusinde optagelser taget af NASA under missionen. På trods af at optagelserne er af ubestridelig værdi for USA, opgav EROS det, da de fleste af filmene blev optaget fra et rumfartøj eller Månens overflade , mens organisationens mission er at bevare film og fotografier taget fra Jorden. Det næstvigtigste evalueringskriterium er værdien af digitale ressourcer, som også kan være primære og sekundære. Primær værdi forstås som administrative, skattemæssige og juridiske værdier. Sekundær værdi ligger i materialernes anvendelighed, anvendelighed og tilgængelighed. Det tredje vurderingskriterium er omkostningerne, som kan være en afgørende faktor ved valg af flere versioner af samme materiale. Arkivarer tager også højde for gennemførligheden af arkivering, da nogle konservatorer nægter at acceptere digitale ressourcer i bestemte filformater eller medier, fordi de ikke kan sikre langtidsbevaring af individuelle materialer [35] .
Elektronisk arkivering anvendes hovedsageligt på objekter, der er skabt i det digitale miljø eller digitaliseret. Den første kategori omfatter data oprettet ved hjælp af en form for digital teknologi. Digitaliserede materialer forstås som data konverteret fra analog til digital form ved hjælp af scanning eller formatændring [38] . Oftest anvendes elektronisk arkivering i forhold til [27] :
Elektroniske depoter eller datavarehuse er et af de centrale elementer i elektronisk arkivering. Lagre gemmer alle slags digitale objekter sammen med deres tilhørende beskrivende og administrative metadata. Digitale objekter kan være artikler i et elektronisk tidsskrift, digitaliserede billeder af fotografier, numeriske data, digitale videoer, fulde versioner af bøger [32] . Som en del af open access -bevægelsen er repositories forbundet med den " grønne " vej eller praksis med selvarkivering - forfattere af videnskabeligt materiale kan selvstændigt placere artikler i den relevante sektion af det elektroniske arkiv og give det en kort beskrivelse [39] [40] . Et af de første større tematiske arkiver arXiv.org dukkede op i 1991. Det giver adgang til videnskabelige artikler inden for matematik, fysik, datalogi, kvantitativ biologi . Repositories giver ikke kun adgang til samlinger af elektroniske kopier af værker, men tilføjer også automatisk publikationer til Citebase- databasen , som giver overvågning af citationsindekset [41] .
Repositories kan være institutionelle, disciplinære (eller tematiske) eller nationale. Temadepoter giver adgang til litteratur på et eller flere områder, mens institutionelle depoter gemmer værker udgivet inden for samme institution - som udgangspunkt er der tale om tekniske rapporter, afhandlinger, databaser, artikler, trykte publikationer. Et eksempel på institutionelle repositories er MIT 's DSpace [42] . Separate depoter blev skabt som et resultat af samarbejde med større videnskabelige publikationer - for eksempel understøtter Springer Nature tjenesten In Review, og Elsevier støtter ChemRN. Også i regi af non-profit Center for Open Science er der en række nationale depoter, herunder Arabirxiv ( fortryk fra arabiske lande), Frenxiv ( fransk server), INArxiv ( indonesisk ), Indiarxiv ( indisk ). Også fortryk af latinamerikanske lande er offentliggjort i SciELO- depotet [43] [44] .
Organisationer bruger open source-softwarepakker til at oprette og implementere institutionelle repositories. Disse omfatter Eprints og DSpace . DSpace, der blev udgivet i 2002, er en open source universal repository-applikation udviklet i fællesskab af HP Labs og Massachusetts Institute of Technology Libraries til tværfaglige forskningsorganisationer. DSpace bruger den relevante Dublin Core -metadatastandard til at beskrive digitale objekter og understøtter også Open Archives Initiative Protocol for Metadata Harvesting [44] . Andre store emnearkiver omfatter PubMed , grundlagt i 1996, hvor artikler inden for medicin og biologi udgives, PhilSci-Archive med artikler i filosofi og Social Science Research Network (SSRN), som har udgivet artikler inden for samfundsvidenskab og humaniora siden 1994. [40] . Et af de største arkiver med åben adgang er Archive of European Integration , etableret i 2003. Siden udgiver dokumenter fra Den Europæiske Union , som er beregnet til offentlig distribution. I januar 2016 indeholdt arkivet mere end 41.800 EU-dokumenter og omkring 7.300 private værker [45] . En række lande har implementeret nationale initiativer til at yde infrastrukturstøtte til depoter, såsom SHERPA -projektet i Storbritannien , DARE i Holland og $12 millioner australske regeringsprojekter til at fremme depoter. Individuelle organisationer kan også købe tjenester, der giver adgang til enkelte cloud-ressourcer. Så Amazon tilbyder flere cloud-servere på én gang, inklusive Amazon S3 til filhosting [46] .
Samtidig udvikles systemer, der søger i flere repositories samtidigt. Et eksempel på et sådant system er OAIster , hvorigennem du kan se information om mere end 200 repositories [47] [48] [42] . OpenDOAR søger i indholdet af næsten 3000 offentligt listede arkiver fra hele verden [49] .
En af de vigtigste standarder for metadata er Dublin Core (DCMES), hvis hovedsæt består af 15 karakteristika [50] :
Dublin Core er en fælles standard for objektkatalogisering. Men på grund af DCMES' generelle karakter kan det være svært at beskrive komplekse samlingsobjekter. Af denne grund kombineres Dublin Core i de fleste tilfælde med andre standarder [51] .
Integritet og modstandsdygtighed er væsentlige egenskaber ved arkiverede digitale objekter. Integritet refererer til at opretholde nøjagtigheden og pålideligheden af data gennem hele deres livscyklus. Det kan blive brudt under dataoverførsel eller replikering. Opretholdelse af integritet er en af de vigtigste opgaver ved elektronisk arkivering [52] [53] . Persistens betyder, at filen forbliver uændret under den elektroniske arkivering, og at den bevares i den form, den blev oprettet i [54] .
Den internationale PREMIS-standard definerer metadata som "information, som et lager bruger til at understøtte den digitale bevaringsproces." Metadata er information om dataene, såsom en beskrivelse af filformatet, softwaren og ændringshistorikken. Ideelt set bør metadata indsamles og opdateres gennem hele livscyklussen af et digitalt objekt [55] . Metadatas primære rolle er at identificere, beskrive og give intelligent adgang til indholdet af en digital samling. Forskellige typer metadata er nødvendige for at beskrive ressourcer, opdage, hente, bruge, repræsentere og bevare digitale objekter. De vigtigste metadata er til at organisere samlinger med visuelle, lyd- og animationsmaterialer, som er svære at identificere uden en tekstbeskrivelse. Der er flere typer metadata [24] :
En af de vigtigste standarder for metadata er Dublin Core (DCMES), hvis hovedsæt består af 15 karakteristika [50] :
Dublin Core er en fælles standard for objektkatalogisering. Men på grund af DCMES' generelle karakter kan det være svært at beskrive komplekse samlingsobjekter. Af denne grund kombineres Dublin Core i de fleste tilfælde med andre standarder [51] .
En anden grundlæggende standard er VRA Core. I modsætning til DCMES giver VRA Core dig mulighed for at klassificere kunstværker (eller originale genstande) og deres surrogater (digitale billeder) i forskellige kategorier. Denne løsning giver dig mulighed for at skabe en mere nøjagtig beskrivelse af objekter og for eksempel angive datoen for oprettelsen af begge værker - det originale værk og dets fotografi [51] .
Preservation Metadata: Implementation Strategies eller PREMIS blev udviklet af OCLC og RLG arbejdsgruppen i 2005. Standarden definerer de metadataenheder, der er nødvendige for at gemme filer i arkiver. For 2021 vedligeholdes og sponsoreres PREMIS af Library of Congress . Standarden består af to hoveddele - datamodellen og ordbogen. PREMIS definerer flere typer metadata, herunder beskrivende, strukturelle, tekniske og administrative. Ordbogen lægger stor vægt på at dokumentere digital oprindelse (et objekts historie) og relationer, især mellem forskellige digitale objekter i depoter [24] . Ifølge PREMIS-standarden skal repositories automatisk justere metadataene for hvert enkelt elektronisk objekt og føre en historik over ændringer i en fil [56] [57] .
De grundlæggende principper for elektronisk dataarkivering blev formuleret i en række standarder og initiativer fra slutningen af 1990'erne og begyndelsen af 2000'erne.
I 1994 indledte den almennyttige organisation Commission on Preservation and Access (CPA) sammen med bibliotekskonsortiet Research Libraries Group [ en særlig kommission, hvis aktiviteter havde til formål at identificere praksis for langsigtet arkivering af elektroniske dokumenter og udvikle passende anbefalinger. Et andet mål for arbejdskommissionen var udviklingen af alternativ arkiveringspraksis – i stedet for at overføre data til nye versioner af det samme medie, som var accepteret på det tidspunkt, foreslog kommissionsmedlemmerne at bruge migreringsmetoden og flytte elektroniske objekter til nye harddiske og software. I maj 1996 udgav et panel på 21 medlemmer, ledet af Donald Waters og John Garrett, den endelige rapport, Preserving Digital Information. Rapporten indeholdt to hovedanbefalinger - inddragelse og udpegelse af indholdsskabere i elektronisk arkiveringspraksis og behovet for at skabe et netværk af pålidelige og certificerede elektroniske arkiver [58] . Dette dokument blev grundlaget for efterfølgende praktiske anbefalinger om emnet [59] [34] . I 1997 blev Council on Library and Information Resources [60] oprettet som et resultat af samarbejdet mellem CPA og RLG .
RLG har gennemført flere praktiske initiativer for at omsætte rapportens hovedprincipper i praksis. Et af disse var Studies in Scarlet, et projekt udført i samarbejde med Harvard Law School Library for at bevare filer fra Amerika, Storbritannien og Irland fra 1815 til 1914 om vold i hjemmet , bigami , brud på løfter om at gifte sig, værgemål , voldtægt og mord [61] . Et andet stort projekt var Global Immigration Project, som digitaliserede immigrationssager. Begge projekter var afsat til digitalisering og databevaring, dog var bevaringslogikken i begge tilfælde forskellig. Arkiveringen af dokumenter til Studies in Scarlet-projektet udsprang således af behovet for at omsætte RLG's kerneprincipper om depotinfrastruktur i praksis, og i tilfældet med Global Immigration Project fra behovet for at digitalisere og stille immigration til rådighed. relaterede samlinger, der hurtigt blev forringet i kvalitet. Projekternes organisatoriske modeller var også forskellige. Studier i Scarlet havde en centraliseret model - alt materiale blev indsendt samlet, og immigrationsprojektets arkiv bestod af en række forskellige samlinger afholdt på 11 deltagende institutioner i USA, Storbritannien og Canada . Samtidig lancerede RLG Arches-projektet, der fokuserede på at skabe et online lager af digitale ressourcer og et softwaremiljø for international adgang til arkivmateriale [62] . Arches er en open source softwareplatform udviklet i samarbejde med Getty Conservation Institute og World Monuments Fund til brug for bevaringsinstitutioner rundt om i verden. Arches giver information om arkæologiske steder, bygninger og strukturer, kulturlandskaber, byensembler [63] [64] .
Moderne tilgange og løsninger inden for elektronisk arkivering er baseret på de koncepter og funktionelle moduler formuleret i den internationale standard OAIS [65] . I 1990 begyndte den internationale rådgivende komité for rumdatasystemer på anmodning fra Den Internationale Standardiseringsorganisation (ISO) at udvikle officielle standarder for langsigtet elektronisk arkivering af information genereret under rummissioner. I 1995 blev der afholdt en række internationale seminarer, som resulterede i frigivelsen af Open Archival Information System (OAIS) referencemodel. Den første version blev udgivet i 1997, og den sidste i 2002 (opdateret i 2012). OAIS var det første system til at beskrive konceptet med en arkivpakke og digitale objekter. Efterfølgende blev standarden en prototype for fremtidige projekter om oprettelse af elektroniske depoter , adgang til eksisterende databaser og metadata [58] . I 2003 blev OAIS godkendt som en international standard ISO 14721:2003 "Data and information transmission systems for outer space. Åbent arkivinformationssystem. Referencemodel” (Rumdata- og informationsoverførselssystemer - Åbent arkivinformationssystem - Referencemodel (OAIS)) [66] . Standarden var den første, der introducerede et neutralt ordforråd til at beskrive aktørers roller og ansvar i forbindelse med vedligeholdelse af arkiver og regulering af brugeradgang [34] . Således definerede og informerede OAIS-standarden udviklingen af et bæredygtigt digitalt bevaringsprogram ved at levere et fælles ordforråd, informationsmodel og digital bevaringsarkitektur på højt niveau [67] . OAIS er baseret på tre hovedkoncepter - "OAIS miljø", "OAIS information", "OAIS eksterne interaktioner". Den første kategori består af "Producere", "Forbrugere" og "Ledere" i miljøet omkring OAIS-arkivet. Producenterne kan både være personer, der leverer data til indlæsning i systemet, og systemer. Ledere er de aktører, der ikke deltager i den daglige drift af arkivet, men som påvirker OAIS's overordnede politik. Andre OAIS-arkiver eller ikke-OAIS-kompatible systemer kan interagere med OAIS-arkivet som "producenter" eller "forbrugere" [68] .
Ifølge OAIS skal informationspakken for et arkiveret objekt indeholde følgende information [69] [66] :
OAIS - referencemodellen beskriver også tre typer informationspakker [69] [66] :
I 2000 begyndte RLG og Online Computer Library Center (OCLC) at samarbejde om at skabe et Trusted Digital Repository (TDR eller Trusted Electronic Repositories ) baseret på den internationale OAIS-standard. Projektrapporten blev udgivet i august 2001. Ifølge dokumentet foreslår RLG- og OCLC-arbejdsgruppen oprettelse af nationale og internationale systemer af elektroniske arkiver, der vil være ansvarlige for at give adgang til offentlig, social, økonomisk, kulturel og intellektuel arv. I henhold til rapportens anbefalinger bør aktiviteterne i RLG, OCLC og andre organisationer være rettet mod at udvikle certificering af elektroniske depoter, studere og skabe værktøjer til at identificere vigtige egenskaber ved digitalt materiale til bevaring; forskning og udvikling af modeller for samarbejdsnetværk og lagertjenester [58] [70] . Sammen med denne definition blev de vigtigste karakteristika ved TDR givet - administrativt ansvar, organisatorisk levedygtighed, finansiel stabilitet, teknologisk og proceduremæssig kompatibilitet og systemsikkerhed [58] .
Et betroet digitalt lager er et, hvis mission er at give pålidelig, langsigtet adgang til administrerede digitale ressourcer til et bestemt fællesskab nu og i fremtiden [34] .
I 2003 dannede Research Library Group en fælles arbejdsgruppe med US National Archives and Records Administration for at udvikle specifikke kriterier for certificering af elektroniske depoter. I 2005 begyndte RLG og Center for Forskningsbiblioteker at teste de grundlæggende principper i praksis, og to år senere udgav de på baggrund af resultaterne af forskningen dokumentet Trustworthy Repositories Audit & Certification , som dannede grundlaget af ISO Standard 16363 og definerede de grundlæggende principper for oprettelse og styring af digitale arkiver dokumenter [71] .
I 2012 blev fællesskabet Digital Preservation Network (DPN) oprettet i USA, som omfattede omkring 60 organisationer, der gik sammen for at dele teknologi, ekspertise og økonomiske ressourcer for at skabe en gennemsigtig og langsigtet elektronisk arkiveringstjeneste. Medlemskab af non-profit organisationen DPN var kun tilgængeligt for amerikanske organisationer, der var interesserede i langsigtet bevaring af elektronisk information [71] . Da de sluttede sig til DPN, blev de inkluderet i et delt lagernetværk, der opererede gennem fem store depoter: Academic Preservation Trust (APTrust), Chronopolis, HathiTrust , Stanford Digital Repository (SDR) og University of Texas Digital Repository (UTDR). Hvert lager blev betragtet som en "knudepunkt" i netværket af DPN-organisationer, placeret i forskellige dele af USA og havde sin egen arkitektur, hardwareplatform og organisatoriske/finansielle struktur. DPN's aktiviteter var rettet mod at skabe et bæredygtigt opbevaringssystem for materialer [72] . I 2018 blev DPN opløst [73] .
InterPARES Project er en række internationale samarbejder, der er blevet gennemført siden 1994 under navnet UBC Project. Projektet blev initieret af University of British Columbia i samarbejde med det amerikanske forsvarsministerium og US National Archives and Records Administration i 1994-1997. Dens hovedmål var at udvikle en elektronisk arkiveringsmetodologi, der ville gøre det muligt at opbevare materialer i en autentisk form i lang tid [74] . I 1999 blev InterPARES oprettet på basis af UBC-projektet, ledet af forskerne Luciana Duranti og Terry Eastwood . Den første fase af projektet (1999-2001) var helliget langtidsbevaring af optegnelser, der er oprettet og vedligeholdt i databaser og dokumentstyringssystemer. I projektets anden fase (2002-2007) analyserede forskerne optegnelser, der blev skabt i løbet af videnskabelige, kunstneriske og statslige aktiviteter. På tredje fase af projektet (2007-2012) blev den erhvervede praktiske viden testet i små og mellemstore arkivinstitutioner. Den sidste fase (2013-2018) var viet til elektroniske optegnelser, der blev uploadet til internettet af brugerne selv [75] [76] . Projektet resulterede i oprettelsen af DOD-standarden 5015.2 for et registreringssystem [71] [74] .
I 2002 oprettede Digital Preservation Department of the National Archives of Great Britain PRONOM - et teknisk register, der indeholder oplysninger om filformater , software og tekniske komponenter i arkiver. Registret opdateres konstant, og forskere, der arbejder med sjældne og proprietære filformater, kan indsende ansøgninger. Oprindeligt blev PRONOM betragtet som en intern ressource i National Archives of Great Britain, men senere blev den ændret til en åben international portal [56] [77] .
Fra 1996 til 2010 drev National Library of Australia projektet Preservating Access to Digital Information (PADI) for at fremme strategier og retningslinjer for arkivering og adgang til digitale objekter af alle kulturarvsinstitutioner i Australien . Som et resultat af projektet blev der oprettet en fælles tematisk portal, hvorigennem institutioner frit kunne udveksle oplysninger samt få adgang til de nødvendige elektroniske ressourcer [56] .
I december 2000 bevilgede den amerikanske kongres 100 millioner dollars til at skabe National Digital Information Infrastructure and Preservation Program (NDIIPP), som blev overført til Library of Congress . Pengene blev afsat til nationale bestræbelser på at planlægge langsigtet arkivering af elektroniske optegnelser og samarbejde med repræsentanter for andre føderale, forsknings-, biblioteks- og erhvervsorganisationer [78] .
I oktober 2011 blev der inden for rammerne af den internationale konference "Bevarelse af elektronisk information i informationssamfundet: problemer og udsigter" i Moskva vedtaget en erklæring om bevarelse af digital information, som senere blev et af de grundlæggende dokumenter på området af elektronisk arkivering [79] . Deklarationen skitserede prioriterede områder for bevaring af digital information og udsendte en række forslag til UNESCO, nationalstater og regeringsstrukturer om at indføre praksis for digitalisering af dokumenter [80] .
Metoden til digital databevaring er at arbejde med materialer i originale formater og på originale medier ved at bruge den originale teknologi eller tidligere brugt hardware og software. I dette tilfælde skabes de såkaldte "computermuseer", hvor visualisering og indhold af materialer vedligeholdes i det originale format og med original funktionalitet. Bevaring er blevet omtalt som en midlertidig elektronisk arkiveringsstrategi, selvom metoden for nogle digitale data er den bedste løsning på grund af dens evne til at bevare de originale adgangsværktøjer såsom software [65] [81] [82] . På lang sigt er strategien problematisk på grund af potentielle vedligeholdelsesproblemer og omkostningerne ved at holde visse filtyper tilgængelige. Bevaring begrænser også en ressources portabilitet, som i dette tilfælde afhænger direkte af det udstyr, der opbevares visse steder [81] .
EmuleringEmulering refererer til reproduktion af systemfunktionalitet for at sikre drift med ældre dataformater. Emulering indebærer oprettelsen af en virtuel maskine på en computer, der giver dig mulighed for at reproducere funktionaliteten af det originale hardware- og softwaremiljø [65] . På nogle måder ligner emulering en konserveringsstrategi , idet den involverer at bevare det originale applikationsprogram. Målet med emulering er at bevare udseendet af et digitalt objekt såvel som dets funktionalitet ved at kopiere det tekniske indhold af ressourcen og bruge det originale objekt eller en opdateret kopi af det originale objekt i fremtiden [81] . Emuleringssoftware er blevet udviklet af pc-spilentusiaster siden begyndelsen af 1990'erne, men siden begyndelsen af 2000'erne har det også tiltrukket sig interesse i det digitale bevaringsfællesskab. På trods af at emulering oprindeligt blev betragtet som et teknologisk komplekst system, desuden vanskeligt at reproducere, blev metoden gradvist en af de vigtigste inden for elektronisk arkivering - nye udviklinger, herunder introduktionen af emulatoren direkte i browser - pluginet , meget forenklet brugen. Emulatoren er programmeret til at efterligne adfærden af ældre hardwareplatforme og operativsystemsoftware såsom spil og filer. Denne strategi involverer dog ikke at beholde ældre hardware og original software. Et eksempel er Java Virtual Machine [81] [83] . Emulering anvendes både på applikationer og operativsystemer og på hardwareplatforme [84] .
Der er flere fordele ved at bruge emulering til at få adgang til filformater og ældre software. Disse omfatter muligheden for at få adgang til komplekse digitale objekter, herunder spil, virtual reality og apps. Ved at tillade brugere at interagere med digitale objekter i deres oprindelige miljø, giver emulering forskere værdifuld kontekst om det miljø, som skaberen arbejdede i på det tidspunkt. Når den bruges i stor skala, kan den give adgang til store dele af en samling [83] . Brugen af emulering kompliceres dog af potentielle juridiske problemer - licensvilkår for ældre software og operativsystemer tillader ikke altid emulering, da denne metode involverer kopiering. Valget af emulering som en elektronisk arkiveringsstrategi kan også føre til en afhængighed af forældelse af emulatorer og tyder over tid på begrænsninger på grund af udstyrsstrømtab [82] .
IndkapslingIndkapslingsmetoden indebærer , at der medtages en teknisk beskrivelse af dokumentet i sammensætningen af selve det digitale objekt, hvilket reducerer dets afhængighed af det ydre miljø, da denne information enten gør det muligt at reproducere det originale miljø eller overføre dokumentet til et nyt [ 65] [85] . I de fleste af de anvendte informationslagringsmetoder lagres forskellige elektroniske datakomponenter forskellige steder (f.eks. i en database eller et filsystem) som en del af forskellige digitale objekter. Relationerne mellem forskellige komponenter er gennem links, pointere og filnavne. Men den hurtige udvikling af informationsteknologi kræver, at forholdet mellem digitale objekter er mere stabilt - at opbevare komponenterne i en elektronisk post separat er altid forbundet med risiko, og så snart forholdet er brudt og ikke kan genoprettes, betragtes posten faret vild. Arkivaren kan undgå denne risiko ved at inkludere metadata i computerfiler, der indeholder dokumenter. Når du kombinerer to komponenter i et fysisk objekt, kan forbindelsen mellem posten og metadataene ikke gå tabt [86] . Indkapsling kan anvendes på digitale ressourcer, hvis format er veldefineret og udbredt [81] . Denne strategi overvinder også problemet med teknologisk forældelse af filformater, da metadata inkluderer en måde at skabe en original applikation til at få adgang til på mere avancerede computerplatforme [87] [81] .
OAIS International Standard beskriver også de typer af hjælpeoplysninger, der skal inkluderes i en indkapslet fil - oprindelse (for at beskrive kilden til et objekt), kontekst (for at beskrive, hvordan et objekt relaterer til andre oplysninger uden for "beholderen"), en henvisning til en eller flere identifikatorer (for entydigt at identificere et objekt) [81] .
MigrationMigreringsmetoden er at overføre elektroniske dokumenter til andre medier eller til et andet styresystem - for eksempel fra et magnetbånd til en cd. Denne strategi er en af de mest populære praksisser inden for elektronisk arkivering, da den bevarer integriteten af digitalt materiale og brugernes evne til at finde og bruge information uden at blive påvirket af forældede teknologier [81] [88] [82] .
Den internationale OAIS-standard skelner mellem fire hovedtyper af migrering: opdatering, replikering, ompakning og transformation. Opdatering sikrer, at en pålidelig kopi af bitstrømmen bevares, mens replikering og ompakning sikrer, at objektets administrerede pakke er tilgængelig [81] . Denne strategi er rettet mod at bevare indholdet af det overførte objekt, mens nogle teknologiske egenskaber kan gå tabt [81] [89] [90] .
Digital arkæologiDigital arkæologi er en dyr metode til arkivering af materialer, som består i at gemme de digitale genstande, der er blevet utilgængelige på grund af teknologisk forældelse og/eller fysisk nedbrydning. På grund af de høje omkostninger og manglen på garantier for genoprettelse af fuldstændigheden af dataene, anses brugen af en sådan strategi for at være en nødvendig foranstaltning [82] [65] .
OpdaterEn opgraderingsstrategi involverer overførsel af information fra et holdbart medie til et andet - for eksempel fra et henfaldende 4 mm DAT -bånd til et nyt 4 mm DAT-bånd eller fra en gammel CD-RW til en ny CD-RW. Opdatering er en nødvendig komponent i ethvert vellykket e-arkiveringsprogram, men er ikke en strategi i sig selv. Metoden løser problemet med medieslid og forældelse, men betragtes ikke som en bæredygtig langsigtet arkiveringsmetode [82] [91] [27] .
WebstedsarkiveringWebarkivering er processen med at indsamle, bevare og udtrække websteder og materialer fra internettet for at placere dem i et elektronisk arkiv for adgang til fremtidige generationer. Denne strategi har til formål at overvinde problemet med tab af information på internettet på grund af netværkets dynamik og ændringer i licensbetingelserne. Et af de største og mest berømte initiativer til webarkivering var det almennyttige Internet Archive , grundlagt i 1996 . Arkivsamlingen består af mange undersamlinger af arkiverede websteder, digitaliserede bøger, lyd- og videofiler, spil og software. I 2001 lancerede Arkivet Wayback Machine , en tjeneste dedikeret til at bevare meget af det "åbne" internet. Wayback Machine-brugere kan spore de ændringer, der finder sted på udvalgte websteder og sammenligne forskellige versioner af redigeringer. Fra august 2021 gav Wayback Machine adgang til over 581 milliarder gemte websider [92] [93] [82] [94] .
Organisationer kan bruge selektive webarkiveringsprogrammer. Den største af disse tjenester omfatter PANDAS (PANDORA Digital Archiving System), som er banebrydende af Australian National Library. PANDAS er en webapplikation skrevet i Java og Perl , der giver en grænseflade til at styre webarkiveringsprocessen. En lignende rolle spilles af The Web Creator Tool, et open source- workflowværktøj til styring af selektiv webarkivering, udviklet i fællesskab af National Library of New Zealand og British Library med Oakleigh Consulting [95] .
Strategi | Fordele | Fejl | Ansøgning |
---|---|---|---|
Bevarelse | Bevarer udseendet. Giver dig mulighed for at arbejde med originale formater og software. | De høje omkostninger ved at vedligeholde filen. Sikkerheden afhænger af udstyret. | Filer med forældede formater, software, ressourcer, hvis udseende har betydning. |
Emulering | Bevarer udseendet. | Kompleksiteten ved at skabe en emulator. Masser af information, der skal gemmes. Adgang til information kræver arkaisk software. | Software; komplekse digitale ressourcer (f.eks. indeholdende eksekverbare filer); ressourcer, hvis værdi er ukendt, og hvis brug er usandsynlig i fremtiden; ressourcer, hvis udseende har betydning. |
Indkapsling | Gemmer information om filen, og hvordan den kan afspilles. | Viden om filen og dens afspilningssystem er bevaret. | Utilgængelige ressourcer og ressourcer med kendte formater. |
Migration | Kræver ikke lagring af originale applikationer. Understøtter aktiv adgang og kontrol. | Høje omkostninger for langtidsbevaring. Manglende mulighed for at gemme metadata. Behovet for konstant opdatering og arbejde fra arkivarers side. | Ressourcer, der aktivt tilgås og administreres, såsom videnskabelige data eller databaser. Ressourcer med almindeligt anvendte formater. |
Digital arkæologi | Giver dig mulighed for at rekonstruere elektroniske objekter, hvortil adgangen er gået tabt. | Høje omkostninger og ingen garantier for filgendannelse. | Filer, der er gået tabt. |
Opdatering | Løser spørgsmålet om slid og mediers forældelse. | Metoden er kun effektiv som en kortsigtet løsning. | Ressourcer, hvis medier risikerer at blive forældede. |
Webarkivering | Løser problemet med tab af information på internettet på grund af dynamikken i netværksudviklingen og ændringer i licensbetingelser. | Potentielle juridiske komplikationer i forbindelse med lov om ophavsret. | Alle filer og websteder, der findes på internettet og anses for værdige til arkivering af den konserverende aktør. |
For effektivt at implementere elektronisk arkiveringspraksis opfordres organisationer til også at implementere strukturelle ændringer. For at reducere den negative effekt af teknologisk forældelse på digitale medier er det således nødvendigt at vedtage og overholde internationale standarder, der regulerer spørgsmål i forbindelse med adoption af software og reducerer afhængigheden af softwareudvikleres opdateringer. Åbne standarder for digital bevaring og arkivering er fastsat af officielle standardiseringsorganer og internationale konsortier, herunder National Digital Stewardship Alliance (NDSA), World Wide Web Consortium (W3C), International Organization for Standardization og International Internet Preservation Consortium (IIPC). NDSA blev grundlagt i 2010 og er et konsortium af organisationer dedikeret til langsigtet bevarelse af digital information. World Wide Web Consortium har været aktivt siden 1994 og er et internationalt samfund, hvis medlemsorganisationer arbejder på at udvikle webstandarder. IIPC blev grundlagt i 2003 på Bibliothèque nationale de France og har adskillige organisationer involveret, herunder National Library of Chile og Library of Congress, der udvikler standarder og værktøjer til webarkivering [82] .
Bevarelsen af digitale materialer kræver betydelige investeringer i den teknologiske infrastruktur, der skal understøtte digitale arkiveringsaktiviteter. For at sikre langsigtet opbevaring af information er det nødvendigt at vælge de anvendte databærere korrekt, hvilket vil give adgang til information i lang tid. For eksempel er brugen af magnetiske og optiske medier siden 2000'erne ikke blevet anset for berettiget. Medieudvælgelseskriterier bør omfatte analyser af spørgsmål såsom forældelse, standardisering, omkostninger. Siden 2010'erne har vedvarende lokale eller cloud-lagringssystemer været populære [82] .
Succesfuld og langsigtet implementering af elektronisk arkiveringspraksis kræver forbedret samarbejde mellem organisationer, teams af fagfolk og skabere af digitale objekter. For at gøre dette er der internationale konsortier, tematiske netværk af organisationer og open source-software - for eksempel Open Journal Systems og DSpace [82] .
Fra et digitalt bevaringssynspunkt er hver e-mail, der består af en header, beskedtekst og vedhæftede filer, en kompleks kommunikationspakke, der indeholder unikt kildemateriale, ofte af potentiel historisk, juridisk og administrativ værdi [96] . Udveksling af e-mails er en væsentlig del af internettrafikken, men det er relativt sjældent at blive en del af elektroniske arkiveringsprogrammer. For eksempel indsamler US Library of Congress et arkiv af offentlige tweets fra hele verden, UK Web Archive, Internet Archive og Internet Memory Foundation har været involveret i at bevare websider og indsamle oplysninger fra websteder; ingen af projekterne indsamler dog oplysninger, der sendes via e-mail [97] . Hovedårsagerne til dette er den potentielle fortrolighed af e-mails, forskelle i e-mailklientformater og manglen på et standardiseret format til lagring af meddelelser [97] [98] [96] .
Der er en række e-mailarkiveringsprojekter:
Fra og med 2012 begyndte Carcanet Press -arkivet , ejet af Manchester University Library , at gemme elektronisk korrespondance med berømte digtere, kritikere, redaktører, oversættere og kunstnere. Carcanet Press Email Preservation Project brugte både traditionelle arkiveringsmetoder og nye standarder for digital bevaring:
Fra 1999 til 2003, som et resultat af samarbejdet mellem Antwerpens byarkiv og det tværfaglige center for jura og informatik ved KU Leuven , var DAVID-projektet aktivt. Formålet med dette projekt var at lave en manual til elektronisk arkivering. Personalet gennemgik juridiske og arkiveringskrav til e-mail-arkivering og pegede på nogle mulige arkiveringsstrategier. Ud over dens teoretiske værdi var rapporten vigtig, efter at den begyndte at implementere praksisser for håndtering af optegnelser og registrering af e-mails og relaterede elektroniske dokumenter [99] .
Smithsonian Institution Archives var blandt de første organisationer, der udviklede praksis for e-mailbevaring. I sine samlinger vedligeholder arkivet e-mail-registre, der går tilbage til 1980'erne og oprettet med ELM . Siden da har Smithsonian brugt en række forskellige e-mail-applikationer og -formater, inklusive PINE, cc:Mail , Lotus Notes , GroupWise og andre applikationer. Smithsonian-ansatte blev beordret til at udskrive elektronisk post til journalføring, som det var praksis på det tidspunkt i andre organisationer og virksomheder. Da der på det tidspunkt praktisk talt ikke var nogen organisationer, der ville arbejde inden for lagring af e-mail-data, blev der i 2005 oprettet et specialiseret projekt i samarbejde med Rockefeller Archive Center - Collaborative Electronic Records Project (CERP). Projektet varede tre år og resulterede i skabelsen af standarder og praksis for arkivering af elektronisk kommunikation [100] [99] .
Siden begyndelsen af 2008 har en arbejdsgruppe arbejdet på Harvard University for at definere strategier for bevarelse af elektroniske meddelelser. I 2015 blev EAS på grundlag af dette lanceret, et partnerskabsprojekt mellem Harvard University Library Office for Information Systems (OIS) og en række kuratororganisationer fra Harvards biblioteksafdelinger [101] . EAS samarbejder med Wordshack for at automatisere datalagringsprocessen. For eksempel sendes e-mail-beskeder og vedhæftede filer, der er valgt til langtidslagring, automatisk til DRS, Harvard University's Electronic Repository Service [101] .
XENA er gratis og open source-software udviklet af National Archives of Australia til langtidsbevaring af elektroniske optegnelser. XENA's hovedfunktion er at bestemme filformatet for digitale poster og konvertere det til det passende format til bevaring baseret på åbne standarder . Xena-softwaren bidrager til digital bevaring ved at udføre to vigtige opgaver: at definere digitale objektfilformater og konvertere dem til åbne formater til bevaring [102] .
Konservering af videospil opnås gennem arkivering af kildekodeudviklinger , digitale kopier af videospil, emulering af spillekonsoller , vedligeholdelse og bevaring af specialiseret videospilhardware og digitalisering af trykte magasiner og bøger til præ - digitale videospil . Bevarelsen af videospil gør det ikke kun muligt at udforske industriens historie, men også at analysere de tekniske og kreative aspekter af produktionen af et bestemt spil [103] .
Teknologien, der blev brugt til at skabe spil, har ændret sig betydeligt siden begyndelsen af 1990'erne, og i mange tilfælde kan datidens originale spil ikke spilles på grund af forældet format [104] . Samtidig blev spil som regel udgivet til en bestemt konsol, hvilket i høj grad komplicerede deres efterfølgende bevarelse [105] . Derfor begyndte der i denne periode at dukke initiativer til at bevare arven fra videospil. Der er etableret spillemuseer, såsom The Strong i New York [106] , Museum of Art and Digital Entertainment i Auckland [107] , Berlin Computer Games Museum [108] , Museum of Soviet Arcade Maskiner i Moskva og St. Petersborg [109] . Video Game History Foundation i USA blev også grundlagt, dedikeret til at bevare ikke kun spil, men også magasiner, manualer og reklamemateriale om emnet. Andre store initiativer omfatter den digitale distributionstjeneste GOG.com og en samling browserbaserede arkadeemulatorer på Internet Archive [105] . Siden 2015 har FN støttet Open Digital Library on Traditional Games-projektet, som har til formål at elektronisk arkivere og beskytte traditionelle indfødte spil gennem katalogisering og opbygning af en fælles database, hvorfra videospil senere vil blive skabt [110] [111] .
Fra midten af 1990'erne begyndte den åbne videnskabsbevægelse at udvikle sig i den videnskabelige verden - flere og flere forskere modsatte sig betalingsmure og de alt for høje omkostninger ved adgang til akademisk litteratur på baggrund af reducerede midler til biblioteker. Et af kravene fra bevægelsens tilhængere var åbningen af adgang til videnskabelige publikationer, hovedsageligt gennem offentliggørelse på internettet [112] [113] . Snart dukkede de første onlinedepoter og elektroniske biblioteker op. Disse omfattede så store projekter som arXiv.org , JSTOR , Public Library of Science (PLoS), BioMed Central [114] . Fra august 2021 viser Directory of Open Access Journals over 15.900 open access-tidsskrifter og over 5 millioner artikler [115] . Samtidig kan logikken i at arkivere videnskabelige publikationer i hvert af projekterne være meget forskellig. For eksempel blev den digitale JSTOR -database oprettet i 1995 for at gemme digitale kopier af trykte magasiner. Databasen omfatter kun de videnskabelige tidsskrifter, hvor publicering sker gennem et peer review -system . Også vigtigt er antallet af organisationer, der abonnerer på dette tidsskrift, og citationsindekset . Arkivering foregår efter princippet om "moving wall" (Moving Wall) - problemstillinger lægges i system fra tidspunktet for tilblivelsen af publikationen og op til 3-5 år til i dag. Indhold sendt til JSTOR er ikke altid i det offentlige domæne og kan være skjult bag betalingsvægge . Adgang til sådanne materialer gives gennem et system af institutionelle abonnementer [116] [117] [118] . Det biomedicinske litteraturarkiv PubMed Central blev oprettet af US National Library of Medicine og blev lanceret i februar 2000. Adgang til materialer udgivet på webstedet er gratis og ubegrænset [119] . Til gengæld, på arXiv.org-portalen, der blev lanceret i 1991, poster forskere uafhængigt fortryk eller frit distribuerede kopier af deres publicerede værker inden for fysik , matematik , astronomi , datalogi og andre eksakte videnskaber. Artikler er ikke peer-reviewed før publicering , men de kontrolleres i første omgang af moderatorer [120] .
Med fremkomsten af elektroniske biblioteker er problemet med langtidslagring af digitale samlinger af videnskabelig litteratur også opstået - at sikre tilgængeligheden af ressourcer for fremtidige generationer kræver en særlig indsats og konstant investering [121] [122] . Open access-materialer krænker generelt ikke ophavsret eller ejendomsrettigheder – biblioteker behøver ikke særlig tilladelse for at bevare dem. For den langsigtede bevaring af open access-litteratur opfordres organisationer til at følge åbne internationale standarder og implementere åbne formater, herunder odt og xml [113] .
Et af hovedproblemerne ved elektronisk arkivering er teknologiernes forældelse - på grund af den hurtige ændring og udvikling af udstyr og softwareformater kan adgangen til elektroniske arkiver gå tabt [27] . Lagermedier bliver i gennemsnit forældede én gang om året, og de erstattes af nye, mere effektive måder at lagre data på og dermed ny hardware og software. Samtidig udgår ældre medieværktøjer. Derudover er lagermedier genstand for fejl og fejl, virusangreb og fysisk nedbrydning [65] . Til elektronisk arkivering opfordres organisationer til at bruge ikke-proprietære, vedvarende formater, der er uafhængige af tredjepartssoftware [123] [124] .
Manglen på ensartet lovgivning, politikker, strategier og bevidsthed inden for elektronisk arkivering komplicerer også praksis med informationsbevaring. For eksempel kan lovgivere ikke være opmærksomme på kravene til elektronisk arkivering, og som følge heraf kan lovgivningen ignorere eller ikke fuldt ud regulere bevarelsen af digitale data. Dette skaber yderligere problemer med hensyn til ophavsret [27] . Intellektuelle ejendomsrettigheder og andre juridiske forpligtelser kan forhindre kopiering, lagring, ændring og brug af indholdet af digitale ressourcer til langtidsbevaring [82] . Spørgsmålet om ophavsret og intellektuelle ejendomsrettigheder til digitale materialer er meget mere komplekst end for traditionelle fysiske materialer. Inden for traditionel arkivering har biblioteket eller arkivet sammen med en fysisk kopi automatisk erhvervet ret til at kopiere og bevare [19] . De fleste elektroniske arkiveringsmetoder kræver dog eksistensen og udøvelsen af enerettigheder til værket, herunder retten til at reproducere [125] . Desuden kan udgivere forbyde kopiering af publikationer ved hjælp af tekniske midler - hvilket er tilladt og forankret i loven om ophavsret, både i USA og i EU. Individuelt materiale kan også have flere ophavsretsindehavere (herunder andre udgivere, forfattere, kunstnere, tredjeparts softwareleverandører), hvilket kan gøre det vanskeligt for udgivere at tildele bevarelsesrettigheder til biblioteker og andre aktører. Men hvis "look and feel" eller funktionalitet af en publikation ændres som følge af kopiering, kan forfattere og skabere føle, at deres rettigheder er blevet krænket, kan det være svært at bevise, at bevarede kopier af publikationer blot er kopier og ikke fuldstændigt nye versioner [126] . Blandt de mulige løsninger på dette problem nævner forskere den potentielle indførelse af licensaftaler, der specifikt præciserer bevaringsbetingelser [127] .
Vanskeligheder omfatter også den menneskelige faktor , computervirus, naturkatastrofer, medie- og softwarefejl [128] [27] .