WebCite | |
---|---|
WebCite | |
| |
URL | webcitation.org |
Site type | arkiv |
Sprog) | engelsk |
Ejer | University of Toronto |
Forfatter | Gunther Eysenbach [d] |
Begyndelse af arbejdet | 2003 |
Land | |
Mediefiler på Wikimedia Commons |
WebCite er en webarkiveringstjeneste lanceret i 2003 af Günter Eisenbach fra University of Toronto . WebCite sikrer langsigtet tilgængelighed af URL'er . Tjenesten brugte ikke søgerobotter til at arkivere hele ressourcer og behandlede brugeranmodninger om at gemme individuelle sider. WebCite "fangede" HTML , PDF , CSS , JavaScript , billeder og andre komponenter på en webside.
Siden juli 2019 er WebCite reelt blevet udfaset på grund af mange års økonomiske problemer: Tjenesten accepterer ikke længere anmodninger om arkivering, men fortsætter med at betjene arkiver, der allerede er oprettet. Før dette var tjenesten et af de mest populære værktøjer i sin niche, aktivt brugt af Wikipedia til arkivering af kilder. Siden slutningen af 2020 har WebCite været blokeret i Rusland på grund af "propaganda eller narkotikahandel".
Ideen om at skabe WebCite tilhører Günther Eisenbach , en ansat ved Center for Global eHealth Innovation ved University of Toronto . Oprindeligt udtænkte Eisenbach WebCite som en platform, der ikke kun ville spare internetressourcer, men også bestemme deres "citationsindeks" (analogt med impact factor ), der måler antallet af hyperlinks , der fører til et bestemt websted. I 1998 begrundede Eisenbach behovet for en sådan service i sin artikel om internetkvalitetskontrol, offentliggjort i PubMed Central [1] . Samme år blev der igangsat et pilotprojekt af samme navn, som dog ikke blev forlænget - med udvidelsen af anvendelsesområdet for " Internet Archive " og Google Cache , var der ikke et presserende behov for en sådan tjeneste [2 ] .
Eisenbach relancerede WebCite i 2003. Dette var foranlediget af en artikel offentliggjort i Science om udryddelse af referencer i videnskabelige artikler, som indikerede manglen på standardisering inden for elektronisk arkivering [3] . Derudover sparede alle webarkiveringstjenester, der eksisterede på det tidspunkt, ressourcer ved hjælp af søgerobotter (eller webcrawlere), arkivering af websider efter behov var umuligt. WebCite udfyldte denne niche og blev den første platform af sin art til at arkivere sider efter behov fra brugere. Projektpartnerne er Institut for Informationsstudier og University of Toronto Library , samt Internet Archive. Derudover blev der oprettet et non-profit konsortium af samme navn , hvis medlemmer kunne blive redaktioner for videnskabelige tidsskrifter og forlag. I 2008 havde den omkring 200 medlemmer [4] [2] [4] .
Den første gang efter oprettelsen af WebCite blev finansieret af Center for Global eHealth Innovation. Delvis blev tjenestens arbejde betalt af medlemmerne af konsortiet, som skulle arkivere de links, der blev brugt i forfatterens publikationer [5] . Siden 2011 havde WebCite haft finansieringsproblemer, så Eisenbach overvejede at kommercialisere tjenesten. I 2012 blev WebCite tvunget til at forlade International Consortium for the Preservation of the Internet , fordi det ifølge Eisenbachs tweet ikke var i stand til at betale sit årlige medlemskontingent på €4.000 [6] [7] .
I 2013 lancerede Eisenbach en indsamlingskampagne for at modernisere WebCite. Det deklarerede beløb var $25-50 tusinde, det blev antaget, at det også ville dække overførslen af databasen til Amazon EC2 (i 2012 var størrelsen af arkivet 2 terabyte [8] ) og juridisk støtte. Indsamlingen fandt sted på FundRazr- platformen [8] .
Tjenesten blev aktivt brugt i Wikipedias arbejde . Tilbage i juni 2009, på grund af den øgede belastning på serverne forårsaget af arbejdet fra WebCiteBOT- bot i den engelske sektion , var WebCite midlertidigt utilgængelig. Fuld helbredelse tog flere uger [9] . På baggrund af WebCites vedvarende økonomiske vanskeligheder foreslog Wikipedia-redaktørerne i februar 2013, at Wikimedia Foundation skulle tage kontrol over projektet, da det havde arkiveret mere end 500.000 links fra wiki-artikler på det tidspunkt, men alt var begrænset til diskussion af ideen i samfundet [10] . Siden var også midlertidigt utilgængelig i 2013 og 2014 [11] .
Økonomiske vanskeligheder førte til den faktiske lukning af projektet. Fra og med juli 2019 accepterer WebCite ikke nye arkivanmodninger, men understøtter fortsat adgang til allerede oprettede webarkiver [12] [13] .
WebCite giver langsigtet tilgængelighed af URL'er arkiveret ved direkte brugeranmodning. Tjenesten er udelukkende baseret på open source-software [14] [2] . Ordet WebCite er et registreret varemærke [15] .
WebCite er blevet mere almindeligt brugt til at gemme statiske websteder . Som mange andre webarkiveringstjenester kunne den ikke fuldt ud gemme komplekse websider med dynamisk indhold [16] .
WebCite gav brugerne tre vigtigste arkiveringsværktøjer. Den første er en speciel formular på webstedet med felter til angivelse af URL og e-mail , som modtog links til en kopi af den ønskede webside. Det andet værktøj er et bogmærke eller et lille JavaScript -program, der er installeret i browseren og giver dig mulighed for at gemme udvalgte websider lige i det øjeblik, de bliver vist på internettet. Den tredje metode, kaldet Comb , var "bulk" arkivering - tjenesten genererede en liste over alle hyperlinks på den angivne side, og brugeren kunne angive de ressourcer, der skulle gemmes. Comb- værktøjet var mest velegnet til at bearbejde store artikler, der var opdelt på flere sider [5] .
Efter at have indtastet URL'en tog WebCite et "snapshot" af siden, gemte en kopi af HTML'en og uploadede billederne (eller andre filer, såsom PDF ) til serveren [4] . Herefter modtog brugerne et brev med to nye links til den angivne e-mail. Den første, længere, indeholdt URL'en på den oprindelige side og datoen for arkivering og kunne bruges i stedet for den oprindelige adresse. Den anden, kortere indeholdt ikke disse oplysninger og blev oftest angivet som supplement til den originale URL. Så WebCite fungerede også som en linkforkorter [ 2] . Hver gemt webside blev også tildelt en unik numerisk identifikator [5] .
Lang og kort version af linket https://webcitation.org/query?url=http://en.wikipedia.org/wiki/Main_Page&date=2008-03-04 http://webcitation.org/5W56XTY5h Arkiveret 16. februar 2012 på Wayback MachineBesøgende på webstedet kan søge efter dokumenter i WebCite-samlingen ved hjælp af URL'en, datoen siden blev kopieret eller det ID, der er tildelt siden [5] .
Forfattere, redaktører og udgivere, der er interesserede i at skabe fungerende links til onlinekilder, der kan bruges til citering i akademiske publikationer, har gjort udstrakt brug af WebCite [5] [6] [17] . Arkiveringstjenester blev leveret gratis, men udgivere kunne tilslutte sig konsortiet af samme navn og mod et medlemsgebyr få adgang til den retrospektive arkiveringstjeneste - i dette tilfælde opsatte WebCite søgerobotter til at "kæmme" organisationens artikler mhp. ikke-gemte URL'er. Konsortiets publikationer pålagde også brugen af tjenesten i deres referenceramme og pålagde forfatterne at arkivere alle referencer, der blev brugt via WebCite, før de indsendte manuskripter [18] [14] [19] .
WebCites arbejde var baseret på doktrinen om rimelig brug . Tjenesten betragter arkiverede kopier af sider som transformative værker - offentligt nyttige til videnskabelig forskning og skader ikke markedsværdien af noget ophavsretligt beskyttet værk [4] [5] . Derfor anmodede WebCite ikke om tilladelse til at arkivere en bestemt ressource, men fjernede sider fra offentlig adgang efter anmodning fra copyright-indehavere. Sådanne værker blev placeret i et "mørkt arkiv" ( engelsk mørkt arkiv ), som man kunne få adgang til mod betaling - 200 $ for 5 sider plus 100 $ for hver efterfølgende 10 sider. Tjenesten fulgte robotundtagelsesstandarden , no-cache og no-archive tags [14] [20] .
I Rusland er webcitation.org- domænet inkluderet i Unified Register of Prohibited Sites . Tjenesten blev tilføjet til registret ved afgørelse fra Indenrigsministeriet den 20. november 2020 med "propaganda eller salg af stoffer" som årsag [21] .