WebCite

WebCite
WebCite

URL webcitation.org
Site type arkiv
Sprog) engelsk
Ejer University of Toronto
Forfatter Gunther Eysenbach [d]
Begyndelse af arbejdet 2003
Land
 Mediefiler på Wikimedia Commons

WebCite er en webarkiveringstjeneste lanceret i 2003 af Günter Eisenbach fra University of Toronto . WebCite sikrer langsigtet tilgængelighed af URL'er . Tjenesten brugte ikke søgerobotter til at arkivere hele ressourcer og behandlede brugeranmodninger om at gemme individuelle sider. WebCite "fangede" HTML , PDF , CSS , JavaScript , billeder og andre komponenter på en webside.

Siden juli 2019 er WebCite reelt blevet udfaset på grund af mange års økonomiske problemer: Tjenesten accepterer ikke længere anmodninger om arkivering, men fortsætter med at betjene arkiver, der allerede er oprettet. Før dette var tjenesten et af de mest populære værktøjer i sin niche, aktivt brugt af Wikipedia til arkivering af kilder. Siden slutningen af ​​2020 har WebCite været blokeret i Rusland på grund af "propaganda eller narkotikahandel".

Historie

Ideen om at skabe WebCite tilhører Günther Eisenbach , en ansat ved Center for Global eHealth Innovation   ved  University of Toronto . Oprindeligt udtænkte Eisenbach WebCite som en platform, der ikke kun ville spare internetressourcer, men også bestemme deres "citationsindeks" (analogt med impact factor ), der måler antallet af hyperlinks , der fører til et bestemt websted. I 1998 begrundede Eisenbach behovet for en sådan service i sin artikel om internetkvalitetskontrol, offentliggjort i PubMed Central [1] . Samme år blev der igangsat et pilotprojekt af samme navn, som dog ikke blev forlænget - med udvidelsen af ​​anvendelsesområdet for " Internet Archive " og Google Cache , var der ikke et presserende behov for en sådan tjeneste [2 ] .

Eisenbach relancerede WebCite i 2003. Dette var foranlediget af en artikel offentliggjort i Science om udryddelse af referencer i videnskabelige artikler, som indikerede manglen på standardisering inden for elektronisk arkivering [3] . Derudover sparede alle webarkiveringstjenester, der eksisterede på det tidspunkt, ressourcer ved hjælp af søgerobotter (eller webcrawlere), arkivering af websider efter behov var umuligt. WebCite udfyldte denne niche og blev den første platform af sin art til at arkivere sider efter behov fra brugere. Projektpartnerne er Institut for Informationsstudier og University of Toronto Library , samt Internet Archive. Derudover blev der oprettet et non-profit konsortium af samme navn , hvis medlemmer kunne blive redaktioner for videnskabelige tidsskrifter og forlag. I 2008 havde den omkring 200 medlemmer [4] [2] [4] .

Den første gang efter oprettelsen af ​​WebCite blev finansieret af Center for Global eHealth Innovation. Delvis blev tjenestens arbejde betalt af medlemmerne af konsortiet, som skulle arkivere de links, der blev brugt i forfatterens publikationer [5] . Siden 2011 havde WebCite haft finansieringsproblemer, så Eisenbach overvejede at kommercialisere tjenesten. I 2012 blev WebCite tvunget til at forlade International Consortium for the Preservation of the Internet , fordi det ifølge Eisenbachs tweet ikke var i stand til at betale sit årlige medlemskontingent på €4.000 [6] [7] .

I 2013 lancerede Eisenbach en indsamlingskampagne for at modernisere WebCite. Det deklarerede beløb var $25-50 tusinde, det blev antaget, at det også ville dække overførslen af ​​databasen til Amazon EC2 (i 2012 var størrelsen af ​​arkivet 2 terabyte [8] ) og juridisk støtte. Indsamlingen fandt sted på FundRazr- platformen [8] .

Tjenesten blev aktivt brugt i Wikipedias arbejde . Tilbage i juni 2009, på grund af den øgede belastning på serverne forårsaget af arbejdet fra WebCiteBOT- bot i den engelske sektion , var WebCite midlertidigt utilgængelig. Fuld helbredelse tog flere uger [9] . På baggrund af WebCites vedvarende økonomiske vanskeligheder foreslog Wikipedia-redaktørerne i februar 2013, at Wikimedia Foundation skulle tage kontrol over projektet, da det havde arkiveret mere end 500.000 links fra wiki-artikler på det tidspunkt, men alt var begrænset til diskussion af ideen i samfundet [10] . Siden var også midlertidigt utilgængelig i 2013 og 2014 [11] .

Økonomiske vanskeligheder førte til den faktiske lukning af projektet. Fra og med juli 2019 accepterer WebCite ikke nye arkivanmodninger, men understøtter fortsat adgang til allerede oprettede webarkiver [12] [13] .

Sådan virker det

WebCite giver langsigtet tilgængelighed af URL'er arkiveret ved direkte brugeranmodning. Tjenesten er udelukkende baseret på open source-software [14] [2] . Ordet WebCite er et registreret varemærke [15] .

WebCite er blevet mere almindeligt brugt til at gemme statiske websteder . Som mange andre webarkiveringstjenester kunne den ikke fuldt ud gemme komplekse websider med dynamisk indhold [16] .

WebCite gav brugerne tre vigtigste arkiveringsværktøjer. Den første er en speciel formular på webstedet med felter til angivelse af URL og e-mail , som modtog links til en kopi af den ønskede webside. Det andet værktøj er et bogmærke eller et lille JavaScript -program, der er installeret i browseren og giver dig mulighed for at gemme udvalgte websider lige i det øjeblik, de bliver vist på internettet. Den tredje metode, kaldet Comb , var "bulk" arkivering - tjenesten genererede en liste over alle hyperlinks på den angivne side, og brugeren kunne angive de ressourcer, der skulle gemmes. Comb- værktøjet var mest velegnet til at bearbejde store artikler, der var opdelt på flere sider [5] .

Efter at have indtastet URL'en tog WebCite et "snapshot" af siden, gemte en kopi af HTML'en og uploadede billederne (eller andre filer, såsom PDF ) til serveren [4] . Herefter modtog brugerne et brev med to nye links til den angivne e-mail. Den første, længere, indeholdt URL'en på den oprindelige side og datoen for arkivering og kunne bruges i stedet for den oprindelige adresse. Den anden, kortere indeholdt ikke disse oplysninger og blev oftest angivet som supplement til den originale URL. Så WebCite fungerede også som en linkforkorter [ 2] . Hver gemt webside blev også tildelt en unik numerisk identifikator [5] .

Lang og kort version af linket https://webcitation.org/query?url=http://en.wikipedia.org/wiki/Main_Page&date=2008-03-04 http://webcitation.org/5W56XTY5h Arkiveret 16. februar 2012 på Wayback Machine

Besøgende på webstedet kan søge efter dokumenter i WebCite-samlingen ved hjælp af URL'en, datoen siden blev kopieret eller det ID, der er tildelt siden [5] .

Brug

Forfattere, redaktører og udgivere, der er interesserede i at skabe fungerende links til onlinekilder, der kan bruges til citering i akademiske publikationer, har gjort udstrakt brug af WebCite [5] [6] [17] . Arkiveringstjenester blev leveret gratis, men udgivere kunne tilslutte sig konsortiet af samme navn og mod et medlemsgebyr få adgang til den retrospektive arkiveringstjeneste - i dette tilfælde opsatte WebCite søgerobotter til at "kæmme" organisationens artikler mhp. ikke-gemte URL'er. Konsortiets publikationer pålagde også brugen af ​​tjenesten i deres referenceramme og pålagde forfatterne at arkivere alle referencer, der blev brugt via WebCite, før de indsendte manuskripter [18] [14] [19] .

WebCites arbejde var baseret på doktrinen om rimelig brug . Tjenesten betragter arkiverede kopier af sider som transformative værker - offentligt nyttige til videnskabelig forskning og skader ikke markedsværdien af ​​noget ophavsretligt beskyttet værk [4] [5] . Derfor anmodede WebCite ikke om tilladelse til at arkivere en bestemt ressource, men fjernede sider fra offentlig adgang efter anmodning fra copyright-indehavere. Sådanne værker blev placeret i et "mørkt arkiv" ( engelsk  mørkt arkiv ), som man kunne få adgang til mod betaling - 200 $ for 5 sider plus 100 $ for hver efterfølgende 10 sider. Tjenesten fulgte robotundtagelsesstandarden , no-cache og no-archive tags [14] [20] .

I Rusland er webcitation.org- domænet inkluderet i Unified Register of Prohibited Sites . Tjenesten blev tilføjet til registret ved afgørelse fra Indenrigsministeriet den 20. november 2020 med "propaganda eller salg af stoffer" som årsag [21] .

Noter

  1. Diepgen, 1998 .
  2. 1 2 3 4 Eysenbach, 2008 , pp. 378-389.
  3. Going, Going, Gone: Tabte  internetreferencer . Videnskab (31. oktober 2003). Hentet 21. december 2021. Arkiveret fra originalen 22. december 2021.
  4. 1 2 3 4 WebCite® Consortium FAQ  . Webcitat. Hentet 21. december 2021. Arkiveret fra originalen 29. september 2011.
  5. 1 2 3 4 5 6 Alexey Kutovenko. Internet kronikører. Webressource-  cachingtjenester . OSP-vejledning til digitale kommunikationsteknologier (6. november 2011). Hentet 26. december 2021. Arkiveret fra originalen 31. maj 2020.
  6. 12 Ian Milligan . Tre værktøjer til den webkyndige historiker: Memento, Zotero og WebCite . Aktiv historie (7. juli 2014). Hentet 21. december 2021. Arkiveret fra originalen 24. september 2021.  
  7. Twitter-indlæg  ( 11. juni 2012). Hentet 21. december 2021. Arkiveret fra originalen 5. marts 2016.
  8. 1 2 Samtale mellem GiveWell og Webcite den  4/10/13 . Giv godt. Hentet 21. december 2021. Arkiveret fra originalen 20. november 2021.
  9. Gunther Eysenbach  . Twitter. Hentet 27. december 2021. Arkiveret fra originalen 6. juni 2019.
  10. WebCite  . _ Meta - Wikimedia. Hentet 21. december 2021. Arkiveret fra originalen 24. november 2021.
  11. Serviceoppetidsdata gennem hele dens historie er fragmenteret
  12. Fund WebCite (http://www.webcitation.org  ) . FundRz. Hentet: 18. december 2021.
  13. Arkiver nu (archivenow  ) . GitHub. Hentet 20. december 2021. Arkiveret fra originalen 20. december 2021.
  14. 1 2 3 Eysenbach, 2005 .
  15. WebCite juridiske og ophavsretlige  oplysninger . WebCite konsortium. Hentet 16. juni 2009. Arkiveret fra originalen 25. juli 2008.
  16. Matthew Cockerill. Webcite-links giver adgang til arkiverede kopier af linkede  websider . BMC (17. september 2007). Hentet 21. december 2021. Arkiveret fra originalen 31. august 2021.
  17. Alexander Lawrence. Afsløring af skjulte forbindelser med Google Analytics  -id'er . Bellingcat (23. juli 2015). Hentet 21. december 2021. Arkiveret fra originalen 27. oktober 2021.
  18. Mikhail Gorbunov-Posadov. Live udgivelse  (engelsk) . O.S.P. Hentet 26. december 2021. Arkiveret fra originalen 13. juni 2019.
  19. Leighton Walter Kille. Det voksende problem med internettets "link råd" og bedste praksis for medier og onlineudgivere  . Journalistens ressource (9. oktober 2015). Hentet 21. december 2021. Arkiveret fra originalen 10. oktober 2021.
  20. ↑ Politik for anmodninger om fjernelse af WebCite  . internet side. Hentet 27. december 2021. Arkiveret fra originalen 11. december 2021.
  21. Blokeret websted webcitation.org  (eng.) . Rubanlist.com er en liste over forbudte websteder. Hentet 1. januar 2022. Arkiveret fra originalen 3. januar 2022.

Litteratur

Links