PURL

PURL ( Persistent Uniform Resource Locator ) er en permanent ensartet locator (locator) af en ressource .  På engelsk manér udtales det som [ purl ], den russiske udtale har endnu ikke lagt sig fast, det bliver sandsynligvis [ pu-er-el ]. PURL-formatet er baseret på URL'en , en standardiseret måde at registrere adressen på en ressource på internettet . PURL er en permanent ressourcefinder, der (i modsætning til en normal URL) ikke kan ændres.

Hovedidé

Peg-og-klik- formsproget på World Wide Web har gjort websurfing til en nem og fornøjelig oplevelse. Men ganske ofte støder brugeren på en 404: "Document Not Found" fejlmeddelelse. Denne fejl opstår, når den anmodede ressource er blevet flyttet, slettet, omstruktureret, omdøbt, eller der er foretaget ændringer i webserverens konfiguration eller serverens filsystem . Internetressourcernes uforudsigelige mobilitet er et enormt problem, især for digitale biblioteker, kataloger, ordbøger og encyklopædier. Og synderen er selve begreberne URL og DNS , som mangler fleksibilitet, hvor det er nødvendigt og helt får det, hvor det ikke er nødvendigt.

Ressourcer på World Wide Web og internettet flyttes, DNS - domæner genregistreres, og URL- links forbliver, hvilket peger på ressourcer, der ikke længere er der. En fælles løsning på disse problemer kan være udviklingen af ​​ensartede ressourcenavne URN ( eng.  Uniform Resource Names ). IETF ( Internet  Engineering Task Force ) har arbejdet på URN i nogen tid , men resultatet er endnu ikke opnået. Der er for mange interessenter involveret i URN-standardisering, og det vil være svært for dem alle at nå til enighed. I mellemtiden har tusindvis af biblioteker, kataloger, ordbøger og encyklopædier rundt om i verden brug for øjeblikkelige løsninger på disse problemer. Og det er her, PURL-projektet kommer i spil.

I deres funktionalitet er PURL'er de samme URL'er, men de peger ikke på en specifik placering af ressourcen, men til en post i PURL-databasen, hvor en specifik ressource-URL allerede er registreret. Ved adgang til PURL finder serveren den nødvendige indgang i denne database og omdirigerer (via standard " HTTP - omdirigering") anmodningen til en specifik ressourceplacering. Hvis adressen på ressourcen ændres, er der ingen grund til at rette alle de utallige referencer til den - bare skift indgangen (specifik adresse) i databasen, og PURL forbliver fuldstændig uændret. Således opnås vedholdenheden af ​​ressourcens eksterne adresse.

Eksempel. Lad os sige, at følgende PURL er registreret:

http://purl.russian-books.com/WarAndPeace/

Denne PURL peger (via et databaselink) til en URL som denne:

http://din.web.server/din/web/root/

Så, hvis en anmodning til PURL følger dette link:

http://purl.russian-books.com/WarAndPeace/chapter12.html

Serveren omdirigerer automatisk anmodningen til:

http://din.web.server/din/web/root/kapitel12.html

Som du kan se fra eksemplet, er alt meget enkelt og effektivt. Denne mekanisme er beslægtet med Wikipedias omdirigeringer .

Struktur PURL

I sin grundlæggende form er PURL næsten det samme som almindelige URL'er:

http://purl.oclc.org/OCLC/PURL/FAQ -------------- -------------------- / | \ protokolserver med DB PURL-navn

Tegnene '#' og '~' kan ikke bruges i PURL.

Ressourceadgangsskemaet ser sådan ud:

+-------+ PURL +----------+ | | ------------>> | | | | | PURL | | K | URL | SERVER | | L | <<------------ | | | Og | +----------+ | E | URL +----------+ | H | ------------>> | | | T | | SERVER | | | RESSOURCE | RESSOURCE | | | <<------------ | | +-------+ +----------+

Ordningen er ikke uden fejl, et ekstra led i denne kæde skaber yderligere netværkstrafik og belaster netværket. Men behandlingshastigheden for PURL er stadig meget høj - for eksempel tilbage i 1996 kunne en enkeltprocessor- filserver "Sun4", der betjener en PURL-database med 500.000 poster, omdirigere 50 anmodninger i sekundet. Og der er intet at sige om moderne kraftfulde servere. Der kan trods alt gå lang tid, før URN-specifikationen frigives, og denne ordning tilbyder en nem løsning lige nu. Denne vidunderlige innovation er endnu ikke populær nok og ikke standardiseret på et højt niveau. Men alle kan bruge PURL lige nu og gratis.

En anden god nyhed er, at PURL er formatkompatibel med den kommende URN-specifikation . Så der vil ikke være endnu en smertefuld kardinalovergang. Indførelsen af ​​den internationale standard IRI vil tilsyneladende heller ikke skade PURL. Derudover er al serversoftwaren til PURL-projektet open source, kildekoderne er offentligt tilgængelige.

Historie og perspektiver

PURL-projektet blev udviklet, lanceret i januar 1996 og understøttes nu af Online Computer Library Center , Inc. , OCLC .  Det er en stor non-profit organisation, hvis computere forbinder mere end 21.000 biblioteker i 63 lande rundt om i verden. OCLC er også engageret i forskning og teknisk udvikling inden for digitale biblioteker.

PURL-servernes modstandsdygtighed er tæt på DNS-servernes modstandsdygtighed, så dem der gerne vil tabe sig lidt, hvis de vil flytte fra et betalt DNS-domæne til et gratis underdomæne i PURL-systemet. Faktum er, at hvis en person stopper med at betale for et DNS-domæne, vil hans domæne blive fjernet fra DNS-serverens databaser og kan endda blive tilbagekøbt af en anden person. Men den permanente PURL-locator vil ikke gå nogen steder og vil eksistere, indtil selve PURL-projektet lukker - og dette vil tilsyneladende ikke ske ret hurtigt (trods alt er OCLC en meget solid og stabil organisation).

PURL-ordningen er af de ovenfor beskrevne årsager formentlig ikke egnet til de fleste store virksomheder. Men hundredvis af biblioteker, kataloger, ordbøger, opslagsværker, encyklopædier og andre ressourcer rundt om i verden er allerede begyndt at bruge PURL-systemet. PURL-systemet er fantastisk til videnskabelige og forskningsorganisationer, såvel som for almennyttige fonde og offentlige foreninger. Der er allerede personer blandt brugerne.

Se også

Noter

Links