Distribuerede korrekturlæsere

Distribuerede korrekturlæsere (fra  engelsk  -  “Distribuerede korrekturlæsere”) er et webprojekt til digitalisering af bøger til Gutenberg-projektet . Tanken bag projektet er, at en masse frivillige arbejder sammen om at skabe e-bøger, fra scanningsstadiet til at lægge den færdige tekst ud på Project Gutenbergs hjemmeside.

Projektet blev oprettet i 2000 , siden da er kataloget over Gutenberg-projektet blevet genopfyldt med mere end 15 tusind bøger [1] . Dette antal stiger i gennemsnit med 150-200 bøger om måneden. Hver dag går den første fase af korrekturlæsningen gennem mere end 2 tusinde sider.

Af historiske årsager understøtter siden ikke Unicode , så antallet af sprog, som bøger digitaliseres på som en del af projektet, er stærkt begrænset. Fra april 2009 er listen over sprog som følger:

Bøger på nogle andre sprog, herunder slavisk, håndteres af Distributed Proofreaders Europe -projektet , som vedligeholder Unicode.

Stadier af oprettelse af bøger

I første fase scannes og genkendes bøger, der ikke er beskyttet af ophavsret [2] . En ganske betydelig del af bøgerne kommer ind i projektet og går uden om scanningsfasen - fra Internet Archive , Google Books og andre lignende kilder.

Som følge af genkendelse opnås en tekst, der som udgangspunkt indeholder et vist antal genkendelsesfejl ( engelsk  scannos ). I den forbindelse gennemgår teksten en korrekturlæsningsprocedure i tre trin , hvor korrekturlæseren både ser billedet modtaget fra scanneren og den aktuelle version af teksten på skærmen.

Bogen gennemgår herefter en formateringsproces i to trin, hvor man som i det foregående trin har højeste prioritet til at holde teksten så tæt på forfatterens version som muligt.

Den formaterede tekst gennemgår den såkaldte efterbehandling og derefter den endelige verifikation. Herefter anses bogen for at være klar til upload på Project Gutenbergs hjemmeside. [3]

Noter

  1. DP: Fuldførte guld-e-tekster . Hentet 29. april 2009. Arkiveret fra originalen 19. april 2009.
  2. Som regel - med udløbet ophavsret i henhold til amerikansk lovgivning.
  3. Eller en hvilken som helst anden. Ifølge begge projekters ideologi er bøgerne frit tilgængelige.

Links