Projekt Gutenberg | |
---|---|
engelsk Projekt Gutenberg | |
URL | gutenberg.org |
Kommerciel | Ikke |
Site type | Digitalt bibliotek |
Registrering | er ledig |
Sprog) | engelsk |
Ejer | Projekt Gutenberg |
Forfatter | Michael Hart |
Begyndelse af arbejdet | 1971 |
Nuværende status | arbejder |
Land | |
Mediefiler på Wikimedia Commons |
Project Gutenberg ( engelsk Project Gutenberg , eller PG ) er et offentligt non-profit initiativ, der har til formål at skabe og distribuere en digital samling af værker i det offentlige domæne . Gutenberg betragtes som det ældste digitale bibliotek i verden. De fleste af værkerne er blevet digitaliseret af frivillige og kan downloades gratis.
Projektet blev oprettet den 4. juli 1971, da University of Illinois -studerende Michael Hart håndskrev teksten til den amerikanske uafhængighedserklæring og sendte den til andre brugere af hans netværk, på det tidspunkt bestående af 15 noder i ARPANET - stamfader til internettet [1] [2] . I løbet af de næste 20 år genoptrykte Hart omkring 100 bøger. Med internettets udbredelse i begyndelsen af 1990'erne gik universitetsfrivillige og allerede i 2000'erne de distribuerede korrekturlæsere med i digitaliseringen af værker . Hart varetog administrativt arbejde og fundraising for at holde hjemmesiden kørende. I 1997 var antallet af værker i samlingen 1000, i 2003 - 10.000 , i 2011 - 40.000 . For 2021 har projektet over 60.000 bøger i sin samling [1] .
Alle elektroniske tekster er digitaliseret i 7-bit American Standard ASCII -kode kaldet Plain Vanilla. Dette format kan læses på enhver enhed og er kompatibelt med 99 % af enhver software. For bøger med accenttegn, såsom dem på tysk og fransk, skaber Project Gutenberg også en 7-bit ASCII-version med accenter [3] . Ud over Plain Vanilla ASCII bruger Gutenberg andre formater, herunder HTML , XML , RTF , Unicode [3] .
Den formelle dato for oprettelsen af projektet er den 4. juli 1971, da en studerende ved University of Illinois, Michael Hart , manuelt genindskrev teksten i den amerikanske uafhængighedserklæring og sendte den til andre brugere af ARPANET -netværket , som bestod af 15 noder og omkring 100 registrerede brugere [2] . På det tidspunkt ville afsendelse af en 5 kilobyte fil have forårsaget et netværksudfald, så Hart sendte en digital tekstlagringsplacering ud, hvorefter den blev downloadet af seks brugere [3] [4] .
Implementeringen af projektet blev mulig på grund af det faktum, at Hart fik muligheden for at arbejde med Xerox Sigma 5 - mainframen - senere mente skaberen af projektet, at den computertid, der blev tildelt ham, var værd cirka 100 millioner dollars . Den studerende ønskede at bruge denne tid på et "værdigt" projekt, men han var ikke tiltrukket af databehandling - hovedområdet for computere på det tidspunkt [5] [6] .
Fra et skriftligt interview med Michael Hart [4]Jeg stoppede ved et uheld undervejs ved vores lokale IGA-købmand. Fejringen af Amerikas 200- års jubilæum var lige ved at finde sted , og sammen med produkterne lagde de historiske dokumenter lavet af kunstigt pergament til mig. Så mens jeg rodede i min rygsæk efter noget at spise, fandt jeg den amerikanske uafhængighedserklæring, og en idé dukkede op i mit hoved. I et stykke tid spekulerede jeg på, om jeg kunne finde på noget, jeg kunne gøre med en computer, der ville være vigtigere end at udstede uafhængighedserklæringen - noget, der stadig ville være der om 100 år. Jeg kunne dog ikke komme i tanke om noget, og Project Gutenberg blev født.
Hart kaldes "den første informationsudbyder" for at begynde at forstå nettet som en ny type massemedier næsten 20 år før Tim Berners-Lee formulerede konceptet om World Wide Web [7] . Uafhængighedserklæringen var den første e-bog i verden [4] . Efterfølgende begyndte Hart at søge efter og digitalisere biblioteksbøger, der allerede var offentligt tilgængelige . Dybest set var disse grundlæggende værker for USA's historie - Bill of Rights , forfatningen , King James Bible , The Complete Works of William Shakespeare , " Alice in Wonderland " af Lewis Carroll , " Peter Pan " af James Barry og andre værker. Alle disse bøger blev digitaliseret i hånden, maskinskrevet af Hart og frivillige [8] [7] [3] [9] .
Filosofien i projektet er baseret på troen på, at den største værdi af computerteknologi ligger i bevarelse og formidling af information. Det oprindelige mål med projektet var at digitalisere de 10.000 mest populære bøger [10] .
Med udviklingen og den udbredte introduktion af internettet i slutningen af 1980'erne opnåede projektet stor popularitet. I 1990 blev der oprettet en frivillig cirkel ved University of Illinois for at hjælpe Hart med at skrive tekster. Hastigheden på deres arbejde steg gradvist, og i 1995 blev samlingen af projektet genopfyldt med et gennemsnit på 16 tekster om måneden. Samtidig blev optisk tegngenkendelsesteknologi introduceret . I 1990'erne blev projektets første hjemmeside oprettet, og der blev lavet en aftale med Carnegie Mellon University i Pittsburgh om at overtage projektets økonomi [7] .
I begyndelsen af 2000'erne begyndte Distributed Proofreaders- bevægelsen, dannet af Charles Franks i 2000, at hjælpe projektet . Mere end tusinde frivillige i flere lande arbejdede på at producere og poste onlinetekster i det offentlige domæne, som havde en betydelig kulturel betydning. Takket være dette samarbejde modtog Gutenberg-kataloget for 2017 fra 150 til 200 bøger om måneden [7] . Til sammenligning tilføjede Project Gutenberg i de første 11 uger af 2004 313 nye e-bøger, mens de første 313 e-bøger tog cirka 26 år at færdiggøre [4] . I foråret 2002 indeholdt projektets samling næsten en fjerdedel af alle offentlige værker, der var tilgængelige på internettet [3] . Allerede i oktober 2003 havde projektet 10.000 e-bøger [11] .
I 2007 udviklede og lancerede Wattpad og Gutenberg et projekt sammen, der gjorde 17.000 bøger tilgængelige til download på de fleste mobiltelefoner [12] .
I begyndelsen af 2000'erne forsøgte Michael Hart sammen med grundlæggeren af World eBook Library, John Guallardo, at lancere Project Gutenberg 2. Initiativet blev dog ikke gennemført, fordi projektet involverede betalte downloads af individuelle værker, hvilket ikke vakte begejstring blandt brugere [10] .
Hart døde i 2011. For 2021 var den administrerende direktør for projektet Gregory Newby [13] [14] .
Projektet beskæftiger sig med digitalisering af offentligt tilgængelige værker. Processen med at genopfylde samlingen udføres i tre hovedfaser - gennem scanning, genkendelse og korrektion. Efter at have løst problemet med værkets juridiske status og dets licenserede renhed, scanner projektdeltagerne dokumentet og kører det optiske tegngenkendelsesprogram . Frivillige kontrollerer, genlæser og retter derefter teksten og sammenligner den med både den scannede version og den originale side. I gennemsnit, selv med forbedret OCR-software, finder frivillige omkring 10 fejl pr. side. Hver bog bliver gennemgået af to forskellige frivillige, som foretager de nødvendige rettelser. Hvis originalværket er i dårlig stand, hvilket ofte sker med gamle bøger, indtastes teksten manuelt. Projektpersonalet er overbevist om, at stadiet med korrektion af mennesker er et af de vigtigste, eftersom blot at scanne værket og placere det i det offentlige domæne ikke tillader søgning gennem teksterne [3] [15] . I gennemsnit tager det omkring 50 timer at arbejde på én tekst [3] .
Alle elektroniske tekster er digitaliseret i 7-bit American Standard ASCII -kode kaldet Plain Vanilla. Dette format kan læses på enhver enhed og er kompatibelt med 99 % af enhver software. For bøger med accenttegn, såsom dem på tysk og fransk, skaber Project Gutenberg også en 7-bit ASCII-version med accenter [3] . Ud over Plain Vanilla ASCII bruger Gutenberg andre formater, herunder HTML , XML , RTF , Unicode [3] .
Vi ser e-bøger som et nyt medie, der ikke har nogen reel relation til papir, bortset fra at præsentere det samme indhold. Jeg kan dog ikke se, hvordan papir kan konkurrere med elektroniske versioner, især hvis alle finder deres egen bekvemme måde at bruge elektroniske tekster på, især i skolerne.Michael Hart [3]
Med tekstgenkendelse kan brugere søge i litteraturen med en søgefunktion, der er tilgængelig i enhver browser og enhver tekstbehandlingssoftware. I den avancerede søgning kan du udfylde flere felter: forfatter, titel, emne, sprog, kategori (enhver, lydbog, musik, billeder), LoCC ( Library of Congress katalogklassificering ), filtype (tekst, PDF, HTML, XML , JPEG osv.) e.) og nummeret på den elektroniske tekst/e-bog [3] . Der kræves ingen gebyr eller registrering for at læse online eller downloade værket [10] .
Portalserverne er placeret og registreret i USA. Af denne grund bruges amerikansk lovgivning til at bestemme copyright . Ophavsretsloven er dog fragmenteret og kan variere betydeligt afhængigt af jurisdiktion. Dette kan resultere i, at en bog i USA er ophavsretligt beskyttet i et andet land. Portalen beskriver specifikt "brugervilkår", som specificerer, at brugere uden for USA skal tjekke ophavsretsbetingelserne i deres lande, før de downloader eller distribuerer e-bøger fra projektet [16] .
LåseI 2015 blev der anlagt sag mod projektet i Tyskland på grund af manglende overholdelse af ophavsretten i forhold til 18 tyske udgivelser i bibliotekets samling, som var frit tilgængelige i USA, men samtidig var beskyttet af ophavsret i Tyskland [16] . Sagen blev anlagt på vegne af forlagene S. Fischer Verlag og GmbH., ejet af Holtzbrinck Publishing Group [17] . Den 9. februar 2018 afgjorde en tysk domstol, at Gutenberg skal spærre adgangen til 18 værker, give en liste over brugere, der har uploadet disse værker, og betale en del af sagsøgerens sagsomkostninger. Som svar blokerede webstedet midlertidigt alle IP-adresser fra Tyskland [18] [19] .
I 2020 blev Project Gutenberg blokeret af internetudbydere i Italien efter påstande om krænkelse af ophavsretten [20] .
År | Digitaliserede bøger |
---|---|
1997 | 1000 |
1999 | 2000 |
2000 | 3000 |
2001 | 4000 |
2002 | 5000 |
2003 | 10.000 |
2005 | 15.000 |
2008 | 24.000 |
2009 | 34.000 |
2015 | 48.000 |
2018 | 56.000 |
2021 | 60.000 |
Fra 1991 til 1996 blev antallet af publicerede værker cirka fordoblet. Udover at digitalisere bøgerne begyndte Michael Hart at koordinere arbejdet for snesevis af frivillige [3] . I august 1998 satte Hart sig som mål at lægge omkring 10.000 elektroniske tekster på nettet, og i oktober 2003 havde han nået det. Næste mål var digitaliseringen af 1.000.000 værker [3] .
I 1993 blev samlingen opdelt i tre hovedkategorier: "let litteratur" (mest skønlitteratur); "tung litteratur" såsom Bibelen , Shakespeare eller Moby Dick ; samt "referencelitteratur" - Rogers synonymordbog , samt et sæt leksika og ordbøger [3] [9] .
I januar 2005 omfattede projektets samling 15.000 e-bøger, og i 2015 mere end 49.200 gratis e-bøger, som alle tidligere var udgivet på prestigefyldte forlag [10] .
Da projektet er baseret i USA, var det oprindeligt rettet mod den engelsktalende offentlighed og digitaliserede bøger udelukkende på engelsk. Siden oktober 1997 har Hart imidlertid besluttet at udvide samlingen og frigive e-bøger på andre sprog, hovedsageligt på engelsk, fransk, tysk, spansk, finsk, hollandsk og kinesisk [3] . Allerede i 2004 blev samlingens værker præsenteret på 25 sprog, og i juli 2005 - på 42, inklusive Iroquois , Sanskrit , Maya -sprog [3] .
I april 1995 dukkede de første billeder op i Gutenberg-samlingen - franske hulemalerier , som i november 2000 blev tilgængelige for offentligheden i XHTML -format [3] .
CD og DVDI august 2003 udgav Gutenberg cd'en "Best of Gutenberg" med 600 af de mest populære værker i bibliotekets samling. I december 2003 blev DVD'en "Project Gutenberg" kompileret med 9.400 titler - hvilket på det tidspunkt udgjorde næsten hele samlingen af "Gutenberg". I juli 2007 udkom en ny DVD-version med 17.000 bøger, og i april 2010 udkom en opdateret dobbeltlags-DVD med 30.000 værker. Brugere kunne downloade ISO-billeder eller anmode om en gratis kopi via mail. I oktober 2010 har projektet udsendt omkring 40.000 skiver. For 2021 er ISO-billeder tilgængelige til download, men gratis CD-forsendelse er udgået [21] [22] .
Projektets samling anses for at være verdens ældste elektroniske bibliotek, og Michael Hart er skaberen af den første digitale bog [3] [9] . Biblioteket fungerede som prototype for en række andre projekter, herunder [23] [3] :
Gutenberg samarbejder også med Internet Archive og LibriVox [31] .
En række initiativer er allerede afsluttet - Project Gutenberg i Filippinerne, Project Europe, drevet af det serbiske Rastko-projekt, Project Gutenberg Rusland (også kaldet "Rutenberg" efter Ruslands middelalderlige europæiske navn for Ruthenia ), Project Gutenberg i Taiwan , tilsyn med en samling af e-bøger på engelsk og kinesisk [32] [3] .
I 2016 blev en Android- applikation udgivet baseret på Gutenberg-samlingen [33] .
Separate projekter beskæftiger sig med konvertering af værker digitaliseret af projektet til andre elektroniske formater. Blackmask Online konverterer således værker i otte forskellige formater baseret på Open eBook . Manybooks.net har konverteret projektets e-bøger til PDA -læsbare formater . Bookshare , det førende digitale bibliotek for synshandicappede i USA, konverterer bøger til blindeskrift og DAISY [3] . Mange tekster bruges af LibriVox- projektet til at skabe lydbøger [34] .
![]() | ||||
---|---|---|---|---|
Tematiske steder | ||||
Ordbøger og encyklopædier | ||||
|
enheder og dokumenter ) | E-bøger (|
---|---|
Enhedsserie | |
Filformater | |
Kataloger | |
Biblioteker | |
se også |