Dbpedia | |
---|---|
URL | dbpedia.org _ |
Kommerciel | Ingen |
Site type | vidensbase , onlinedatabase [d] , database afledt af Wikimedia-projekter [d] og vidensgraf [d] |
Sprog) | Scala , Java , Virtuoso Server Pages |
Programmeringssprog | Java og Scala |
Ejer | Universitetet i Leipzig og Universitetet i Mannheim |
Forfatter | University of Leipzig , University of Mannheim og Hasso Platner Institute [d] |
Begyndelse af arbejdet | 10. januar 2007 |
Mediefiler på Wikimedia Commons |
DBpedia er et crowdsourced projekt, der har til formål at udtrække struktureret information fra data skabt af Wikipedia - projektet og udgive det som datasæt , der er tilgængelige under en gratis licens . Projektet er blevet citeret af Tim Berners-Lee som en af de bedst kendte implementeringer af konceptet forbundet data [1] .
Projektet blev startet af en gruppe frivillige fra det frie universitet i Berlin og universitetet i Leipzig i samarbejde med OpenLink Software , med det første datasæt offentliggjort i 2007 . Siden 2012 har University of Mannheim været en aktiv deltager i projektet .
Fra april 2016 beskriver DBpedia-databaser mere end 6 millioner koncepter, hvoraf 5,2 millioner er klassificeret i henhold til ontologien , herunder 1,5 millioner personligheder, 810 tusinde geografiske objekter, 135 tusinde musikalbum, 106 tusind film, 20.000 videospil, 275.000 organisationer , 201.000 taxa og 5.000 sygdomme. DBpedia indeholder 38 millioner tags og annoteringer på 125 sprog; 25,2 millioner links til billeder og 29,8 millioner links til eksterne websider; 50 millioner eksterne links til andre RDF- databaser , 80,9 millioner Wikipedia-kategorier.
Projektet bruger Resource Description Framework (RDF) til at repræsentere udvundet information, pr. september 2014 består baserne af mere end 9,5 milliarder RDF-tripler, hvoraf 1,3 milliarder er taget fra den engelske Wikipedia og 5,0 milliarder er udtrukket fra sektioner om andre sprog .
Et af problemerne ved at udtrække information fra Wikipedia er, at de samme begreber kan udtrykkes i skabeloner på forskellige måder, for eksempel kan begrebet "fødselssted" formuleres på engelsk som "fødselssted" og som "fødselssted". På grund af denne tvetydighed passerer forespørgslen gennem begge muligheder for at opnå et mere pålideligt resultat. For at lette søgningen og samtidig reducere antallet af synonymer, blev der udviklet et særligt sprog - DBpedia Mapping Language, og DBpedia-brugere har mulighed for at forbedre kvaliteten af dataudtræk ved hjælp af Mapping-tjenesten.
DBpedia udtrækker faktuelle oplysninger fra Wikipedia-sider, hvilket giver brugerne mulighed for at finde svar på spørgsmål i situationer, hvor den nødvendige information findes i flere forskellige Wikipedia-artikler. For at finde alle værkerne af manga- illustratoren Tokyo Mew Mew , er det for eksempel muligt at udføre følgende SPARQL- forespørgsel [2] :
PREFIX dbprop : < http : // dbpedia . org / property /> PREFIX db : < http : // dbpedia . org / ressource /> VÆLG ? hvem ? arbejde ? genre HVOR { db : Tokyo_Mew_Mew dbprop : illustrator ? hvem . ? arbejde dbprop : forfatter ? hvem . VALGFRI { ? arbejde dbprop : genre ? genre } . }Wikipedia | |
---|---|
Hovedartikler |
|
Mennesker | |
Udviklinger |
|
Kritik |