Dbpedia

Dbpedia
URL dbpedia.org
Kommerciel Ingen
Site type vidensbase , onlinedatabase [d] , database afledt af Wikimedia-projekter [d] og vidensgraf [d]
Sprog) Scala , Java , Virtuoso Server Pages
Programmeringssprog Java og Scala
Ejer Universitetet i Leipzig og Universitetet i Mannheim
Forfatter University of Leipzig , University of Mannheim og Hasso Platner Institute [d]
Begyndelse af arbejdet 10. januar 2007
 Mediefiler på Wikimedia Commons

DBpedia  er et crowdsourced projekt, der har til formål at udtrække struktureret information fra data skabt af Wikipedia - projektet og udgive det som datasæt , der er tilgængelige under en gratis licens . Projektet er blevet citeret af Tim Berners-Lee som en af ​​de bedst kendte implementeringer af konceptet forbundet data [1] .

Projektet blev startet af en gruppe frivillige fra det frie universitet i Berlin og universitetet i Leipzig i samarbejde med OpenLink Software , med det første datasæt offentliggjort i 2007 . Siden 2012 har University of Mannheim været en aktiv deltager i projektet .

Databaser

Fra april 2016 beskriver DBpedia-databaser mere end 6 millioner koncepter, hvoraf 5,2 millioner er klassificeret i henhold til ontologien , herunder 1,5 millioner personligheder, 810 tusinde geografiske objekter, 135 tusinde musikalbum, 106 tusind film, 20.000 videospil, 275.000 organisationer , 201.000 taxa og 5.000 sygdomme. DBpedia indeholder 38 millioner tags og annoteringer på 125 sprog; 25,2 millioner links til billeder og 29,8 millioner links til eksterne websider; 50 millioner eksterne links til andre RDF- databaser , 80,9 millioner Wikipedia-kategorier.

Projektet bruger Resource Description Framework (RDF) til at repræsentere udvundet information, pr. september 2014 består baserne af mere end 9,5 milliarder RDF-tripler, hvoraf 1,3 milliarder er taget fra den engelske Wikipedia og 5,0 milliarder er udtrukket fra sektioner om andre sprog .

Et af problemerne ved at udtrække information fra Wikipedia er, at de samme begreber kan udtrykkes i skabeloner på forskellige måder, for eksempel kan begrebet "fødselssted" formuleres på engelsk som "fødselssted" og som "fødselssted". På grund af denne tvetydighed passerer forespørgslen gennem begge muligheder for at opnå et mere pålideligt resultat. For at lette søgningen og samtidig reducere antallet af synonymer, blev der udviklet et særligt sprog - DBpedia Mapping Language, og DBpedia-brugere har mulighed for at forbedre kvaliteten af ​​dataudtræk ved hjælp af Mapping-tjenesten.

Eksempel

DBpedia udtrækker faktuelle oplysninger fra Wikipedia-sider, hvilket giver brugerne mulighed for at finde svar på spørgsmål i situationer, hvor den nødvendige information findes i flere forskellige Wikipedia-artikler. For at finde alle værkerne af manga- illustratoren Tokyo Mew Mew , er det for eksempel muligt at udføre følgende SPARQL- forespørgsel [2] :

PREFIX dbprop : < http : // dbpedia . org / property /> PREFIX db : < http : // dbpedia . org / ressource /> VÆLG ? hvem ? arbejde ? genre HVOR { db : Tokyo_Mew_Mew dbprop : illustrator ? hvem . ? arbejde dbprop : forfatter ? hvem . VALGFRI { ? arbejde dbprop : genre ? genre } . }

Noter

  1. Afskrift: Sir Tim Berners-Lee taler med Talis om det semantiske web Arkiveret 10. maj 2013.
  2. [1] Arkiveret 29. juli 2020 på Wayback Machine  - anmodning om SPARQL til DBPedia