Korankorpus af arabisk | |
---|---|
URL | corpus.quran.com |
Kommerciel | GNU General Public License |
Site type | korpus af tekster |
Sprog) | Arabisk / engelsk |
Serverplacering | Storbritanien |
Ejer | Leeds Universitet |
Begyndelse af arbejdet | 2009 |
Nuværende status | virker og udvikler sig |
The Arabic Qur'anic Corpus er et søgbart online elektronisk korpus af korantekster, der indeholder 77.430 arabiske ord. Formålet med projektet er at levere morfologiske og syntaktiske data til forskere, der ønsker at studere klassisk arabisk [1] [2] [3] [4] [5] .
Grammatiktekstanalyse hjælper brugerne med at afdække de tilsigtede betydninger af hvert vers og hver sætning. Hvert ord i teksten i Koranen tilskrives en indikation af dets orddel og adskillige morfologiske karakteristika. I modsætning til andre arabiske korpus er grammatikken brugt af Korankorpus den traditionelle arabiske grammatik Irab (إعراب). The Qur'anic Corpus of Arabic er et forskningsprojekt ledet af datalog Kays Dukes fra University of Leeds [4] og er en del af det arabiske sprogstudieprojekt på School of Computing ledet af Eric Atwell [6] .
Det kommenterede korpus omfatter [1] [7] :
Taleledsopmærkning tildeler hvert ord i korpuset et ordledelsesmærke og morfologiske træk - for eksempel en indikation af, om det givne ord er et substantiv eller et verbum , er i maskulinum eller feminin . I projektets første fase blev der anvendt automatisk delmærkning. Karakteristikaene for hvert af de 77.430 ord i Koranen bliver derefter forfinet trin for trin af to annotatorer, og justeringerne fortsætter til i dag.
Sproglig forskning, der bruger Koranens korpus, omfatter undervisning i en skjult Markov -model af arabisk ordstemmemarkering [8] , automatisk kategorisering af kapitler i Koranen [9] og prosodisk tekstanalyse [10] .
Derudover sørger projektet for en bogstavelig oversættelse af Koranen baseret på accepterede engelske kilder i stedet for en ny oversættelse af Koranen [4] .
Arabisk sprog • العربية | |||||||
---|---|---|---|---|---|---|---|
Anmeldelser | |||||||
Skrivning | |||||||
arabisk alfabet |
| ||||||
Breve | |||||||
periodisering | |||||||
Sorter |
| ||||||
Akademisk | |||||||
Kalligrafi |
| ||||||
Lingvistik |
Korpuslingvistik | |
---|---|
engelske korpus |
|
Russisksprogede korpus |
|
Corpora på andre sprog |
|
Organisationer |