Kvantitativ lingvistik

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 25. marts 2018; checks kræver 12 redigeringer .

Kvantitativ lingvistik ( eng. kvantitativ lingvistik ) er et afsnit af almen lingvistik og i særdeleshed matematisk lingvistik . Kvantitativ lingvistik (QL) udforsker sprog ved hjælp af statistiske metoder ; dets ultimative mål er at formulere de love, som sproget fungerer efter, og i sidste ende at opbygge en generel teori om sprog i form af et sæt indbyrdes forbundne love for sprogs funktion [1] :1-16[ af hvem? ] Synergetisk lingvistik . [1] :760-774 Kvantitativ lingvistik er empirisk baseret på resultaterne af sprogstatistikker, som igen kan tolkes som statistik over sprog eller statistik over et sprogligt objekt. Dette vidensfelt er ikke nødvendigvis relateret til grundlæggende videnskabelige mål. Korpuslingvistik og datalingvistik bidrager også til kvantitativ lingvistik ved at levere vigtige empiriske data.

Historie

De tidligste begreber af KL går tilbage til oldtidens græske og antikke indiske kulturer. En af de historiske kilder omfatter anvendelser af kombinatorik til sproglige realiteter [2] , den anden er baseret på elementære statistiske undersøgelser, som kan findes under overskrifterne kolorometri og stihometri . [3]

Sproglove i kvantitativ lingvistik

I CL forstås en lov som en klasse af hypoteser afledt af teoretiske antagelser, matematisk formuleret, forbundet med andre love på dette område og tilstrækkeligt og succesfuldt testet på empiriske data, det vil sige dem, der ikke kunne tilbagevises på trods af adskillige forsøg. Köhler skriver om KL's love: ”Desuden kan det påvises, at disse egenskaber ved sproglige elementer og relationerne mellem dem adlyder universelle love, der kan formuleres strengt matematisk, ligesom naturvidenskabernes love. Man skal i denne sammenhæng huske på, at disse love er af stokastisk karakter; de overholdes ikke i hvert enkelt tilfælde (dette ville ikke være nødvendigt og muligt); snarere bestemmer de sandsynligheden for begivenheder eller de kvantitative sammenhænge mellem de fænomener, der undersøges. Det er let at finde modsætninger til hvert af de ovennævnte eksempler, ikke desto mindre overtræder disse tilfælde ikke de tilsvarende love, da variationer omkring det statistiske gennemsnit ikke kun er tilladte, men endda nødvendige, da de i sig selv er kvantitativt nøjagtigt bestemt af den tilsvarende love. Situationen er den samme som i naturvidenskaberne, der for længst har forladt de gamle deterministiske og kausale (kausale) verdensanskuelser og erstattet dem med statistiske/sandsynlighedsmodeller” [4] .

Nogle sproglige (sproglige) love

Der er en række sproglove, blandt hvilke [5] :

Lov om diversificering: Hvis sproglige kategorier (såsom orddele eller grammatiske slutninger) optræder i forskellige former, så kan det siges, at frekvenserne af deres forekomst i tekster er styret af visse love.

Loven om fordeling af længder (eller mere generelt multikomponent). Studiet af frekvenserne af forskellige sproglige enheder med hensyn til deres længder i tekster og ordbøger fører regelmæssigt til identifikation af en række fordelinger, afhængigt af den enhed, der studeres. Følgende enheder er blevet undersøgt indtil videre:
- Loven om fordeling af længder af morfer;
- Loven om fordeling af længder af rytmiske enheder [6] ;
- Loven om fordeling af sætningslængder;
- Loven om fordeling af stavelseslængder;
- Ordlængdefordelingslov [7] [8] ;

Andre sproglige enheder, der også overholder denne lov, er for eksempel bogstaver (symboler) af varierende kompleksitet, længder af såkaldte hrebs og talehandlinger. Det samme gælder for fordelinger af lyde (baggrunde) af forskellig varighed (længdegrad).

Martins lov: Denne lov omhandler leksikalske kæder, der dannes, når man slår definitioner (definitioner) af ord op i en ordbog, derefter definitioner af nyfundne definitioner osv. I sidste ende danner alle disse definitioner et hierarki af mere og mere generelle betydninger. mens definitioner bliver mindre, jo mere generel værdi opnås. Blandt niveauerne i dette hierarki er der en række forhold, der adlyder loven.

Menzeraths lov (også, især i lingvistik, kendt som Menzerath-Altmanns lov): Denne lov siger, at dimensionerne af en strukturs bestanddele aftager, efterhånden som selve strukturen bliver større. Jo længere f.eks. en sætning (målt ved antallet af dens konstituerende sætninger), jo kortere dens konstituerende sætninger (målt ved antallet af ord), eller: jo længere ordet (i stavelser eller morfer), jo kortere stavelser eller deres lyd.

Love for frekvensrangfordeling: Næsten enhver sprogenhed adlyder disse love. Her er blot nogle få eksempler:
- Ordene i teksten er organiseret efter hyppigheden af deres forekomst i teksten, og hver af dem tildeles et rangnummer og tilsvarende frekvens. Siden George Kingsley Zipfs tid (og hans berømte lov) er et stort antal matematiske modeller blevet foreslået til at beskrive forholdet mellem rang og frekvens.
- En lignende fordeling kan observeres mellem rang og frekvens af lyde, fonemer og bogstaver.
- Ordassociationer: Rangen og hyppigheden af associationer reagerer på en (verbal) stimulus.
Sprogændringsloven: vækstprocesserne i et sprog (såsom ordforrådsudvidelse), spredningen af fremmede og lånte ord, ændringer i bøjningssystemet - adlyde loven kendt i KL som Piotrovskys lov, og svarer til vækstmønstre i andre videnskabelige discipliner. Piotrovskys lov er et særtilfælde af den såkaldte logistiske model (jf . logistisk ligning ). Det har vist sig, at det også påvirker sprogtilegnelsesprocesserne (jf. loven om sprogtilegnelse).
Tekstbloklov: Sproglige enheder (f.eks. ord, bogstaver, syntaktiske funktioner og konstruktioner) viser bestemte frekvensfordelinger i lige store tekstblokke.
Zipfs lov : frekvensen af et ord er omvendt proportional med dets løbenummer i frekvenslisterne [9] .

Stilistik

Studiet af poetiske og ikke-poetiske stilarter kan baseres på statistiske metoder; desuden er det muligt at udføre passende forskning på grundlag af særlige former (parametre), som sproglovgivningen antager i tekster af forskellige stilarter. I sådanne tilfælde forsker CL i stilistik: Et af de endelige mål er at bevise eksistensen af et stilistisk fænomen ved at henvise til sproglovens virkemåde (og så objektivt som muligt. En af CL's hovedantagelser er, at nogle love (for eksempel lovfordelinger af ordlængder) kræver forskellige modeller, i det mindste forskellige værdier af lovens parametre (fordelinger eller funktioner), afhængigt af teksttypen. Hvis poetiske tekster studeres, så CL-metoder danne en underdisciplin kaldet "Quantitative study of literature" ( Stylometry ) [10] .

Noter

↑ 1 2 Reinhard Köhler. Gegenstand und Arbeitsweise der Quantitativen Linguistik // Quantitative Linguistics / Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.). — Berlin/New York: Ein internationales Handbuch. de Gruyter, 2005. - ISBN 3-11-015578-8 .
↑ NL Biggs: The Roots of Combinatorics. I: Historia Mathematica 6, 1979, s. 109-136.
↑ Adam Pawłowski: Prolegomena to the History of Corpus and Quantitative Linguistics. græsk oldtid. I: Glottotheory 1, 2008, s. 48-54.
↑ jf. note 1, s. 1-2.
↑ jf. referencer: Köhler, Altmann, Piotrowski (red.) (2005)
↑ Marina Knaus: Zur Verteilung rhythmischer Einheiten in russischer Prosa. I: Glottometrics 16, 2008, s. 57-62. (PDF ram-verlag.eu Arkiveret 11. juni 2020 på Wayback Machine )
↑ Ioan-Iovitz Popescu, et alii: Ordlængde : aspekter og sprog. I: Reinhard Köhler, Gabriel Altmann (red.): Issues in Quantitative Linguistics 3. Dedikeret til Karl-Heinz Best i anledning af hans 70 års fødselsdag . Ludenscheid: RAM-Verlag 2013, s. 224-281. ISBN 978-3-942303-12-5 .
↑ Ioan-Iovitz Popescu, Karl-Heinz Best, Gabriel Altmann: Unified Modeling of Length in Language. Lüdenscheid: RAM-Verlag 2014. ISBN 978-3-942303-26-2 .
↑ H. Guiter, MV Arapov (red.): Studies on Zipf's Law. Bochum: Brockmeyer 1982. ISBN 3-88339-244-8 .
↑ Alexander Mehler: Eigenschaften der textuellen Einheiten und Systeme . I: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. En internationales håndbog. de Gruyter, Berlin/New York 2005, s. 325-348, især Kvantitativ stil , s. 339-340. ISBN 3-11-015578-8 ; Vivien Altmann, Gabriel Altmann: Anleitung zu quantitativen Textanalysen. Methoden og Anwendungen. Lüdenscheid: RAM-Verlag 2008, ISBN 978-3-9802659-5-9 .

Litteratur

Karl-Heinz Best : Quantitative Linguistik. Ene Annaherung . 3., stark überarbeitete und ergänzte Auflage. Peust & Gutschmidt, Göttingen 2006, ISBN 3-933043-17-4 .
Karl-Heinz Best, Otto Rottmann: Kvantitativ lingvistik, en invitation. RAM-Verlag, Lüdenscheid 2017. ISBN 978-3-942303-51-4 .
Peter Grzybek, Emmerich Kelih: Zur Vorgeschichte quantitativer Ansätze in der russischen Sprach- und Literaturwissenschaft . I: Reinhard Köhler, Gabriel Altmann, Gabriel, Rajmund G. Piotrowski (red.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch - En international håndbog. de Gruyter, Berlin/New York 2005, s. 23-64. ISBN 3-11-015578-8 .
Emmerich Kelih: Geschichte der Anwendung quantitative Verfahren in der russischen Sprach- und Literaturwissenschaft. Kovač, Hamborg 2008. ISBN 978-3-8300-3575-6 .
Sebastian Kempgen Systematischer Oberblick und Bibliographie. Verlag Otto Sagner, München 1995. ISBN 3-87690-617-2 .
VV Levitsky: Kvantitative metoder i lingvistik. Ny bog, Vinnitsa 2007. ISBN 978-966-382-046-0 .
AV Zenkov, A Method of Text Attribution Based on the Statistics of Numerals // Journal of Quantitative Linguistics. 2018 bind. 25, nr. 3, s. 256-270. DOI: 10.1080/09296174.2017.1371915.

Ordbøger og encyklopædier	stor kinesisk Stor russer
I bibliografiske kataloger	GND : 4182534-2 J9U : 987007529215405171 LCCN : sh85077229 NKC : ph122047