Kvantitativ lingvistik

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 25. marts 2018; checks kræver 12 redigeringer .

Kvantitativ lingvistik ( eng.  kvantitativ lingvistik ) er et afsnit af almen lingvistik og i særdeleshed matematisk lingvistik . Kvantitativ lingvistik (QL) udforsker sprog ved hjælp af statistiske metoder ; dets ultimative mål er at formulere de love, som sproget fungerer efter, og i sidste ende at opbygge en generel teori om sprog i form af et sæt indbyrdes forbundne love for sprogs funktion [1] :1-16[ af hvem? ] Synergetisk lingvistik . [1] :760-774 Kvantitativ lingvistik er empirisk baseret på resultaterne af sprogstatistikker, som igen kan tolkes som statistik over sprog eller statistik over et sprogligt objekt. Dette vidensfelt er ikke nødvendigvis relateret til grundlæggende videnskabelige mål. Korpuslingvistik og datalingvistik bidrager også til kvantitativ lingvistik ved at levere vigtige empiriske data.

Historie

De tidligste begreber af KL går tilbage til oldtidens græske og antikke indiske kulturer. En af de historiske kilder omfatter anvendelser af kombinatorik til sproglige realiteter [2] , den anden er baseret på elementære statistiske undersøgelser, som kan findes under overskrifterne kolorometri og stihometri . [3]

Sproglove i kvantitativ lingvistik

I CL forstås en lov som en klasse af hypoteser afledt af teoretiske antagelser, matematisk formuleret, forbundet med andre love på dette område og tilstrækkeligt og succesfuldt testet på empiriske data, det vil sige dem, der ikke kunne tilbagevises på trods af adskillige forsøg. Köhler skriver om KL's love: ”Desuden kan det påvises, at disse egenskaber ved sproglige elementer og relationerne mellem dem adlyder universelle love, der kan formuleres strengt matematisk, ligesom naturvidenskabernes love. Man skal i denne sammenhæng huske på, at disse love er af stokastisk karakter; de overholdes ikke i hvert enkelt tilfælde (dette ville ikke være nødvendigt og muligt); snarere bestemmer de sandsynligheden for begivenheder eller de kvantitative sammenhænge mellem de fænomener, der undersøges. Det er let at finde modsætninger til hvert af de ovennævnte eksempler, ikke desto mindre overtræder disse tilfælde ikke de tilsvarende love, da variationer omkring det statistiske gennemsnit ikke kun er tilladte, men endda nødvendige, da de i sig selv er kvantitativt nøjagtigt bestemt af den tilsvarende love. Situationen er den samme som i naturvidenskaberne, der for længst har forladt de gamle deterministiske og kausale (kausale) verdensanskuelser og erstattet dem med statistiske/sandsynlighedsmodeller” [4] .

Nogle sproglige (sproglige) love

Der er en række sproglove, blandt hvilke [5] :

Andre sproglige enheder, der også overholder denne lov, er for eksempel bogstaver (symboler) af varierende kompleksitet, længder af såkaldte hrebs og talehandlinger. Det samme gælder for fordelinger af lyde (baggrunde) af forskellig varighed (længdegrad).

Stilistik

Studiet af poetiske og ikke-poetiske stilarter kan baseres på statistiske metoder; desuden er det muligt at udføre passende forskning på grundlag af særlige former (parametre), som sproglovgivningen antager i tekster af forskellige stilarter. I sådanne tilfælde forsker CL i stilistik: Et af de endelige mål er at bevise eksistensen af ​​et stilistisk fænomen ved at henvise til sproglovens virkemåde (og så objektivt som muligt. En af CL's hovedantagelser er, at nogle love (for eksempel lovfordelinger af ordlængder) kræver forskellige modeller, i det mindste forskellige værdier af lovens parametre (fordelinger eller funktioner), afhængigt af teksttypen. Hvis poetiske tekster studeres, så CL-metoder danne en underdisciplin kaldet "Quantitative study of literature" ( Stylometry ) [10] .

Noter

  1. ↑ 1 2 Reinhard Köhler. Gegenstand und Arbeitsweise der Quantitativen Linguistik // Quantitative Linguistics / Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.). — Berlin/New York: Ein internationales Handbuch. de Gruyter, 2005. - ISBN 3-11-015578-8 .
  2. NL Biggs: The Roots of Combinatorics. I: Historia Mathematica 6, 1979, s. 109-136.
  3. Adam Pawłowski: Prolegomena to the History of Corpus and Quantitative Linguistics. græsk oldtid. I: Glottotheory 1, 2008, s. 48-54.
  4. jf. note 1, s. 1-2.
  5. jf. referencer: Köhler, Altmann, Piotrowski (red.) (2005)
  6. Marina Knaus: Zur Verteilung rhythmischer Einheiten in russischer Prosa. I: Glottometrics 16, 2008, s. 57-62. (PDF ram-verlag.eu Arkiveret 11. juni 2020 på Wayback Machine )
  7. Ioan-Iovitz Popescu, et alii: Ordlængde : aspekter og sprog. I: Reinhard Köhler, Gabriel Altmann (red.): Issues in Quantitative Linguistics 3. Dedikeret til Karl-Heinz Best i anledning af hans 70 års fødselsdag . Ludenscheid: RAM-Verlag 2013, s. 224-281. ISBN 978-3-942303-12-5 .
  8. Ioan-Iovitz Popescu, Karl-Heinz Best, Gabriel Altmann: Unified Modeling of Length in Language. Lüdenscheid: RAM-Verlag 2014. ISBN 978-3-942303-26-2 .
  9. H. Guiter, MV Arapov (red.): Studies on Zipf's Law. Bochum: Brockmeyer 1982. ISBN 3-88339-244-8 .
  10. Alexander Mehler: Eigenschaften der textuellen Einheiten und Systeme . I: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. En internationales håndbog. de Gruyter, Berlin/New York 2005, s. 325-348, især Kvantitativ stil , s. 339-340. ISBN 3-11-015578-8 ; Vivien Altmann, Gabriel Altmann: Anleitung zu quantitativen Textanalysen. Methoden og Anwendungen. Lüdenscheid: RAM-Verlag 2008, ISBN 978-3-9802659-5-9 .

Litteratur