Beregningslingvistik

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 21. december 2021; checks kræver 2 redigeringer .

Computerlingvistik (også: matematisk eller datalingvistik , engelsk  computerlingvistik ) er en videnskabelig retning inden for matematisk og computermodellering af intellektuelle processer hos mennesker og dyr ved skabelse af kunstige intelligenssystemer , som har til formål at bruge matematiske modeller til at beskrive naturlige sprog .

Beregningslingvistik overlapper med naturlig sprogbehandling . I sidstnævnte lægges der dog ikke vægt på abstrakte modeller, men på anvendte metoder til at beskrive og bearbejde sprog til computersystemer.

Beregningslingvisters aktivitetsområde er udvikling af algoritmer og applikationsprogrammer til behandling af sproglig information.

Oprindelse

Matematisk lingvistik er en gren af ​​videnskaben om kunstig intelligens . Dens historie begyndte i USA i 1950'erne. Med opfindelsen af ​​transistoren og fremkomsten af ​​en ny generation af computere, såvel som de første programmeringssprog, begyndte eksperimenter med maskinoversættelse , især af russiske videnskabelige tidsskrifter. I 1960'erne blev lignende undersøgelser udført i USSR (for eksempel en artikel om oversættelse fra russisk til armensk i samlingen "Problems of Cybernetics" for 1964 ). Kvaliteten af ​​maskinoversættelse er dog stadig langt ringere end kvaliteten af ​​menneskelig oversættelse. I 2021 var kvaliteten af ​​Google-oversætterens maskinoversættelse ikke længere så ringere end kvaliteten af ​​menneskelig oversættelse. .

Fra den 15. maj til den 21. maj 1958 blev den første unionskonference om maskinoversættelse afholdt på det 1. Moskva statsinstitut for fremmedsprog. Organisationskomiteen blev ledet af V. Yu. Rozentsveig og eksekutivsekretær for Organisationskomiteen G. V. Chernov . Det fulde program for konferencen er offentliggjort i samlingen "Machine Translation and Applied Linguistics", vol. 1, 1959 (a.k.a. Bulletin of the Machine Translation Association nr. 8). Som V. Yu. Rozentsweig husker , kom den offentliggjorte samling af konferenceresuméer til USA og gjorde et stort indtryk der.

I april 1959 blev den første All-Union-konference om matematisk lingvistik afholdt i Leningrad, indkaldt af Leningrad Universitet og Komitéen for Anvendt Lingvistik. Hovedarrangøren af ​​konferencen var N. D. Andreev . En række fremtrædende matematikere deltog i mødet, især S. L. Sobolev , L. V. Kantorovich (senere nobelpristager) og A. A. Markov (de sidste to talte i debatten). På konferencens åbningsdag holdt V. Yu. Rozentsveig en hovedtale "General Linguistic Theory of Translation and Mathematical Linguistics".

Retninger til computerlingvistik

Datalingvistiks opgaver og retninger omfatter:

  1. Korpuslingvistik , skabelse og brug af elektroniske tekstkorpus.
  2. Udarbejdelse af elektroniske ordbøger , tesaurier , ontologier . For eksempel Lingvo . Ordbøger bruges for eksempel til automatisk oversættelse, stavekontrol.
  3. Automatisk oversættelse af tekster. Promt er populært blandt russiske oversættere . Blandt de gratis, er Google translate oversætter kendt .
  4. Automatisk udtrækning af fakta fra tekst (informationsekstraktion) ( engelsk  fact extraction, text mining )
  5. Auto -reference ( eng.  automatisk tekstresumé ). Denne funktion er inkluderet i for eksempel Microsoft Word .
  6. Opbygning af videnstyringssystemer . Se ekspertsystemer .
  7. Oprettelse af spørgsmål-svar-systemer ( engelske  spørgsmål svarsystemer ).

Større foreninger og konferencer

Se også

Noter

  1. ACL (downlink) . Hentet 15. september 2010. Arkiveret fra originalen 4. september 2010. 
  2. Dialog 2020 / Computational Linguistics Conference . www.dialog-21.ru Hentet 27. december 2019. Arkiveret fra originalen 26. december 2019.

Links