Naturlig sprogbehandling

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 23. december 2019; checks kræver 15 redigeringer .

Natural Language Processing ( NLP ) er et generelt område inden for kunstig intelligens og matematisk lingvistik . Den studerer problemerne med computeranalyse og syntese af tekster på naturlige sprog . I forhold til kunstig intelligens betyder analyse at forstå sproget, og syntese betyder at generere læsefærdig tekst .

Opgaver og begrænsninger

Teoretisk set er opbygningen af ​​en naturlig sproggrænseflade til computere et meget attraktivt mål. Tidlige systemer som SHRDLU , der arbejdede med en begrænset "verden af ​​blokke" og brugte et begrænset ordforråd, så ekstremt godt ud, hvilket inspirerede deres skabere. Optimismen forsvandt dog hurtigt, da disse systemer stod over for kompleksiteten og tvetydigheden i den virkelige verden.

Naturlig sprogforståelse overvejes nogle gange[ hvem? ] AI er en komplet opgave, fordi genkendelsen af ​​et levende sprog kræver en enorm viden om systemet om verden omkring os og evnen til at interagere med den. Selve definitionen af ​​betydningen af ​​ordet " forstå " er en af ​​hovedopgaverne for kunstig intelligens. .

Vanskeligheder med at forstå

På russisk

Kvaliteten af ​​forståelse afhænger af mange faktorer: sprog, national kultur, samtalepartneren selv osv. Her er nogle eksempler på de vanskeligheder, som tekstforståelsessystemer står over for.

Klassificering af opgaver

Populære problemer: [1] [2] [3]

  1. Tale genkendelse
  2. Tekstanalyse
  3. Tekstgenerering
  4. talesyntese

Analyse- og synteseopgaver i komplekset:

Generel klassifikation:

  1. Tekstkategorisering
  2. Klassificering af tegnsekvenser
    1. Navngivet enhedsgenkendelse
    2. Definition af orddele
  3. Sætningsgenkendelse
  4. Udtræk information fra tekst
  5. Syntaks annotering
  6. Semantisk anmærkning
  7. Tekstgenerering
    1. Tekstgenerering baseret på genkendt tale
    2. Maskinoversættelse
    3. Generalisering af teksten

Software

Se også

Noter

  1. Shervin Minaee, Nal Kalchbrenner, Erik Cambria, Narjes Nikzad, Meysam Chenaghlu. Deep Learning Based Text Classification: A Comprehensive Review  // arXiv:2004.03705 [cs, stat]. - 2020-04-05. Arkiveret fra originalen den 24. juni 2020.
  2. Tom Young, Devamanyu Hazarika, Soujanya Poria, Erik Cambria. Seneste tendenser inden for dyb læringsbaseret naturlig  sprogbehandling // arXiv:1708.02709 [cs]. — 2018-11-24. Arkiveret 6. maj 2020.
  3. Prof. Jason Eisner. Kursus i automatisk tekstbehandling  (engelsk)  ? . Hentet 7. maj 2020. Arkiveret fra originalen 13. maj 2020.

Links