Automatisk reference

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 21. oktober 2020; checks kræver 3 redigeringer .

Automatisk abstraktion, annotering eller summering  er oprettelsen af ​​en kort version ( abstrakt , annotation ) af et tekstdokument ved hjælp af et computerprogram.

Historie

Det første arbejde med automatisk reference blev udført af den amerikanske videnskabsmand G.P. Lun i 1958 på det engelske sprogs materiale. [1] [2] [3] Principperne for ekstraktiv abstraktion blev formuleret af J. Salton i slutningen af ​​50'erne og begyndelsen af ​​60'erne. [2] [4]

I USSR var pionererne inden for automatiske referencer V. E. Berzon, I.P. Sevbo , E.F. Skorokhodko , D.G. Lakhuti , R.G. Piotrovsky og andre [5] [2]

Tilnærmelser

Der er to hovedtilgange til automatisk reference: ekstrahering (ekstrahering, overfladisk) og generering (abstrakt, dyb). [6] [1] [5] [2]

Ekstraktiv (ekstraktion)

De vigtigste sætninger, sætninger eller afsnit er udvalgt fra kildeteksten, hvis helhed danner et bestemt uddrag, en kvasi-abstrakt. [5] I dette tilfælde er disse fragmenter ikke bearbejdet, men udtrukket i den rækkefølge og form, som de er angivet i kildeteksten. [6]

Fordele ved tilgangen: uafhængighed af fagområdet, forholdsvis let udvikling. [1] Ulemper: usammenhængende resultat. [en]

Generering (abstraktion)

Genereringsmetoder er baseret på de sproglige regler for naturlig sprogbehandling eller kunstig intelligens metoder. [6] De generaliserer indholdsmæssigt kildedokumentet og skaber tekst, der ikke eksplicit præsenteres i det. [6]

Fordele ved fremgangsmåden: den bedste kvalitet af resultatet. [1] Ulemper: kompleksiteten af ​​praktisk implementering, behovet for at indsamle en stor mængde sproglig viden. [en]

Noter

  1. 1 2 3 4 5 6 Batura T. V., Bakieva A. M. Metoder og systemer til automatisk opsummering af tekster - Novosibirsk : 2019. - 110 s. - 100 eksemplarer. — ISBN 978-5-4437-0974-1
  2. 1 2 3 4 Sedova E.P. Automatisk abstraktion af videnskabelige publikationer ved hjælp af syntaktisk analyse baseret på moderne artikler om computersyntaks - St. Petersborg. : 2018. - 49 s.
  3. Luhn H. P. The Automatic Creation of Literature Abstracts  (Eng.) // IBM Journal of Research and Development / C. A. Pickover - IBM Corporation , IEEE , 1958. - Vol. 2, Iss. 2. - S. 159-165. — ISSN 0018-8646 ; 2151-8556 - doi:10.1147/RD.22.0159
  4. Salton G. Dynamic Information and Library Processing  (engelsk) - 1975. - 523 s.
  5. 1 2 3 Trevgoda S. A. Metoder og algoritmer til automatisk tekstabstraktion baseret på analyse af funktionelle relationer - St. Petersborg. : 2009. - 157 s. - 100 eksemplarer.
  6. 1 2 3 4 Osminin P. G. Moderne tilgange til automatisk reference og annotering // Bulletin of the South Ural State University - Chelyabinsk : 2012. - vol. 25. - S. 134-135.