Automatisk abstraktion, annotering eller summering er oprettelsen af en kort version ( abstrakt , annotation ) af et tekstdokument ved hjælp af et computerprogram.
Det første arbejde med automatisk reference blev udført af den amerikanske videnskabsmand G.P. Lun i 1958 på det engelske sprogs materiale. [1] [2] [3] Principperne for ekstraktiv abstraktion blev formuleret af J. Salton i slutningen af 50'erne og begyndelsen af 60'erne. [2] [4]
I USSR var pionererne inden for automatiske referencer V. E. Berzon, I.P. Sevbo , E.F. Skorokhodko , D.G. Lakhuti , R.G. Piotrovsky og andre [5] [2]
Der er to hovedtilgange til automatisk reference: ekstrahering (ekstrahering, overfladisk) og generering (abstrakt, dyb). [6] [1] [5] [2]
De vigtigste sætninger, sætninger eller afsnit er udvalgt fra kildeteksten, hvis helhed danner et bestemt uddrag, en kvasi-abstrakt. [5] I dette tilfælde er disse fragmenter ikke bearbejdet, men udtrukket i den rækkefølge og form, som de er angivet i kildeteksten. [6]
Fordele ved tilgangen: uafhængighed af fagområdet, forholdsvis let udvikling. [1] Ulemper: usammenhængende resultat. [en]
Genereringsmetoder er baseret på de sproglige regler for naturlig sprogbehandling eller kunstig intelligens metoder. [6] De generaliserer indholdsmæssigt kildedokumentet og skaber tekst, der ikke eksplicit præsenteres i det. [6]
Fordele ved fremgangsmåden: den bedste kvalitet af resultatet. [1] Ulemper: kompleksiteten af praktisk implementering, behovet for at indsamle en stor mængde sproglig viden. [en]
naturlig sprogbehandling | |
---|---|
Generelle definitioner | |
Tekstanalyse |
|
Referencer |
|
Maskinoversættelse |
|
Identifikation og dataindsamling | |
Tematisk model | |
Peer review |
|
Naturlig sproggrænseflade [ |