Regelbaseret maskinoversættelse

Regelbaseret maskinoversættelse ( RBMT fra regelbaseret maskinoversættelse ) er en  betegnelse for maskinoversættelsesteknologier baseret på sproglig information om kilde- og målsproget. Sådan information udvindes som regel fra ordbøger (både sproglige og oversættelser ), beskrivelser af sprogens grammatik og er struktureret i form af maskinlæsbare regler, der dækker de vigtigste semantiske, morfologiske og syntaktiske mønstre for hvert sprog. Baseret på sådanne regler konverteres kildeteksten sekventielt, sætning for sætning, til målteksten.

Regelbaserede maskinoversættelsessystemer falder i tre grupper:

Et typisk regelbaseret maskinoversættelsessystem kan omfatte følgende komponenter:

Historisk set gik brugen af ​​regelsystemer i maskinoversættelse forud for brugen af ​​korpusmetoder , hvorfor denne tilgang også kaldes den klassiske. Fordelene ved klassiske systemer er syntaktisk og morfologisk nøjagtighed, stabilitet og forudsigelighed af resultatet, evnen til at tilpasse sig emneområdet; ulemper - kompleksiteten og varigheden af ​​udviklingen, behovet for at vedligeholde og opdatere sproglige databaser; "maskinaccent" ved oversættelse. Efterhånden som maskinoversættelsesteknologier har udviklet sig, er en hybrid tilgang blevet udbredt , der kombinerer både regelbaserede metoder og korpusteknologier (herunder statistisk oversættelse og eksempelbaseret oversættelse ).

Noter

  1. Koehn, Philipp. Statistisk maskinoversættelse . - Cambridge : Cambridge University Press, 2010. - S. 15. - ISBN 9780521874151 . Arkiveret 21. april 2022 på Wayback Machine
  2. Nirenburg, Sergei (1989). "Vidensbaseret maskinoversættelse". Machine Trandation 4 (1989), 5-24 . Kluwer Academic Publishers. 4 (1): 5-24. JSTOR40008396  . _

Litteratur