Regelbaseret maskinoversættelse ( RBMT fra regelbaseret maskinoversættelse ) er en betegnelse for maskinoversættelsesteknologier baseret på sproglig information om kilde- og målsproget. Sådan information udvindes som regel fra ordbøger (både sproglige og oversættelser ), beskrivelser af sprogens grammatik og er struktureret i form af maskinlæsbare regler, der dækker de vigtigste semantiske, morfologiske og syntaktiske mønstre for hvert sprog. Baseret på sådanne regler konverteres kildeteksten sekventielt, sætning for sætning, til målteksten.
Regelbaserede maskinoversættelsessystemer falder i tre grupper:
Et typisk regelbaseret maskinoversættelsessystem kan omfatte følgende komponenter:
Historisk set gik brugen af regelsystemer i maskinoversættelse forud for brugen af korpusmetoder , hvorfor denne tilgang også kaldes den klassiske. Fordelene ved klassiske systemer er syntaktisk og morfologisk nøjagtighed, stabilitet og forudsigelighed af resultatet, evnen til at tilpasse sig emneområdet; ulemper - kompleksiteten og varigheden af udviklingen, behovet for at vedligeholde og opdatere sproglige databaser; "maskinaccent" ved oversættelse. Efterhånden som maskinoversættelsesteknologier har udviklet sig, er en hybrid tilgang blevet udbredt , der kombinerer både regelbaserede metoder og korpusteknologier (herunder statistisk oversættelse og eksempelbaseret oversættelse ).
maskinoversættelse | Tilgange til|
---|---|
|
naturlig sprogbehandling | |
---|---|
Generelle definitioner | |
Tekstanalyse |
|
Referencer |
|
Maskinoversættelse |
|
Identifikation og dataindsamling | |
Tematisk model | |
Peer review |
|
Naturlig sproggrænseflade [ |