Statistisk maskinoversættelse

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 18. juni 2021; checks kræver 2 redigeringer .

Statistisk maskinoversættelse (  SMT ) er en   type maskinoversættelse, hvor oversættelsen genereres ud fra statistiske modeller, hvis parametre er afledt af analysen af ​​tosprogede tekstkorpus (tekstkorpus).

Statistisk maskinoversættelse står i kontrast til regelbaserede maskinoversættelsessystemer (RBMT) og eksempelbaserede MT (EBMT) maskinoversættelsessystemer.

De første ideer til statistisk maskinoversættelse blev udgivet af Warren Weaver i 1949. "Anden bølge" - begyndelsen af ​​1990'erne, IBM . "Tredje bølge" - Google, Microsoft, Language Weaver, Yandex ...

Udviklere af maskinoversættelsessystemer introducerer nogle "tværgående" regler for at forbedre kvaliteten og gør derved rent statistiske systemer til hybrid maskinoversættelse . Tilføjelsen af ​​nogle regler, det vil sige oprettelsen af ​​hybride systemer, forbedrer kvaliteten af ​​oversættelser noget, især når mængden af ​​inputdata, der bruges til at opbygge maskinoversætterindekset, er utilstrækkelig.

Grundlæggende

Fordele ved SMT

Ulemper ved SMT

Sprogmodeller

Som sprogmodel bruger statistiske oversættelsessystemer hovedsageligt forskellige modifikationer af n-gram-modellen, som siger, at " grammatikaliteten " ved at vælge det næste ord, når du danner en tekst, kun bestemmes af, hvilke (n-1) ord der kommer før det [ 1] .

Statistiske modeller for oversættelse

Se også

Kilder

  1. Statistisk maskinoversættelsessystem (Distribueret statistisk maskinoversættelsessystem) | Ilya (w-495) Nikitin - Academia.edu . Hentet 19. marts 2013. Arkiveret fra originalen 22. marts 2013.
  2. Arkiveret kopi (link ikke tilgængeligt) . Hentet 17. marts 2013. Arkiveret fra originalen 3. november 2013. 
  3. Kilde . Hentet 17. marts 2013. Arkiveret fra originalen 3. november 2013.
  4. Kilde . Hentet 17. marts 2013. Arkiveret fra originalen 26. maj 2013.
  5. Arkiveret kopi (link ikke tilgængeligt) . Hentet 17. marts 2013. Arkiveret fra originalen 3. februar 2013. 
  6. Arkiveret kopi (link ikke tilgængeligt) . Hentet 17. marts 2013. Arkiveret fra originalen 26. maj 2013.