Oversættelseshukommelse
Oversættelseshukommelse (PP, engelsk oversættelseshukommelse , TM, nogle gange også kaldet et "oversættelsesdrev") er en database, der indeholder et sæt af tidligere oversatte tekstsegmenter .
Beskrivelse
Én oversættelseshukommelsesdatabasepost svarer til et segment eller " oversættelsesenhed " ( engelsk oversættelsesenhed ), som normalt tages som én sætning (mindre ofte en del af en sammensat sætning eller et afsnit ). Hvis oversættelsesenheden i kildeteksten nøjagtigt matcher den oversættelsesenhed, der er gemt i databasen ( eksakt match ), kan den automatisk erstattes med oversættelsen . Det nye segment kan også afvige lidt fra det, der er gemt i databasen (fuzzy match, engelsk fuzzy match ). Et sådant segment kan også erstattes i oversættelsen, men oversætteren skal foretage de nødvendige ændringer.
Udover at fremskynde processen med at oversætte gentagne fragmenter og ændringer i allerede oversatte tekster (f.eks. nye versioner af softwareprodukter eller ændringer i lovgivningen), sikrer PP-systemer også ensartetheden af oversættelsen af terminologi i de samme fragmenter, hvilket er især vigtig for teknisk oversættelse. På den anden side, hvis en oversætter regelmæssigt erstatter eksakte matches fra oversættelseshukommelsen i sin oversættelse uden kontrol over deres brug i en ny kontekst, kan kvaliteten af den oversatte tekst forringes.
I hvert enkelt pc-system lagres data i sit eget format (tekstformat i Wordfast, Access-database i Deja Vu), men der findes en international standard TMX ( English Translation Memory eXchange format ), som er baseret på XML og kan genereres af næsten alle pc-systemer. Takket være dette kan de udførte oversættelser bruges i forskellige applikationer, det vil sige, at en oversætter, der arbejder med OmegaT , kan bruge den BT, der er oprettet i Trados , og omvendt.
De fleste softwaresystemer understøtter i det mindste oprettelse og brug af brugerordbøger, oprettelse af nye databaser baseret på parallelle tekster ( engelsk alignment ), samt semi-automatisk udtrækning af terminologi fra originale og parallelle tekster.
Populære PP-softwaresystemer
Ifølge anmeldelser af brugen af PP-systemer inkluderer de mest populære systemer [1] [2] :
- memoQ
- XTM Cloud
- Memsource
- Deja Vu
- OmegaT (gratis system licenseret under GNU GPL )
- SDLX [3]
- Trados
- SmartCAT (gratis software med indbygget PDF-genkendelse)
- STAR Transit
- Wordfast (implementeret som et sæt makroer til MS Word , ny 2009-version er et separat program)
Den engelske Wikipedia har en liste, der sammenligner forskellige systemers muligheder.
Standarder og formater for oversættelseshukommelse [4]
- TMX (Translation Memory Exchange Format - Translation Memory Exchange). Denne standard tillader udveksling mellem forskellige udbydere af oversættelseshukommelse. TMX er et almindeligt brugt format blandt oversættere og er bedst egnet til import og eksport af oversættelseshukommelser. Den seneste version af dette format, 1.4b, giver dig mulighed for at gendanne originale dokumenter og deres oversættelse fra en TMX-fil.
- TBX (Termbase Exchange format - termbase exchange). Dette Localization Industry Standards Association (LISA)-format er i øjeblikket ved at blive revideret og genudgivet i henhold til ISO 30042 . Denne standard giver mulighed for udveksling af terminologi, herunder detaljerede leksikalske oplysninger. Hovedbasen for TBX er defineret af standarder: ISO 12620 , ISO 12200 og ISO 16642 . ISO 12620 giver et register over veldefinerede "datakategorier" med standardiserede navne, der fungerer som dataelementtyper eller foruddefinerede værdier. ISO 12200 (også kendt som MARTIF ) giver rammen for TBX-rammerne. ISO 16642 (også kendt som Terminological Markup Framework ) inkluderer en strukturel metamodel for Terminological Markup Languages generelt.
- SRX er designet til at forbedre TMX-formatet og gøre overførsel af oversættelseshukommelser mere effektiv mellem programmer. Evnen til at specificere segmenteringsreglerne, der blev brugt i den tidligere oversættelse, forbedrer effektiviteten af at identificere segmenter i den aktuelle tekst med indholdet af PG.
- GMX GILT står for globalisering, internationalisering, lokalisering og oversættelse (Globalisering, internationalisering , lokalisering , oversættelse). GILT Metrics -standarden består af tre dele: GMX-V til volumenmålinger, GMX-C til kompleksitetsmålinger og GMX-Q til kvalitetsmålinger. Den foreslåede GILT Metrics-standard har til formål at kvantificere arbejdsomfanget og kvalitetskrav til implementering af GILT-mål.
- OLIF er en XML - kompatibel åben standard , der bruges til at udveksle terminologiske og leksikalske data. Selvom det oprindeligt blev brugt som en måde at udveksle leksikalske data mellem private maskinoversættelsesleksikoner, har dette format gradvist udviklet sig til en mere generel terminologisk udvekslingsstandard.
- XLIFF (XML Localization Interchange File Format ) er designet som et enkelt udvekslingsfilformat, der genkendes af al lokaliseringssoftware. XLIFF er den bedste måde at udveksle information i XML-format i nutidens oversættelsesindustri. Nogle værktøjer bruger proprietære XLIFF-formater, der ikke tillader, at filer, der er oprettet i dem, åbnes i andre programmer.
- TransWS (Translation Web Services - oversættelseswebtjenester), definerer de nødvendige parametre for at kalde webtjenester ved afsendelse og modtagelse af filer og meddelelser relateret til lokaliseringsprojekter. Det blev udtænkt som et indsat system til automatisering af lokaliseringsprocessen ved hjælp af tjenester på internettet .
- xml:tm , denne tilgang til oversættelseshukommelse er baseret på begrebet teksthukommelse, som tillader kombinationen af forfatters hukommelse og oversættelseshukommelse. xml:tm-formatet blev givet til Lisa OSCAR af XML-INTL .
Fordele og ulemper
Fordele
- Reduktion af tid og volumen af oversætterens arbejde.
- Forbedring af oversættelseskonsistens, især når en gruppe oversættere arbejder på det samme projekt.
- Forøgelse af overskuddet ved at øge produktiviteten hos oversætteren, en gruppe af oversættere.
- Forbedring af kvaliteten af tjenester ved at øge nøjagtigheden og ensartetheden af oversættelsen af termer, især i specialiserede tekster.
Ulemper
- Kan gøre oversættelsen mere "tør"; selve essensen af teksten går tabt, hvis oversættelsen ved hjælp af oversættelseshukommelsen udføres af en lavt kvalificeret oversætter.
- Ofte er der ingen sammenhæng mellem sætningen/teksten foreslået af programmet med nabosætninger og med teksten som helhed.
- Originalen skal være i elektronisk form.
- En uopdaget fejl kan sprede sig til hele projektet.
- Det er nødvendigt at lære at arbejde i selve programmet, og når man skifter job, måske mere end én gang (hvis arbejdsgivere bruger forskellige TM-programmer).
- Ikke egnet til alle typer tekster.
- Høje omkostninger ved licenseret software.
Se også
Noter
- ↑ Se side 26 i Imperial College London Translation Memories Survey 2006 Arkiveret 2007-03-25. (PDF)
- ↑ ITI Translation Memory Survey, 2007 (downlink) (downlink pr. 13-05-2013 [3456 dage])
- ↑ Som et resultat af det britiske selskab SDL Internationals opkøb i juni 2005 af Trados i 2006, dukkede et enkelt produkt TRADOS SDLX 2006 op
- ↑ Standarder for Localization Industry Standards Association (LISA).
Litteratur
- Grabovsky VN Technology Oversættelseshukommelse // Broer. Tidsskrift for oversættere. 2004. nr. 2. - S. 57-62.
Links