Google Neural Machine Translation (GNMT) er et Neural Machine Translation -system (NMT) udviklet af Google og introduceret i november 2016, som bruger et kunstigt neuralt netværk til at forbedre oversættelsesevnen og -nøjagtigheden i Google Translate . [1] [2] [3]
GNMT forbedrer oversættelseskvaliteten ved at bruge eksempelbaseret maskinoversættelse ( EBMT ), hvor systemet "lærer af millioner af eksempler". [2] Den foreslåede GNMT-systemlæringsarkitektur blev først testet på over hundrede sprog understøttet af Google Translate. [2] På grund af den store ende-til-ende-struktur lærer systemet med tiden at producere bedre og mere naturlige oversættelser. [1] GNMT er i stand til at oversætte hele sætninger, ikke dele. [1] GNMT-netværket kan udføre interlingual maskinoversættelse ved at indkode en sætnings semantik i stedet for at huske oversættelser af individuelle sætninger. [2] [4]
Google Brain - projektet blev oprettet i 2011 i "Google X's hemmelige forskningslaboratorium" [5] af Jeff Dean , en Google-medarbejder, Greg Corrado, en Google-forsker, og Andrew Ng , en professor i datalogi ved Stanford University . [6] [7] [8] Euns arbejde var grundlaget for et af de største teknologiske gennembrud hos Google og Stanford. [5]
I september 2016 annoncerede Google-forskningsgruppen udviklingen af GNMT-oversættelsessystemet, og i november begyndte Google Translate at bruge neural maskinoversættelse (NMT) i stedet for de tidligere statistiske metoder (SMT) [1] [9] [10] [ 11] der havde været brugt siden oktober 2007 i vores eget lukkede SMT-system. [12] [13]
NMT-systemet i Google Translate bruger et stort kunstigt neuralt netværk, der er velegnet til dyb læring . [1] [2] [3] Ved at undersøge millioner af eksempler forbedrer GNMT kvaliteten af oversættelsen ved at bruge en bredere kontekst til at udlede den mest passende oversættelse. Resultatet omarrangeres derefter og tilpasses, så det passer til det menneskelige sprogs grammatik. GNMT skabte ikke sit eget interne universelle sprog, men søgte snarere at finde fællestræk mellem mange sprog, som burde være af interesse for psykologer og lingvister mere end for dataloger. [14] En ny oversættelsesmaskine blev inkluderet i begge retninger for ni sprog: engelsk, fransk, tysk, spansk, portugisisk, kinesisk, japansk, koreansk og tyrkisk i 2016. [15] I marts 2017 blev yderligere tre sprog tilføjet: russisk, hindi og vietnamesisk. [16] I samme måned blev understøttelse af hebraisk og arabisk tilføjet med hjælp fra Google Translate-fællesskabet. [17] Yderligere støtte blev tilføjet i slutningen af april 2017 for ni indiske sprog, nemlig hindi, bengali, marathi, gujarati, punjabi, tamil, telugu, malayalam og kannada. [atten]
Nedenfor er en liste over sprogpar, der bruger Google Neural Machine Translation (NMT)-modellen til oversættelse. Fra juli 2017 understøttes kun oversættelse til og fra engelsk for alle sprog: [19]
sprogpar | Sprogkoder | |
---|---|---|
en | Afrikaans <-> engelsk | af<->en |
2 | Arabisk <-> engelsk | ar<->en |
3 | Bulgarsk <-> engelsk | bg<->en |
fire | Kinesisk (forenklet) <-> engelsk | zh-CN <->en |
5 | Kinesisk (traditionel) <-> engelsk | zh-TW<->en |
6 | Kroatisk <-> engelsk | hr<->en |
7 | Tjekkisk <-> engelsk | cs<->en |
otte | Dansk <-> Engelsk | da<->en |
9 | Hollandsk <-> Engelsk | nl<->en |
ti | Fransk <-> engelsk | fr<->en |
elleve | Tysk <-> engelsk | de<->en |
12 | Græsk <-> engelsk | el<->en |
13 | Hebraisk <-> engelsk | iw<->en |
fjorten | Hindi <-> engelsk | hi<->en |
femten | islandsk <-> engelsk | is<->en |
16 | Indonesisk <-> engelsk | id<->en |
17 | Italiensk <-> engelsk | it<->en |
atten | Japansk <-> engelsk | ja<->en |
19 | Koreansk <-> engelsk | ko<->en |
tyve | Norsk <-> Engelsk | no<->en |
21 | polsk <-> engelsk | pl<->en |
22 | Portugisisk <-> engelsk | pt<->en |
23 | Rumænsk <-> engelsk | ro<->en |
24 | Russisk <-> engelsk | ru<->en |
25 | Slovakisk <-> engelsk | sk<->en |
26 | Spansk <-> Engelsk | es<->en |
27 | Svensk <-> engelsk | sv<->en |
28 | Thai <-> engelsk | th<->en |
29 | Tyrkisk <-> engelsk | tr<->en |
tredive | vietnamesisk <-> engelsk | vi<->en |
GNMT-systemet siges at være den tidligere version af Google Translate overlegen ved, at det kan udføre "direkte oversættelse", dvs. oversætte direkte fra et sprog til et andet (f.eks. fra japansk til koreansk). [2] Tidligere oversatte Google Translate først fra kildesproget til engelsk og derefter fra engelsk til målsproget i stedet for direkte at oversætte fra et sprog til et andet. [fire]
maskinoversættelse | Tilgange til|
---|---|
|
naturlig sprogbehandling | |
---|---|
Generelle definitioner | |
Tekstanalyse |
|
Referencer |
|
Maskinoversættelse |
|
Identifikation og dataindsamling | |
Tematisk model | |
Peer review |
|
Naturlig sproggrænseflade [ |