Google Neural Machine Translation

Google Neural Machine Translation  (GNMT) er et  Neural Machine Translation -system (NMT) udviklet af Google og introduceret i november 2016, som bruger et  kunstigt neuralt netværk til at forbedre oversættelsesevnen og -nøjagtigheden i Google Translate . [1] [2] [3]

GNMT forbedrer oversættelseskvaliteten ved at bruge eksempelbaseret maskinoversættelse ( EBMT ), hvor systemet "lærer af millioner af eksempler". [2] Den foreslåede GNMT-systemlæringsarkitektur blev først testet på over hundrede sprog understøttet af Google Translate. [2] På grund af den store ende-til-ende-struktur lærer systemet med tiden at producere bedre og mere naturlige oversættelser. [1] GNMT er i stand til at oversætte hele sætninger, ikke dele. [1] GNMT-netværket kan udføre interlingual maskinoversættelse ved at indkode en sætnings semantik i stedet for at huske oversættelser af individuelle sætninger. [2] [4]

Historie

Google Brain - projektet blev oprettet i 2011 i "Google X's hemmelige forskningslaboratorium" [5] af Jeff Dean , en Google-medarbejder, Greg Corrado, en Google-forsker, og Andrew Ng , en professor i datalogi ved Stanford University . [6] [7] [8] Euns arbejde var grundlaget for et af de største teknologiske gennembrud hos Google og Stanford. [5]

I september 2016 annoncerede Google-forskningsgruppen udviklingen af ​​GNMT-oversættelsessystemet, og i november begyndte Google Translate at bruge neural maskinoversættelse (NMT) i stedet for de tidligere statistiske metoder (SMT) [1] [9] [10] [ 11] der havde været brugt siden oktober 2007 i vores eget lukkede SMT-system. [12] [13]

NMT-systemet i Google Translate bruger et stort kunstigt neuralt netværk, der er velegnet til dyb læring . [1] [2] [3] Ved at undersøge millioner af eksempler forbedrer GNMT kvaliteten af ​​oversættelsen ved at bruge en bredere kontekst til at udlede den mest passende oversættelse. Resultatet omarrangeres derefter og tilpasses, så det passer til det menneskelige sprogs grammatik. GNMT skabte ikke sit eget interne universelle sprog, men søgte snarere at finde fællestræk mellem mange sprog, som burde være af interesse for psykologer og lingvister mere end for dataloger. [14] En ny oversættelsesmaskine blev inkluderet i begge retninger for ni sprog: engelsk, fransk, tysk, spansk, portugisisk, kinesisk, japansk, koreansk og tyrkisk i 2016. [15] I marts 2017 blev yderligere tre sprog tilføjet: russisk, hindi og vietnamesisk. [16] I samme måned blev understøttelse af hebraisk og arabisk tilføjet med hjælp fra Google Translate-fællesskabet. [17] Yderligere støtte blev tilføjet i slutningen af ​​april 2017 for ni indiske sprog, nemlig hindi, bengali, marathi, gujarati, punjabi, tamil, telugu, malayalam og kannada. [atten]

Sprog understøttet af GNMT

Nedenfor er en liste over sprogpar, der bruger Google Neural Machine Translation (NMT)-modellen til oversættelse. Fra juli 2017 understøttes kun oversættelse til og fra engelsk for alle sprog: [19]

sprogpar Sprogkoder
en Afrikaans <-> engelsk af<->en
2 Arabisk <-> engelsk ar<->en
3 Bulgarsk <-> engelsk bg<->en
fire Kinesisk (forenklet) <-> engelsk zh-CN <->en
5 Kinesisk (traditionel) <-> engelsk zh-TW<->en
6 Kroatisk <-> engelsk hr<->en
7 Tjekkisk <-> engelsk cs<->en
otte Dansk <-> Engelsk da<->en
9 Hollandsk <-> Engelsk nl<->en
ti Fransk <-> engelsk fr<->en
elleve Tysk <-> engelsk de<->en
12 Græsk <-> engelsk el<->en
13 Hebraisk <-> engelsk iw<->en
fjorten Hindi <-> engelsk hi<->en
femten islandsk <-> engelsk is<->en
16 Indonesisk <-> engelsk id<->en
17 Italiensk <-> engelsk it<->en
atten Japansk <-> engelsk ja<->en
19 Koreansk <-> engelsk ko<->en
tyve Norsk <-> Engelsk no<->en
21 polsk <-> engelsk pl<->en
22 Portugisisk <-> engelsk pt<->en
23 Rumænsk <-> engelsk ro<->en
24 Russisk <-> engelsk ru<->en
25 Slovakisk <-> engelsk sk<->en
26 Spansk <-> Engelsk es<->en
27 Svensk <-> engelsk sv<->en
28 Thai <-> engelsk th<->en
29 Tyrkisk <-> engelsk tr<->en
tredive vietnamesisk <-> engelsk vi<->en

Direkte oversættelse

GNMT-systemet siges at være den tidligere version af Google Translate overlegen ved, at det kan udføre "direkte oversættelse", dvs. oversætte direkte fra et sprog til et andet (f.eks. fra japansk til koreansk). [2] Tidligere oversatte Google Translate først fra kildesproget til engelsk og derefter fra engelsk til målsproget i stedet for direkte at oversætte fra et sprog til et andet. [fire]

Se også

Links

  1. 1 2 3 4 5 Barak Turovsky (15. november 2016), Fundet i oversættelse: Mere nøjagtige, flydende sætninger i Google Translate , < https://blog.google/products/translate/found-translation-more-accurate-fluent -sætninger-google-oversæt/ > . Hentet 11. januar 2017. Arkiveret 7. april 2017 på Wayback Machine 
  2. 1 2 3 4 5 6 Mike Schuster, Melvin Johnson og Nikhil Thorat (22. november 2016), Zero-Shot Translation with Google's Multilingual Neural Machine Translation System , < https://research.googleblog.com/2016/11/ zero-shot-translation-with-googles.html > . Hentet 11. januar 2017. Arkiveret 10. juli 2017 på Wayback Machine 
  3. 1 2 Gil Fewster (5. januar 2017), The mind-blowing AI-annoncering fra Google, som du sandsynligvis gik glip af , < https://medium.freecodecamp.com/the-mind-blowing-ai-announcement-from-google- at-du-sandsynligvis-gik glip af-2ffd31334805#.msj1mdvbh > . Hentet 11. januar 2017. Arkiveret 31. maj 2017 på Wayback Machine 
  4. 12 Boitet , Christian; Blanchon, Herve; Seligman, Mark; Bellynck, Valérie MT på og for internettet (PDF)  (link ikke tilgængeligt) (2010). Dato for adgang: 1. december 2016. Arkiveret fra originalen 29. marts 2017.
  5. 1 2 Robert D. Hof. En kinesisk internetgigant begynder at drømme: Baidu er en fast bestanddel af onlinelivet i Kina, men den ønsker at blive en global magt. Kan en af ​​verdens førende kunstig intelligens-forskere hjælpe den med at udfordre Silicon Valleys største virksomheder? . Teknologigennemgang (14. august 2014). Hentet 11. januar 2017. Arkiveret fra originalen 8. januar 2020.
  6. Brug af hjernesimuleringer i stor skala til maskinlæring og kunstig intelligens . Officiel Google-blog (26. juni 2012). Hentet 26. januar 2015. Arkiveret fra originalen 23. august 2020.
  7. Googles storskala Deep Neurale Networks Project . Hentet 25. oktober 2015. Arkiveret fra originalen 16. februar 2019.
  8. Markoff, John Hvor mange computere kan man identificere en kat? 16.000 . New York Times (25. juni 2012). Dato for adgang: 11. februar 2014. Arkiveret fra originalen 9. maj 2017.
  9. Katyanna Quach (17. november 2016), Googles neurale netværk lærer at oversætte sprog, det ikke er blevet trænet i: Første gang, maskinoversættelse har brugt ægte overførselslæring , < https://www.theregister.co.uk/ 2016/ 17/11/googles_neural_net_translates_languages_not_trained_on > . Hentet 11. januar 2017. Arkiveret 22. september 2017 på Wayback Machine 
  10. Lewis-Kraus, Gideon . The Great AI Awakening , The New York Times  (14. december 2016). Arkiveret fra originalen den 5. maj 2017. Hentet 11. januar 2017.
  11. Le, Quoc; Schuster, Mike Et neuralt netværk for maskinoversættelse, i produktionsskala . Google Research Blog . Google (27. september 2016). Hentet 1. december 2016. Arkiveret fra originalen 7. maj 2018.
  12. Google skifter til sit eget oversættelsessystem Arkiveret 29. april 2017 på Wayback Machine 22. oktober 2007
  13. Barry Schwartz. Google Translate dropper SYSTRAN til hjemmebrygget oversættelse . Søgemaskineland (23. oktober 2007). Hentet 4. maj 2017. Arkiveret fra originalen 21. maj 2017.
  14. Chris McDonald (7. januar 2017), kommenterer Gil Fewsters artikel fra 5. januar i Atlanterhavet , < https://medium.com/@chrismcdonald_94568/ok-slow-down-516f93f83ac8#.l0ti3ct0b > . Hentet 11. januar 2017. Arkiveret 22. juni 2017 på Wayback Machine 
  15. Turovsky, Barak Fundet i oversættelse: Mere nøjagtige, flydende sætninger i Google Translate . Søgeordet Google-bloggen . Google (15. november 2016). Hentet 1. december 2016. Arkiveret fra originalen 14. april 2020.
  16. Turovsky, Barak Neurale oversættelser af højere kvalitet til en masse flere sprog . Søgeordet Google-bloggen . Google. Hentet 6. marts 2017. Arkiveret fra originalen 7. marts 2017.
  17. Novet, Jordan Google leverer nu AI-drevne oversættelser til arabisk og hebraisk . Venture Beat (30. marts 2017). Arkiveret fra originalen den 1. januar 2020.
  18. Turovsky, Barak Gør internettet mere inkluderende i Indien . Nøgleordet (25. april 2017). Arkiveret 11. november 2020.
  19. Oversættelse API sprogunderstøttelse . Google Cloud Platform (4. maj 2017). Arkiveret fra originalen den 16. september 2017.

Eksterne links