Sztuczna inteligencja Google Translate tłumaczy także te języki, których jej nie uczono
Tym odkryciem byli zaskoczeni nawet inżynierowie odpowiedzialni za projekt. Obsługująca tłumaczenia sieć neuronowa wykazała zdolność tłumaczenia także tych języków, których nie uczono jej bezpośrednio. Jak to możliwe?
26.11.2016 | aktual.: 10.03.2022 09:00
Automat zastąpiony sztuczną inteligencją
Google Translate tłumaczy obecnie 103 różne języki w tempie 140 miliardów słów dziennie. Bardzo długo wykonywał to automatycznie, podstawiając słowa w oparciu o słownik i statystykę, jednak we wrześniu tego roku zapowiedziano zmiany, wdrożone 16 listopada. Od tej pory za coraz większą część tłumaczeń odpowiada system neuronowego tłumaczenia maszynowego (GNMT).
Zaawansowany projekt oparty na sieciach neuronowych aktualnie obsługuje 9 języków, czyli 35% ogółu zapytań. W toku uczenia maszynowego bardzo szybko zetknięto się z nieprzewidzianą umiejętnością sztucznej inteligencji: "nauczona" tłumaczenia jednego języka na dwa inne, całkiem trafnie potrafiła przekładać dwa ostatnie między sobą.
System złożony bardziej niż się spodziewano
Zaskoczeni badacze postanowili bliżej przyjrzeć się działaniu mechanizmu tłumaczenia. W tym celu wybrano trzy języki: angielski, koreański i japoński, po czym „nauczono” sieć neuronową wyłącznie przekładów z angielskiego na oba pozostałe. Rezultaty okazały się obiecujące: sieć neuronowa dostarczyła całkiem trafnych tłumaczeń między językiem koreańskim i japońskim.
Dalszą analizę przeprowadzono na trój-językowym modelu 3D, reprezentującym dane zgromadzone przez sztuczną inteligencję. Pozwoliło to dostrzec, że system grupuje frazy o podobnym znaczeniu ze wszystkich trzech językach. Innymi słowy tworzy własne, lingwistyczne grupy pojęciowe, w których gromadzi bliskoznaczne słowa i sformułowania.
Przyszłość pod znakiem sieci neuronowych
Inżynierowie nazwali tę metodę tłumaczeń „zero-shot” i będą im się przyglądać bliżej. Odkrycie ma ogromne znaczenie, gdyż dowodzi rozpoznawania przez sztuczną inteligencję czegoś na kształt semantyki sformułowań zamiast stricte mechanicznego ich zapamiętywania i rozpoznawania.
Takie zachowanie systemu jest również świetnym prognostykiem na przyszłość, w której będzie się ona „uczyć” języków szybciej i skuteczniej niż dotychczas sądzono. Nieco mniej polegając na sztywnym przykładzie i nieco bardziej analizując pozostałe języki świata. Stąd już coraz krótsza droga do tłumaczeń, które póki co oglądamy wyłącznie na filmach sci-fi.