Sztuczna inteligencja Google Translate tłumaczy także te języki, których jej nie uczono

Tym odkryciem byli zaskoczeni nawet inżynierowie odpowiedzialni za projekt. Obsługująca tłumaczenia sieć neuronowa wykazała zdolność tłumaczenia także tych języków, których nie uczono jej bezpośrednio. Jak to możliwe?

Automat zastąpiony sztuczną inteligencją

Google Translate tłumaczy obecnie 103 różne języki w tempie 140 miliardów słów dziennie. Bardzo długo wykonywał to automatycznie, podstawiając słowa w oparciu o słownik i statystykę, jednak we wrześniu tego roku zapowiedziano zmiany, wdrożone 16 listopada. Od tej pory za coraz większą część tłumaczeń odpowiada system neuronowego tłumaczenia maszynowego (GNMT).

Zaawansowany projekt oparty na sieciach neuronowych aktualnie obsługuje 9 języków, czyli 35% ogółu zapytań. W toku uczenia maszynowego bardzo szybko zetknięto się z nieprzewidzianą umiejętnością sztucznej inteligencji: "nauczona" tłumaczenia jednego języka na dwa inne, całkiem trafnie potrafiła przekładać dwa ostatnie między sobą.

System złożony bardziej niż się spodziewano

Zaskoczeni badacze postanowili bliżej przyjrzeć się działaniu mechanizmu tłumaczenia. W tym celu wybrano trzy języki: angielski, koreański i japoński, po czym „nauczono” sieć neuronową wyłącznie przekładów z angielskiego na oba pozostałe. Rezultaty okazały się obiecujące: sieć neuronowa dostarczyła całkiem trafnych tłumaczeń między językiem koreańskim i japońskim.

Dalszą analizę przeprowadzono na trój-językowym modelu 3D, reprezentującym dane zgromadzone przez sztuczną inteligencję. Pozwoliło to dostrzec, że system grupuje frazy o podobnym znaczeniu ze wszystkich trzech językach. Innymi słowy tworzy własne, lingwistyczne grupy pojęciowe, w których gromadzi bliskoznaczne słowa i sformułowania.

Mapa działań sieci neuronowej: a) Ogólna geometria tłumaczeń. Podobne znaczenia oznaczono tymi samymi kolorami, b) Przybliżenie jednej z grup, c) Kolory uporządkowane wg języka źródłowego

Przyszłość pod znakiem sieci neuronowych

Inżynierowie nazwali tę metodę tłumaczeń „zero-shot” i będą im się przyglądać bliżej. Odkrycie ma ogromne znaczenie, gdyż dowodzi rozpoznawania przez sztuczną inteligencję czegoś na kształt semantyki sformułowań zamiast stricte mechanicznego ich zapamiętywania i rozpoznawania.

Takie zachowanie systemu jest również świetnym prognostykiem na przyszłość, w której będzie się ona „uczyć” języków szybciej i skuteczniej niż dotychczas sądzono. Nieco mniej polegając na sztywnym przykładzie i nieco bardziej analizując pozostałe języki świata. Stąd już coraz krótsza droga do tłumaczeń, które póki co oglądamy wyłącznie na filmach sci-fi.