Monolingual TTS – uniwersalny tłumacz Microsoftu przemówi naszym głosem

Automatyczne tłumaczenie ma długą historię, jednak w miarę skuteczne i popularne rozwiązania wprowadził dopiero Google Translator. Microsoft postanowił zaprezentować coś znacznie lepszego – urządzenie, które nie tylko przetłumaczy nasze słowa, ale do tego wypowie je naszym głosem.

Monolingual TTS – uniwersalny tłumacz Microsoftu przemówi naszym głosem 1Technologia ze Star Treka przestaje być fikcją (Fot. Memory-Alpha.org)
Łukasz Michalik

Automatyczne tłumaczenie ma długą historię, jednak w miarę skuteczne i popularne rozwiązania wprowadził dopiero Google Translator. Microsoft postanowił zaprezentować coś znacznie lepszego – urządzenie, które nie tylko przetłumaczy nasze słowa, ale do tego wypowie je naszym głosem.

Frank Soong z Microsoftu zaprezentował nowy wynalazek - translator Monolingual TTS (Text-To-Speech), którego możliwości przekraczają obecne standardy. Oprogramowanie translatora pozwala na tłumaczenie ludzkiej mowy na 26 różnych języków (co potwierdza prognozę IBM-u z 2007 roku, która jeszcze kilka miesięcy temu wydawała się nietrafiona).

To nie wszystko. Elektroniczny tłumacz nie tylko przetłumaczy słowa, ale na dodatek będzie mógł wypowiedzieć je głosem użytkownika – słowa, wypowiadane w nieznanym języku będą brzmiały tak, jakby powiedział je ich nadawca, a nie maszyna.

Na obecnym etapie rozwoju Monolingual TTS potrzebuje około godziny, by nauczyć się głosu użytkownika. Co więcej, do głosu można dodać również obraz – wyświetlana na ekranie twarz będzie poruszać ustami stosownie do wypowiadanych słów. Na poniższych filmach możecie zobaczyć, jak Craig Mundie z Microsoftu, a raczej jego awatar, wita gości po angielsku, a poniżej powtarza powitanie w jezyku mandaryńskim.

Craig Mundie's talking head speaks in English

Craig Mundie's talking head speaks in Chinese.

Trudno opisać ogrom zastosowań, w jakich może sprawdzić się Monolingual TTS. Po dopracowaniu technologii i umieszczeniu jej np. w smartfonach bariera językowa przestanie być jakimkolwiek problemem. Poniżej dłuższy film prezentujący możliwości Monolingual TTS. Część dotycząca wynalazku zaczyna się od około 12. minuty.

TechFest 2012 Keynote - TVtech

Źródło: PGSTechnology RevievTechnaBob

Źródło artykułu: WP Gadżetomania
Wybrane dla Ciebie
Najbardziej jadowita ryba świata. Jak działa jad szkaradnicy?
Najbardziej jadowita ryba świata. Jak działa jad szkaradnicy?
Syberyjskie tatuaże. Na mumii sprzed 2 tysięcy lat
Syberyjskie tatuaże. Na mumii sprzed 2 tysięcy lat
Może uszkodzić sprzęt. Ekspert ostrzega przed popularną pastą termoprzewodzącą
Może uszkodzić sprzęt. Ekspert ostrzega przed popularną pastą termoprzewodzącą
YouTube podnosi jakość starych filmów. AI skaluje materiały nawet do 1080p
YouTube podnosi jakość starych filmów. AI skaluje materiały nawet do 1080p
Wspólna koncepcja. Czym właściwie jest świaodmość?
Wspólna koncepcja. Czym właściwie jest świaodmość?
Otworzyli sarkofag sprzed 2 tys. lat. Szczątki zachowały się wyjątkowo dobrze
Otworzyli sarkofag sprzed 2 tys. lat. Szczątki zachowały się wyjątkowo dobrze
Gboard na Androida ma nowe opcje. Sprawdź aktualizację
Gboard na Androida ma nowe opcje. Sprawdź aktualizację
Efekt zmian klimatycznych. Mikroorganizmy budzą się po latach
Efekt zmian klimatycznych. Mikroorganizmy budzą się po latach
To był największy wybuch w historii. Car-bomba wywołała globalny niepokój
To był największy wybuch w historii. Car-bomba wywołała globalny niepokój
Zmiany w Messengerze. Przygotuj się
Zmiany w Messengerze. Przygotuj się
Nowa gra ze świata Wiedźmina w fazie przygotowań. Szukają scenarzysty
Nowa gra ze świata Wiedźmina w fazie przygotowań. Szukają scenarzysty
Chcieli skopiować maszynę do produkcji procesorów. Przyłapali chińskich inżynierów
Chcieli skopiować maszynę do produkcji procesorów. Przyłapali chińskich inżynierów