Sztuczna inteligencja Google'a czyta z ruchu warg lepiej, niż ludzie. Wystarczy nagranie, by podsłuchać rozmowę

Sztuczna inteligencja Google'a czyta z ruchu warg lepiej, niż ludzie. Wystarczy nagranie, by podsłuchać rozmowę27.11.2016 11:13

Możliwości oprogramowania Google’a po raz kolejny zaskakują. Po przeanalizowaniu tysięcy godzin nagrań wideo, sztuczna inteligencja potrafi – wyłącznie na podstawie obrazu – odczytać wypowiadane słowa z ruchu warg.

Demonstracja możliwości

Tworzone przez Google’a oprogramowanie bywa często nazywane – nieco na wyrost – sztuczną inteligencją. Niezależnie od tego, jak zdefiniujemy SI, możliwości algorytmów Google’a nie przestają nas zaskakiwać.

Jeszcze dwa lata temu wydawało się, że niebywałym osiągnięciem jest nauczenie się przez nią gry w Arkanoida, kiedy to oprogramowanie Google’a samodzielnie opanowało reguły gry, a następnie wypracowało optymalną strategię rozgrywki, osiągając w niej biegłość, o której ludzie mogą zazwyczaj tylko pomarzyć.

Sztuczna inteligencja lepsza od ludzi

Od tamtego czasu Google (a właściwe Alphabet, ale mało kto używa poprawnej nazwy koncernu) co pewien czas zaskakuje nas kolejnymi doniesieniami o postępach swojego oprogramowania.

Całkiem niedawno mogliśmy dowiedzieć się np. o tym, że automatyczny tłumacz Google’a potrafi tłumaczyć z par języków, których nie był bezpośrednio uczony, odczytując sens i znaczenia na podstawie innych, znanych zestawów języków.

Nowe doniesienia są równie zaskakujące. Okazuje się bowiem, że oprogramowanie o nazwie Watch, Listen, Attend, and Spell, tworzone przez Google’a, a właściwie przez należącą do Alphabetu firmę DeepMind i zespół z Oxford Uniersity, opanowało trudną sztukę czytania z ruchu warg. Co więcej, jest w tym skuteczniejsze od ludzi.

Oprogramowanie DeepMind w akcji
Oprogramowanie DeepMind w akcji

Nauka przez oglądanie filmów

Aby nauczyć je odczytywania ruchów warg, badacze poddali analizie 5000 godzin nagrań materiałów wideo, pochodzących ze stacji BBC, w tym m.in. kłótni prowadzonych przez polityków. Dało to w sumie 118 tys. różnych zdań, budowanych z około 16 - 17 tys. słów.

Dla porównania – słowniki języka angielskiego wyróżniają około 170 tys. słów. Słowniki polskiego – około 150 tys. Do codziennej komunikacji wystarcza zazwyczaj znajomość około 2 tys. słów.

Na podstawie filmów Watch, Listen, Attend, and Spell nauczył się analizować ruchy warg z niebywałą dokładnością – o ile najlepsi spośród ludzi są w stanie odczytać w ten sposób około 12 - 20 proc. wypowiadanych słów, to oprogramowanie Google’a osiąga skuteczność niemal 50 proc.!

Czytanie z ruchu warg – nowe możliwości

Zdaniem Google’a nowa technologia – choć wciąż jeszcze daleka od doskonałości i zależna od jakości materiału wideo – może pomóc w codziennym życiu osobom z dysfunkcjami słuchu, przydać się do udźwiękowienia niemych filmów albo być wykorzystana np. do obsługi asystentów głosowych – dzięki analizie obrazu będzie bowiem możliwe sterowanie nimi za pomocą bezgłośnych, niesłyszalnych dla otoczenia komend.

Brzmi to całkiem sensownie, ale nie byłbym sobą, gdybym – podziwiając skuteczność oprogramowania Google’a – nie zwrócił uwagi na zagrożenia. Nowa technologia wydaje mi się bowiem kolejnym krokiem, zmniejszającym i tak iluzoryczny obszar naszej prywatności.

Wielki Brat patrzy i słucha

Jeszcze do niedawna obraz z kamer, którymi obwieszone są nasze ulice, mógł co najwyżej pokazać, że dwie osoby spotkały się i rozmawiały. W połączeniu z rosnącą popularnością wideo wysokiej jakości i nowymi możliwościami oprogramowania Google’a, prawdopodobne wydaje się zarejestrowanie nie tylko faktu spotkania, ale i treści prowadzonej rozmowy.

Wygląda zatem na to, że orwellowski slogan o Wielkim Bracie nabrał nowego znaczenia. Dzięki nowym technologiom Wielki Brat patrząc, przy okazji również słucha.

Źródło artykułu:WP Gadżetomania
Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.