Komputery uczą się nawzajem: jeden nauczył drugi grać w Pac-Mana i StarCrafta

Komputery uczą się nawzajem: jeden nauczył drugi grać w Pac-Mana i StarCrafta09.04.2014 08:07

Nie wkładaj ręki do ognia, nie jedz grzybów z białymi kropkami, zejdź z drogi ludziom bez karku i nie ufaj politykom. Niemal w każdej chwili naszego życia korzystamy z mądrości będącej sumą własnych doświadczeń i wiedzy poprzednich pokoleń. Szkoła, rodzice, przyjaciele - oni wszyscy są dla nas źródłem informacji. Czy da się to zastosować w świecie komputerów? Okazuje się, że tak. Maszyny potrafią już uczyć się od siebie!

Jak najskuteczniej zdobywać nową wiedzę? Jednym z najbardziej efektywnych sposobów jest korzystanie z pomocy kogoś, kto tę wiedzę już ma. Mentor, nauczyciel, mistrz - niezależnie, jak nazwiemy tę osobę, zasada jest podobna: ktoś, kto wie więcej od nas, może przekazać nam nie tylko proste informacje, ale również własne doświadczenia i rady, a także skorygować nasze błędy. Zazwyczaj działa to całkiem nieźle i sprawdza się w różnych sytuacjach, obojętnie, czy będzie to lekcja matematyki, kurs gotowania czy trening krav magi.

Pamiętacie, jak komputer WOPR w “Grach wojennych” uczył sam siebie, grając w kółko i krzyżyk? Po wielu remisowych partiach doszedł do wniosku, że światowy konflikt nuklearny jest bez sensu, bo nie można go wygrać. Zanim jednak ukryta pod górą Cheyenne maszyna to zrozumiała, o mało nie zmieniła połowy planety w poatomowe zgliszcza. Sytuacja byłaby znacznie prostsza, gdyby przed rozpoczęciem zabawy w wojnę inna maszyna przekazała jej prosty komunikat: nie graj, to mija się z celem, zwycięstwo jest niemożliwe.

That scene from War Games

Próbę sprostania temu wyzwaniu podjął zespół badawczy z Washington State University, kierowany przez Matthew Taylora. Zadanie, jakie postawiono przed dwoma maszynami, było dość nietypowe. Jeden komputer usiłował grać w Pac-Mana albo w bardzo uproszczoną modyfikację StarCrafta (jedna jednostka własna kontra jedna jednostka przeciwnika), a drugi dawał mu instrukcje.

Przekazywanie wiedzy w ten sposób okazało się całkiem skuteczne: w przypadku Pac-Mana na podstawie rad nauczyciela uczeń zaczął podejmować decyzje w zależności od liczby niezjedzonych kropek i odległości od “duszków”. Nieco gorzej było ze StarCraftem - początkowo uczeń przegrywał, ruszając od razu na przeciwnika, ale z czasem wypracował taktykę zapewniającą zwycięstwo.

Co istotne, zaobserwowano różnicę pomiędzy skutecznością algorytmu, który uczył się sam na własnych błędach, a tym, który korzystał ze wskazówek drugiej maszyny. W drugim przypadku wypracowanie właściwej strategii następowało szybciej.

Towards knowledge transfer between robots: Computers teach each other Pac-Man

Imponujące, ale czy nie lepiej byłoby po prostu skopiować bazę danych z całą “wiedzą” jednej z maszyn? Zdaniem badaczy nie zawsze będzie to możliwe, ponieważ mogą pojawić się problemy z kompatybilnością urządzeń i oprogramowania. Maszyny, które uczą się od siebie, zamiast po prostu kopiować dane, pozwolą na uniknięcie tej niedogodności. Co więcej, w przyszłości będą zdolne także do tego, aby uczyć ludzi, odsyłając do lamusa zawód nauczyciela.

Komentujący swoje eksperymenty Matthew Taylor wskazuje również na ich bardziej przyziemne znaczenie. Możemy wyobrazić sobie nieodległą przyszłość, gdy kupując nowe urządzenia, nie będziemy musieli przejmować się ich programowaniem czy kompatybilnością, a nowy automatyczny odkurzacz szybko nauczy się od starego, w jakich godzinach sprzątać i jak reagować na pojawienie się kota.

W artykule wykorzystałem informacje z serwisów Ars Technica, Dziennik Internautów i Phys.org.

Źródło artykułu:WP Gadżetomania
Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.