NEKST – nowa, polska wyszukiwarka. Aby miała sens, technologia musi stać się produktem

NEKST – nowa, polska wyszukiwarka. Aby miała sens, technologia musi stać się produktem14.01.2014 08:27
Czy NEKST okaże się sukcesem?

Polska wyszukiwarka oparta na autorskich, zoptymalizowanych pod kątem lokalnego użytkownika algorytmach? W erze dominacji Google’a brzmi to niesamowicie, ale już niebawem może być faktem. Polscy naukowcy pracują nad lokalną wyszukiwarką, która z obsługą polskich internautów poradzi sobie lepiej niż światowi liderzy.

TL;DR:

Polscy naukowcy opracowują nową wyszukiwarkę, która lepiej niż Google poradzi sobie z obsługą polskich dokumentów. Lokalna usługa prezentuje się bardzo obiecująco, a lista jej możliwości obejmuje m.in. rozpoznawanie znaczenia wyrazów czy zaangażowania emocjonalnego. Kluczem do sukcesu jest jednak nie tyle sama technologia, ale pomysł, jak przekształcić ja w powszechnie używany produkt.

Monopol wyszukiwania

Co robimy, gdy szukamy czegoś w Sieci? Z reguły bez zastanowienia wpisujemy mniej lub bardziej precyzyjne pytanie w odpowiednim polu aplikacji, ta przesyła pytanie do Google’a lub rzadziej Binga i wypluwa listę odpowiedzi.

I choć podsuwany nam przez wyszukiwarki wykaz linków może być daleki od obiektywizmu (więcej na ten temat znajdziecie w artykule „Internet: konserwator biedy. Zabójcze skutki personalizacji”), to przyzwyczailiśmy się do Google’a i chyba jest nam z tym dobrze, bo raczej nie szukamy alternatyw (dajcie znać w komentarzach, jeśli korzystacie z innych wyszukiwarek).

Tak jest w większości państw na świecie, z nielicznymi (a gdy policzymy użytkowników, całkiem licznymi) wyjątkami, jak Rosja czy Chiny.

Co dobrego dla Polaków?

Problem polega na tym, że Google nie jest zoptymalizowany pod kątem polskiego użytkownika. Oczywiście ma wiele opcji personalizacji i wydaje się całkiem nieźle rozumieć zadawane po polsku pytania, jednak daleko mu w tej kwestii do doskonałości. I raczej nieprędko się to zmieni, bo z punktu widzenia globalnych firm Polska jest przecież mało znaczącym rynkiem.

W rezultacie – według szacunków Polskiej Akademii Nauk – Google indeksuje mniej więcej jedną piątą z miliarda dostępnych w Sieci polskich dokumentów. Na co dzień większość z nas tego nie dostrzega, jednak w praktyce 80 proc. treści w języku polskim jest niedostępnych z poziomu wyszukiwarki!

IPIPAN.waw.pl/nekst/ - strona WWW projektu
IPIPAN.waw.pl/nekst/ - strona WWW projektu

Efektem tego jest niezagospodarowana na razie nisza. Chcą ją wypełnić naukowcy z Instytutu Podstaw Informatyki PAN w Warszawie i Politechniki Wrocławskiej, którzy pracują nad nową, polską wyszukiwarką o nazwie NEKST.

Polska wyszukiwarka? To już było!

Warto w tym miejscu zauważyć, że nie jest to pierwsza tego typu próba. Polskie wyszukiwarki internetowe mają bowiem całkiem długą historię: od archaicznego Emulti, poprzez tworzone w latach 90. NEToskop i Sieciowid, po wyszukiwarkę NetSprint i działającego do niedawna (i miło przeze mnie wspominanego) Szukacza.

Tyle zostało z polskiej wyszukiwarki...
Tyle zostało z polskiej wyszukiwarki...

To wszystko jest jednak historią. W praktyce polski Internet łącznie z wyszukiwarkami największych portali to monokultura Google’a z nieśmiało upominającym się o swoje Bingiem. Polska wyszukiwarka ma ambicje, by to zmienić. W jaki sposób? Tak o swoim dziele piszą twórcy NEKST-a:

Celem projektu jest konstrukcja systemu wspomagającego rozwiązywanie szerokiej klasy problemów w oparciu o analizę struktury i treści dostępnych dokumentów elektronicznych. Analiza ma dotyczyć zawartej w dokumentach wiedzy i informacji reprezentowanej w postaci tekstu oraz wybranych elementów multimedialnych. System będzie łączył mechanizmy: automatycznej odpowiedzi na zadane w języku polskim pytania, automatycznej analizy opinii oraz wielkoskalowej, przekrojowej analizy semantycznej źródeł elektronicznych, połączonej z wyszukiwaniem i wizualizacją wyników. Głównym obiektem analizy będą dokumenty tekstowe.

Wyszukiwarka NEKST - możliwości

Kluczem do sukcesu ma być skupienie się na polskojęzycznych treściach i zindeksowanie tych dokumentów, których nie dostrzega Google. Twórcy wyszukiwarki udostępnili listę zadań, które muszą zostać wykonane przed uruchomieniem wyszukiwarki. Jest to zarazem skrótowe przedstawienie jej możliwości:

Zadania wchodzące w skład projektu NEKST, Źródło zdjęć: © ipipan.waw.pl
Zadania wchodzące w skład projektu NEKST
Źródło zdjęć: © ipipan.waw.pl

Co ciekawego wynika z powyższego wykazu? Okazuje się, że NEKST nie będzie tępą maszyną, przeszukującą dokumenty po słowach kluczowych, ale czymś znacznie bardziej finezyjnym. Algorytm wyszukiwarki ma m.in. rozumieć analizowaną treść i rozróżniać na podstawie kontekstu znaczenie słów takich, jak np. wywrotka (upadek i samochód ciężarowy) czy klapa (porażka, pokrywa na zawiasach i część skrzydła).

Inną umiejętnością będzie analiza opinii, co pozwoli oddzielić warte uwagi treści od internetowego szamba, w którym taplają się komentujący w serwisach horyzontalnych. Co więcej, NEKST ma odpowiadać nie tylko na typowe zapytania w postaci odpowiednio dobranych fraz, ale też pozwoli na zadawanie pytań językiem naturalnym, tak jak robimy to podczas zwykłej rozmowy.

Algorytm wyszukiwarki ma rozumieć, jakiego zagadnienia dotyczy dany dokument. Dzięki temu użytkownik, który zada pytanie, dostanie w odpowiedzi nie tylko – jak w Google’u – link, ale też otrzyma wskazówkę z zaznaczonym fragmentem dokumentu, najlepiej odpowiadającym na zadane pytanie.

NEKST to unikat

Wyszukiwarka NEKST to przedsięwzięcie wyjątkowe. Jeśli wszystko pójdzie zgonie z harmonogramem, polska wyszukiwarka będzie w Europie pierwszą tego typu tak dużą usługą opracowaną z uwzględnieniem specyfiki lokalnego języka. Co istotne, jej zasoby będą również dostępne dla użytkowników zadających pytania po niemiecku i angielsku.

NEKST już częściowo działa. Nie jest jeszcze dostępny publicznie, ale NekstBOT, czyli robot indeksujący treści w Internecie, przeczesuje już Sieć w poszukiwaniu polskich dokumentów. Do tej pory udało się zindeksować około 16 proc. treści, które po skompresowaniu zajmują skromne 3 terabajty.

Do czerwca baza wyszukiwarki ma zawierać około połowy dostępnych w Sieci polskich dokumentów i wówczas NEKST zostanie udostępniony publicznie. Przyznam, że nie mogę się doczekać pierwszych testów.

Produkt, nie technologia!

Tym, co wywołuje mój niepokój, jest brak konkretnych informacji na temat tego, w jaki sposób NEKST ma funkcjonować i zarabiać na siebie. Kluczem jest spostrzeżenie, którym w jednym z wywiadów podzielił się Jaromir Działo – Polak będący partnerem zarządzającym w funduszu Status Venture, który działa w Dolinie Krzemowej.

Chodzi o przekształcenie ciekawej technologii w produkt. Sama technologia, choć może budzić podziw i uznanie, jest bowiem w wielu przypadkach zupełnie bez znaczenia. Co z tego, że według twórców jest przełomowa i wspaniała, skoro nikt z niej nie korzysta?

Eric Schmidt - filar sukcesu Google'a
Eric Schmidt - filar sukcesu Google'a

Doskonałym przykładem może być tu historia Google’a. Choć Sergey i Larry mieli świetną technologię, a ich wyszukiwarka szybko zdobywała użytkowników, dopiero Eric Schmidt zmienił studencki projekt w produkt, który był w stanie zarobić na swój dalszy rozwój i ekspansję.

Mam nadzieję, że NEKST również znajdzie swojego Erica Schmidta. Bez tego, mimo medialnych zachwytów i sporego zainteresowania, pozostanie jedynie jednym z wielu uczelnianych projektów, który po zakończeniu finansowania ze środków Unii Europejskiej przestanie kogokolwiek - poza garstką twórców - interesować. Mam jednak nadzieję, że tak się to nie skończy.

A my zamiast pytać Google’a, zaczniemy coraz częściej korzystać z odpowiedzi udzielanych przez NEKST-a. Nie dlatego, że to fajna ciekawostka, ani nie z poczucia patriotyzmu, tylko dlatego, że polska wyszukiwarka będzie po prostu najlepsza. Czego w tym miejscu zarówno jej twórcom, jak i nam, potencjalnym użytkownikom, szczerze życzę.

Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.