Google Docs skanuje tekst z PDF-ów

Po wielu miesiącach pracy, Google po cichu wprowadziło do swojej usługi Docs nową funkcjonalność - od niedawna, dokumenty Googla wykorzystują technologię OCR do wykrywania tekstu w dokumentach graficznych czy PDF'ach.

Google Docs skanuje tekst z PDF-ów 1

Po wielu miesiącach pracy, Google po cichu wprowadziło do swojej usługi Docs nową funkcjonalność - od niedawna, dokumenty Googla wykorzystują technologię OCR do wykrywania tekstu w dokumentach graficznych czy PDF'ach.

OCR, czyli Optical Character Recognition to technologia służąca do rozpoznawiania znaków i całych fragmentów tekstu w plikach graficznych. Technologię stosuje się głównie do rozpoznawania ciągów liter w zeskanowanych dokumentach.

W większości wypadków osoby, które muszą przerobić kilka obrazków na tekst ciągły są zmuszone do korzystania z komercyjnych rozwiązań, lub też darmowych aplikacji, które nie zawsze spełniają wymagania użytkowników.

Google postanowiło spróbować swoich sił i wprowadziło możliwość rozpoznawania znaków w czasie wgrywania dokumentów do Docsów. Wgrywając nowy plik (czy to obrazek czy PDF), możemy zaznaczyć opcję konwersji na znaki. Zeskanowany tekst trafi do nowego dokumentu tekstowego.

Póki co wprowadzona funkcjonalność nie jest idealna. PDFy sprawdzają się znacznie lepiej, niż zwykłe obrazki. Niestety proces skanowania pozbawia tekst większości elementów formatowania i niektórych spacji. W przypadku obrazków, pojawiają się trudności z większymi literami, choć małe są konwertowane bez większych problemów. Nie zauważyłem zaś problemów ze skanowaniem polskich liter - działają bez zarzutu. Dodatkowo, wgrywając plik PDF i konwertując go w tym samym czasie, zapisanym zostanie jedynie przekonwertowany tekst. Chcąc zapisać właściwy plik PDF, trzeba go wgrać jeszcze raz.

Nowa opcja jest z pewnością bardzo wartościowa, wymaga jednak dopracowania. Sprawdzi się dla osób, które potrzebują skorzystać z OCR'a od czasu do czasu. Osoby skanujące obrazki do tekstu częściej póki co powinny pozostać przy rozwiązaniach komercyjnych.

Rzuć także okiem na nasze zestawienie 10 darmowych edytorów tekstu i pakietów biurowych.

Źródło artykułu: WP Gadżetomania
Wybrane dla Ciebie
Ten projekt robi wrażenie. Portowy cypel zmieni się w zieloną oazę z operą
Ten projekt robi wrażenie. Portowy cypel zmieni się w zieloną oazę z operą
Co roku zabija setki osób. Szybciej niż popularne choroby
Co roku zabija setki osób. Szybciej niż popularne choroby
"Lodowiec zagłady". Śmiały plan ma ograniczyć wzrost poziomu mórz
"Lodowiec zagłady". Śmiały plan ma ograniczyć wzrost poziomu mórz
Jak dobrze umyć ziemniaki? Większość Polaków popełnia błąd
Jak dobrze umyć ziemniaki? Większość Polaków popełnia błąd
Bociany w Afryce szykują się do drogi. Kiedy dotrą do Polski?
Bociany w Afryce szykują się do drogi. Kiedy dotrą do Polski?
„Widzieć” bez oczu. Trening aktywuje korę wzrokową
„Widzieć” bez oczu. Trening aktywuje korę wzrokową
Boty na Moltbooku: "Ludzie to zgnilizna". Tak wyglądałby świat bez ludzi
Boty na Moltbooku: "Ludzie to zgnilizna". Tak wyglądałby świat bez ludzi
Lodowy "statek widmo" przybił do Gdańska. Obserwował go cały świat
Lodowy "statek widmo" przybił do Gdańska. Obserwował go cały świat
Waży 100 ton. Znaleźli ją w Londynie
Waży 100 ton. Znaleźli ją w Londynie
Nowość w mObywatelu. Opcja dla wszystkich
Nowość w mObywatelu. Opcja dla wszystkich
"Zjada mózg".To wyjatkowo niebezpieczny mikrooorganizm
"Zjada mózg".To wyjatkowo niebezpieczny mikrooorganizm
Błoto i sól niszczą twoje podłogi? Tak usuniesz uporczywe ślady
Błoto i sól niszczą twoje podłogi? Tak usuniesz uporczywe ślady
ZANIM WYJDZIESZ... NIE PRZEGAP TEGO, CO CZYTAJĄ INNI! 👇