Google Docs skanuje tekst z PDF-ów

Po wielu miesiącach pracy, Google po cichu wprowadziło do swojej usługi Docs nową funkcjonalność - od niedawna, dokumenty Googla wykorzystują technologię OCR do wykrywania tekstu w dokumentach graficznych czy PDF'ach.

Google Docs skanuje tekst z PDF-ów 1
Wojciech Usarzewicz

Po wielu miesiącach pracy, Google po cichu wprowadziło do swojej usługi Docs nową funkcjonalność - od niedawna, dokumenty Googla wykorzystują technologię OCR do wykrywania tekstu w dokumentach graficznych czy PDF'ach.

OCR, czyli Optical Character Recognition to technologia służąca do rozpoznawiania znaków i całych fragmentów tekstu w plikach graficznych. Technologię stosuje się głównie do rozpoznawania ciągów liter w zeskanowanych dokumentach.

W większości wypadków osoby, które muszą przerobić kilka obrazków na tekst ciągły są zmuszone do korzystania z komercyjnych rozwiązań, lub też darmowych aplikacji, które nie zawsze spełniają wymagania użytkowników.

Google postanowiło spróbować swoich sił i wprowadziło możliwość rozpoznawania znaków w czasie wgrywania dokumentów do Docsów. Wgrywając nowy plik (czy to obrazek czy PDF), możemy zaznaczyć opcję konwersji na znaki. Zeskanowany tekst trafi do nowego dokumentu tekstowego.

Póki co wprowadzona funkcjonalność nie jest idealna. PDFy sprawdzają się znacznie lepiej, niż zwykłe obrazki. Niestety proces skanowania pozbawia tekst większości elementów formatowania i niektórych spacji. W przypadku obrazków, pojawiają się trudności z większymi literami, choć małe są konwertowane bez większych problemów. Nie zauważyłem zaś problemów ze skanowaniem polskich liter - działają bez zarzutu. Dodatkowo, wgrywając plik PDF i konwertując go w tym samym czasie, zapisanym zostanie jedynie przekonwertowany tekst. Chcąc zapisać właściwy plik PDF, trzeba go wgrać jeszcze raz.

Nowa opcja jest z pewnością bardzo wartościowa, wymaga jednak dopracowania. Sprawdzi się dla osób, które potrzebują skorzystać z OCR'a od czasu do czasu. Osoby skanujące obrazki do tekstu częściej póki co powinny pozostać przy rozwiązaniach komercyjnych.

Rzuć także okiem na nasze zestawienie 10 darmowych edytorów tekstu i pakietów biurowych.

Źródło artykułu: WP Gadżetomania
Wybrane dla Ciebie
Ten "trick" to pułapka. Możesz uszkodzić szyby
Ten "trick" to pułapka. Możesz uszkodzić szyby
Wyszli na spacer. Wrócili bogatsi o 80 tys. zł.
Wyszli na spacer. Wrócili bogatsi o 80 tys. zł.
OpenAI szykuje urządzenie z ChatGPT. Ma mieć formę długopisu
OpenAI szykuje urządzenie z ChatGPT. Ma mieć formę długopisu
Kiedy urodził się Jezus? Historycy mówią o jednym
Kiedy urodził się Jezus? Historycy mówią o jednym
Aparat leżał w rzece przez lata. Udało się odzyskać zdjęcia
Aparat leżał w rzece przez lata. Udało się odzyskać zdjęcia
Ołów, ścieki i tony odchodów. Mieszkańcy polegają na tej rzece
Ołów, ścieki i tony odchodów. Mieszkańcy polegają na tej rzece
Samsung zapowiada lodówki z Gemini. Sztuczna inteligencja Google'a trafi do kuchni
Samsung zapowiada lodówki z Gemini. Sztuczna inteligencja Google'a trafi do kuchni
PKO BP ostrzega przed oszustami. Zalecenia dla klientów
PKO BP ostrzega przed oszustami. Zalecenia dla klientów
Co tam się dzieje? Niezwykły wycinek lodu może rozwiązać tajemnicę
Co tam się dzieje? Niezwykły wycinek lodu może rozwiązać tajemnicę
Rzymianie wymyślili beton, który sam się naprawia? Nowe odkrycie
Rzymianie wymyślili beton, który sam się naprawia? Nowe odkrycie
Windows 11 z nową stroną do aktualizacji wszystkich aplikacji
Windows 11 z nową stroną do aktualizacji wszystkich aplikacji
Messenger zniknął z Windowsa. Oto rozwiązanie
Messenger zniknął z Windowsa. Oto rozwiązanie
ZANIM WYJDZIESZ... NIE PRZEGAP TEGO, CO CZYTAJĄ INNI! 👇