Google Docs skanuje tekst z PDF-ów

Po wielu miesiącach pracy, Google po cichu wprowadziło do swojej usługi Docs nową funkcjonalność - od niedawna, dokumenty Googla wykorzystują technologię OCR do wykrywania tekstu w dokumentach graficznych czy PDF'ach.

Google Docs skanuje tekst z PDF-ów 1
Wojciech Usarzewicz

Po wielu miesiącach pracy, Google po cichu wprowadziło do swojej usługi Docs nową funkcjonalność - od niedawna, dokumenty Googla wykorzystują technologię OCR do wykrywania tekstu w dokumentach graficznych czy PDF'ach.

OCR, czyli Optical Character Recognition to technologia służąca do rozpoznawiania znaków i całych fragmentów tekstu w plikach graficznych. Technologię stosuje się głównie do rozpoznawania ciągów liter w zeskanowanych dokumentach.

W większości wypadków osoby, które muszą przerobić kilka obrazków na tekst ciągły są zmuszone do korzystania z komercyjnych rozwiązań, lub też darmowych aplikacji, które nie zawsze spełniają wymagania użytkowników.

Google postanowiło spróbować swoich sił i wprowadziło możliwość rozpoznawania znaków w czasie wgrywania dokumentów do Docsów. Wgrywając nowy plik (czy to obrazek czy PDF), możemy zaznaczyć opcję konwersji na znaki. Zeskanowany tekst trafi do nowego dokumentu tekstowego.

Póki co wprowadzona funkcjonalność nie jest idealna. PDFy sprawdzają się znacznie lepiej, niż zwykłe obrazki. Niestety proces skanowania pozbawia tekst większości elementów formatowania i niektórych spacji. W przypadku obrazków, pojawiają się trudności z większymi literami, choć małe są konwertowane bez większych problemów. Nie zauważyłem zaś problemów ze skanowaniem polskich liter - działają bez zarzutu. Dodatkowo, wgrywając plik PDF i konwertując go w tym samym czasie, zapisanym zostanie jedynie przekonwertowany tekst. Chcąc zapisać właściwy plik PDF, trzeba go wgrać jeszcze raz.

Nowa opcja jest z pewnością bardzo wartościowa, wymaga jednak dopracowania. Sprawdzi się dla osób, które potrzebują skorzystać z OCR'a od czasu do czasu. Osoby skanujące obrazki do tekstu częściej póki co powinny pozostać przy rozwiązaniach komercyjnych.

Rzuć także okiem na nasze zestawienie 10 darmowych edytorów tekstu i pakietów biurowych.

Źródło artykułu: WP Gadżetomania
Wybrane dla Ciebie
Neandertalczycy nie "zniknęli". Zostali wchłonięci
Neandertalczycy nie "zniknęli". Zostali wchłonięci
Gigantyczna porażka rosyjskiej propagandy. Nikt w to nie gra
Gigantyczna porażka rosyjskiej propagandy. Nikt w to nie gra
Mapy Google z nową funkcją. Sprawdź wskaźniki
Mapy Google z nową funkcją. Sprawdź wskaźniki
Jeżowce z układem nerwowym przypominającym mózg
Jeżowce z układem nerwowym przypominającym mózg
Rzymski obóz wojskowy wysoko w Alpach. Niezwykłe odkrycie pełne artefaktów
Rzymski obóz wojskowy wysoko w Alpach. Niezwykłe odkrycie pełne artefaktów
Zaktualizuj Windows 10. Łatka rozwiązuje ważny problem
Zaktualizuj Windows 10. Łatka rozwiązuje ważny problem
Naukowcy ostrzegają. Jeziora w Amazonii parują w wysokich temperaturach
Naukowcy ostrzegają. Jeziora w Amazonii parują w wysokich temperaturach
Zajmuje 15 proc. całego globu. Co skrywa wnętrze Księżyca?
Zajmuje 15 proc. całego globu. Co skrywa wnętrze Księżyca?
Kupił chińską kartę graficzną. Dostał podrobiony sprzęt
Kupił chińską kartę graficzną. Dostał podrobiony sprzęt
Była ukryta po ziemią. Odnaleziono starożytną stolicę sprzed 2700 lat
Była ukryta po ziemią. Odnaleziono starożytną stolicę sprzed 2700 lat
Norma 36,6 st. C już nieaktualna. Temperatura zdrowego człowieka jest inna
Norma 36,6 st. C już nieaktualna. Temperatura zdrowego człowieka jest inna
Wyjątki przy zastrzeganiu numeru PESEL. Co warto wiedzieć?
Wyjątki przy zastrzeganiu numeru PESEL. Co warto wiedzieć?
ZACZEKAJ! ZOBACZ, CO TERAZ JEST NA TOPIE 🔥