OCR převod textu

Kvalitní rozpoznání textu (OCR), klidně i z fotografie, s online nástrojem i2OCR

Nedávno jsme přidali na náš web Zdarma.org jednu z mnoha online služeb pro převod textu ve formě obrázku na text editovatelný. Co nás ale mile překvapilo, byla přesnost a použitelnost i u obrázků, kde text rozhodně nebyl ideálně vyfocen. Více se dočtete v tomto článku.

Metoda, která se pro převod na editovatelný text používá, se nazývá tzv. OCR. To nás laiky ale nemusí až tolik trápit. Rozhodující je, že funguje a v případě námi použité služby i2OCR až překvapivě dobře. Princip je přitom jednoduchý, webové stránce předáte obrázek z digitálního fotoaparátu, mobilu, případně ze skeneru a za chvíli se můžete těšit na výsledek. Tím je text, který lze editovat. A to vše včetně bezproblémové podpory češtiny.

Začínáme s i2OCR

Název samotné služby odkazuje na převod obrázků („image“) do / skrze (2 = „to“) OCR. A není to pouhý řekněme, „marketingový“ tah provozovatele. Služba opravdu funguje i s obyčejnými obrázky z mobilu či fotoaparátu.

Formulář i2OCR pro zadání obrázku

Formulář, do kterého vložíme obrázek

i2OCR položka Select imagePo volbě jazyka (Step 1), je nutno zvolit obrázek obsahující text (Step 2). Odkázat lze na obrázek na Internetu, skrze jeho URL adresu, případně obrázek na web i2OCR nahrát. Vybrat jej přitom můžeme přes známé dialogové okno vyhledání souboru a nebo jej na položku „select image“ přesuneme metodou táhni a pusť.

Třetím krokem (Step 3) je pouze opsání kontrolního čísla a odeslání formuláře pomocí červeného tlačítka „Extract text“.

Proces rozpoznávání textu z obrázku

Web indikuje, že obrázek zpracovává

Celý proces rozpoznávání chvíli trvá. Cca naším odhadem mezi 30-50 sekundami. Na první pohled není zřejmé, že se proces nezasekl. Za chvíli jsme odměněni výsledkem.

Zobrazí se (opět) červené tlačítko „Download“ (stáhnout), kdy si můžeme zvolit formát, v jakém chceme text uložit na své PC. Na výběr je prostý text, dokument MS Word (.DOC), PDF a nebo HTML.

 

Stažení rozpoznaného textu do PC

Možnosti stažení rozpoznaného textu do počítače

Pokud vlastníte a používáte online kancelářské aplikace Google Dokumenty, můžete si text k úpravě poslat přímo do nich (tlačítko: Edit Google Docs). Možnost přeložit do jiného jazyka je poté poslední možnost.

V případě, že vás zajímá pouze malá část textu, kterou si chcete zkopírovat do pracovní paměti PC (clipboardu), stačí se na dané straně posunout níže a vedle původního obrázku uvidíte převedený text, který můžete dle potřeby označit (viz obrázek níže). Malý TIP: po kliknutí myší do pole s převedeným textem, se vám vždy označí celý text. Pro označení jen jeho části použijte kurzorové klávesy (šipky nahoru, dolu atd.).

Náhled převedeného textu v prohlížeči

Náhled převedeného textu spolu s původním obrázkem v prohlížeči

Nároky i2OCR služby na kvalitu podkladových obrázků

Foto pro první pokus OCR převodu

Foto pro první OCR převod

Na jednu stranu nejsou nároky velké, na druhou mají svá omezení. Pro první pokus převodu jsme použili záměrně fotografii s mobilního telefonu, která nebyla nikterak moc kvalitní. Ponechali jsme ji ve stavu, v jakém byla vyfocena. Tedy strany knihy nebyly srovnány a obecně bylo vše tmavé. Výsledek byl nepoužitelný. Zejména z levé strany, která otevřením více deformována.

Foto pro druhý pokus s OCR

Upravené foto pro druhý OCR převod

Při druhém pokusu jsme stranu vyrovnali a následně upravili v grafickém editoru tak, aby text byl kontrastem zřetelně odlišen od bílého pozadí. Převod dopadl výborně.

Foto pro třetí OCR převod textu

Foto pro třetí OCR převod textu

Pro poslední třetí test jsme použili vyrovnanou fotografii, u které jsme nechali kontrast obrazu bez jakýchkoliv úprav. Výsledek byl překvapivě také výborný. Je tedy velmi pravděpodobné, že samotná služba i2OCR si dokáže jas, kontrast a vyčištění pozadí provést sama tak, aby následný OCR převod byl úspěšný.

Jak vidíme, pro úspěšný převod textu je důležité mít obrázek rovně vyfotografovaný (naskenovaný), samotná úprava jasu, kontrastu či zvýraznění textu je při použití této služby zbytečná.

Jaké využití služba i2OCR může nalézt?

Na webu i2OCR, jak jsme si ověřili, je možno s dostatečnou kvalitou převést text z fotografie nebo naskenovaného obrázku do editovatelné podoby. Služba neklade velké nároky na dobrou čitelnost textu (s čímž jiné OCR programy mívají problémy), ale obtíže jí dělají nevyrovnané stránky (text). Řádky textu prostě musí být vodorovné. My jsme text vyrovnali v bezplatném grafickém editoru GIMP tak, že pomocí vodících linek jsme si určili zamýšlený tvar stránky a nástrojem „Perspektiva“ fotografii do něj upravili. Toto je jediné nepatrně pracnější úskalí jinak fungujícího převodu. Pokud ale máte text již dobře vyfotografovaný nebo naskenovaný, můžete se tomuto kroku vyhnout.

Služba není určena k hromadnému převodu mnoha stran textu. To byste se, jak se říká „uklikali“, ale pro příležitostný převod jedné, či několika málo stran je jako dělaná.

(Přidat komentář)

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *