4 bezplatné online nástroje OCR podrobené konečnému testu

4 bezplatné online nástroje OCR podrobené konečnému testu

Ak chcete previesť akýkoľvek vytlačený text na digitálny text, ktorý môžete kopírovať, vkladať, upravovať a vyhľadávať, budete musieť použiť skenery OCR (Optical Character Recognition).





Keď sa rozhodnete naskenovať alebo odfotiť dokument, dokument sa uloží vo formáte JPEG alebo PDF. Softvér OCR potom dokáže rozpoznať písmená a číslice v týchto dokumentoch a previesť ich do prehľadávateľného PDF alebo do súboru, ktorý môžete upravovať v programoch, ako je Microsoft Word.





Problém je v tom, že niektoré skenery OCR fungujú oveľa lepšie ako ostatné, pričom tie najlepšie sú na peňaženku dosť ťažké.





Omnipage18 napríklad stojí 150 dolárov, ale je obzvlášť dobrý v rozpoznávaní rôznych jazykov. Adobe Acrobat Pro DC stojí 400 dolárov, ale má neuveriteľnú presnosť. ABBYY FineReader stojí 150 dolárov, ale je fantastický pri prevádzaní dokumentov, ako sú časopisy a brožúry, na text, ktorý je možné vyhľadávať. Online ponuku spoločnosti ABBYY budeme testovať neskôr v tomto článku.

Ak však hľadáte bezplatné alternatívy, môžete Stiahnuť ▼ a používať v systéme Windows alebo OS X, mali by ste vyskúšať tieto nástroje OCR. Ak však chcete použiť bezplatný online Nástroj OCR, čítajte ďalej, pretože sme vyskúšali niekoľko najlepších, s výsledkami nižšie.



Test

Zdá sa, že väčšina ľudí teraz používa na skenovanie svoje smartfóny, ktoré som sa rozhodol použiť Skenovateľná aplikácia Evernote (Zadarmo pre iOS a Android). Naskenoval som prvú stranu Richarda Dawkina Výstup na horu nepravdepodobný , aby sme zistili, aké výsledky by sme mohli dosiahnuť pri veľmi základnom formátovaní. Tiež som naskenoval stránku Tima Ferrissa Štvorhodinový šéfkuchár vyskúšať skenery s trochu komplikovanejším formátovaním. Každý z týchto súborov som uložil ako PDF.

Tieto dokumenty boli potom prevedené prostredníctvom niektorých z údajne najlepších online nástrojov OCR, aby sa zistilo, ako sa im darí.





Online OCR zadarmo [Už nie je k dispozícii]

Našťastie nie je potrebná žiadna registrácia na používanie bezplatného online OCR. A dvojnásobne na mňa zapôsobilo, keď som videl ich požiadavku zachovať formátovanie a rozloženie môjho dokumentu.

Táto stránka tvrdí, že môže ako vstup podporovať formáty PDF, GIF, BMP, JPEG, TIFF a PNG. Výstupmi môžu byť DOC, textový dokument PDF, RTF a TXT. Bohužiaľ sa mi nepodarilo zistiť, či majú limit veľkosti súboru.





Základný dokument do PDF

Konvertované úplne perfektne. Nie je viac čo povedať! Ideme do a veľmi dobrý začiatok.

Základný dokument do DOC

Zdá sa, že skutočné slová sa bezchybne skonvertovali, okrem toho, že „ount“ z „Mount Rushmore“ sa nejakým spôsobom AWOL. Formátovanie je však iný príbeh. Mnoho čiarok bolo nahradených podčiarkovníkmi a v bodoch celého dokumentu boli vložené náhodné medzery. Keď neskôr uvidíte, ako si v tomto teste poradil prémiový softvér, nie je to zlé úsilie vôbec .

Komplexný dokument do PDF

Komplexný dokument DOC

Prevod tentokrát trval iba 10 sekúnd, pričom text bol opäť prevedený s približne 95% presnosťou. Vyskytli sa podivné problémy s medzerami a softvér mal problémy s prevodom písma v pravom hornom rohu dokumentu a sem -tam vynechal niekoľko znakov.

Verdikt

i2OCR

i2OCR uvádza niekoľko pôsobivých tvrdení. Tento nástroj rozpoznáva viac ako 60 jazykov, zvláda rozloženie vo viacerých stĺpcoch (odstránením formátovania), nemá žiadne obmedzenia veľkosti súborov, dokáže prevádzať nahrané súbory a z adries URL. A ani na používanie tohto nástroja sa nemusíte registrovať.

Táto služba funguje tak, že jednoducho extrahuje text z obrázku a potom vygeneruje neformátovaný text. Chyby v zobrazení vedľa seba, pred kopírovaním textu do iných programov alebo sťahovaním vo formáte DOC, PDF alebo HTML, môžete rýchlo opraviť.

Poznámka: Keď som sa pokúšal nahrať svoje dokumenty PDF, i2OCR ich odmietol, takže som ich potreboval previesť do formátu JPEG (urobením snímky obrazovky a odovzdaním súborov).

Základný dokument na čistý text

Zložitý dokument na čistý text

Väčšina textu bola prevedená bez prílišných chýb, okrem názvu a receptu vpravo hore, ktoré boli pre tento nástroj nečitateľné. Spôsob, akým boli stĺpce prevedené na obyčajný text, nebol ani zďaleka ideálny. Ak chcete, aby bola táto konverzia uskutočniteľná, bolo by potrebné veľa času na usporiadanie riadkov do súvislých viet.

Verdikt

Online OCR

Online OCR v súčasnosti podporuje 46 rôznych jazykov a dokáže prevádzať PDF, JPG, BMP, TIFF a GIF do formátu Word, Excel alebo obyčajného textu. Stránka tvrdí, že „skonvertované dokumenty vyzerajú úplne rovnako ako originály - tabuľky, stĺpce a grafika“.

Verzia, ktorú môžete používať bez registrácie, vám umožňuje prevádzať až 15 obrázkov za hodinu (limit 5 MB). Ak si zaregistrujete účet, môžete si kúpiť viac stránok nad tento limit a súčasne môžete prevádzať aj viacstránkové dokumenty a archívy ZIP.

Základný dokument do DOC

Základný dokument sa bez rímskych číslic bezchybne prevádzal Ja nie je vyzdvihnutý. Ako stránka sľubovala, formátovanie bolo presne také, ako bolo v knihe. Sláva tomuto nástroju.

Komplexný dokument DOC

Potom, čo som bol sklamaný predchádzajúcimi nástrojmi OCR pri prevode komplexného dokumentu, ma Online OCR ohromne ohromilo. Rozloženie bolo takmer dokonalé, ako vidíte vyššie. Recept nebol opäť vyzdvihnutý príliš dobre, ale akékoľvek ďalšie drobné chyby boli zanedbateľné.

Verdikt

Úplne fantastické výsledky z online OCR. Jedinú nevýhodu vidím v tom, že neexistuje spôsob, ako previesť dokumenty vo formáte PDF, pretože uvedené výstupné formáty obsahujú iba DOCX, XLSX a TXT.

ABBYY FineReader Online (10-stranová skúšobná verzia)

Ako už bolo spomenuté, ABBYY je jedným z lídrov na trhu softvéru OCR a jeho úplný program na stiahnutie stojí približne 150 dolárov. Ponúkajú a 10-stranová bezplatná skúšobná verzia pre ich online nástroj (vyžaduje sa však registrácia). Za predplatné 5 dolárov vám ich online nástroj umožní previesť 200 strán každý mesiac.

Prijímané súbory môžu mať veľkosť až 100 MB v ľubovoľnom z týchto formátov: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP a PNG. ABBYY tiež rozpoznáva takmer 200 jazykov. Obzvlášť pôsobivé sú výstupy s možnosťou výberu medzi formátmi DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 a EPUB.

Počas skúšobnej verzie si môžete dokonca vyskúšať niekoľko funkcií BETA. Prvou je možnosť preložiť váš dokument do iného jazyka. Na druhej strane je export vášho konvertovaného dokumentu do účtu cloudového úložiska, či už ide o Dropbox, Disk Google, Evernote, Microsoft OneDrive alebo Box.

Základný dokument do formátu DOCX

Komplexný dokument do formátu DOCX

Po konverzii bolo v texte dokumentu veľmi málo chýb (okrem toho, že OCR opäť zápasí s písmom tohto receptu!), Ale formátovanie ponechalo veľa na želanie.

Tri stĺpce nejako zaberali dve strany, pričom stredný stĺpček bol iba zobrazujúce sa na druhej strane. Ak by ste vlastne chceli urobiť čokoľvek s týmto prevedeným dokumentom, nakoniec by ste si vytrhali vlasy.

Základný dokument do PDF

Komplexný dokument do PDF

Verdikt

Konečný výsledok

Ak ako väčšina ľudí hľadáte iba skenovanie niekoľkých článkov z časopisov a niektorých účtov za domácnosť, tieto dokumenty nebudete musieť upravovať. Preto bude pre vás vhodný priamy prevod na PDF, pretože v týchto dokumentoch budete stále môcť vyhľadávať. Na tento účel bol Free Online OCR rozhodne najlepším bezplatným nástrojom, ktorý sme testovali. To znamená, že ak ste ochotní zaplatiť 5 dolárov mesačne za takmer dokonalosť, FineReader online od spoločnosti ABBYY bolo o niečo presnejšie.

Pokiaľ ide o prevod dokumentov do formátu DOC, nepodarilo sa nám nájsť žiadne riešenie, ktoré by bolo dokonalé, ale zďaleka najlepšie výsledky pochádzajú z Online OCR . Konverzia nebola dokonalá, ale integrita formátovania bola do značnej miery zachovaná a chyby boli zanedbateľné. Keď porovnáme tieto výsledky s „prémiovou“ ponukou od spoločnosti ABBYY, nemôžete sa nechať ohromiť.

Do tohto príspevku sme nezahrnuli možnosti OCR služby Disk Google; trochu pre všadeprítomnosť spoločnosti Google, ale skôr pre skutočnosť, že sme chceli vyskúšať niekoľko ďalších bezplatných online služieb OCR.

Na vás: Aké ďalšie online nástroje OCR by ste odporučili našim čitateľom? A ktoré ste vyskúšali, že by ste už nikdy nepoužili?

zdieľam zdieľam Tweet E -mail Príručka pre začiatočníkov k animovanej reči

Animovaná reč môže byť výzvou. Ak ste pripravení začať pridávať dialógy do svojho projektu, proces za vás rozložíme.

máte počítačový systém s dvojjadrovým procesorom
Čítajte ďalej Súvisiace témy
  • Internet
  • Produktivita
  • Konverzia súboru
  • OCR
O autorovi Rob Nightingale(272 publikovaných článkov)

Rob Nightingale je absolventom filozofie na University of York, UK. Pracoval ako manažér sociálnych médií a konzultant viac ako päť rokov, pričom organizoval workshopy vo viacerých krajinách. Za posledné dva roky bol Rob aj technologickým spisovateľom a je manažérom sociálnych médií MakeUseOf a redaktorom spravodajov. Obvykle ho nájdete na cestách po svete, kde sa učí strih videa a experimentuje s fotografiou.

Viac od Roba Nightingala

prihlásiť sa ku odberu noviniek

Pripojte sa k nášmu bulletinu a získajte technické tipy, recenzie, bezplatné elektronické knihy a exkluzívne ponuky!

Kliknutím sem sa prihlásite na odber