Съвети за постигане на отлични конверсии на OCR


Колкото и впечатляващо да е оптичното разпознаване на символи, то не е съвършено и трябва да се положат някои грижи, за да се получат очакваните резултати. Подобно на предварителната подготвителна работа, необходима за конвертиране на PDF в Excel, има и няколко неписани правила за конвертиране на сканирани файлове. По-долу ще намерите удобен контролен списък, който се прилага еднакво добре за PDF към DOCX и PDF към XLSX.


За да оптимизирате документа си за целите на OCR:

  • Настройте ръчно завъртането на страниците, когато е необходимо. Освен че ще направи крайния документ по-лесен за четене, това ще подобри и точността на извлечения текст.

  • Използвайте изображения с висока разделителна способност. В идеалния случай изображенията трябва да са във формат PNG и да могат да се четат без прекалено натоварване на очите, но JPEG работят също толкова добре. Колкото по-ясно е изображението, толкова по-добър е резултатът от преобразуването.

  • Включете форматиране, което да съответства точно на изходния формат (напр. таблици, които наподобяват форматирането в Excel). Това вероятно е най-големият фактор за гарантиране на вярното пресъздаване на вашия оригинален PDF файл в DOCX или XLSX.