Consejos para obtener buenas conversiones de OCR


Por muy impresionante que sea el reconocimiento óptico de caracteres, no es perfecto y hay que tener cierto cuidado para obtener los resultados esperados. Al igual que el trabajo previo necesario para convertir un PDF a Excel, también existen algunas reglas no escritas para convertir archivos escaneados. A continuación encontrará una práctica lista de comprobación que se aplica tanto a la conversión de PDF a DOCX como de PDF a XLSX.


Optimice su documento para los propósitos del OCR:

  • Ajuste manualmente la rotación de las páginas cuando sea necesario. Además de facilitar la lectura del documento final, mejorará la precisión del texto extraído.

  • Utilice imágenes de alta resolución. Lo ideal es que las imágenes estén en formato PNG y se puedan leer sin forzar demasiado la vista, pero las JPEG funcionan igual de bien. Cuanto más clara sea la imagen, mejor será el resultado de la conversión.

  • Incluya un formato que se ajuste al formato de salida (por ejemplo, tablas que se parezcan al formato de Excel). Éste es probablemente el factor más importante para garantizar la fiel recreación de su PDF original en DOCX o XLSX.