Tipps für eine optimale OCR-Konvertierung


So beeindruckend die optische Zeichenerkennung auch sein mag, sie ist nicht perfekt, und es muss einiges beachtet werden, um die erwarteten Ergebnisse zu erzielen. Ähnlich wie bei der Konvertierung von PDF in Excel gibt es auch bei der Konvertierung von gescannten Dateien einige ungeschriebene Regeln. Im Folgenden finden Sie eine praktische Checkliste, die sowohl für die Konvertierung von PDF in DOCX als auch von PDF in XLSX gilt.


So optimieren Sie Ihr Dokument für die OCR:

  • Passen Sie die Seitendrehung bei Bedarf manuell an. Dadurch wird nicht nur das endgültige Dokument besser lesbar, sondern auch die Genauigkeit des extrahierten Textes verbessert.

  • Verwenden Sie hochauflösende Bilder. Die Bilder sollten idealerweise im PNG-Format vorliegen und ohne allzu große Augenbelastung lesbar sein, aber JPEGs funktionieren genauso gut. Je klarer das Bild ist, desto besser ist das Konvertierungsergebnis.

  • Fügen Sie Formatierungen ein, die dem Ausgabeformat entsprechen (z. B. Tabellen, die der Formatierung in Excel ähneln). Dies ist wahrscheinlich der wichtigste Faktor für die originalgetreue Umwandlung Ihres PDF in DOCX oder XLSX.