बेहतरीन OCR रूपांतरण प्राप्त करने के लिए युक्तियाँ


ऑप्टिकल कैरेक्टर रिकॉग्निशन जितना प्रभावशाली है, यह ’ यह पूर्ण नहीं है और आपके अपेक्षित परिणाम पाने के लिए कुछ सावधानी बरतनी होगी। आपके PDF को Excel में परिवर्तित करने के लिए आवश्यक अग्रिम तैयारी कार्य के समान, स्कैन की गई फ़ाइलों को परिवर्तित करने के लिए भी कुछ अलिखित नियम हैं। नीचे आप ’ आपको एक आसान चेकलिस्ट मिलेगी जो पीडीएफ से डीओसीएक्स और पीडीएफ से एक्सएलएसएक्स पर समान रूप से लागू होती है।


OCR के प्रयोजनों के लिए अपने दस्तावेज़ को अनुकूलित करने के लिए:

  • जहां आवश्यक हो, पृष्ठ रोटेशन को मैन्युअल रूप से समायोजित करें . अंतिम दस्तावेज़ को पढ़ने में आसान बनाने के अलावा, इससे निकाले गए पाठ की सटीकता में भी सुधार होगा।
  • उच्च-रिज़ॉल्यूशन छवियों का उपयोग करें । छवियां आदर्श रूप से पीएनजी प्रारूप में होनी चाहिए और आंखों पर बहुत अधिक दबाव डाले बिना पढ़ने योग्य होनी चाहिए, लेकिन जेपीईजी भी उसी तरह काम करते हैं। छवि जितनी साफ़ होगी, रूपांतरण परिणाम उतना ही बेहतर होगा।
  • ऐसी फ़ॉर्मेटिंग शामिल करें जो आउटपुट फ़ॉर्मेट से निकटता से मेल खाती हो (उदाहरण के लिए तालिकाएँ जो Excel में फ़ॉर्मेटिंग से मिलती जुलती हों)। यह संभवतः आपके मूल पीडीएफ को DOCX या XLSX में विश्वसनीय रूप से पुनः प्रस्तुत करने को सुनिश्चित करने का सबसे बड़ा कारक है।