Wenn die Akte in dann gescannt, kann sie als Bild eher als ein Dokument gescannt worden sein. Verwenden Sie OCR überhaupt bei der Überprüfung? Dieses erlauben, dass der Text in Ihrem Scan als Text gedeutet.
Es sollte eine Wahl im Seiltänzer geben, zum des renderable Textes umzuwandeln.
Matt