Gilt für
Readiris 25 Essential und Elite Versionen.
- Digitale PDFs enthalten echte Text- und Bildobjekte. Sie können den Text suchen, auswählen, kopieren und bearbeiten (mit entsprechender Software). Diese Dateien werden direkt aus digitalen Quellen erstellt und sind ideal für die weitere Bearbeitung oder Textextraktion.
- Analoge (reine Bild-)PDFs sind im Wesentlichen Fotos oder Scans von Dokumenten. Der Inhalt ist in einer Bildebene "eingeschlossen", so dass Sie keinen Text suchen oder auswählen können, es sei denn, Sie fügen mithilfe der optischen Zeichenerkennung (OCR) eine Textebene hinzu. Diese können nicht als Text bearbeitet werden und sind standardmäßig nicht durchsuchbar.
________________________________________
Readiris PDF verarbeitet vorhandene Bilder oder Scans mithilfe von OCR, um die Bilder von Text in echten Text umzuwandeln. Dieser Text kann dann manipuliert oder zu einer Ausgabedatei verarbeitet werden, die den eigentlichen Text enthält.
- Wenn Sie eine analoge PDF-Datei öffnen, fragt das Programm, ob Sie OCR durchführen möchten. In der Regel lautet die Antwort ja.
- Beim Öffnen einer digitalen PDF-Datei ist eine OCR nicht erforderlich, da das Originaldokument bereits "lebenden" Text enthält, der in Readiris PDF als solcher geöffnet wird.
________________________________________
In einigen Fällen kann ein bestimmtes PDF-Dokument eine ungewöhnliche Überlagerung von Text und Bild aufweisen und schlechte Ergebnisse liefern. In diesem Fall exportieren Sie das Dokument als Bild (TIFF für mehrseitige Dokumente) und öffnen die Datei erneut in der Software, um OCR durchzuführen.
Casey King