Wie kann man alte Schreibmaschinen-Scans verbessern?

jacques_noris

Süssreinette (Aargauer Herrenapfel)
Registriert
05.01.10
Beiträge
403
Ich habe aus einem historischen Archiv ein 265-seitiges Dokument, das im Original in den 50er Jahren per Schreibmaschine auf schlechtem Papier geschrieben wurde. Die Seiten wurden irgendwann in nicht besonders guter Qualität abfotografiert.

Mit dem menschlichen Auge kann man mit etwas Mühe alles entziffern, auch wenn die Seiten auf dem Monitor griselig aussehen.

Ich würde das Dokument jetzt gerne per OCR lesbar machen und habe es dazu in Abby Finereader geöffnet. Leider ist die Erkennungsrate ziemlich schlecht, Abby erkennt so viele Buchstaben nicht, dass das Dokument nicht brauchbar ist.

Ich habe schon mit den Einstellungen in Abby rumgespielt, Kontrast erhöht, Schärfe erhöhte, Helligkeit usw. hat aber alles nichts Entscheidendes gebracht.

Kennt jemand ein Tool, das vielleicht die fotografierten Seiten so weit verbessern kann, dass Abby mehr erkennt? Am besten automatisiert, bei 265 Seiten würde das per Hand auf jeder Seite ewig dauern.

(Sorry, wenn das dass falsche Unterforum ist, ich bin mir nicht sicher, wo das genau hingehört)
 

Zivius Oktavius

Stechapfel
Registriert
29.01.10
Beiträge
156
Ich kenne die Abby Software nicht, bei diesem Problem würde ich aber versuchen über Tonwertkorrektur oder Gradationskurven an die Bilder ranzugehen. Photoshop kann so etwas automatisiert nachdem man vorher Werte dazu festgelegt hat.
 

jacques_noris

Süssreinette (Aargauer Herrenapfel)
Registriert
05.01.10
Beiträge
403
Danke. Ich kenn mich wiederum mit Photoshop nicht aus. Die Scans liegen als 265-seitiges PDF vor, kann Photoshop das dann auf einen Rutsch verarbeiten? ich habs mit Pixelmator versucht, weil ich Photoshop nicht habe, aber das kann immer nur eine Seite eines PDFs bearbeiten, bringt mir also nichts.
 

Wuchtbrumme

Golden Noble
Registriert
03.05.10
Beiträge
21.417
wenn ich Dich richtig verstehe, versuchst Du, Dich an den eigenen Haaren aus dem Sumpf in die Höhe zu ziehen, dabei Kaffee und Kuchen serviert zu bekommen und das natürlich alles automagisch.

Rein korintenkackerisch: Was an Informationen verloren ist, das wirst Du aus diesen Daten nicht wieder hervorzaubern.

Du kannst jetzt manuell versuchen, jede Seite erkennen zu lassen (Abby FineReader gilt auf dem Mac übrigens als der Maßstab) und dabei ein wenig herumzuspielen - es kommt dabei wohl darauf an, *wieviel* der relevanten Informationen verloren sind. Ich würde da mit den Kontrasten spielen (schwarz auf weiß) und ggfls. auch mit den graustufigen Ausgangsdaten (statt Farbe). Vielleicht bringt auch der erneute Ausdruck auf weißem Papier etwas? Zu viel Auflösung ist genauso wenig gut wie zuviel - frühere Experimente ergaben ein Optimum bei ca. 5MP. Vermutlich bekommt man das aber in weniger Zeit auch selbst abgeschrieben. Ein normaler 10Finger-Tippser schafft so 250 Zeichen pro Minute netto.
 

Samson39

Wohlschmecker aus Vierlanden
Registriert
15.10.17
Beiträge
237
Da müsste es eine Demo geben. Ansonten wirst Du so etwas nicht kostenlos bekommen.