• Apfeltalk ändert einen Teil seiner Allgemeinen Geschäftsbedingungen (AGB), das Löschen von Useraccounts betreffend.
    Näheres könnt Ihr hier nachlesen: AGB-Änderung
  • Viele hassen ihn, manche schwören auf ihn, wir aber möchten unbedingt sehen, welche Bilder Ihr vor Eurem geistigen Auge bzw. vor der Linse Eures iPhone oder iPad sehen könnt, wenn Ihr dieses Wort hört oder lest. Macht mit und beteiligt Euch an unserem Frühjahrsputz ---> Klick

Text in Spalten scannen und erkennen?

Matze Mumpitz

Transparent von Croncels
Registriert
07.03.06
Beiträge
306
Hallo Apfelgemeinde!
Ich möchte mit einem Canon Pixma (so ein recht günstiges Multifunktionsding, hab die genaue Bezeichnung gerade nicht hier) Wörterbuchseiten (einzeln) einscannen und dann per OCR erkennen lassen.
Hab sowas noch nie gemacht. Daher drei Fragen:
Wie gut (dpi) muss der Scanner für das Vorhaben sein?
Welche OCR kann ich benutzen? (hat jemand Erfahrung mit der OCR von DevonThinkProOffice gemacht? Abby Finereader?)
Und die wichtigste Frage: Checken die OCR Programme, dass es sich um Spalten handelt oder muss man die Bereiche in dem PDF dann markieren?

Herzlichen Dank für eure Antworten und einen entspannten Sonntag, Matze
 

Sawtooth

Langelandapfel
Registriert
14.06.07
Beiträge
2.675
OCR-Scanauflösung 150 – 300 dpi.

OCR-SW (Auswahl):

ABBYY FineReader Express Edition for Mac
I.R.I.S Readiris 12 for Mac
NUANCE OmniPage Pro X for Macintosh

DEVONtechnologies DEVONthink kenne ich nicht; kann ich nicht einschätzen.


Und die wichtigste Frage: Checken die OCR Programme, dass es sich um Spalten handelt oder muss man die Bereiche in dem PDF dann markieren?

Ja, checken sie.
Das Einlesen von Tabellen gehört heute zum kleinen Einmaleins einer (guten) OCR-SW.
Trotzdem kann manchmal Handarbeit erforderlich sein.


MfG, Sawtooth
 
Zuletzt bearbeitet:

Matze Mumpitz

Transparent von Croncels
Registriert
07.03.06
Beiträge
306
Danke ...

... für die Infos Sawtooth! Das klingt ja vielversprechend!

Beste Grüße, Matze