• Apfeltalk ändert einen Teil seiner Allgemeinen Geschäftsbedingungen (AGB), das Löschen von Useraccounts betreffend.
    Näheres könnt Ihr hier nachlesen: AGB-Änderung
  • Was gibt es Schöneres als den Mai draußen in der Natur mit allen Sinnen zu genießen? Lasst uns teilhaben an Euren Erlebnissen und macht mit beim Thema des Monats Da blüht uns was! ---> Klick

Text in Spalten scannen und erkennen?

Matze Mumpitz

Transparent von Croncels
Registriert
07.03.06
Beiträge
306
Hallo Apfelgemeinde!
Ich möchte mit einem Canon Pixma (so ein recht günstiges Multifunktionsding, hab die genaue Bezeichnung gerade nicht hier) Wörterbuchseiten (einzeln) einscannen und dann per OCR erkennen lassen.
Hab sowas noch nie gemacht. Daher drei Fragen:
Wie gut (dpi) muss der Scanner für das Vorhaben sein?
Welche OCR kann ich benutzen? (hat jemand Erfahrung mit der OCR von DevonThinkProOffice gemacht? Abby Finereader?)
Und die wichtigste Frage: Checken die OCR Programme, dass es sich um Spalten handelt oder muss man die Bereiche in dem PDF dann markieren?

Herzlichen Dank für eure Antworten und einen entspannten Sonntag, Matze
 

Sawtooth

Langelandapfel
Registriert
14.06.07
Beiträge
2.675
OCR-Scanauflösung 150 – 300 dpi.

OCR-SW (Auswahl):

ABBYY FineReader Express Edition for Mac
I.R.I.S Readiris 12 for Mac
NUANCE OmniPage Pro X for Macintosh

DEVONtechnologies DEVONthink kenne ich nicht; kann ich nicht einschätzen.


Und die wichtigste Frage: Checken die OCR Programme, dass es sich um Spalten handelt oder muss man die Bereiche in dem PDF dann markieren?

Ja, checken sie.
Das Einlesen von Tabellen gehört heute zum kleinen Einmaleins einer (guten) OCR-SW.
Trotzdem kann manchmal Handarbeit erforderlich sein.


MfG, Sawtooth
 
Zuletzt bearbeitet:

Matze Mumpitz

Transparent von Croncels
Registriert
07.03.06
Beiträge
306
Danke ...

... für die Infos Sawtooth! Das klingt ja vielversprechend!

Beste Grüße, Matze