• Apfeltalk ändert einen Teil seiner Allgemeinen Geschäftsbedingungen (AGB), das Löschen von Useraccounts betreffend.
    Näheres könnt Ihr hier nachlesen: AGB-Änderung
  • Was gibt es Schöneres als den Mai draußen in der Natur mit allen Sinnen zu genießen? Lasst uns teilhaben an Euren Erlebnissen und macht mit beim Thema des Monats Da blüht uns was! ---> Klick

OCR-Software für Massenverarbeitung gesucht

Kref

Querina
Registriert
08.03.18
Beiträge
187
Hallo.

Ich sammle seit bestimmt 10 Jahren meine Dokumente auf meinem NAS in einer halbwegs sauberen Ordnerstruktur, die es mir erlaubt MEISTENS alles relativ zügig zu finden.

Was ich bislang allerdings nie genutzt habe ist eine OCR-Software, weder wenn ich Dokumente mit meinem Brother-Einzugs-Scanner noch mit Scanner Pro auf dem iPhone digitalisiert habe.

Das habe ich nun geändert, neue Dokumente kommen nun mit OCR in die Ablage. Ich würde aber auch gerne die hunderten, vielleicht tausenden alten Dokumente, die im Ordnerbaum liegen durch eine OCR-Software jagen ohne da nun jede Datei einzeln bearbeiten zu müssen.

Gibt es eine Software, die einen kompletten Ordner, idealerweise sogar mit Unterordnern, nach PDF-Dateien durchsucht, sämtliche PDFs öffnet, OCR rüberlaufen lässt und unter gleichem Namen wieder speichert?

Idealerweise natürlich eine Software, die nicht 299 EUR kostet.
___________
Nachtrag: Ich möchte nicht auf ein Dokumentenmanagementsystem wie ecoDMS wechseln, die Dokumente sollen weiterhin auf einem geteilten Ordner auf meiner Synology DS-920+ liegen.
 

Wuchtbrumme

Golden Noble
Registriert
03.05.10
Beiträge
21.524
Die Empfehlung ist grundsätzlich DevonThink Office. Das hat eine eigene Datenbank, aber die kann ja zusätzlich da sein; ich lege zum Beispiel alle meine PDFs noch als Original in einen Backupordner (so wie es bei Dir auf dem NAS sein könnte). Vorteil ist die wesentlich bessere und schnellere Suchfunktion und die platzsparendere Aufbewahrung wenn man zusätzlich mit iOS-Geräten synct.
Es hat hierzu auch etliche - u.a. einen Sammelthread zum papierlosen Büro - Threads.
(es gibt mehr)

Wenn es kein DMS sein soll (Deine Entscheidung, ich habe es nicht bereut, auch den ScanSnap dazu nicht), dann schau Dir FineReader OCR Pro (App Store) an, den man übrigens in DevonThink auch einbinden kann (lwobei das schon sehr gut ist, aber Abbey ist noch mal einen Zacken besser und mit ScanSnap sehr flott).

Beide Softwares sind immer mal wieder auch im Angebot oder im Bundle.
 
Zuletzt bearbeitet:
  • Like
Reaktionen: Scotch

Scotch

Bittenfelder Apfel
Registriert
02.12.08
Beiträge
8.056
Das hat eine eigene Datenbank, aber die kann ja zusätzlich da sein; ich lege zum Beispiel alle meine PDFs noch als Original in einen Backupordner (so wie es bei Dir auf dem NAS sein könnte).

Devonthink kann die Datenbank auch auf eine vorhandene Ordnerstruktur aufsetzen, die DB enthält dann Verweise (Softlinks) auf die Originaldateien. Ich würd' mit 15 Jahren Devonthink-Erfahrung davon abraten: Das funktioniert zwar im Prinzip problemlos, aber wehe man fängt an (i.d.R. unabsichtlich) in der Dateistruktur irgendwelche Dateioperationen außerhalb von Devonthink durchzuführen. Kann man alles reparieren (in der DB), ist aber eine Heidenarbeit.

den man übrigens in DevonThink auch einbinden kann

Ist in Devonthink Office (oder hiess das Pro?) enthalten. Also die Engine, nicht die Standalone-App (braucht man ja dann auch nicht). Ist der Platzhirsch, in meinem Office-n-PDF für Windows läuft das auch.
 

Kref

Querina
Registriert
08.03.18
Beiträge
187
Hallo und danke

Da mein Wunsch, keine DMS zu verwenden sondern bei der Ordnerstruktur zu bleiben auf „verwunderung“ stößt:

ich hatte ecoDMS direkt auf der synology ausprobiert und fand es prinzipiell gut aber der Grund, warum ich von solchen Lösungen privat nicht begeistert bin ist die Zugänglichkeit für dritte.

wenn mir was passiert will ich, dass mein Bruder oder meine Eltern, denen ich Gastzugänge auf dem NAS eingerichtet hab an die wichtigen Dokumente kommen OHNE sich mit einer komplexen Software auseinander zu setzen, das können sie nämlich nicht.

und ich muss sagen, dass ich mit so einer Software auch meine Probleme habe. Der Aufwand, all meine Dokumente da nachträglich einzupflegen ist gigantisch.
 

Scotch

Bittenfelder Apfel
Registriert
02.12.08
Beiträge
8.056
ecoDMS lässt sich aber nicht mit Devonthink vergleichen. Unbeteiligte Dritte finden deine Dokumente in DT im Zweifel schneller und einfacher als in 'ner Ordnerstruktur.
 
  • Like
Reaktionen: Wuchtbrumme

Wuchtbrumme

Golden Noble
Registriert
03.05.10
Beiträge
21.524
ecoDMS lässt sich aber nicht mit Devonthink vergleichen. Unbeteiligte Dritte finden deine Dokumente in DT im Zweifel schneller und einfacher als in 'ner Ordnerstruktur.
das sicherlich, aber die Arbeitsplätze kosten mal mindestens Lizenzen (wobei zwei im normalen Preis drin sind, IIRC)
 

Scotch

Bittenfelder Apfel
Registriert
02.12.08
Beiträge
8.056
Ich hatte es nicht so verstanden, dass es um Multiuser-Zugriff ging, sondern das

wenn mir was passiert will ich, dass mein Bruder oder meine Eltern, (...) an die wichtigen Dokumente kommen OHNE sich mit einer komplexen Software auseinander zu setzen

Das kriegt ja nun jeder mit Zugang zum Mac mit DT in so einem Fall hin.
 

Kref

Querina
Registriert
08.03.18
Beiträge
187
Ich hatte es nicht so verstanden, dass es um Multiuser-Zugriff ging, sondern das



Das kriegt ja nun jeder mit Zugang zum Mac mit DT in so einem Fall hin.

OK. Das Problem ist, dass ich niemandem Zugriff zu meinem Mac eingerichtet habe sondern zu meinem Dokumentenordner auf der Synology. Mein Bruder z.B. weiß, wie er sich mit seinem Windows-Laptop auf meine Syn einloggt (er hat ja auch selber eine). Und darum will ich eben keine Datenbank auf dem Mac, ich will weiterhin die Dokumente einfach in einem Ordnerbaum auf dem NAS liegen haben.

Daher bleibe ich leider bei der ursprünglichen Frage: Ich möchte ein PDF-Bearbeitungsprogramm, dem ich wenigstens alle Dateien eines Ordners, idealerweise auch die Dateien sämtlicher Unterordner, in eine Stapelverarbeitung legen und eine OCR-Funktion rüberlaufen lassen kann. Anschließend speichern und fertig.
 

Keef

Gestreifter Böhmischer Borsdorfer
Registriert
17.07.09
Beiträge
3.426
Versuche es mal mit der Online Version von PDF24.

Wenn Du über einen Computer mit Windows verfügst, kannst Du den PDF24 Creator laden. Ein sehr umfangreiches Tool zur Bearbeitung von PDFs inklusive OCR. Und dazu noch kostenlos.

 

NorbertM

Laxtons Superb
Registriert
03.01.15
Beiträge
9.397
Zum Bearbeiten und Zusammenstellen von PDFs ist das Top, für OCR z.B. lädt es aber die Dateien auf deren Server hoch und das ist eher suboptimal.
 

Kref

Querina
Registriert
08.03.18
Beiträge
187
Moin.

Das PRoblem wurde mittlerweile ohne den Mac direkt auf der Synology gelöst. synOCR macht das ordentlich (holt PDFs aus seinem Eingangsordner, OCRt sie und schiebt sie in seinen Ausgangsordner; per Script mehrfach täglicher Aufruf).

Außerdem gibt es ein sehr praktisches Skript, dass einen Verzeichnisbaum auf PDF untersucht, allen PDF-Dateinamen eine Indexnummer voranstellt, in einer Indexdatei die Nummer und den ursprünglichen Speicherort einträgt und die PDFs dann in den synOCR-Eingang verschiebt.

Dann wird synOCR gestartet (es darf keine Umbenennung durch synOCR erfolgen).

Beim zweiten Aufruf des Skriptes geht es dann in den synOCR-Ausgang, nimmt sich dort die Dateien raus, schaut in der Index-Datei den Ursprungsort nach, schiebt sie dahin und entfernt die Indexnummer.

Habe damit meinen gesamten Dokumentenordner durch das OCR-Programm gejagt (vorher natürlich ein Backup).

Neu gescannte Dateien, egal ob über ScannerPro auf dem iPhone über WebDAV oder über meinen Dokumentenscanner (mit Scan-to-network-Funktion) werden automatisch direkt in synOCR abgelegt.
 
  • Like
Reaktionen: frostdiver