• Apfeltalk ändert einen Teil seiner Allgemeinen Geschäftsbedingungen (AGB), das Löschen von Useraccounts betreffend.
    Näheres könnt Ihr hier nachlesen: AGB-Änderung
  • Viele hassen ihn, manche schwören auf ihn, wir aber möchten unbedingt sehen, welche Bilder Ihr vor Eurem geistigen Auge bzw. vor der Linse Eures iPhone oder iPad sehen könnt, wenn Ihr dieses Wort hört oder lest. Macht mit und beteiligt Euch an unserem Frühjahrsputz ---> Klick

Inhalt von .pdf mit Spotlight indizieren

  • Ersteller costafu
  • Erstellt am

costafu

Gast
Hallo,

ich verwende einen Dokumentenscanner (Fujitsu ScanSnap), welcher mir Dokumentenscans als PDF- Dateien liefert. Wie kann ich diese Scans denn indizieren und den Inhalt mit Spotlight finden? Benötige ich noch eine zusätzliche OCR- Software zu Adobe Acrobat? Und wie wäre den Ablauf?

Danke für Eure Hilfe!

Costa
 

BerndderHeld

Spätblühender Taffetapfe
Registriert
03.09.06
Beiträge
2.802
pdfs werden automatisch indiziert wenn sie im Computer abgelegt werden.
 

quarx

Brauner Matapfel
Registriert
17.04.05
Beiträge
8.444
pdfs werden automatisch indiziert wenn sie im Computer abgelegt werden.
Auf externen Datenträgern wird allerdings IMHO nur der Dateiname indiziert, nicht der Inhalt. Dort muss man das Indizieren erst noch freischalten:
Code:
sudo mdutil -i on /Volumes/NamedesVolumes

Wenn die eingescannten PDFs nur Grafiken enthalten, scheitert allerdings jegliches Indizieren. Da müsste erst eine OCR-Software drüber laufen.
 

costafu

Gast
[/code]Da müsste erst eine OCR-Software drüber laufen.[/quote]

Jepp, und wie stelle ich das an? (eine OCR- Komponente ist ja in Acrobat enthalten)

Danke vorab & Gruß

Costa
 

ruelpsnase

Tokyo Rose
Registriert
07.07.07
Beiträge
71
Siehe Antwort des Vorredners ;)

Manche Scansoftware kommt mit OCR-Funktionalität mit, um aus einem gescannten Bild (oder Screenshots, oder ...) Text zu machen. Mir ist aber keine Scansoftware bekannt, die diese Texte zu "Suchdaten" für den Finder umwandelt und an das PDF hängt. Man kann natürlich den eingescannten Text (meist als purer Text oder RTF) einfach auf der Platte lassen, dann findet ihn Spotlight und indiziert ihn.
Oder man bedient sich Fremdsoftware, die die PDFs speichert und gleichzeitig eine Texterkennung durchführt. Ich glaube, "Devonthink" kann das. Ist aber (im Gegensatz zu anderer Software) nicht preiswert (ca. 120-150 Euronen).
 

nomos

Borowinka
Registriert
22.12.03
Beiträge
7.721
[/code]Da müsste erst eine OCR-Software drüber laufen.

Jepp, und wie stelle ich das an? (eine OCR- Komponente ist ja in Acrobat enthalten)

Danke vorab & Gruß

Costa[/quote]

Die eingebaute OCR in Acrobat einfach drüberlaufen lassen. Aber das Dokument muss eine bestimmte Mindestauflösung vorweisen, sonst kann es die Acrobat OCR nicht erkennen (mind 300dpi meine ich).

Carsten
 

costafu

Gast
[/quote]

Die eingebaute OCR in Acrobat einfach drüberlaufen lassen. Aber das Dokument muss eine bestimmte Mindestauflösung vorweisen, sonst kann es die Acrobat OCR nicht erkennen (mind 300dpi meine ich).

Carsten[/quote]

Kann ich das auch mit Acrobat automatisieren?

Danke & Gruß

Costa
 

costafu

Gast
...wirklich niemand mehr einen Tipp wie ich per Batch PDFs OCR- "behandeln" kann????