• Apfeltalk ändert einen Teil seiner Allgemeinen Geschäftsbedingungen (AGB), das Löschen von Useraccounts betreffend.
    Näheres könnt Ihr hier nachlesen: AGB-Änderung
  • Viele hassen ihn, manche schwören auf ihn, wir aber möchten unbedingt sehen, welche Bilder Ihr vor Eurem geistigen Auge bzw. vor der Linse Eures iPhone oder iPad sehen könnt, wenn Ihr dieses Wort hört oder lest. Macht mit und beteiligt Euch an unserem Frühjahrsputz ---> Klick

Literaturtip gesucht - Einsteigerfrage

lowflyer7

Cripps Pink
Registriert
29.01.08
Beiträge
154
Hallo zusammen,

ich suche nach ein paar Tipps, um mich weitergehend zu informieren. Ich möchte gerne für OSX ein Skript schreiben, mit dem ich Daten aus PDF-Dateien herauslesen kann und in eine ics-Datei für iCal einfügen kann. Habe leider bisher nur Erfahrung mit Website-Programmierung per PHP.

Irgendwelche Ideen oder Vorschläge? Oder gibt es vielleicht schon ähnliche Programme, die man nur anpassen müsste?

Danke!
 

below

Purpurroter Cousinot
Registriert
08.10.06
Beiträge
2.858
Ich verstehe Dich richtig, Du willst PDF Parsen?

Alex
 

lowflyer7

Cripps Pink
Registriert
29.01.08
Beiträge
154
Im Prinzip ja. Jetzt mal konkret: Ich habe einen Dienstplan im PDF-Format, in dem nach einem logischen Muster Daten und Uhrzeiten sowie noch ein paar Detailinformationen auftauchen. Diese Daten und Uhrzeiten möchte ich auslesen und in iCal importieren.

Gibt es dazu einen brauchbaren Lösungsansatz. Ich habe ein ähnliches Programm für Windows bereits über Kollegen erhalten, habe aber selbst keine Lust mehr auf Windows.
 

tjp

Altgelds Küchenapfel
Registriert
07.07.04
Beiträge
4.059
I
Gibt es dazu einen brauchbaren Lösungsansatz.
Das hängt von der Struktur des PDFs ab, wenn es keine Strukturen mehr in der Datei gibt, ist das so ziemlich unmöglich. Ansonsten kann man bei Adobe die PDF Doku sich herunterladen und dann einen Parser bauen. Fertige Libraries dafür gibt es zwar, aber die sind kommerziell und entsprechend teuer.
 

lowflyer7

Cripps Pink
Registriert
29.01.08
Beiträge
154
Mmmhhhh ... also es ist zunächst schon mal im TextEdit nichts in plain text zu erkennen. Alles sehr kryptisch und es gibt mehrere stream-endstream-Abschnitte.

Hast du einen Link zur Doku? Ich bin eben bei Adobe auf die Schnelle nicht fündig geworden.
 

lowflyer7

Cripps Pink
Registriert
29.01.08
Beiträge
154
Okay, ich schaue mir das mal an. Vielleicht hilft es ja noch was, dass ich gerade gesehen habe, dass die PDFs mit Ghostscript 7.07 kodiert wurden???