1. Diese Seite verwendet Cookies. Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies. Weitere Informationen

Literaturtip gesucht - Einsteigerfrage

Dieses Thema im Forum "OS X-Developer" wurde erstellt von lowflyer7, 28.11.08.

  1. lowflyer7

    lowflyer7 Fießers Erstling

    Dabei seit:
    29.01.08
    Beiträge:
    128
    Hallo zusammen,

    ich suche nach ein paar Tipps, um mich weitergehend zu informieren. Ich möchte gerne für OSX ein Skript schreiben, mit dem ich Daten aus PDF-Dateien herauslesen kann und in eine ics-Datei für iCal einfügen kann. Habe leider bisher nur Erfahrung mit Website-Programmierung per PHP.

    Irgendwelche Ideen oder Vorschläge? Oder gibt es vielleicht schon ähnliche Programme, die man nur anpassen müsste?

    Danke!
     
  2. below

    below Kalterer Böhmer

    Dabei seit:
    08.10.06
    Beiträge:
    2.865
    Ich verstehe Dich richtig, Du willst PDF Parsen?

    Alex
     
  3. lowflyer7

    lowflyer7 Fießers Erstling

    Dabei seit:
    29.01.08
    Beiträge:
    128
    Im Prinzip ja. Jetzt mal konkret: Ich habe einen Dienstplan im PDF-Format, in dem nach einem logischen Muster Daten und Uhrzeiten sowie noch ein paar Detailinformationen auftauchen. Diese Daten und Uhrzeiten möchte ich auslesen und in iCal importieren.

    Gibt es dazu einen brauchbaren Lösungsansatz. Ich habe ein ähnliches Programm für Windows bereits über Kollegen erhalten, habe aber selbst keine Lust mehr auf Windows.
     
  4. tjp

    tjp Baldwins roter Pepping

    Dabei seit:
    07.07.04
    Beiträge:
    3.252
    Das hängt von der Struktur des PDFs ab, wenn es keine Strukturen mehr in der Datei gibt, ist das so ziemlich unmöglich. Ansonsten kann man bei Adobe die PDF Doku sich herunterladen und dann einen Parser bauen. Fertige Libraries dafür gibt es zwar, aber die sind kommerziell und entsprechend teuer.
     
  5. lowflyer7

    lowflyer7 Fießers Erstling

    Dabei seit:
    29.01.08
    Beiträge:
    128
    Mmmhhhh ... also es ist zunächst schon mal im TextEdit nichts in plain text zu erkennen. Alles sehr kryptisch und es gibt mehrere stream-endstream-Abschnitte.

    Hast du einen Link zur Doku? Ich bin eben bei Adobe auf die Schnelle nicht fündig geworden.
     
  6. tjp

    tjp Baldwins roter Pepping

    Dabei seit:
    07.07.04
    Beiträge:
    3.252
    Adobes Doku findet sich hier.
     
  7. lowflyer7

    lowflyer7 Fießers Erstling

    Dabei seit:
    29.01.08
    Beiträge:
    128
    Okay, ich schaue mir das mal an. Vielleicht hilft es ja noch was, dass ich gerade gesehen habe, dass die PDFs mit Ghostscript 7.07 kodiert wurden???
     

Diese Seite empfehlen