1. Diese Seite verwendet Cookies. Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies. Weitere Informationen

Worddokumente entschlüsseln?

Dieses Thema im Forum "Unix & Terminal" wurde erstellt von C64, 28.04.07.

  1. C64

    C64 Halberstädter Jungfernapfel

    Dabei seit:
    12.04.06
    Beiträge:
    3.836
    Hallo,

    ich hatte von einem Prof an der Uni gehört, dass man Worddokumente vollständig unter Unix anschauen kann. Windowsdateien sind ja irgendwie standardmäßig verschlüsselt, weshalb man ja nie genau sieht, was alles drinsteckt.
    Aber so genau hab ich das nicht verstanden...
    Jedenfalls bekomme (vor allem bei Rundmails) immer und immer wieder .doc-Dateien. Das nervt mich persönlich, dashalb würde ich gerne die Worddokumente entschlüsseln und den kompletten Inhalt, falls etwas ungewolltes drin ist;) zurückschicken. Denn oft sind ja in den Dokumenten mehr Dinge drin, als man vermutet.... so der Prof in der Vorlesung.
    Wie aber mache ich das. Ich bin was Unix angeht leider noch etwas unbefleckt;)
    Danke für eure Hilfe:-D
     
  2. Hobbes_

    Hobbes_ Gast

    Die OpenSource Office Pakete wie OpenOffice.org oder NeoOffice können Word-Dokumente lesen. Diese gibt es als Implementation auf den verschiedensten OS (zumindest OOo für Win, Mac, Linux (leider nicht direkt UNIX, evtl nur als Versuch möglich??); NeoOffice nur Mac).

    Auf was für einem UNIX brauchst Du das ganze denn?

    Daneben gibt es noch Konverter (zB word2text oder wv) --> am einfachsten mal nach diesen Begriffen und Deinem UNIX googeln...

    Gruss
    psc
     
  3. kasei

    kasei Gast

    Windowsdateien sind standardmässig NICHT verschüsselt.

    Kasei
     
  4. C64

    C64 Halberstädter Jungfernapfel

    Dabei seit:
    12.04.06
    Beiträge:
    3.836
    Mmh... Mir geht es ja nicht um Inhalte, die man in Word sieht... die sehe ich mit Pages auch.
    Hab mich wohl missverständlich ausgedrückt.
    in Unix wird ja nur mit ASCII gearbeitet. Windows arbeitet aber standardmäßig mit einem erweiterten Code, also statt mit 128 mit 256 Zeichen (so ähnlich hab ich das in Erinnerung)... Und irgendwie werden mit den 256 Zeichen mehr Infos gespeichert, als dem Nutzer recht sein kann.
    Mein Prof hat damals aus einer Worddatei noch zwei Briefe rausgeholt, die der Verfasser vorher getippt hatte, die aber nicht für den Prof bestimmt waren. In den normalen Officeprogrammen werden die auch nicht angezeigt, aber irgendwie hat er es über das Terminal (so weit ich weiß) die "Nebeninfos" rausgeholt.
    Versteht jemand was ich meine?
     
  5. Hobbes_

    Hobbes_ Gast

    Aufgrund der zahlreichen Sonderzeichen wird nicht mehr mit dem originalen ASCII-Code (7 Bit) sondern mit 8 Bit (256 Zeichen-Zeichentabelle) oder noch mehr (siehe auch UTF-8) gearbeitet. Jedoch arbeitet auch UNIX nicht mehr nur mit den originalen 7 Bit ASCII (ausser Du hast ein historisches Gerät).

    In diesem zusätzlichen Bit sind (ausser jemand kreiert eine eigene Codemaschien, welche das 8. Bit beispielsweise als Morse-Code verwendet, wäre noch cool :) ) jedoch keine Geheimcodes aufgezeichnet, sondern einfach die Informationen für die Zeichentabelle (siehe oben).

    Word jat jedoch die Unart, mehr Informationen zu speichern, als man direkt sieht. So kann man (je nachdem ob die Option eingeschaltet ist) den ganzen Verlauf des Projektes rekonstruieren. Je nachdem, wenn jemand innerhalb der Datei verschiedene Dokumente geschrieben hat, kann man so auch mehr rekonstruieren. Dazu genügt jedoch Word selbst und es braucht kein top geheimes Programm.

    Dieses Problem wurde übrigens schon einigen Firmen und auch Personen der Klatschpresse zum Verhängnis (siehe Google, wie immer, wenn nicht Wikipedia zur Anwendung kommt :) ).

    Auch deshalb eignen sich Word-Dateien nicht, um beispielsweise Texte zu publizieren. Dazu ist eine Postscript oder eine PDF Datei wesentlich besser geeignet.

    ------

    Kurze Frage: Kannst Du nicht am einfachsten den Professor direkt fragen, wie er das damals gemacht hat?

    Hope it helps
    psc
     
  6. C64

    C64 Halberstädter Jungfernapfel

    Dabei seit:
    12.04.06
    Beiträge:
    3.836
    Den hab ich auch schon angeschrieben, aber er hat sich leider noch nicht gemeldet... aber hat ja auch Zeit. Hatte nur gedacht ich frag hier mal;)
    Jetzt hab ich das mit dem 7-Bit und 8-Bit Codes auch gleich besser verstanden:-D
    Dankeschön... dann werd ich mal auch googlen und ansonsten die Antwort von meinem Prof abwarten;)
     
  7. C64

    C64 Halberstädter Jungfernapfel

    Dabei seit:
    12.04.06
    Beiträge:
    3.836
    So, jetzt habe ich mal eine Antwort:)
    Schade. Ich kann damit relativ wenig anfangen, weil man mit dem Befehl strings vermutlich nur das bekommt, was man auch in Pages, Word, OpenOffice etc... bekommt....
    Vielleicht weiß jemand noch was;)
     
  8. Tengu

    Tengu Apfel der Erkenntnis

    Dabei seit:
    05.02.07
    Beiträge:
    721
    Kann es sein, dass ihr eigentlich ohne es zu wissen, von antiword redet.

    Nach Installation einfach:
    antiword -t Datei.doc

    eingeben und das Dokument wird im Terminal angezeigt.

    Naja fast... grundsätzlich ist das proprietäre Format von *.docx nicht einsehbar. Das ist das neue 2007er Format. xml verschlüsselt ist natürlich zuvor eine Entschlüsselung notwendig!

    - Daher sind OpenSource Implementationen ins Terminal nie 100%ig kompatibel. Genausowenig wie NeoOffice und OO es sind.

    Im Terminal selbst... mit antiword. ;) Sonst, also darüber hinaus ist das hier ja das falsche Forum.
     

Diese Seite empfehlen