• Apfeltalk ändert einen Teil seiner Allgemeinen Geschäftsbedingungen (AGB), das Löschen von Useraccounts betreffend.
    Näheres könnt Ihr hier nachlesen: AGB-Änderung
  • Viele hassen ihn, manche schwören auf ihn, wir aber möchten unbedingt sehen, welche Bilder Ihr vor Eurem geistigen Auge bzw. vor der Linse Eures iPhone oder iPad sehen könnt, wenn Ihr dieses Wort hört oder lest. Macht mit und beteiligt Euch an unserem Frühjahrsputz ---> Klick

Probleme mit Textkodierung

  • Ersteller Faustus
  • Erstellt am

Faustus

Gast
Hallo Leute,

mein Problem ist ziemlich speziell und möglicherweise habe ich nicht das richtige Forum dafür getroffen, aber ich versuchs mal. Es geht um folgendes:
Ich muss mit Dateien arbeiten, die unter UTF-16 Little Endian kodiert sind. Aber sowohl mit TextWrangler als auch mit Smultron gehen die Dateien bei Umkodierungsversuchen reihenweise den Bach runter und werden zunehmend mit chinesischen Zeichen angezeigt. Selbst wenn sich die beiden Editoren mal einig sind und beide angeben, dass das Dokument jetzt definitiv UTF_16-LE sei, erkennt meine Software die Datei nicht oder gibt sie nur mit Fehlern aus. Das treibt mich mittlerweile völlig in den Wahnsinn, weder der Entwickler von Smultron noch mein Prof konnten mir bisher irgendwie helfen. Es ist auch so ein bescheuertes kleines Spezialproblem was vermutlich kein Mensch je hatte - und bei mir ist es auf zwei Rechnern und ich kann so einfach meine Arbeit nicht machen. :eek: Die Rechner sind ein Powerbook G4 und ein relativ aktueller iMac, beide mit Leopard und allen Updates.
Hinzu kommt, das Smultron sogar ab und zu abstürzt, wenn ich den dort konvertierten Text öffnen möchte. Verschiedene Varianten von "Automatisch erkennen" über "Immer öffnen als..." bis hin zu was weiß ich was habe ich schon probiert. Meine Hoffnung ist, dass einer von Euch ein Kodierungsprofi ist und direkt sagen kann: "Machs so..." Das wäre famos.
Vielen Dank schon mal,
Faustus
 

Rastafari

deaktivierter Benutzer
Registriert
10.03.05
Beiträge
18.150
Ich muss mit Dateien arbeiten, die unter UTF-16 Little Endian kodiert sind.
Wenn du das sicher weisst, solltest du diese Angabe beim öffnen manuell vorgeben, anstatt dich auf die Automatik zu verlassen. Wenn dabei nicht das rauskommt was zu erwarten wäre, dann stimmt diese Annahme wohl einfach nicht.
das Dokument jetzt definitiv UTF_16-LE sei, erkennt meine Software die Datei nicht oder gibt sie nur mit Fehlern aus.
Die meiste Software mag UTF-16 Formate nicht, aber UTF-8 ist schokolativ. Umspeichern?
Tip: UTF OHNE einen "BOM" (bzw. "Bang") zu speichern ist meist die bessere Idee.
 

Faustus

Gast
Hallo und danke für die Antwort.
Der Punkt ist, dass die Datei am Schluss UTF16LE sein soll, vorher aber irgendein anderes Format, Mac Roman z.B., haben kann. Aber mittlerweile habe ich eine Art Lösung gefunden: Ich darf einfach die Dateien nicht bearbeiten solange sie UTF16LE als Kodierung haben sondern muss sie vorher anders speichern, bearbeiten und dann zurück konvertieren. Merkwürdig. Und danke nochmals.