1. Diese Seite verwendet Cookies. Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies. Weitere Informationen

Unicode UTF-8 öffnen

Dieses Thema im Forum "Web-Programmierung" wurde erstellt von Caesar, 20.09.07.

  1. Caesar

    Caesar Weigelts Zinszahler (Rotfranch)

    Dabei seit:
    03.04.06
    Beiträge:
    245
    Hallo,

    die Dateien auf unserem Webserver sind alle mit dem Charset UTF-8 codiert. Irgendwie bekomme ich es nicht hin, diese Dateien korrekt zu öffnen und wieder im richtigen Format zu speichern.

    Smultron meldet z.B. "Fehler beim Öffnen des Dokuments mit Kodierung "Unicode (UTF-8)". Soll es trotzdem geöffnet werden?" Öffne ich es trotzdem, gehen die Umlaute flöten.

    Habt Ihr eine Idee, mit welchem Programm ich damit keine Probleme habe?

    Viele Grüße & Merci

    Manuel
     
  2. crossinger

    crossinger Doppelter Melonenapfel

    Dabei seit:
    30.07.06
    Beiträge:
    3.369
    Z.B. Textwrangler? Ist kostenlos und kommt mit verschiedenen Codierungen klar. Wäre zumindest einen Versuch wert, der nix kostet.

    *J*
     
  3. sAiKo

    sAiKo Cripps Pink

    Dabei seit:
    13.01.06
    Beiträge:
    152
    Smultron kann garantiert auch UTF8. Hast du in den Einstellungen von Smultron vielleicht so was eingestellt wie: Benutze immer ASCII oder so?

    Gruß

    Christian
     
  4. Caesar

    Caesar Weigelts Zinszahler (Rotfranch)

    Dabei seit:
    03.04.06
    Beiträge:
    245
    Nein, habe ich nicht. Die Einstellung steht auf "Automatisch erkennen". Aber selbst wenn ich die Einstellung auf "Benutze immer UTF-8" ändere, kommt die Fehlermeldung beim Öffnen der Datei.

    Manuel
     
  5. Skeeve

    Skeeve Pomme d'or

    Dabei seit:
    26.10.05
    Beiträge:
    3.121
    jEdit kann auch UTF-8 und noch viele andere Kodierungen.

    Nachtrag: Schau Dir doch mal einen Hexdump an, ob Du tatsächlich UTF-8 vorliegen hast.
     
  6. Caesar

    Caesar Weigelts Zinszahler (Rotfranch)

    Dabei seit:
    03.04.06
    Beiträge:
    245
    Habe ich gerade gemacht. Woher weiß ich denn, ob UTF-8 vorliegt?

    Manuel
     
  7. Skeeve

    Skeeve Pomme d'or

    Dabei seit:
    26.10.05
    Beiträge:
    3.121
    Naja... Speicher mal eine korrekte UTF-8 Datei ab (also eine, mit einem der o.g. Editoren erzeugte) und vergleiche die Bytefolgen der Zeichen.
     
  8. Caesar

    Caesar Weigelts Zinszahler (Rotfranch)

    Dabei seit:
    03.04.06
    Beiträge:
    245
    Sorry, so genau kenne ich mich da nicht aus. Vielleicht kannst Du ja mal kucken...

    (1) Datei die ich mit Smultron korrekt im UTF-8 Format gespeichert habe:
    0000000 6554 7473 7520 646e 5420 7365 2174
    000000e

    (2) Datei vom Server (die ersten und letzten drei Zeilen)
    0000000 213c 4f44 5443 5059 2045 7468 6c6d 5020
    0000010 4255 494c 2043 2d22 2f2f 3357 2f43 442f
    0000020 4454 5820 5448 4c4d 3120 302e 5320 7274
    ...
    0002340 6f62 7964 0d3e 3c0a 682f 6d74 3e6c 0a0d
    0002350 0a0d 0a0d 0a0d 0a0d
    0002358

    Manuel
     
  9. Skeeve

    Skeeve Pomme d'or

    Dabei seit:
    26.10.05
    Beiträge:
    3.121
    Alles Klar! Es ist ein Big vs. Little Endian Problem. Dem kannst Du allenfalls entgehen, indem Du eine BOM an den Anfang der Datei schreiben läßt.

    Man sieht es hierdran: 21 3c 4f 44 ist "!<OD" statt "<!DO" (vom DOCTYPE).
     

Diese Seite empfehlen