• Apfeltalk ändert einen Teil seiner Allgemeinen Geschäftsbedingungen (AGB), das Löschen von Useraccounts betreffend.
    Näheres könnt Ihr hier nachlesen: AGB-Änderung
  • Was gibt es Schöneres als den Mai draußen in der Natur mit allen Sinnen zu genießen? Lasst uns teilhaben an Euren Erlebnissen und macht mit beim Thema des Monats Da blüht uns was! ---> Klick

Nach Switch Probleme mit Umlauten

O-bake

Aargauer Weinapfel
Registriert
21.01.07
Beiträge
750
Hallo,

Ich bin während des letzten Jahres nun endgültig von Windows geswitched und habe dabei natürlich sämtliche Daten mitgenommen. Dabei habe ich auch neue (externe) Platten angeschafft und wollte das ganze mal so richtig schön sortieren.

Ich habe jetzt eine große Archivplatte mit hfs+ Dateisystem, auf die ich all meine persönlichen Sachen kopiert habe (von FAT32 und NTFS Laufwerken).

Eben habe ich jedoch gemerkt, dass etwas mit Umlauten in Dateinamen nicht stimmt.
Ich hatte einen Ordnernamen mit Apfel+V kopiert und in Google eingefügt und habe dabei gemerkt, dass der Umlaut aus dem Dateinamen falsch dargestellt wurde.
Es war das Wort "Kömödie", das im Google-Suchfeld als "Ko"mo"die" dargestellt wurde.
Ich habe dann den Ordnernamen einfach mal neu geschrieben, wieder kopiert und eingefügt und dann war alles in Ordnung.

Allerdings habe ich es mit ein paar anderen alten Ordner- und Dateinamen versucht und das Problem trat wieder auf.

Kennt jemand das Problem, bzw. gibt es dafür eine Lösung? Ich kann mir vorstellen, dass das bei Netzwerkfreigaben u.ä. zu Problemen führen kann, denn schliesslich stimmt da etwas nicht. Und vor allem: Wer zeigt mir den "richtigen" Namen an? Das Google-Textfeld, bzw. in einer leeren Textdatei tritt das auch auf, oder der Finder? Und wo liegt die Ursache des Problems?
 

nev03

Freiherr von Berlepsch
Registriert
18.05.07
Beiträge
1.104
Also der Finder zeigt das wort so an wie es sein sollte aber wenn du es kopierst und in ein textfeld einfügst sieht das wort so seltsam aus? hast du mal unter system einstellungen nachgesehen ob alles auf deutsch eingestellt ist. es kann mal schnell passieren das sich dort was verstellt. aber pass auf man kann dort schnell mal was verstellen...sonst kann ich es mir nicht erkläreno_O
 

Rastafari

deaktivierter Benutzer
Registriert
10.03.05
Beiträge
18.150
wo liegt die Ursache des Problems?
An einer uneinheitlichen Verwendung verschiedener Unicode-Darstellungen unter Windows.
(Man könnte auch sagen: Hier beweist sich die Chaostheorie...)

Umlaute lassen sich in UTF-8 auf mehrere verschiedene Arten abbilden. Einmal als ein einziges eigenständiges Zeichen, oder aber auch als eine aufeinanderfolgende Reihe von mehreren Symbolen, welche zusammen angezeigt lediglich wie ein Umlaut aussehen.
("Non-composed" bzw "Composed" Characters)

So lässt sich beispielsweise das Ö folgendermassen erzeugen:
Entweder als eigenständiger Buchstabe Ö (ein Zeichen), oder aber als...
O, horizontaler Cursorsprung ein Feld nach links, Diakritische Punkte oben (drei Zeichen, die zusammen abgebildet die sichtbare Form eines Ö ergeben - ohne wirklich ein Ö zu sein).

Treten dann noch in einem String mehrere dieser Zeichen auf, wirds nicht nur diakritisch, sondern extrem kritisch. Dann ist unter Win nämlich nicht mehr vorhersagbar (jedenfalls nicht für sterbliche Menschen...), in welcher Abfolge diese Zeichenkombinationen letztendlich gebildet wurden.
So kann das fiktive Wort "Bäär" in Composit-Darstellung auf vielerlei Weise generiert werden:
B-a-a-r-links-links-links-Punkte-Punkte-rechts
B-a-a-links-links-Punkte-Punkte-r
B-a-links-Punkte-a-links-Punkte-r

Bei komplexeren Worten gehen die Interpretationsmöglichkeiten ratzfatz gegen Unendlich.

Beim Dateisystem HFS+ ist klipp und klar definiert, wie das abzulaufen hat, daher klappt das (nahezu) ohne Ausnahmeregeln reibungslos.
(Die Unicode-Spezifikation kennt zB die "canonical" oder auch eine "non-canonical" Regel für die Reihenfolge. Und noch so einiges mehr...)
Bei NTFS und dem Rest des Windows-OS wäre das ja eigentlich auch geregelt - aber leider eben nur eigentlich. Praktisch gemacht wird das dann nach der "Pi mal Fensterkreuz minus Mondschein"-Methode. Mal so, mal anders oder auch mal ganz nach Herrn Ballmers tagesaktuellen Cholesterinspiegel...

Und wer nicht zum zahlenden Kreis derer Marktsklaven gehört, die bei MS die volle Spezifikation des Dateisystems lizenziert haben, der darf noch nicht mal all die komplexen Ausnahmeregeln in seinem eigenen Programmcode einbauen, weil das dann ein ganz pöses Sakrileg wider das Heiligtum der "geistige Eigentumsrechte" wäre...
Entweder du bezahlst für das Original und das Wissen um die verworrenen Gedankengänge der Redmonder Geheimdunstleute, oder deine selbstgestrickten Programme werden immer wieder auf "unvorhersehbare" Probleme stossen. Das ist keinesfalls eine typische Microsoft-Produktpolitik und natürlich überhaupt nicht beabsichtigt vom selbstgekrönten Weltmeister der "Interoperabilität". Amen.