• Apfeltalk ändert einen Teil seiner Allgemeinen Geschäftsbedingungen (AGB), das Löschen von Useraccounts betreffend.
    Näheres könnt Ihr hier nachlesen: AGB-Änderung
  • Wir haben den Frühjahrsputz beendet, Ihr auch? Welches Foto zu dem Thema hat Euch dann am Besten gefallen? Hier geht es lang zur Abstimmung --> Klick

Text in HTML-Text wandeln (HTML-Konverter)

knalli-peng

Gloster
Registriert
24.11.08
Beiträge
62
Moin!

Einfache Frage: Ich habe einen HTML-Text, der aber noch Umlaute enthält. Diesen Text möchte ich in einem Rutsch in HTML umwandeln, sodass z. B. aus "ü" "ü" wird. Welches Programm könnt Ihr mir empfehlen?

Hinweis: Ich habe bereits zwei Tage lang gegoogelt und zahlreiche Programme (auch HTML Editoren) ausprobiert. Entweder funktionierten die gar nicht, hatten keine entsprechende Funktion oder verrichteten ihren Dienst nicht zufriedenstellend wie z. B. HTML Converter 2.0, der aus "ßüÜä&–•#\" leider "§ƒ∫…&Ð¥#\" macht, egal welche Kovertierung ich einstelle.
 

Alecco

Transparent von Croncels
Registriert
17.02.09
Beiträge
306
Einfach Suchen und Ersetzen?

Oder nen Shellscript schrieben.
 

gKar

Maunzenapfel
Registriert
25.06.08
Beiträge
5.362
Ich schreibe auch in HTML keine ö-Entities o.ä., sondern die Umlaute im Klartext. Voraussetzung ist nur, dass ich den Text in einer bestimmten Kodierung (in meinem Fall UTF-8) speichere und diese auch normgerecht / standardkonform deklariere. D.h. ein vernünftiger vollständiger HTML-Kopf sollte nicht fehlen.
 

knalli-peng

Gloster
Registriert
24.11.08
Beiträge
62
Einfach Suchen und Ersetzen?

Oder nen Shellscript schrieben.

Einfach suchen und ersetzen? DAS hätte ich auch noch selbst hinbekommen!!

Ein Shellscript kann ich nicht schreiben. Ich fragte ja auch nach einer wirklich einfachen Lösung, bei der ich ein Tool oder (kostenloses) Programm benutzen kann und nicht erst noch was selbst programmieren muss. Dennoch danke für den Tipp!
 

knalli-peng

Gloster
Registriert
24.11.08
Beiträge
62
Im Head steht <meta http-equiv="Content-Type" content="text/html; charset="ISO-8859-1">. Die Datei ist in BBEdit einfach gesichert worden, ich habe keine Eintsellungen dabei vorgenommen. Beim ersten Test online zeigte sich, dass die Umlaute nicht korrekt gewandelt werden. Ein Eszett wird zu einem §.

Was nun?
 

landplage

Admin
AT Administration
Registriert
06.02.05
Beiträge
23.475
Versuch doch mal den Kompozer. Dort gibt es eine Funktion, daß in der Normalansicht eingegebener Text entsprechend umgewandelt werden kann.
Den kann man dann in der Quelltext-Ansicht einfach kopieren.

Beispiel: müssen öle außer wird zu

Tja, wie verhindere ich, daß der Text umgewandelt wird hier bei der Anzeige?

Ein Bild als Ersatz:
 

Anhänge

  • html-text.jpg
    html-text.jpg
    18 KB · Aufrufe: 163

knalli-peng

Gloster
Registriert
24.11.08
Beiträge
62
Versuch doch mal den Kompozer. Dort gibt es eine Funktion, daß in der Normalansicht eingegebener Text entsprechend umgewandelt werden kann.
Den kann man dann in der Quelltext-Ansicht einfach kopieren.

Habe meine BBEdit-Datei jetzt in KompoZer geöffnet und sie unter Western ISO-Latin-1 abgespeichert. Im Browser wird das Eszett als § angezeigt. Hat also nichts gebracht.
 

landplage

Admin
AT Administration
Registriert
06.02.05
Beiträge
23.475
Ich meinte, den Text direkt in den Kompozer kopieren. Dann kannst Du den Quelltext wieder zurück nach BBEdit holen.
 

knalli-peng

Gloster
Registriert
24.11.08
Beiträge
62
Das Problem dabei ist nur, dass ich keinen reinen Text habe, sondern eine fertige komplexe HTML-Datei. Wenn ich den Text nehme kommt am Ende eine Webseite heraus, auf der der Quellcode steht. *lol*
 

landplage

Admin
AT Administration
Registriert
06.02.05
Beiträge
23.475
Du sollst ja aus dem Kompozer auch nur den Bereich aus dem Quelltext kopieren, der den Text enthält. In meinem Bild wäre das der markierte Bereich.
 

Cillit Bang

Weißer Winterglockenapfel
Registriert
21.12.08
Beiträge
877
Also ich nutze das Programm Textwrangler. Dort kannst du, wenn du Speichern unter wählst, die Konvertierung einstellen. Denke aber, dass es bei BBEdit ähnlich ist.
 

knalli-peng

Gloster
Registriert
24.11.08
Beiträge
62
Das geht nicht, und zwar deswegen, weil ich in meinem komplexen HTML-Dokument nicht nur einen Text an einer Stelle habe, sondern ganz viele an ganz vielen Stellen.
 

knalli-peng

Gloster
Registriert
24.11.08
Beiträge
62
Mit TextWrangler habe ich eben bereits Tests gemacht. Ich habe noch mal die Datei mit der Meta-Angabe ISO-8859-1 in TextWrangler geöffnet und als Western ISO-Latin-1 abgespeichert. Im Browser wird das Eszett immer noch als § dargestellt. Die Browser-Zeichenkodierung steht auf "Westlich (ISO-8859-1)".
 

knalli-peng

Gloster
Registriert
24.11.08
Beiträge
62
Ich habe nun die 30-Tage-Trial-Version von TextSoap ausprobiert. Meine HTML-Datei habe ich in dem Programm geöffnet und dann im Fenster "Cleaners" unter "Group" die Option "HTML" ausgewählt, dann erschien darunter eine Liste, in der ich den Punkt "Text to Named HTML Entity" angeklickt habe. Daraufhin wurde der Dateitext umgewandelt. Ich habe ihn dann entsprechend der Meta-Tag-Angabe als Western ISO-Latin-1 abgespeichert. Anschließend wurden alle (!) Umlaute und Sonderzeichen im Browser (Zeichenkodierung steht auf "Westlich (ISO-8859-1)") korrekt dargestellt.

Leider keine Dauerlösung, da TextSoap keine Freeware ist, aber für den Moment ist das Problem gelöst.

Danke an alle, die Tipps gegeben haben! :)
 

risetothesky

Macoun
Registriert
19.02.09
Beiträge
119
Du kannst alle Umlaute und auch das ß verwenden, wenn du die Textcodierung einfach auf UTF-8 stellst. Ist bei weitem die einfachste und barrierefreiste Lösung!