Vielleicht hilft es, nicht nach Programmen für Word-Dateien zu suchen. Wenn du die Texte als Nur-Text abspeicherst zum Durchsuchen, müsste sich das auch über das Terminal machen lassen - ich bin mir aber ziemlich sicher, daß es dafür dann kleine Progrämmchen gibt.
Ergebnis 1 bis 6 von 6
- 27.01.2011, 14:29 #1
Wortliste aus Text erstellen ?
Hallo,
ich möchte gerne aus verschiedenen umfänglichen Fachtexten ( unter Word 2008)
die Worte als Liste erstellt haben,
um sie in Wörterbücher für die Word-Rechtschreibung eingeben zu können.
Für Windows scheint es einige wenige Programme zu geben,
aber für MAC finde ich einfach nichts..........???
Kann vielleicht jemand Helfen?
Gruß, WKIf your looking for more than one thing,
you'll find the most important one last.--------------------------------------------------------------------------------
Mac mini 1,5 Ghz(G4) / iMac 2,16 -non-glossy-/ ibook(G4) 1,42 Ghz.
- 27.01.2011, 15:30 #2Gelber Richard
- Registriert
- 12.2005
- Ort
- Alzenau
- Beiträge
- 12.365
- 27.01.2011, 15:57 #3
Die Suche ging nach" wortliste aus Text erstellen",
da kamen meist Progrämmchen, die aus verschiedenen Formaten auslesen können!
Aber wie gesagt, windowsbasiert.
Mit selbst erstellten Makros kenne ich mich leider nicht aus....
Trotzdem Danke,WKIf your looking for more than one thing,
you'll find the most important one last.--------------------------------------------------------------------------------
Mac mini 1,5 Ghz(G4) / iMac 2,16 -non-glossy-/ ibook(G4) 1,42 Ghz.
- 27.01.2011, 19:33 #4
Ein paar mehr Infos wären gut. Wie muss die Liste aussehen? Nummeriert? Deutsch/englische Texte?
Ich biete jetzt mal Perl an. So oder so ähnlich könnte das aussehen:
Das in einen Texteditor kopieren und z.b. als words.pl speichern. Dann im Terminal (Ordner Dienstprogramme) in den Ordner des Skripts wechseln und aufrufen mit:Code:#!/usr/bin/perl -w use strict; my $input = shift; open(FILE, $input); my @file = <FILE>; foreach(@file){ #hier alle auszuschliessenden Zeichen angeben, zwischen den ersten beiden / / und mit vorangestelltem \ $_ =~ tr/\(\)\&\!\?\"\.\,\;\:\-\n\t\r/ /; my @words = split(/ /, $_); foreach(@words){ print $_ . "\n"; } }
Oder als Liste in einer neuen Datei speichern:Code:perl words.pl DieDateiMitDemText.txt
Der Perl-Interpreter ist hoffentlich auch ohne die Developer Tools schon vorhanden (?). Den Text am besten als reine .txt Datei abspeichern. Ich weiß leider nicht wie es mit Umlauten aussieht, vielleicht weiß das jemand.Code:perl words.pl DieDateiMitDemText.txt > DieNeueDatei.txt
It's more fun to be a pirate than to join the navy.RTF Apfeltalk Wiki
- 28.01.2011, 10:36 #5
DAnke Guy.brush,
einfache Liste untereinander, Alphab. sortiert, Dubletten gelöscht, deutsch.
Genau das machen diese Progrämmchen.
Dein Vorschlag überfordert so leider meine Kenntnisse.
Es gibt wohl auch die Möglichkeit den Text als .txt in EXCEL zu importieren mit dem Befehl
Leerzeichen durch Absatz zu ersetzen.
Allerdings werden die Worte alle nebeneinander ausgegeben,
nicht sortiert, und Umlaute "ü" durch Ä1/4 ersetzt.....
Danke soweit, WKIf your looking for more than one thing,
you'll find the most important one last.--------------------------------------------------------------------------------
Mac mini 1,5 Ghz(G4) / iMac 2,16 -non-glossy-/ ibook(G4) 1,42 Ghz.
- 11.01.2012, 22:39 #6
Hallo,
das ist soweit recht einfach mit WOrd, Excel und einer Stoppwortliste (in Mac OS X enthalten oder frei im Web) möglich.
Den Text in Word laden. Leerzeichen in Absatzmarken ändern, Liste in Excel… -> Terminologieextraktion mit einfachen Mitteln
Ansonsten gibts im Bereich Termextraktion auch schon einiges für den Mac -> freies und kostenloses für Translator
Und Übersetzer finden professionelle Werkzeuge für Terminologieverwaltung, Translation Memory usw. in meiner kleinen Liste.
Gruss,
docXterdocXter - Technische Dokumentation für und mit iMac, iPad, iPhone & Co.


Zitieren

