• Apfeltalk ändert einen Teil seiner Allgemeinen Geschäftsbedingungen (AGB), das Löschen von Useraccounts betreffend.
    Näheres könnt Ihr hier nachlesen: AGB-Änderung
  • Die Bildungsoffensive hier im Forum geht weiter! Jetzt sollen Kreativität und technische Möglichkeiten einen neue Dimension erreichen. Das Thema in diesem Monat lautet - Verkehrte Welt - Hier geht es lang --> Klick

Text kopieren -> Buchstabensalat

rob-master

Golden Delicious
Registriert
16.01.10
Beiträge
6
Hallo miteinander,
ich habe derzeit das Problem, dass ich PDFs (die unter Windows erstellt wurden) zwar in der "Vorschau" öffnen kann, aber wenn ich Textabschnitte bspw. aus diesem PDF in Word oder Textedit kopieren möchte, erhalte ich einen Buchstabensalat. Vorweg: Das PDF ist nicht geschützt vom Autoren und wenn ich zum Test mal ein PDF unterm Mac erstelle (z.B. aus Word heraus) und kopiere dann den Text wieder zurück in Word, funktioniert es. Hier ein Beispiel, aus:

Minimierung von Risiken

wird

B')'@'$(+)&*01)*#'2'8$)*

Ich benutze Mac OSX 10.6.2.

Ich hab keine Idee woran das liegen könnte.

Herzlichen Dank für Eure Ideen / Hilfen
 
Vielleicht gibt es ein Problem mit der Kodierung des Textes? Falls du zufällig den Adobe Reader hast, probiere es doch mal aus (bei mir gibt es manchmal Probleme mit Vorschau unter 10.6.x).
 
Danke für deine Antwort.
Ja das hatte ich auch schon überlegt und habe es daraufhin mit dem Acrobat versucht. Hier ist der gleiche Effekt. Es liegt also direkt am PDF.
Ich vermute, dass der Text im PDF in Word 2007 unter Windows erstellt und dann in ein PDF konvertiert wurde. Aber wer weiß, wie der letzte Schritt erfolgt ist?!? :-/
 
Danke für deine Antwort.
Ja das hatte ich auch schon überlegt und habe es daraufhin mit dem Acrobat versucht. Hier ist der gleiche Effekt. Es liegt also direkt am PDF.
Ich vermute, dass der Text im PDF in Word 2007 unter Windows erstellt und dann in ein PDF konvertiert wurde. Aber wer weiß, wie der letzte Schritt erfolgt ist?!? :-/

Zwei Sachen, die man noch probieren könnte:

a) Falls du den Adobe Reader Pro hast, dann kannst du unter "Datei -> Speichern unter" "als Word-Dokument" ausprobieren.

b) Falls du OpenOffice verwendest, dann versuche doch mal mit Copy&Paste den Text einzufügen. Ich persönlich hatte auch schon Probleme mit Formatierungen aus M$ Office heraus. Deshalb verwende ich eigentlich nur noch OpenOffice!
 
Ich tippe mal, dass der Autor des PDFs nicht möchte, dass Du etwas aus seinem Werk kopierst und einen Zeichenversatz eingebaut hat.
Schau Dir Deinen Satz mal genau an:
B=M
'=i
)=n
@=m
usw...
 
Das ist ein Problem, das von einer mangelhaften Erstellersoftware herrührt.
Bei der eingebetteten Schrift fehlt der obligatorische "Encoding Vector". Das ist eine Zuordnungstabelle, welche eine bestimmte visuelle Zeichenform (eine "Glyphe") einer bestimmten Bedeutung, also einem wiedererkennbaren Schriftzeichen (einem "Character") zuweist. Das PDF "weiss" zwar wie ein bestimmter Buchstabe im Text auszusehen hat, es weiss aber nicht welcher Buchstabe das tatsächlich mal war.
Also wird eine Standardtabelle verwendet, die aber mit der nur teilweise (als "Subset") eingebetteten Schrift nicht mehr übereinstimmt --> Salat.
Manchmal wird sowas auch ganz gezielt gemacht, um das kopieren von Text zu erschweren ("poor mans crypto").
 
Ausdrucken -> einscannen, wahlweise photographieren -> OCR-Programm nutzen?

Gruß
Andreas