Text kopieren -> Buchstabensalat

rob-master

Golden Delicious
Registriert
16.01.10
Beiträge
6
Hallo miteinander,
ich habe derzeit das Problem, dass ich PDFs (die unter Windows erstellt wurden) zwar in der "Vorschau" öffnen kann, aber wenn ich Textabschnitte bspw. aus diesem PDF in Word oder Textedit kopieren möchte, erhalte ich einen Buchstabensalat. Vorweg: Das PDF ist nicht geschützt vom Autoren und wenn ich zum Test mal ein PDF unterm Mac erstelle (z.B. aus Word heraus) und kopiere dann den Text wieder zurück in Word, funktioniert es. Hier ein Beispiel, aus:

Minimierung von Risiken

wird

B')'@'$(+)&*01)*#'2'8$)*

Ich benutze Mac OSX 10.6.2.

Ich hab keine Idee woran das liegen könnte.

Herzlichen Dank für Eure Ideen / Hilfen
 

Alecco

Transparent von Croncels
Registriert
17.02.09
Beiträge
306
Vielleicht gibt es ein Problem mit der Kodierung des Textes? Falls du zufällig den Adobe Reader hast, probiere es doch mal aus (bei mir gibt es manchmal Probleme mit Vorschau unter 10.6.x).
 

rob-master

Golden Delicious
Registriert
16.01.10
Beiträge
6
Danke für deine Antwort.
Ja das hatte ich auch schon überlegt und habe es daraufhin mit dem Acrobat versucht. Hier ist der gleiche Effekt. Es liegt also direkt am PDF.
Ich vermute, dass der Text im PDF in Word 2007 unter Windows erstellt und dann in ein PDF konvertiert wurde. Aber wer weiß, wie der letzte Schritt erfolgt ist?!? o_O
 

Alecco

Transparent von Croncels
Registriert
17.02.09
Beiträge
306
Danke für deine Antwort.
Ja das hatte ich auch schon überlegt und habe es daraufhin mit dem Acrobat versucht. Hier ist der gleiche Effekt. Es liegt also direkt am PDF.
Ich vermute, dass der Text im PDF in Word 2007 unter Windows erstellt und dann in ein PDF konvertiert wurde. Aber wer weiß, wie der letzte Schritt erfolgt ist?!? o_O

Zwei Sachen, die man noch probieren könnte:

a) Falls du den Adobe Reader Pro hast, dann kannst du unter "Datei -> Speichern unter" "als Word-Dokument" ausprobieren.

b) Falls du OpenOffice verwendest, dann versuche doch mal mit Copy&Paste den Text einzufügen. Ich persönlich hatte auch schon Probleme mit Formatierungen aus M$ Office heraus. Deshalb verwende ich eigentlich nur noch OpenOffice!
 

NobiMan

Osnabrücker Reinette
Registriert
08.09.09
Beiträge
978
Ich tippe mal, dass der Autor des PDFs nicht möchte, dass Du etwas aus seinem Werk kopierst und einen Zeichenversatz eingebaut hat.
Schau Dir Deinen Satz mal genau an:
B=M
'=i
)=n
@=m
usw...
 

Rastafari

deaktivierter Benutzer
Registriert
10.03.05
Beiträge
18.150
Das ist ein Problem, das von einer mangelhaften Erstellersoftware herrührt.
Bei der eingebetteten Schrift fehlt der obligatorische "Encoding Vector". Das ist eine Zuordnungstabelle, welche eine bestimmte visuelle Zeichenform (eine "Glyphe") einer bestimmten Bedeutung, also einem wiedererkennbaren Schriftzeichen (einem "Character") zuweist. Das PDF "weiss" zwar wie ein bestimmter Buchstabe im Text auszusehen hat, es weiss aber nicht welcher Buchstabe das tatsächlich mal war.
Also wird eine Standardtabelle verwendet, die aber mit der nur teilweise (als "Subset") eingebetteten Schrift nicht mehr übereinstimmt --> Salat.
Manchmal wird sowas auch ganz gezielt gemacht, um das kopieren von Text zu erschweren ("poor mans crypto").
 

afri

Maren Nissen
Registriert
01.09.07
Beiträge
2.319
Ausdrucken -> einscannen, wahlweise photographieren -> OCR-Programm nutzen?

Gruß
Andreas