• Apfeltalk ändert einen Teil seiner Allgemeinen Geschäftsbedingungen (AGB), das Löschen von Useraccounts betreffend.
    Näheres könnt Ihr hier nachlesen: AGB-Änderung
  • Viele hassen ihn, manche schwören auf ihn, wir aber möchten unbedingt sehen, welche Bilder Ihr vor Eurem geistigen Auge bzw. vor der Linse Eures iPhone oder iPad sehen könnt, wenn Ihr dieses Wort hört oder lest. Macht mit und beteiligt Euch an unserem Frühjahrsputz ---> Klick

Tipp: Text ohne OCR aus Bildern extrahieren

Schomo

Zehendlieber
Registriert
15.11.04
Beiträge
4.118
Hi vielleicht haben einige von euch keine OCR Software. Vielleicht kennen auch schon viele das Feature, mir ist es aber gerade erst aufgefallen. Man kann wenn man ein Bild als PDF sichert, in Acrobat Professional dieses PDF als HTML sichern, und dann den Text per copy & paste aus der entstehenden html Datei in Textdokumente einfügen. Ein paar Korrekturen sind sicher nötig, aber eine feine Sache...

Tolles Feature von Acrobat!

Update: Das bild muss minimum 200 dpi heben oder max. 600 dpi. Über Dokument/Paper Capture kann der Text auch gelesen werden und dann als Text gespeichert werden.
Danke für eure Ergänzungen.

Gruß Schomo
 
Zuletzt bearbeitet:

KayHH

Gast
Moin Schomo,

bei mir (Vers. 6 Prof.) funktioniert das nicht. Welches Acrobat hast du denn?


Gruss KayHH
 

Schomo

Zehendlieber
Registriert
15.11.04
Beiträge
4.118
Ich hab Acrobat Prof. 6.02, als HTML mit CSS 1.0 sichern.

Gruß Schomo
 

Rastafari

deaktivierter Benutzer
Registriert
10.03.05
Beiträge
18.150
Schomo schrieb:
Ich hab Acrobat Prof. 6.02, als HTML mit CSS 1.0 sichern.
Das funktioniert nur, wenn der Text im PDF auch als Text vorliegt.
Dann kannst du aber auch gleich "Als Text sichern" benutzen, oder?
 

KayHH

Gast
Moin Schomo,

Rastafari schrieb:
Das funktioniert nur, wenn der Text im PDF auch als Text vorliegt.
Dann kannst du aber auch gleich "Als Text sichern" benutzen, oder?
das ist auch mein Gedanke, mit OCR hat es nichts zu tun.


Gruss KayHH
 

Schomo

Zehendlieber
Registriert
15.11.04
Beiträge
4.118
Ich rede von einem Zeitungsscan, den ich dann als (übrigens korrekt) als Text sichern kann. Hatte ich noch gar net gesehen, dass das auch möglich ist. Dann muss es doch eine OCR Umsetzung geben, oder wie solldas dann gehen?

Gruß Schomo
 

KayHH

Gast
Moin Schomo,

Schomo schrieb:
Ich rede von einem Zeitungsscan, den ich dann als (übrigens korrekt) als Text sichern kann. Hatte ich noch gar net gesehen, dass das auch möglich ist. Dann muss es doch eine OCR Umsetzung geben, oder wie solldas dann gehen?
Scannersoftware mit integrierter OCR würde ich mal tippen, oder kannst du mein Demo-pdf als Text sichern?


Gruss KayHH
 

Schomo

Zehendlieber
Registriert
15.11.04
Beiträge
4.118
Tatsächlich, dann muss ich den Tipp wohl revidieren. Schade ich hatte mich schon gefreut, weil OCR Software am Mac ja nicht gerade weit verbreitet ist. Da war ich wohl zu enthusiastisch ;)

Gruß Schomo
 

high-end-freak

Herrenhut
Registriert
16.12.05
Beiträge
2.289
Scannersoftware mit integrierter OCR würde ich mal tippen, oder kannst du mein Demo-pdf als Text sichern?


Gruss KayHH
deine demo-pdf erscheint als html als ein bild. das funzt nett, habe hier acrobat 7. wenn man es als rtf sichert funzt es auch nett. ich habhe aber hier im acrobat was gefunden(s. anhang) er meckert aber, dass die auflösung von KayHHs demo zu niedrig ist.
 

Anhänge

  • Bild 2.jpg
    Bild 2.jpg
    84,7 KB · Aufrufe: 287

high-end-freak

Herrenhut
Registriert
16.12.05
Beiträge
2.289
jetzt hab ich mal nen anderen text genommen, hier meckert er aber auch:eek: :eek: :eek:
 

Anhänge

  • Bild 3.jpg
    Bild 3.jpg
    30,3 KB · Aufrufe: 215

Schomo

Zehendlieber
Registriert
15.11.04
Beiträge
4.118
In meiner Version 6.02 geht diese Option unter Dokument/Paper Capture, und meldet dann, dass nur Auflösungen von 200-600 dpi unterstützt werden. Ich hab es ausprobiert und es geht. Ergo kann Acrobat tatsächlich mit dieser Option Text mit seiner OCR Engine sichern, der Text muss nur über 200 dpi gross sein. Egal ob als html, Text...

Puuuuhhhh da bin ich jetzt aber erleichtert. ThanX High-end-freak für den Denkanstoss.

Gruß Schomo
 

high-end-freak

Herrenhut
Registriert
16.12.05
Beiträge
2.289
In meiner Version 6.02 geht diese Option unter Dokument/Paper Capture, und meldet dann, dass nur Auflösungen von 200-600 dpi unterstützt werden. Ich hab es ausprobiert und es geht. Ergo kann Acrobat tatsächlich mit dieser Option Text mit seiner OCR Engine sichern, der Text muss nur über 200 dpi gross sein. Egal ob als html, Text...

Puuuuhhhh da bin ich jetzt aber erleichtert. ThanX High-end-freak für den Denkanstoss.
*karmahabenwoll*

ich würd aber trotzdem noch gerne wissen, was text ist, der gerendert werden kann(was ist rendern?). any ideas?
 
  • Like
Reaktionen: Schomo

Schomo

Zehendlieber
Registriert
15.11.04
Beiträge
4.118
Karmadirgegeben....
was meinst du mit Text? Ich meine damit das du einen eingescannten Text hast.

Gruß Schomo
 

high-end-freak

Herrenhut
Registriert
16.12.05
Beiträge
2.289
Karmadirgegeben....
danke! bald hab ich 2 knubbel:) .
was meinst du mit Text? Ich meine damit das du einen eingescannten Text hast.
ich mein den anhang, wo die fehlermeldung vom acrobat ist, die ich nett versteh. ich kapier nett, was man an text rendern kann. das pdf-dokument hab ich von nem kollegen, weiß nicht, wie er es produziert hat, wills aber in nen text konvertiert haben. er hats mir als pdf geschickt, damit ich nix dran verbessern kann. so, jetz will ichs ihm zeigen und was verbessern, weil ich an dem text was auszusetzen hab und ihm zeigen will, was der mac alles kann. irgendwie muss man sich ja durchsetzen, so als minderheit. deshalb brauch ich unbedingt ne lösung! sonst wird das referat sch...
 

cws

Pomme d'or
Registriert
04.01.04
Beiträge
3.103
Mal ein ganz anderer Ansatz:

Wenn man ein Grafiktablett an den Mac anschliesst, dann kommt doch die alte Text- Handschrifterkennung die wir schon vom Newton her kannten zum Einsatz, kann man damit, ohne Acrobat nicht auch was erreichen?

Oder ist die wieder verschwunden? Es zeigte sich bei angeschlossenem Grafiktablett ein extra Feld in den Systemeinstellungen.
 

high-end-freak

Herrenhut
Registriert
16.12.05
Beiträge
2.289
ja, das nennt sich Ink. wenn aber kein grafiktablet angeschlossen ist, ist diese systemeinstellung nicht zu sehen.
 

Schomo

Zehendlieber
Registriert
15.11.04
Beiträge
4.118
high-end-freak schrieb:
danke! bald hab ich 2 knubbel:) .
ich mein den anhang, wo die fehlermeldung vom acrobat ist, die ich nett versteh. ich kapier nett, was man an text rendern kann.
Dann blas das Bild auf 300 dpi auf, und schau was passiert.

"Im Bereich der Computergrafik bezeichnet Rendern die Erzeugung eines digitalen Bildes aus einer Bildbeschreibung. Bei einer zweidimensionalen Beschreibung ist damit die Rasterung gemeint. Bei 3D-Szenen sind räumliche Objekt-Daten Teil der Bild- oder Szenenbeschreibung. Die Software dazu wird als (3D-)Renderer bezeichnet, siehe dazu den Hauptartikel 3D-Computergrafik." Wikipedia

Wobei ich mir net ganz sicher bin ob die Definition im Falle von Acrobat stimmt. denn eigentlich wandelt Acrobat die Pixel in Pfade um, die dann wieder als Pixel am Bildschirm dargestellt werden...Also eigentlich der umgekehrte Weg.

Gruß Schomo
 

Schomo

Zehendlieber
Registriert
15.11.04
Beiträge
4.118
Die dpi Einstellung machst du normalerweise in deiner Scansoftware. Oder in deinem Bildbearbeitungsprogramm.

Das Acrobat kompliziert ist kann ich nur unterschreiben. Ich benutze Acrobat eigentlich nur zur Erstellung von PDFs in der Druckvorstufe. Also zuerst mache ich eine PS Datei, und dann distilliere ich eine PDF daraus.
Ab und zu benutze ich noch die Kommentarfunktion, wenn ich mit Kunden ein Projekt bearbeite.

Gruß Schomo