1. Diese Seite verwendet Cookies. Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies. Weitere Informationen

Tipp: Text ohne OCR aus Bildern extrahieren

Dieses Thema im Forum "Officeanwendungen" wurde erstellt von Schomo, 11.03.06.

  1. Schomo

    Schomo Russet-Nonpareil

    Dabei seit:
    15.11.04
    Beiträge:
    3.756
    Hi vielleicht haben einige von euch keine OCR Software. Vielleicht kennen auch schon viele das Feature, mir ist es aber gerade erst aufgefallen. Man kann wenn man ein Bild als PDF sichert, in Acrobat Professional dieses PDF als HTML sichern, und dann den Text per copy & paste aus der entstehenden html Datei in Textdokumente einfügen. Ein paar Korrekturen sind sicher nötig, aber eine feine Sache...

    Tolles Feature von Acrobat!

    Update: Das bild muss minimum 200 dpi heben oder max. 600 dpi. Über Dokument/Paper Capture kann der Text auch gelesen werden und dann als Text gespeichert werden.
    Danke für eure Ergänzungen.

    Gruß Schomo
     
    #1 Schomo, 11.03.06
    Zuletzt bearbeitet: 11.03.06
  2. KayHH

    KayHH Gast

    Moin Schomo,

    bei mir (Vers. 6 Prof.) funktioniert das nicht. Welches Acrobat hast du denn?


    Gruss KayHH
     
  3. Schomo

    Schomo Russet-Nonpareil

    Dabei seit:
    15.11.04
    Beiträge:
    3.756
    Ich hab Acrobat Prof. 6.02, als HTML mit CSS 1.0 sichern.

    Gruß Schomo
     
  4. Rastafari

    Rastafari Golden Noble

    Dabei seit:
    10.03.05
    Beiträge:
    17.896
    Das funktioniert nur, wenn der Text im PDF auch als Text vorliegt.
    Dann kannst du aber auch gleich "Als Text sichern" benutzen, oder?
     
  5. KayHH

    KayHH Gast

  6. KayHH

    KayHH Gast

    Moin Schomo,

    das ist auch mein Gedanke, mit OCR hat es nichts zu tun.


    Gruss KayHH
     
  7. Schomo

    Schomo Russet-Nonpareil

    Dabei seit:
    15.11.04
    Beiträge:
    3.756
    Ich rede von einem Zeitungsscan, den ich dann als (übrigens korrekt) als Text sichern kann. Hatte ich noch gar net gesehen, dass das auch möglich ist. Dann muss es doch eine OCR Umsetzung geben, oder wie solldas dann gehen?

    Gruß Schomo
     
  8. KayHH

    KayHH Gast

    Moin Schomo,

    Scannersoftware mit integrierter OCR würde ich mal tippen, oder kannst du mein Demo-pdf als Text sichern?


    Gruss KayHH
     
  9. Schomo

    Schomo Russet-Nonpareil

    Dabei seit:
    15.11.04
    Beiträge:
    3.756
    Tatsächlich, dann muss ich den Tipp wohl revidieren. Schade ich hatte mich schon gefreut, weil OCR Software am Mac ja nicht gerade weit verbreitet ist. Da war ich wohl zu enthusiastisch ;)

    Gruß Schomo
     
  10. high-end-freak

    high-end-freak Herrenhut

    Dabei seit:
    16.12.05
    Beiträge:
    2.289
    deine demo-pdf erscheint als html als ein bild. das funzt nett, habe hier acrobat 7. wenn man es als rtf sichert funzt es auch nett. ich habhe aber hier im acrobat was gefunden(s. anhang) er meckert aber, dass die auflösung von KayHHs demo zu niedrig ist.
     

    Anhänge:

  11. high-end-freak

    high-end-freak Herrenhut

    Dabei seit:
    16.12.05
    Beiträge:
    2.289
    jetzt hab ich mal nen anderen text genommen, hier meckert er aber auch:eek: :eek: :eek:
     

    Anhänge:

  12. Schomo

    Schomo Russet-Nonpareil

    Dabei seit:
    15.11.04
    Beiträge:
    3.756
    In meiner Version 6.02 geht diese Option unter Dokument/Paper Capture, und meldet dann, dass nur Auflösungen von 200-600 dpi unterstützt werden. Ich hab es ausprobiert und es geht. Ergo kann Acrobat tatsächlich mit dieser Option Text mit seiner OCR Engine sichern, der Text muss nur über 200 dpi gross sein. Egal ob als html, Text...

    Puuuuhhhh da bin ich jetzt aber erleichtert. ThanX High-end-freak für den Denkanstoss.

    Gruß Schomo
     
  13. high-end-freak

    high-end-freak Herrenhut

    Dabei seit:
    16.12.05
    Beiträge:
    2.289
    *karmahabenwoll*

    ich würd aber trotzdem noch gerne wissen, was text ist, der gerendert werden kann(was ist rendern?). any ideas?
     
    Schomo gefällt das.
  14. Schomo

    Schomo Russet-Nonpareil

    Dabei seit:
    15.11.04
    Beiträge:
    3.756
    Karmadirgegeben....
    was meinst du mit Text? Ich meine damit das du einen eingescannten Text hast.

    Gruß Schomo
     
  15. high-end-freak

    high-end-freak Herrenhut

    Dabei seit:
    16.12.05
    Beiträge:
    2.289
    danke! bald hab ich 2 knubbel:) .
    ich mein den anhang, wo die fehlermeldung vom acrobat ist, die ich nett versteh. ich kapier nett, was man an text rendern kann. das pdf-dokument hab ich von nem kollegen, weiß nicht, wie er es produziert hat, wills aber in nen text konvertiert haben. er hats mir als pdf geschickt, damit ich nix dran verbessern kann. so, jetz will ichs ihm zeigen und was verbessern, weil ich an dem text was auszusetzen hab und ihm zeigen will, was der mac alles kann. irgendwie muss man sich ja durchsetzen, so als minderheit. deshalb brauch ich unbedingt ne lösung! sonst wird das referat sch...
     
  16. cws

    cws Pommerscher Krummstiel

    Dabei seit:
    04.01.04
    Beiträge:
    3.074
    Mal ein ganz anderer Ansatz:

    Wenn man ein Grafiktablett an den Mac anschliesst, dann kommt doch die alte Text- Handschrifterkennung die wir schon vom Newton her kannten zum Einsatz, kann man damit, ohne Acrobat nicht auch was erreichen?

    Oder ist die wieder verschwunden? Es zeigte sich bei angeschlossenem Grafiktablett ein extra Feld in den Systemeinstellungen.
     
  17. high-end-freak

    high-end-freak Herrenhut

    Dabei seit:
    16.12.05
    Beiträge:
    2.289
    ja, das nennt sich Ink. wenn aber kein grafiktablet angeschlossen ist, ist diese systemeinstellung nicht zu sehen.
     
  18. Schomo

    Schomo Russet-Nonpareil

    Dabei seit:
    15.11.04
    Beiträge:
    3.756
    Dann blas das Bild auf 300 dpi auf, und schau was passiert.

    "Im Bereich der Computergrafik bezeichnet Rendern die Erzeugung eines digitalen Bildes aus einer Bildbeschreibung. Bei einer zweidimensionalen Beschreibung ist damit die Rasterung gemeint. Bei 3D-Szenen sind räumliche Objekt-Daten Teil der Bild- oder Szenenbeschreibung. Die Software dazu wird als (3D-)Renderer bezeichnet, siehe dazu den Hauptartikel 3D-Computergrafik." Wikipedia

    Wobei ich mir net ganz sicher bin ob die Definition im Falle von Acrobat stimmt. denn eigentlich wandelt Acrobat die Pixel in Pfade um, die dann wieder als Pixel am Bildschirm dargestellt werden...Also eigentlich der umgekehrte Weg.

    Gruß Schomo
     
  19. high-end-freak

    high-end-freak Herrenhut

    Dabei seit:
    16.12.05
    Beiträge:
    2.289
    wie kann man die pdf aufblasen? dieser acrobat ist furchtbar kompliziert:(
     
  20. Schomo

    Schomo Russet-Nonpareil

    Dabei seit:
    15.11.04
    Beiträge:
    3.756
    Die dpi Einstellung machst du normalerweise in deiner Scansoftware. Oder in deinem Bildbearbeitungsprogramm.

    Das Acrobat kompliziert ist kann ich nur unterschreiben. Ich benutze Acrobat eigentlich nur zur Erstellung von PDFs in der Druckvorstufe. Also zuerst mache ich eine PS Datei, und dann distilliere ich eine PDF daraus.
    Ab und zu benutze ich noch die Kommentarfunktion, wenn ich mit Kunden ein Projekt bearbeite.

    Gruß Schomo
     

Diese Seite empfehlen