• Apfeltalk ändert einen Teil seiner Allgemeinen Geschäftsbedingungen (AGB), das Löschen von Useraccounts betreffend.
    Näheres könnt Ihr hier nachlesen: AGB-Änderung
  • Was gibt es Schöneres als den Mai draußen in der Natur mit allen Sinnen zu genießen? Lasst uns teilhaben an Euren Erlebnissen und macht mit beim Thema des Monats Da blüht uns was! ---> Klick

Doppelte Seiten in PDFs finden

  • Ersteller Mitglied 231572
  • Erstellt am

Mitglied 231572

Gast
Ich digitalisiere alles, was mir in den echten Briefkasten kommt.
Aus reiner Bequemlichkeit sind nun thematische PDFs entstanden (anstelle EinzePDFs und Ordner).
D.h. ich habe zB ein "Banking.pdf" in dem alle meine Bankdokumente drin sind.

Da ich durch Datei-Sync-Probleme aber manche Einzelseiten PDFs mehrfach in so ein Sammelpdf gemerged habe, sind in diesen teilweise rund 100 Seiten langen PDFs aber auch doppelte (sprich: identische) Seiten drin.

Kann ich die automatisch finden - und entfernen - lassen?
 

MACaerer

Charlamowsky
Registriert
23.05.11
Beiträge
12.989
Nein, das wird nicht funktionieren. Scans sind BitMap-Dateien und wenn die in ein pdf umgewandelt werden bleiben es immer noch BitMaps, da lediglich der Datei-Header geändert wird. Eine Text-Suche, die hierfür in Frage kommen könnte, funktioniert bei BitMaps naturgemäß nicht.
Unabhängig davon: Es ist natürlich deine private Angelegenheit wie du Daten archivierst. Aber bist du dir wirklich sicher, dass deine Vorgehensweise, nämlich alle Dokumente in eine Datei zu packen, eine gute Idee ist? Eine Datei kann immer mal beschädigt oder überschrieben werden und dann ist alles weg und nicht nur ein einzelnes Dokument. Man kann dir nur raten immer und oft genug für ein aktuelles BackUp zu sorgen. Mit Ordnern und Unterordnern lässt sich auch sehr einfach eine gute Verwaltungsstruktur machen. Abgesehen davon dürfte es gar nicht so einfach sein einzelne Dokumente in einer umfangreichen Datei zu finden.