Themabewertung:
  • 0 Bewertung(en) - 0 im Durchschnitt
  • 1
  • 2
  • 3
  • 4
  • 5

pdf-Texterkennung
#1

Hallo zusammen!

Ich möchte meine papierhaften Dokumente mit einem Epson-Scanner unter macOS Mojave einscannen und als pdf-Dateien speichern.
Toll wäre, wenn ich innerhalb dieser pdf-Dateien nach bestimmten Textteilen suchen könnte. Meines Wissens nach benötigt man dafür eine Texterkennungs-Software.
Habt ihr so etwas schon mal gemacht? Welche Software könnt ihr empfehlen?

Vielen Dank und Grüße,
Marcus

Grüße, invidianer
Zitieren
#2

Wenn du nicht täglich 500:Seiten scannen willst oder keinen Scanner mit Einzug hast, dann würde ich das mit einem iPhone machen.

Ich nutze CamScanner von Intsig seit Jahren.
Für daheim kannst du dir sogar eine Scannerbox aus Karton bauen, Handy drauf, scanobjekt in die markierten Linien und per Autoscan ein Bild machen.

Gibt genug Scan Apps, die gut sind und auch pdf und ocr bieten.

Die Qualität ist genauso gut wie die, die ich mit meinem Flachbettscanner und Adobe Acrobat mache.
Zitieren
#3

Danke für den Tipp, aber es sind tatsächlich mehrere hundert Seiten, die ich täglich durchjagen muß, um mal irgendwann alles digital zu haben.

Einen sehr guten Flachbettscanner mit automatischem Einzug habe ich, daher wollte ich alles auf dem Mac machen, also scannen und OCR.

Grüße, invidianer
Zitieren
#4

@invidianer In welcher Qualität liegen denn deine Dokumente vor? Was ist dein Ziel der OCR. Den Inhalt als Volltext zur Verfügung stellen um dann auch global zu suchen... oder geht es Dir um das PDF über den Dateinamen zu finden und dann bewusst an eine Seite zu springen oder die Kombination ??...
Zitieren
#5

@JarvisRoot
Die Dokumente sind zumeist "ganz normale" Briefe bzw. Ausdrucke, also "sehr gute" Qualität.
Natürlich wäre am schönsten, wenn ich in allen Dokumenten in deren Inhalt suchen kann ... also wenn ich nach dem Wort "Muster" suche, sollten alle Dokumente, in denen das Wort "Muster" vorkommt, gefunden werden und wenn ich dann eines der Dokumente aufrufe und darin (z.B. mit dem macOS-Programm "Vorschau") wieder nach "Muster" suche, sollte er die Stellen im Dokument anzeigen, in denen das Wort "Muster" vorkommt Zwinkern

Grüße, invidianer
Zitieren
#6

@invidianer Ok, über welche Anzahl reden wir. Ist ja grundsätzlich ein DMS/ECM gibt es auch für Privatpersonen um z.B. Rechnungen zu klassifizieren. Eine automatische Zuordnung... kommt ja immer auf den Prozess darauf an. Ich suche Dir hier mal ein paar Optionen raus. Bitte noch Anzahl Dokumente/Seiten.
Zitieren
#7

@invidianer ich kann dir nur ELO ans Herz legen, bin damit schon viele Jahre privat und beruflich unterwegs. JarvisRoot wird’s richten Zwinkern
Zitieren
#8

@JarvisRoot
Ich schätze mal, daß es erstmal einmalig ca. 1.000 Seiten sein werden, dann vielleicht immer ca. 100 pro Jahr.
Vielen Dank schon mal!!

Grüße, invidianer
Zitieren
#9

Ich denke mal DEVONthink wäre hier eine gute Lösung. Nutze ich schon lange als DMS.

VG und frohe Weihnachten
Zitieren
#10

@xXLaemmiXx
Danke, aber 150$ für die Pro Office Variante (die man zum Erstellen durchsuchbarer PDFs benötigt) ist mir ehrlich gesagt zu viel.

Grüße, invidianer
Zitieren
#11

Grundsätzlich musst Du Dir im Vorfeld überlegen, was Du langfristig erreichen möchtest.

1. Chaosablage im Filesystem -> Dokumente werden ohne Struktur abgelegt, jedoch analysiert und stehen im Volltext zur Verfügung.

2. Ablagestruktur basierend auf der Dokumentenklasse oder des Dokumententyps: Rechnung, Vertrag, ...

3. Ablagestruktur nach Vorgang: Versicherungssfall-123, Handyvertrag Vodafone, Bestellung Amazon 123-1321-1232-1221, Reklamation XYZ, ...

Die Zuordnung erfolgt über Schlagworte / Metadaten, welche man manuel erfassen müsste - danach kann über diese Daten die automatisierte Ablage erfolgen.

Geht es Dir wirklich nur um eine einmalige Erfassung der Dokumente in digitaler Form sowie einer vollständigen manuellen Ablage in die Filestruktur kannst Du auch „nur“ eine Scan/OCR Komponente einsetzen. Abbyy for macOS hat gute Erkennungsraten. Hast Du darüberhinaus auch Themen wie Wiedervorlagen auf Dokumenten -> Kündigung Handyvertrag, Überweisung Rechnung am, oder einfach nur - Prüfe xyz, wäre tatsächlich ein DMS/ECM eine gute Wahl.

Sowohl bei Fall 1 (Scan/OCR) als auch Fall 2 (DMS/ECM) wirst Du einen gewissen Bertrag investieren müssen -> denn dies ist eine Investition in die Zukunft!

Kostenlos könntest Du die Dokumente in Google Drive legen, da wird eine OCR im Hintergrund gemacht - ob nur für Dich möchte ich nicht beurteilen.

Wenn Du mir sagst ob Fall 1 oder 2 kann ich Dir weitere Infos zusenden...
Zitieren
#12

@JarvisRoot
Fall 1 genügt mir völlig! Zwinkern
Danke schon mal!!

Grüße, invidianer
Zitieren
#13

Ich würde mir eine günstige Vollversion von Adobe Acrobat besorgen, muss ja nicht die neuste sein. Dann kannst du jedes eingescannte Dokument nach bestimmten Begriffen und so weiter durch suchen lassen. Weiterhin kannst du natürlich jedes PDF beliebig bearbeiten und nicht nur lesen.

Grüßle
toptac



iPhone 15 Pro Max Titan-Blau 256GB iOS 17.2.1, Apple Watch S7, Mac Mini M1 16GB 2TB 34" LG 21:9, iPad Air 4G
Zitieren
#14

Naja, bei 1 Seite alle 3 Tage, würde ich die Handyscanmethode wählen, und für 100 Seiten pro Jahr lohnt sich ein Digitsles Management nicht.

Und wenn man täglich 30 der 1.000 Anfangsdokumente wegblitz ist man nach einem Monat fertig.

https://www.macwelt.de/a/scanner-apps-am...le,3436957
Zitieren
#15

Habe ich gerade gefunden:

https://www.ifun.de/pdfify-aktualisiert-...fs-131636/

Grüßle
toptac



iPhone 15 Pro Max Titan-Blau 256GB iOS 17.2.1, Apple Watch S7, Mac Mini M1 16GB 2TB 34" LG 21:9, iPad Air 4G
Zitieren


Möglicherweise verwandte Themen…
Thema / Verfasser Antworten Ansichten Letzter Beitrag



Benutzer, die gerade dieses Thema anschauen: 8 Gast/Gäste