IVW
Hallo, Gast! Registrieren
Hol dir unsere App: iszene.com App

pdf-Texterkennung
  • 0 Bewertung(en) - 0 im Durchschnitt
  • 1
  • 2
  • 3
  • 4
  • 5
invidianer Offline
Senior Member
****
Avatar
Beiträge: 523
Registriert seit: Nov 2007
Bewertung: 1

22.12.2018, 11:52 | #1
pdf-Texterkennung
Hallo zusammen!

Ich möchte meine papierhaften Dokumente mit einem Epson-Scanner unter macOS Mojave einscannen und als pdf-Dateien speichern.
Toll wäre, wenn ich innerhalb dieser pdf-Dateien nach bestimmten Textteilen suchen könnte. Meines Wissens nach benötigt man dafür eine Texterkennungs-Software.
Habt ihr so etwas schon mal gemacht? Welche Software könnt ihr empfehlen?

Vielen Dank und Grüße,
Marcus

Grüße, invidianer
Zitat @
Denner Abwesend
Honorary Member
*****
Avatar
Beiträge: 11.938
Registriert seit: Oct 2012
Bewertung: 452

22.12.2018, 12:16 | #2
RE: pdf-Texterkennung
Wenn du nicht täglich 500:Seiten scannen willst oder keinen Scanner mit Einzug hast, dann würde ich das mit einem iPhone machen.

Ich nutze CamScanner von Intsig seit Jahren.
Für daheim kannst du dir sogar eine Scannerbox aus Karton bauen, Handy drauf, scanobjekt in die markierten Linien und per Autoscan ein Bild machen.

Gibt genug Scan Apps, die gut sind und auch pdf und ocr bieten.

Die Qualität ist genauso gut wie die, die ich mit meinem Flachbettscanner und Adobe Acrobat mache.
Zitat @
invidianer Offline
Senior Member
(Threadstarter)
****
Avatar
Beiträge: 523
Registriert seit: Nov 2007
Bewertung: 1

22.12.2018, 12:37 | #3
RE: pdf-Texterkennung
Danke für den Tipp, aber es sind tatsächlich mehrere hundert Seiten, die ich täglich durchjagen muß, um mal irgendwann alles digital zu haben.

Einen sehr guten Flachbettscanner mit automatischem Einzug habe ich, daher wollte ich alles auf dem Mac machen, also scannen und OCR.

Grüße, invidianer
Zitat @
JarvisRoot Offline
println("Hello, iSzene!")
******
Avatar
Beiträge: 4.242
Registriert seit: Sep 2011
Bewertung: 133

22.12.2018, 14:17 | #4
RE: pdf-Texterkennung
@invidianer In welcher Qualität liegen denn deine Dokumente vor? Was ist dein Ziel der OCR. Den Inhalt als Volltext zur Verfügung stellen um dann auch global zu suchen... oder geht es Dir um das PDF über den Dateinamen zu finden und dann bewusst an eine Seite zu springen oder die Kombination [Bild: 1f62c.png]🧐...
Zitat @
invidianer Offline
Senior Member
(Threadstarter)
****
Avatar
Beiträge: 523
Registriert seit: Nov 2007
Bewertung: 1

22.12.2018, 17:36 | #5
RE: pdf-Texterkennung
@JarvisRoot
Die Dokumente sind zumeist "ganz normale" Briefe bzw. Ausdrucke, also "sehr gute" Qualität.
Natürlich wäre am schönsten, wenn ich in allen Dokumenten in deren Inhalt suchen kann ... also wenn ich nach dem Wort "Muster" suche, sollten alle Dokumente, in denen das Wort "Muster" vorkommt, gefunden werden und wenn ich dann eines der Dokumente aufrufe und darin (z.B. mit dem macOS-Programm "Vorschau") wieder nach "Muster" suche, sollte er die Stellen im Dokument anzeigen, in denen das Wort "Muster" vorkommt Zwinkern

Grüße, invidianer
Zitat @
JarvisRoot Offline
println("Hello, iSzene!")
******
Avatar
Beiträge: 4.242
Registriert seit: Sep 2011
Bewertung: 133

22.12.2018, 18:41 | #6
RE: pdf-Texterkennung
@invidianer Ok, über welche Anzahl reden wir. Ist ja grundsätzlich ein DMS/ECM gibt es auch für Privatpersonen um z.B. Rechnungen zu klassifizieren. Eine automatische Zuordnung... kommt ja immer auf den Prozess darauf an. Ich suche Dir hier mal ein paar Optionen raus. Bitte noch Anzahl Dokumente/Seiten.
Zitat @
dusti64 Abwesend
Posting Freak
*****
Avatar
Beiträge: 3.113
Registriert seit: Jan 2014
Bewertung: 107

22.12.2018, 19:12 | #7
RE: pdf-Texterkennung
@invidianer ich kann dir nur ELO ans Herz legen, bin damit schon viele Jahre privat und beruflich unterwegs. JarvisRoot wird’s richten Zwinkern
(Dieser Beitrag wurde zuletzt bearbeitet: 22.12.2018, 19:13 von dusti64.)
Zitat @
invidianer Offline
Senior Member
(Threadstarter)
****
Avatar
Beiträge: 523
Registriert seit: Nov 2007
Bewertung: 1

22.12.2018, 23:05 | #8
RE: pdf-Texterkennung
@JarvisRoot
Ich schätze mal, daß es erstmal einmalig ca. 1.000 Seiten sein werden, dann vielleicht immer ca. 100 pro Jahr.
Vielen Dank schon mal!!

Grüße, invidianer
Zitat @
xXLaemmiXx Offline
Member
***
Avatar
Beiträge: 93
Registriert seit: Feb 2010
Bewertung: 1

23.12.2018, 00:00 | #9
RE: pdf-Texterkennung
Ich denke mal DEVONthink wäre hier eine gute Lösung. Nutze ich schon lange als DMS.

VG und frohe Weihnachten
Zitat @
invidianer Offline
Senior Member
(Threadstarter)
****
Avatar
Beiträge: 523
Registriert seit: Nov 2007
Bewertung: 1

23.12.2018, 01:19 | #10
RE: pdf-Texterkennung
@xXLaemmiXx
Danke, aber 150$ für die Pro Office Variante (die man zum Erstellen durchsuchbarer PDFs benötigt) ist mir ehrlich gesagt zu viel.

Grüße, invidianer
Zitat @
JarvisRoot Offline
println("Hello, iSzene!")
******
Avatar
Beiträge: 4.242
Registriert seit: Sep 2011
Bewertung: 133

23.12.2018, 09:45 | #11
RE: pdf-Texterkennung
Grundsätzlich musst Du Dir im Vorfeld überlegen, was Du langfristig erreichen möchtest.

1. Chaosablage im Filesystem -> Dokumente werden ohne Struktur abgelegt, jedoch analysiert und stehen im Volltext zur Verfügung.

2. Ablagestruktur basierend auf der Dokumentenklasse oder des Dokumententyps: Rechnung, Vertrag, ...

3. Ablagestruktur nach Vorgang: Versicherungssfall-123, Handyvertrag Vodafone, Bestellung Amazon 123-1321-1232-1221, Reklamation XYZ, ...

Die Zuordnung erfolgt über Schlagworte / Metadaten, welche man manuel erfassen müsste - danach kann über diese Daten die automatisierte Ablage erfolgen.

Geht es Dir wirklich nur um eine einmalige Erfassung der Dokumente in digitaler Form sowie einer vollständigen manuellen Ablage in die Filestruktur kannst Du auch „nur“ eine Scan/OCR Komponente einsetzen. Abbyy for macOS hat gute Erkennungsraten. Hast Du darüberhinaus auch Themen wie Wiedervorlagen auf Dokumenten -> Kündigung Handyvertrag, Überweisung Rechnung am, oder einfach nur - Prüfe xyz, wäre tatsächlich ein DMS/ECM eine gute Wahl.

Sowohl bei Fall 1 (Scan/OCR) als auch Fall 2 (DMS/ECM) wirst Du einen gewissen Bertrag investieren müssen -> denn dies ist eine Investition in die Zukunft!

Kostenlos könntest Du die Dokumente in Google Drive legen, da wird eine OCR im Hintergrund gemacht - ob nur für Dich möchte ich nicht beurteilen.

Wenn Du mir sagst ob Fall 1 oder 2 kann ich Dir weitere Infos zusenden...
Zitat @
invidianer Offline
Senior Member
(Threadstarter)
****
Avatar
Beiträge: 523
Registriert seit: Nov 2007
Bewertung: 1

23.12.2018, 19:29 | #12
RE: pdf-Texterkennung
@JarvisRoot
Fall 1 genügt mir völlig! Zwinkern
Danke schon mal!!

Grüße, invidianer
Zitat @
toptac Offline
Senior Member
****
Avatar
Beiträge: 649
Registriert seit: Jul 2010
Bewertung: 8

23.12.2018, 19:37 | #13
RE: pdf-Texterkennung
Ich würde mir eine günstige Vollversion von Adobe Acrobat besorgen, muss ja nicht die neuste sein. Dann kannst du jedes eingescannte Dokument nach bestimmten Begriffen und so weiter durch suchen lassen. Weiterhin kannst du natürlich jedes PDF beliebig bearbeiten und nicht nur lesen.

Grüße
toptac

iPhone 11 Pro Max, iMac 27" 5k, iPad Air 2, Apple Watch 5 GPS
Zitat @
Denner Abwesend
Honorary Member
*****
Avatar
Beiträge: 11.938
Registriert seit: Oct 2012
Bewertung: 452

23.12.2018, 21:45 | #14
RE: pdf-Texterkennung
Naja, bei 1 Seite alle 3 Tage, würde ich die Handyscanmethode wählen, und für 100 Seiten pro Jahr lohnt sich ein Digitsles Management nicht.

Und wenn man täglich 30 der 1.000 Anfangsdokumente wegblitz ist man nach einem Monat fertig.

https://www.macwelt.de/a/scanner-apps-am...le,3436957
Zitat @
toptac Offline
Senior Member
****
Avatar
Beiträge: 649
Registriert seit: Jul 2010
Bewertung: 8

24.12.2018, 10:00 | #15
RE: pdf-Texterkennung
Habe ich gerade gefunden:

https://www.ifun.de/pdfify-aktualisiert-...fs-131636/

Grüße
toptac

iPhone 11 Pro Max, iMac 27" 5k, iPad Air 2, Apple Watch 5 GPS
Zitat @

Möglicherweise verwandte Themen...
Thema Verfasser Antworten Ansichten Letzter Beitrag
  FineReader: Neue Texterkennung für den Mac MojoMan 0 766 10.07.2009, 18:10
Letzter Beitrag: MojoMan



Benutzer, die gerade dieses Thema anschauen: 1 Gast/Gäste