OCR

OCR (Optical Character Recognition)

Was ist OCR?

OCR ist die Abkürzung für Optical Character Recognition und wird häufig mit „Texterkennung“ oder „optischer Zeichenerkennung“ übersetzt. Bei OCR handelt es sich um den Vorgang, ein Bild von einem Text zu erstellen und dieses in ein maschinenlesbares Textformat umzuwandeln.

Wie funktioniert OCR?

OCR kommt zum Einsatz, um eine Bildinformation in bearbeitbaren Text zu wandeln. Das können neben Bildformaten wie JPG, PNG oder TIF auch PDF-Dokumente sein. Häufig werden solche Dokumente vorab über einen Scanner aus Papierdokumenten digitalisiert.

Folgende Schritte werden dabei durchlaufen:

1. Bilderstellung mittels Scan oder Foto

Das Dokument wird eingescannt oder fotografiert und in ein Bildformat umgewandelt. Die OCR-Software übernimmt eine Analyse des Scans und klassifiziert zwei Bereiche: den hellen als Hintergrund, den dunklen als Text.
2. Vorbereitung für den Lesevorgang
Das Bild wird von der Software ge- und um Fehler bereinigt, bis es für den Lesevorgang vorbereitet ist. Die Reinigung erfolgt typischerweise über folgende Mechanismen:
- Digitale Image-Flecken entfernen oder Kanten von Text-Images glätten
- Kontrast erhöhen
- Kästen und Linien auf dem Bild reinigen
- Textbereiche klassifizieren
3. Musterabgleich, um Zeichendarstellungen zu isolieren

Beim Musterabgleich werden Zeichendarstellungen, sogenannte Glyphen, isoliert. Diese werden mit ähnlichen Glyphen verglichen insofern die gespeicherte Glyphe eine ähnliche Schriftart oder Skala nutzt. Es wird zwischen Mustererkennung, dem Pattern Matching, und Merkmalserkennung (Feature Matching) unterschieden.
4. Merkmale extrahieren

Bei der Extraktion von Merkmalen werden Glyphen in Segmente wie Linien, geschlossene Streifen und Schnittpunkte von Linien zerlegt. Diese Merkmale dienen dann dazu, die höchste Übereinstimmung mit den gespeicherten Glyphen zu entdecken.
5. Nachverarbeitung der Textdateien

Ist die Analyse abgeschlossen, werden aus den gewonnenen Analyseinformationen die Textdaten gebildet, die genauso wie ein per Tastatur erfasster Text zur weiteren Verarbeitung genutzt werden kann. Fortgeschrittenere OCR-Systeme plausibilisieren die erkannten Worte zudem gegen Wörterbücher, lernen darüber, auch bei künftigen Vorgängen besser zu erkennen und können so sogar Handschrift auslesen.

Warum selbst Dokumente auslesen, wenn Software das für Sie übernimmt?

Rasant! So liest Optical Character Recognition Ihre Dokumente aus. Ist das Tool zusätzlich Teil eines Top Dokumentenmanagementsystems, schießt Ihre Effizienz steil nach oben! Lernen Sie unsere Lösung YAVEON ProDocs kennen!

Auf welchem Prinzip basiert OCR Software?

Die Funktion von OCR-Software basiert auf drei grundlegenden IPA-Prinzipien:

Integrity / Einheit
Purposefulness / Zweckmäßigkeit
Adaptability / Anpassungsfähigkeit

Durch IPA schaffen es Software-Scanner, flexible und intelligente Erkennungsmethoden anzuwenden, die auch von Menschen in der Erkennung von Objekten verwendet werden.

Wie lange dauert OCR?

Der Zeitraum zwischen dem Einspielen des Bildes bis zum bearbeitbaren Dokument hängt von der Dokumentengröße ab. Die Übersetzung des Bildes zum Dokument kann daher wenige Sekunden bis hin zu einigen Minuten dauern.

Welche Vorteile hat OCR?

Digital

Die Dokumente können komfortabel nachbearbeitet werden.
Geschwindigkeit

Statt Inhalte von Papierunterlagen zum Beispiel in Word eintippen zu müssen, steht das gesamte Dokument in kurzer Zeit zur Verfügung.
Große Mengen

So können große Textmengen durchsucht und bearbeitet werden.
Formaterkennung

Häufig können nicht nur die reinen Texte, sondern sogar die Schriftart und das Format erkannt werden, was eine Weiternutzung noch mehr vereinfacht.
Automatisierung

Papier- und Bilddokumente können mit wenig Aufwand automatisch verarbeitet und dann zum Beispiel durch Zusatzdienste automatisiert übersetzt werden. Alternativ können die Inhalte in das ERP-System zur Anlage von Belegen übergeben werden, beispielsweise bei der Eingangsrechnungsverarbeitung.

Wann wird OCR eingesetzt?

Typische Szenarien für den Einsatz von OCR-Software sind:

Dokumentenmanagement

Papierdokumente automatisiert ins DMS einlesen, die Inhalte klassifizieren und Zusatzinformationen zur leichteren Suche am Dokument ablegen. So entsteht der gewünschte Nutzen im DMS und der Originalbeleg liegt dennoch vor, auf Wunsch sogar revisionssicher.
Automatisierte Verarbeitung von Belegen rund um das ERP

Wichtige Dokumente wie Aufträge und Lieferscheine, Retourenbelege und Einkaufsrechnung können ausgelesen und passgenau für das ERP-System oder für ein Buchhaltungssystem zur Verfügung gestellt werden.
Post

Erfassen der Inhalte von Papierpost zur Indizierung und um sie für die unternehmensweite Recherche und Workflowsteuerung bereitzustellen.
Visitenkartenscanner

Umwandlung von Fotos einer Visitenkarte in einen vollständig erfassten Outlook-Kontakt.
Lesefunktion

Maschinelles Vorlesen ursprünglich gedruckter Unterlagen.
Übersetzung

Texterkennung, um die Inhalte automatisiert übersetzen zu lassen.
Gesundheitswesen

Zum Beispiel zur Bearbeitung von Formularen bei Krankenkassen.
Verkehr

Erkennen von Kfz-Kennzeichen im Straßenverkehr und Erkennung von Straßenschildern aus dem Auto heraus.
Finanz-, Bank-, Versicherungs- und Immobilienbranche

Know Your Cusomer/KYC-Automatisierungen und damit Identifizierung und Überprüfung der Kundenidentität.
Kreditkarten

Automatisches Auslesen von Kreditkarten in Apps.

Was ist der Unterschied zwischen OCR und ICR?

OCR meint die optische Erkennung von Texten, um aus gescannten Dokumenten Texte zu extrahieren und zu erfassen. ICR hingegen steht für Intelligent Character Recognition. Darunter ist die intelligente Erkennung von Texten für handschriftlich verfasste Dokumente zu sehen. Manuelle Schrift zu erkennen, ist deutlich komplexer als maschinell erstellte. Deshalb nutzt ICR eine Vielzahl an Vergleichs- und Erkennungsprozessen.

Wie nutzt man OCR in Verbindung mit einer DMS-Software?

Im Dokumentenmanagement, das auch online betrieben werden kann, wird OCR-Technologie meist zum Erfassen von Dokumenteninhalten eingesetzt. Dokumente werden so durchsuchbar und lassen sich im Archiv schnell auffinden, was mit reiner Bildinformation nicht möglich wäre.

Im Falle einer Eingangsrechnung werden dabei folgende Schritte durchlaufen:

Die eingehende Rechnung wird mit einem Scanner erfasst oder das PDF-Dokument aus Mails genutzt.
Mittels OCR werden Kopf- und Positionsdaten erkannt und je nach Möglichkeit auch mit Bestell- sowie Bewegungsdaten abgeglichen, was den Erkennungsgrad erhöht.
Das eingescannte Dokument wird samt der erkannten Daten wie Absender und Empfänger, Rechnungsnummer, Rechnungsdatum, Beträge und Positionsdaten im ERP System bereitgestellt.
Auf dieser Basis startet in der Regel ein Freigabeworkflow, der alle Beteiligten zur Prüfung – auch im Vieraugenprinzip – des Beleges auffordert und die Freigabe im ERP-System bewirkt.
Jetzt kann der Beleg verbucht werden. So kann auch eine große Anzahl an Einkaufsbelegen abgewickelt werden.

Warum selbst Dokumente auslesen, wenn Software das für Sie übernimmt?

Inhalte

Schluss mit Dokumentenchaos!

Puuuuh! Dokumente ablegen und finden gehört zu den ungeliebten Aufgaben? Geben Sie sie doch einfach an YAVEON ProDocs ab. Wir zeigen Ihnen wie!

Beitrag teilen

Autor

Matthias Sebald

Welchen Nutzen die Kombination aus menschlichem Handeln und digitalen Möglichkeiten erzeugt, weiß Matthias Sebald, Head of Power Platform & AI, genau. Zudem greift er auf jahrelange Erfahrung mit den YAVEON Produkten zurück und kennt deren Zusammenspiel wie seine Westentasche. Profitieren Sie von seiner Expertise und lassen Sie sich von ihm mitnehmen in die fachlichen Welten der YAVEON Software.

Weitere interessante Beiträge

Machine Learning

Von Matthias Sebald

Machine Learning hat die Aufgabe, Zusammenhänge zwischen Daten zu erkennen, ohne vorab für diesen Zweck programmiert worden zu sein.

Wareneingang

Von Hannes Storz

Der Wareneingang ist der Prozess, der in Unternehmen bei Warenankunft durchlaufen wird. Er ist Teil der Materialwirtschaft, Logistik und FiBu.

EUDAMED

Von Hannes Storz

EUDAMED ist eine Datenbank zur Verwaltung von Medizinprodukten in der EU. Sie unterstützt die Sicherheit von Medizinprodukten.

OCR (Optical Character Recognition)

Was ist OCR?

Wie funktioniert OCR?

1. Bilderstellung mittels Scan oder Foto

2. Vorbereitung für den Lesevorgang

3. Musterabgleich, um Zeichendarstellungen zu isolieren

4. Merkmale extrahieren

5. Nachverarbeitung der Textdateien

Warum selbst Dokumente auslesen, wenn Software das für Sie übernimmt?

Auf welchem Prinzip basiert OCR Software?

Wie lange dauert OCR?

Welche Vorteile hat OCR?

Wann wird OCR eingesetzt?

Was ist der Unterschied zwischen OCR und ICR?

Wie nutzt man OCR in Verbindung mit einer DMS-Software?

Warum selbst Dokumente auslesen, wenn Software das für Sie übernimmt?

Machine Learning

Wareneingang

EUDAMED

YAVEON

Weitere Inhalte

Unser Quartalsupdate

OCR (Optical Character Recognition)

Was ist OCR?

Wie funktioniert OCR?

1. Bilderstellung mittels Scan oder Foto

2. Vorbereitung für den Lesevorgang

3. Musterabgleich, um Zeichendarstellungen zu isolieren

4. Merkmale extrahieren

5. Nachverarbeitung der Textdateien

Warum selbst Dokumente auslesen, wenn Software das für Sie übernimmt?

Auf welchem Prinzip basiert OCR Software?

Wie lange dauert OCR?

Welche Vorteile hat OCR?

Wann wird OCR einge­setzt?

Was ist der Unterschied zwischen OCR und ICR?

Wie nutzt man OCR in Verbindung mit einer DMS-Software?

Warum selbst Dokumente auslesen, wenn Software das für Sie übernimmt?

Machine Learning

Wareneingang

EUDAMED

YAVEON

Weitere Inhalte

Unser Quartalsupdate

Wann wird OCR eingesetzt?