Gemeinsam neu definiert: Entdecken Sie unseren Rebranding-Trailer. Jetzt ansehen!
yaveon favicon bildmarke
Icon weiße Lupe

OCR (Optical Character Recognition)

Veröffentlicht Mai 10, 2023
Hände tippen auf einer Laptop-Tastatur mit digitalem Hintergrund.

Was ist OCR?

OCR ist die Abkürzung für Optical Character Recognition und wird häufig mit „Texterkennung“ oder „optischer Zeichenerkennung“ übersetzt. OCR bezeichnet den Prozess, bei dem Text aus einem Bild extrahiert und in ein maschinenlesbares Textformat umgewandelt wird.

In diesem Artikel:

Wie funktioniert OCR?

OCR kommt zum Einsatz, um eine Bild­information in bearbeitbaren Text zu wan­deln. Das können neben Bildformaten wie JPG, PNG oder TIF auch PDF-Dokumente sein. Häufig werden solche Dokumente vorab über einen Scanner aus Papier­doku­menten digitalisiert.
Folgende Schritte werden dabei durchlaufen:

  1. Bilderstellung mittels Scan oder Foto:
    Das Dokument wird eingescannt oder fotografiert und in ein Bildformat umgewandelt. Die OCR-Software übernimmt eine Analyse des Scans und klassifiziert zwei Bereiche: den hellen als Hintergrund, den dunklen als Text.
  2. Vorbereitung für den Lesevorgang:
    Das Bild wird von der Software ge- und um Fehler bereinigt, bis es für den Lesevorgang vorbereitet ist. Die Reinigung erfolgt typischerweise über folgende Mechanismen:
    1. Digitale Image-Flecken entfernen oder Kanten von Text-Images glätten
    2. Kontrast erhöhen
    3. Kästen und Linien auf dem Bild reinigen
    4. Textbereiche klassifizieren
  3. Musterabgleich, um Zeichendarstellungen zu isolieren:
    Beim Musterabgleich werden Zeichendarstellungen, sogenannte Glyphen, isoliert. Diese werden mit ähnlichen Glyphen verglichen insofern die gespeicherte Glyphe eine ähnliche Schriftart oder Skala nutzt. Es wird zwischen Mustererkennung, dem Pattern Matching, und Merkmalserkennung (Feature Matching) unterschieden.
  4. Merkmale extrahieren:
    Bei der Extraktion von Merkmalen werden Glyphen in Segmente wie Linien, geschlossene Streifen und Schnittpunkte von Linien zerlegt. Diese Merkmale dienen dann dazu, die höchste Übereinstimmung mit den gespeicherten Glyphen zu entdecken.
  5. Nachverarbeitung der Textdateien:
    Ist die Analyse abgeschlossen, werden aus den gewonnenen Analyseinformationen die Textdaten gebildet, die genauso wie ein per Tastatur erfasster Text zur weiteren Verarbeitung genutzt werden kann.Fortgeschrittenere OCR-Systeme plausibilisieren die erkannten Worte zudem gegen Wörterbücher, lernen darüber, auch bei künftigen Vorgängen besser zu erkennen und können so sogar Handschrift auslesen.

Auf welchem Prinzip basiert OCR Software?

Die Funktion von OCR-Software basiert auf drei grundlegenden IPA-Prinzipien:

  1. Integrity / Einheit
  2. Purposefulness / Zweckmäßigkeit
  3. Adaptability / Anpassungsfähigkeit

Durch IPA schaffen es Software-Scanner, flexible und intelligente Erkennungs­metho­den anzuwenden, die auch von Menschen in der Erkennung von Objekten verwendet werden.

Mockup der verschiedenen Yaveon Whitepaper

Inhalte via OCR auslesen? Yaveon ProDocs kann es!

Nicht nur ein DMS, sondern eine Re­vo­lution: Yaveon ProDocs liest In­hal­te automatisiert. Wir zeigen Ihnen, wie.

Wie lange dauert OCR?

Der Zeitraum zwischen dem Einspielen des Bildes bis zum bearbeitbaren Dokument hängt von der Dokumentengröße ab. Die Übersetzung des Bildes zum Dokument kann daher wenige Sekunden bis hin zu einigen Minuten dauern.

Welche Vorteile hat OCR?

  • Digital: Die Dokumente können komfortabel nachbearbeitet werden.
  • Geschwindigkeit: Statt Inhalte von Papierunterlagen zum Beispiel in Word eintippen zu müssen, steht das gesamte Doku­ment in kurzer Zeit zur Verfügung.
  • Große Mengen: So können große Textmengen durchsucht und bearbeitet werden.
  • Formaterkennung: Häufig können nicht nur die reinen Texte, sondern sogar die Schriftart und das Format erkannt werden, was eine Weiternutzung noch mehr verein­facht.
  • Automatisierung: Papier- und Bilddokumente können mit wenig Aufwand automatisch verarbeitet und dann zum Beispiel durch Zusatzdienste automatisiert übersetzt werden. Alternativ können die Inhalte in das ERP-System zur Anlage von Belegen übergeben werden, beispielsweise bei der Eingangsrechnungsverarbeitung.

Wann wird OCR eingesetzt?

Typische Szenarien für den Einsatz von OCR-Software sind:

  • Dokumentenmanagement:
    Papierdokumente automatisiert ins DMS einlesen, die Inhalte klassi­fizieren und Zusatz­infor­mationen zur leich­te­ren Suche am Dokument ablegen. So entsteht der gewün­schte Nutzen im DMS und der Originalbeleg liegt den­noch vor, auf Wunsch sogar revisions­sicher.
  • Automatisierte Verarbeitung von Belegen rund um das ERP:
    Wichtige Dokumente wie Aufträge und Lieferscheine, Retourenbelege und Ein­kaufsrechnung können ausgelesen und passgenau für das ERP-System oder für ein Buch­haltungs­system zur Verfügung gestellt werden.
  • Post:
    Erfassen der Inhalte von Papierpost zur Indizierung und um sie für die unternehmensweite Recherche und Workflowsteuerung bereitzustellen.
  • Visitenkartenscanner:
    Umwandlung von Fotos einer Visitenkarte in einen vollständig erfassten Outlook-Kontakt.
  • Lesefunktion:
    Maschinelles Vorlesen ursprünglich gedruckter Unterlagen.
  • Übersetzung:
    Texterkennung, um die Inhalte automa­tisiert übersetzen zu lassen.
  • Gesundheitswesen:
    Zum Beispiel zur Bearbeitung von Formu­laren bei Krankenkassen.
  • Verkehr:
    Erkennen von Kfz-Kennzeichen im Straßenverkehr und Erkennung von Straßenschildern aus dem Auto heraus.
  • Finanz-, Bank-, Versicherungs- und Immobilienbranche:
    Know Your Cusomer/KYC-Automati­sierungen und damit Identifizierung und Überprüfung der Kundenidentität.
  • Kreditkarten:
    Automatisches Auslesen von Kreditkarten in Apps.
Laptop-Nutzer mit digitalen Diagrammen und Dokumenten-Icons.

Jetzt die volle Power von Yaveon ProDocs erleben!

Verabschieden Sie sich von chao­tischen Dokumentenmanagement und über­nehmen Sie mit Yaveon ProDocs die volle Kontrolle über Ihre Akten.

Was ist der Unterschied zwischen OCR und ICR?

OCR meint die optische Erkennung von Texten, um aus gescannten Dokumenten Texte zu extrahieren und zu erfassen.

ICR hingegen steht für Intelligent Character Recognition. Darunter ist die intelligente Erkennung von Texten für handschriftlich verfasste Dokumente zu sehen. Manuelle Schrift zu erkennen, ist deutlich komplexer als maschinell erstellte. Deshalb nutzt ICR eine Vielzahl an Vergleichs- und Erken­nungs­prozessen.

Wie nutzt man OCR in Verbindung mit einer DMS-Software?

Im Dokumentenmanagement, das auch online betrieben werden kann, wird OCR-Technologie meist zum Erfassen von Doku­menteninhalten eingesetzt. Doku­men­te werden so durchsuchbar und lassen sich im Archiv schnell auffinden, was mit reiner Bildinformation nicht möglich wäre.

Im Falle einer Eingangsrechnung werden dabei folgende Schritte durchlaufen:

  1. Die eingehende Rechnung wird mit einem Scanner erfasst oder das PDF-Dokument aus Mails genutzt.
  2. Mittels OCR werden Kopf- und Posi­tions­daten erkannt und je nach Mög­lich­keit auch mit Bestell- sowie Be­wegungs­daten abgeglichen, was den Erkennungsgrad erhöht.
  3. Das eingescannte Dokument wird samt der erkannten Daten wie Absen­der und Empfänger, Rechnungs­num­mer, Rechnungs­datum, Beträge und Positionsdaten im ERP System bereit­gestellt.
  4. Auf dieser Basis startet in der Regel ein Freigabeworkflow, der alle Beteilig­ten zur Prüfung – auch im Vieraugen­prinzip – des Beleges auffordert und die Freigabe im ERP-System bewirkt.
  5. Jetzt kann der Beleg verbucht werden. So kann auch eine große Anzahl an Einkaufsbelegen abgewickelt werden.

Dokumentenverarbeitung inklusive OCR mit Yaveon ProDocs

Effiziente Prozesse sind entscheidend. Mit Yaveon ProDocs und OCR-Technologie verarbeiten Sie Dokumente einfacher und sparen Zeit. Unsere Lösung erkennt Texte in gescannten Dokumenten und wandelt sie in durchsuchbare Formate um – ob Rechnungen, Lieferscheine oder Verträge. So reduzieren Sie manuelle Eingaben, vermeiden Fehler und steigern Ihre Produktivität.

Ihre Vorteile auf einen Blick:

  • Automatische Texterkennung und Verarbeitung
  • Weniger manuelle Arbeit, mehr Effizienz
  • Schnelle, fehlerfreie Dokumentenverarbeitung
  • Sichere Archivierung und einfache Suche
Autor Stefan Klammler

Fragen an unseren Experten Stefan Klammler?

Kontaktieren Sie unser Team und wir melden uns bei Ihnen.

Trends, Tipps & Events: 
aktuelle Insights

Wie aufwändig ist es, ein DMS einzuführen? Wie aufwändig ist es, ein DMS einzuführen? – Beitrag öffnen
Wie aufwändig ist es, ein DMS einzuführen?

Wie teuer ist eine DMS-Einführung, welche Ressourcen braucht Sie und was sind die einzelnen Schritte? Wir klären auf.

Zufriedene Mitarbeiter dank New Work und DMS Zufriedene Mitarbeiter dank New Work und DMS – Beitrag öffnen
Zufriedene Mitarbeiter dank New Work und DMS

Software-Experte Paulus Celik erklärt, wie digitales Dokumentenmanagement zufriedene Mitarbeiter schafft und Unternehmen voran bringt.

DMS Integration in ERP, CRM und Co. DMS Integration in ERP, CRM und Co. – Beitrag öffnen
DMS Integration in ERP, CRM und Co.

Die DMS Integration in verschiedene Systeme wird für moderne Unternehmen immer relevanter. Welche Optionen gibt es und wie geht man vor?

Immer auf dem Laufenden mit unseren Insights.

Anmeldung zum Newsletter
Yaveon Favicon
Über 750 Unternehmen vertrauen auf Yaveon als ERP-Partner Ihrer Wahl
Yaveon Favicon
© 2025 Yaveon. All rights reserved.
cross