Was bedeutet OCR-Zeichenerkennung? 🔎

OCR steht für optical character recognition (optische Zeichenerkennung) und bezeichnet eine Technologie zur Texterkennung für digitales Bildmaterial.

Was haben dann z. B. Rechnungen damit zu tun? Eine Rechnung ist ja kein Bild, sondern ein Textdokument. Stimmt – und gleichzeitig auch wieder nicht. Beim OCR-Prozess bei CAYA scannen wir zuvor Unterlagen als Bilddatei ein. Dabei werden z. B. gedruckte Dokumente oder per Hand geschriebener Text ausgelesen und einhergehend mit der Erkennung einzelner Zeichen in eine digitale Form umgewandelt. Dabei kann es sich beim Originaldokument sowohl um einen Text (wie bei einer Rechnung oder einem Schreiben) oder auch um Bildmaterial mit Text handeln (z. B. in Werbegrafiken, Flyern, Prospekten). Das Ursprungsdokument wird zuerst als digitales Image erfasst und im OCR-Vorgang anschließend ausgelesen. Der OCR-Prozess zur Dokumentendigitalisierung und Datenerfassung wird u. a. allgemein auch für das Digitalisieren von Passdokumenten, dem Scannen von Rechnungen, oder dem Auslesen von Kontoauszügen oder Visitenkartendaten genutzt.

Die OCR-Texterkennung ist zugleich auch ein Forschungsgebiet der künstlichen Intelligenz (KI) und der Merkmals- (Feature Matching) und Mustererkennung (Pattern Matching). Bei der Datenerfassung, z. B. von Briefen in Papierform, wird durch OCR-Software die Dokumentenstruktur analysiert und dabei in verschiedene Elemente wie Absender, Betreffzeile und Textkörper unterteilt. Hier kommt eine globale Strukturerkennung im Rahmen einer Layoutanalyse zum Einsatz, die Textblöcke von Grafikelementen unterscheiden kann und somit sowohl Zeilenstrukturen als auch einzelne Zeichen erkennen kann. Das Programm speichert, wo sich welche Inhalte befinden.

Bei der Textkonvertierung werden einzelne, extrahierte Textzeilen in Wörter und darüber hinaus in einzelnen Buchstaben zerlegt. Ein durch einen Scan erzeugtes Bild besteht aus einer Ansammlung von Bildpunkten, so auch bei jedem Buchstaben. Zur optischen Zeichenerkennung werden diese Pixel durch Algorithmen mit einer Reihe von Mustern abgeglichen (Pattern Matching), sodass einzelne Buchstaben definiert werden. Über die eingescannte Bilddatei wird anschließend wieder eine Textebene mit rechnerinterpretierbaren Zeichen (ASCII-Zeichen) gelegt.

Korrektes Auslesen von Textinformationen aus Bildmaterial ⚖️

Sowohl die Typographie / Schriftart von Briefen, wie auch die Handschrift bei geschriebenen Briefen, unterscheidet sich je Absender oft stark. Beim Scannen als Bilddatei muss das korrekte Auslesen der vorhanden Informationen sichergestellt sein. Dazu findet ein zusätzliches System zur Kontexterkennung „ICR“ (intelligent context recognition) Anwendung. ICR unterstützt hierbei so, dass falsch erkannte Zeichen im Kontext berichtigt werden können. Z. B wäre eine Fehlerkennung eine Zahl „8“ anstatt dem Großbuchstaben „B“ auszulesen. Ohne eine ICR-Kontexterkennung würde aus „Bus“ schnell „8us“ werden. ICR sorgt hier für die entsprechende Korrektur. Alternativ wird jedoch auch gewährleistet, dass alphanumerische Begriffe wie „8ter“ aus Kontextgründen nicht umgewandelt werden.

Digitalisierte Briefpost durch OCR Texterkennung
OCR-Texterkennung bei CAYA

Wichtig zu bemerken ist auch, dass sich diese Fehlerkorrektur auch mit einer steigenden Anzahl von digitalen Textkonvertierungen, im Sinne von machine learning, mit jedem Scan noch besser wird. Da OCR-Technologie sich merkt, wo standardisierte Formulare oder Belege mit wiederkehrenden Inhalten (Rechnungen etc.) Elemente wie z. B. einen Briefkopf oder ein Rechnungsfeld platziert haben, wird die Textkonvertierung schnell lernend mit jedem neuen Scan optimiert. Ein weiterer Vorteil von durch OCR-Software digitalisierten Dokumenten ist, dass eine neu erstellte PDF-Datei, z. B. in der CAYA Document Cloud, anschließend durch Volltextsuche auf Suchbegriffe oder Textpassagen durchsuchbar ist. Außerdem lassen Sie sich über die Suchen & Kopieren Funktion bearbeiten und auch kompakt speichern.

Scan als OCR - kein händisches Abtippen mehr ⌨️

Die Digitalisierung von Dokumenten durch OCR Technologie steigert die Produktivität von Unternehmen erheblich. Eine automatisierte Datenverarbeitung beschleunigt Ihren Arbeitsablauf im Vergleich zur manuellen Eingabe der in Dokumenten enthaltenen Informationen immens. Dokumente lassen sich als PDF scannen und sind auf alle enthaltenen Begriffe durchsuchbar - Es ist kein manuelles Abtippen in andere Systeme mehr nötig.

Zusätzlich erhöht der Einsatz einer OCR-Lösungen auch unternehmensinterne Sicherheitsstandards, da die kostspielige und oft unsichere lokale Speicherung von Daten überflüssig wird.

Automatisch kategorisierte Dokumentenablage dank OCR-Texterkennung 🏷️

Wichtige Information wie Absender oder der Betreff werden beim OCR-Vorgang automatisch erfasst. Dies gilt auch für die Rechnungsverarbeitung, für Daten wie z. B. Rechnungsbetrag, Zahlungsempfänger, IBAN, BIC oder Überweisungszweck.

CAYA klassifiziert eingehende Dokumente automatisch. Dadurch lässt sich später ganz einfach z. B. nach Rechnungen filtern oder Dokumente können automatisch an die entsprechende Abteilung weitergeleitet werden. Eine eingehende Rechnung wird auch als solche erkannt (Rechnungserfassung) und entsprechend kategorisiert. Belege scannen und archivieren wird bei der Rechnungsverarbeitung durch einen automatisch in den entsprechenden digitalen Ordner einkategorisierten Scan als PDF stark erleichtert. Auf dem Weg zum papierlosen Büro wird somit das händische Ablegen von (digitalen) Dokumenten überflüssig.

Generell lassen sich für das papierlose Büro u. a. folgende Vorteile von OCR-Texterkennung ausmachen:

  • Zeit- & ortsunabhängiger Dokumentenzugriff
  • Erleichterter Zugriff auf Informationen für andere
  • Scan als PDF dank Volltextsuche komplett durchsuchbar
  • Erhöhte Bearbeitungsfunktionen (u. a. copy & paste Option)
  • Automatische Post-Kategorisierung (tagging)
  • Digitale, revisionsssichere Dokumentenablage in CAYA Document Cloud
  • Möglichkeiten, automatisierte Prozesse an digitalisierte Dokumente anzubinden

OCR-Vorgang als Basis für automatisierte Workflows🖇️

Ein Schritt, der in den Prozessketten des Dokumentenmanagements meist am Anfang steht, ist die Briefpost. CAYA digitalisiert Ihren Posteingang. Dazu leiten wir Ihre Post in Zusammenarbeit mit der Deutschen Post und PIN AG zu einem unserer Scancenter um. Anschließen digitalisieren wir Ihre Post in einem hochautomatisierten Verfahren. Das Digitalisieren des Posteingangs ermöglicht erst, Dokumente in Papierform in den digitalen Prozess einzubinden und beschleunigt deren Bearbeitung.

Eingelesene Rechnungsdaten von Unternehmen können über Integrationen automatisch an die entsprechenden Buchhaltungstools übergeben werden. Postalische Rechnungen werden gescannt und können über die Schnittstelle automatisch in die Masken der jeweiligen Buchhaltungstools eingefügt werden. In der Regel muss nur noch überprüft und bestätigt werden. Verwaltungsaufgaben wie Abtippen entfallen. Verknüpft mit der entsprechenden Abrechnungssoftware werden die eingelesenen Daten automatisch in die Programme eingepflegt. Der zuständige Mitarbeiter erhält im nur noch Überwachungsprozess alle Daten für eine endgültige Entscheidung ( decision ready), was viel Zeit spart. Rechnungen können darüber hinaus auch online über das CAYA-Konto mit nur wenigen Klicks bezahlt werden. Die Zahlung erfolgt als SEPA-Überweisung direkt vom Konto.

💡

Übrigens: Wir haben einen Ratgeber für die Auswahl von Buchhaltungssoftware entwickelt.💻 Ob Sie eine All-in-One-Software oder eine spezialisierte Softwarelösung bevorzugen: 💳 Mithilfe unseres Vergleichs (inkl. Experten-Interviews) finden Sie das passende Tool für Ihre Buchhaltung. ✔️


Bestehende Papierarchive jetzt digitalisieren 🗄️

Haben Ihr Unternehmen noch viele Papierdokumente in Ihren Aktenschränken archiviert? CAYA scannt auf Wunsch Ihr papierbasiertes Archiv und stellt Ihnen anschließend Ihre Unterlagen digital und revisionssicher zur Verfügung. Zur Datenextraktion und zur Klassifizierung von Dokumenten nutzt CAYA z. B. modernste, proprietäre Machine Learning Technologie, entwickelt auf der Basis von hunderttausenden Scans. Mit bis zu 97% Genauigkeit werden neue Dokumente automatisch verarbeitet. Sprechen Sie bei Bedarf mit unseren Digitalisierungsexperten auf individueller Basis und lassen Sie Ihre Unterlagen einscannen. Durch eine Digitalisierung Ihrer Unterlagen schützen Sie diese vor Verlust oder Beschädigung und sorgen dafür, dass diese revisionssicher in der Cloud abgelegt sind.

Sprechen Sie mit unseren Digitalisierungsexperten
Persönliche ProduktdemosErstellung individueller Angebote Beantwortung von Fragen