Jedes Finanzteam hat schon einmal Zeit damit verbracht, Zahlen von Papierbelegen in eine Tabellenkalkulation oder ein Buchhaltungssystem einzugeben. Das ist langsam, fehleranfällig und im Jahr 2024 absolut unnötig. OCR (Optical Character Recognition) wandelt diese manuelle Aufgabe in eine automatisierte um. Indem es ein Foto oder einen Scan eines Belegs liest und den gedruckten Text in strukturierte Daten umwandelt, eliminiert OCR die erneute Eingabe an der Quelle. Für Unternehmen, die Dutzende oder Hunderte von Belegen pro Monat bearbeiten, sind die Zeitersparnisse beträchtlich. Dieser Artikel erklärt, was OCR für Belege ist, wie die zugrunde liegende Technologie funktioniert, warum sie für Finanzteams wichtig ist und wie Docnova sie in die Praxis umsetzt.
Was ist OCR?
OCR steht für Optical Character Recognition (Optische Zeichenerkennung). Es ist eine Technologie, die ein Bild analysiert – sei es ein gescanntes Dokument, ein mit dem Handy aufgenommenes Foto oder eine PDF-Datei – und die darin enthaltenen Zeichen erkennt, um sie in maschinenlesbaren Text umzuwandeln.
Im Kontext von Quittungen geht OCR einen Schritt weiter. Ein rohes Quittungsbild enthält unstrukturierten Text: ein Händlernamen, ein Datum, einzelne Posten, einen Zwischensummenbetrag, einen Mehrwertsteuerbetrag und einen Gesamtbetrag sind in jedem beliebigen Format aufgeführt, das das Kassensystem gewählt hat. Modernes Quittungs-OCR extrahiert nicht nur Zeichen, sondern parst und ordnet sie auch benannten Feldern zu: Händler, Datum, Währung, Nettobetrag, Mehrwertsteuerbetrag, Gesamtbetrag. Diese strukturierte Ausgabe macht die Daten sofort ohne zusätzliche manuelle Arbeit in Finanzsoftware nutzbar.
Frühe OCR-Systeme erforderten sauberen, getippten Text auf weißem Papier. Heutige Systeme verwenden maschinelle Lernmodelle, die auf Millionen von Dokumentlayouts trainiert wurden, wodurch sie unempfindlich gegenüber handschriftlichen Notizen, schiefen Fotos, farbigen Hintergründen und unterschiedlichen Belegformaten aus verschiedenen Ländern sind.
Wie OCR für Belege funktioniert
Der Prozess durchläuft mehrere Phasen. Zuerst wird das Bild vorverarbeitet: Drehungen werden korrigiert, der Kontrast wird verstärkt und Rauschen wird reduziert, um der Erkennungs-Engine eine möglichst saubere Eingabe zu geben.
Zweitens erkennt die Engine Textbereiche auf der Seite – Blöcke, Zeilen und einzelne Zeichen – und liest sie aus. Dies erzeugt eine Roh-Textzeichenfolge, die den gedruckten Inhalt des Belegs widerspiegelt.
Drittens interpretiert eine Parsing-Schicht den Rohtext. Sie verwendet Mustererkennung und kontextbezogene Regeln, um zu identifizieren, welcher String der Händlername ist, welches Datum, welche Zahlen sind Einzelpostenpreise im Vergleich zum Gesamtbetrag und welche Zahl die Mehrwertsteuer ist. Auf Belegen ist diese Stufe besonders wichtig, da es kein festes Schema gibt und jeder Händler seine Belege anders gestaltet.
Abschließend wird das strukturierte Ergebnis validiert: Währungssymbole werden normalisiert, Datumsformate standardisiert und Beträge auf interne Konsistenz geprüft (stimmen die Einzelposten mit dem Zwischensumme überein?). Die validierten Daten werden dann in den Spesenbeleg geschrieben.
Vorteile für Finanzteams
Der unmittelbarste Vorteil ist die Geschwindigkeit. Ein Beleg, dessen manuelle Eingabe zwei bis drei Minuten dauern würde, wird in Sekundenschnelle verarbeitet. Über die monatlichen Spesenabrechnungen der Mitarbeiter gerechnet, summiert sich das zu eingesparter Zeit.
Die Genauigkeit verbessert sich ebenfalls. Manuelle Dateneingabe führt zu Transkriptionsfehlern – vertauschte Ziffern, falsche Daten, fehlende Dezimalpunkte. OCR eliminiert den manuellen Kopiervorgang, sodass die Daten in Ihrem System mit denen auf der Quittung übereinstimmen.
Es gibt auch Vorteile bei Compliance und Prüfung. Wenn jeder Beleg digital erfasst wird und das Originalbild angehängt ist, ist der Spesenbericht vollständig und nachvollziehbar. Prüfer können das Originaldokument jederzeit verifizieren. Finanzmanager können Ausgaben nach Händler, Kategorie, Datumsbereich oder Mehrwertsteuerbetrag filtern, durchsuchen und Berichte darüber erstellen – all das ist mit einer Mappe voller Papierbelege nicht praktikabel.
Schließlich ermöglicht OCR die Durchsetzung von Richtlinien. Sobald Ausgabendaten strukturiert sind, können sie automatisch anhand von Regeln überprüft werden: Ausgabenlimits pro Kategorie, genehmigte Händlerlisten oder Erkennung doppelter Einreichungen.
Wie Docnova OCR zur Spaltenerfassung nutzt
In Docnova unterstützt die Seite zur Beleg- und Ausgabenverfolgung zwei Methoden zur Erstellung von Ausgaben: manuelle Eingabe und Dokumenten-Upload. Die Option “Dokument hochladen” akzeptiert ein Belegbild oder eine PDF-Datei und löst automatisch eine OCR-Extraktion aus.
Nach dem Hochladen extrahiert Docnova die Schlüsselfelder und erstellt einen Beitragsdatensatz mit dem Händlernamen, dem Beitragsdatum, der Währung, dem Mehrwertsteuerbetrag und dem Betrag inklusive Mehrwertsteuer – dieselben Spalten, die auch in der Beitragsliste sichtbar sind. Die für die Extraktion verwendete OCR-Quelle ist in den KI-Einstellungen konfigurierbar, sodass Teams die Engine für ihre Dokumententypen optimieren können.
So erfasste Ausgaben fließen direkt in die Finanzberichterstattung ein. Die Kennzahl „Gesamtausgaben aus Belegbuchungen“ auf der Seite „Finanzübersicht“ aggregiert alle hochgeladenen und manuell eingegebenen Belege und gibt Finanzteams eine Echtzeitübersicht über Ausgaben ohne Rechnung neben ihren Rechnungs- und Ausgabenzahlen.
Fazit
OCR für Belege eliminiert manuelle Arbeit bei der Spesenabrechnung, verbessert die Datenqualität und schafft eine vollständige digitale Prüfungsspur. Für Finanzteams, die Mitarbeiter- und Lieferantenbelege oder geringe Bargeldbestände verwalten, ist es eine der effektivsten Automatisierungen.
