Gefälschte Spesenbelege: Betrugserkennung mit KI 2026
Wie Unternehmen gefälschte Spesenbelege mit KI erkennen — Warnsignale, forensische Methoden, Rechtslage und automatisierte Prüfung im Überblick.

Diesen Artikel zusammenfassen mit
Generative KI hat aus dem gelegentlichen Spesenschwindel ein systematisches Problem gemacht: Ein Bildgenerator oder ein Sprachmodell erzeugt in Sekunden eine Restaurantquittung, ein Taxiticket oder einen Tankbeleg, der Papierstruktur, Logo, Knicke und sogar Kellner-Signaturen täuschend echt imitiert. Für Finanzabteilungen und Personalverantwortliche in Deutschland bedeutet das: Die Sichtprüfung eingereichter Spesenbelege, die jahrzehntelang ausreichte, versagt zunehmend gegen synthetische Dokumente.
Dieser Artikel schließt eine Lücke in der Berichterstattung über Dokumentenbetrug: Während gefälschte Gehaltsabrechnungen, Rechnungen und Kontoauszüge bereits gut dokumentiert sind, bleibt der Spesenbeleg als Angriffsfläche unterbelichtet — obwohl er wegen seines geringen Einzelwerts und seiner hohen Stückzahl besonders anfällig für automatisierte Fälschung ist.
Dieser Artikel dient ausschließlich Informationszwecken und stellt keine Rechts- oder Steuerberatung dar. Regulatorische Verweise sind zum Veröffentlichungsdatum korrekt.
Warum Spesenbelege ein bevorzugtes Ziel für KI-Fälschung sind
Spesenbelege sind für Betrüger attraktiver als große Rechnungen, weil Einzelbeträge klein genug bleiben, um keine gesonderte Prüfung auszulösen, aber in der Masse erhebliche Summen ergeben. Ein Angestellter, der monatlich zwanzig kleine Belege einreicht, bewegt sich unterhalb der Aufmerksamkeitsschwelle, die eine einzelne große Rechnung auslösen würde.
Die Verfügbarkeit generativer Bildmodelle hat die technische Hürde für diese Fälschungen praktisch auf null gesenkt. Nutzer berichten in einschlägigen Fachartikeln, dass Werkzeuge wie Bildgeneratoren realistische Quittungen mit korrekten Logos, Flecken und Knicken erzeugen — Details, die früher stundenlange Bildbearbeitung erforderten (Tages-Anzeiger zu KI-Spesenbetrug).
Konkrete Fälle bestätigen die Dimension: Das Fintech-Unternehmen Ramp deckte laut Medienberichten innerhalb von 90 Tagen gefälschte Belege im Wert von über einer Million US-Dollar auf, während der Anbieter AppZen einen Anstieg KI-generierter betrügerischer Belege registrierte (t3n zu KI-Spesenbetrug). Solche Zahlen stammen aus dem angloamerikanischen Markt, zeigen aber die Größenordnung, mit der auch deutsche Unternehmen konfrontiert sind, sobald ihre Belegprüfung überwiegend manuell bleibt.
In Foren und Fachforen zum Thema Compliance wird häufig gefragt, ob ein einzelner gefälschter Kassenbon überhaupt nachweisbar ist, wenn Betrag und Datum plausibel wirken — und ob eine einmalige Verfehlung bereits arbeitsrechtliche Konsequenzen nach sich zieht. Beide Fragen greifen wir im FAQ-Teil auf.
Wie gefälschte Spesenbelege heute entstehen
Drei Fälschungstechniken dominieren die Praxis
Diffusionsmodelle erzeugen ein komplettes Belegbild aus einer Textbeschreibung — etwa "Restaurantquittung, zwei Personen, 68 Euro, deutsches Layout" — inklusive Logo, Schriftart und Papiertextur. Das Ergebnis ist ein Dokument, das visuell nicht von einer echten Quittung zu unterscheiden ist, aber ohne jede reale Transaktion existiert.
Bildbearbeitung bestehender echter Belege ist die zweite, technisch einfachere Variante: Ein Angestellter fotografiert eine echte Quittung, ändert Betrag oder Datum in einer Bildbearbeitungs-App und reicht das manipulierte Foto ein. Anders als bei der vollständigen Neuerstellung bleibt hier ein Teil der Originaldaten erhalten, was die Erkennung über Metadaten erschwert, aber nicht unmöglich macht.
Textgenerierung durch Sprachmodelle wird eingesetzt, um plausible Begleitangaben zu erzeugen — Bewirtungsanlass, Teilnehmerlisten, Reisegründe —, die zu einem gefälschten oder echten Beleg passen, aber frei erfunden sind. Diese Kombination aus Bild- und Textgenerierung macht die reine Sichtprüfung eines Belegs zunehmend wertlos.
Warnsignale gefälschter Spesenbelege und passende Erkennungsmethode
| Warnsignal | Was auffällt | Erkennungsmethode |
|---|---|---|
| Identische oder sich wiederholende Kellner-Namen/Uhrzeiten | Mehrere Belege verschiedener Restaurants nennen denselben Namen oder dieselbe Uhrzeit | Textextraktion + Duplikatsabgleich über die gesamte Belegdatenbank |
| PDF/Bild-Metadaten ohne Kamera- oder Kassensystem-Signatur | Erstellungssoftware ist ein Bildeditor oder unbekanntes Tool statt Kassensystem | Metadaten- und EXIF-Analyse |
| Beleg-Datum außerhalb der genehmigten Reisezeit | Tankbeleg an einem Tag ohne genehmigte Dienstreise | Kontextabgleich mit Reise- und Kalenderdaten |
| Arithmetisch inkonsistente Summen (MwSt., Trinkgeld, Gesamtbetrag) | Einzelposten ergeben nicht die ausgewiesene Endsumme | Automatisierte Rechenprüfung |
| Zu perfekte oder zu einheitliche Bildstruktur | Fehlende natürliche Unschärfe, Kompressionsartefakte typisch für Diffusionsmodelle | Forensische Bildanalyse / KI-Generierungssignale |
| Fehlender Abgleich mit Kreditkarten- oder Kontobewegung | Kein entsprechender Zahlungsvorgang im Zeitraum auffindbar | Kreuzvalidierung mit Zahlungsdaten |
Automatisierte Prüfsysteme, die Bildforensik mit Kontextabgleich kombinieren, erkennen die Mehrzahl dieser Signale in Sekunden, während eine rein visuelle Prüfung durch Sachbearbeiter strukturell blind für Metadaten- und Duplikatsmuster bleibt. Genau diese methodische Lücke schließt eine mehrschichtige Analyse aus OCR, dokumentenübergreifender Konsistenzprüfung und Erkennung von KI-Generierungssignalen, wie sie CheckFile für Dokumentenprüfung insgesamt einsetzt.
Bereit, Ihre Prüfungen zu automatisieren?
Kostenloses Pilotprojekt mit Ihren eigenen Dokumenten. Ergebnisse in 48h.
Kostenloses Pilotprojekt anfragenManuelle versus automatisierte Prüfung von Spesenbelegen
| Kriterium | Manuelle Stichprobenprüfung | Automatisierte KI-gestützte Prüfung |
|---|---|---|
| Abdeckung | Stichprobe, meist unter 10 % der Belege | Systematisch, jeder eingereichte Beleg |
| Erkennung von Duplikaten über mehrere Abrechnungen | Praktisch nicht durchführbar von Hand | Automatischer Abgleich in Echtzeit |
| Metadatenprüfung | Nicht Teil der Standardroutine | Automatisiert bei jedem Upload |
| Reaktionszeit bei Verdachtsfall | Tage bis Wochen | Sekunden bis Minuten |
| Skalierbarkeit bei wachsendem Belegvolumen | Erfordert zusätzliches Personal | Linear skalierbar ohne Personalaufbau |
| Nachvollziehbarkeit für Audit | Abhängig von individueller Dokumentation | Systematisches, exportierbares Prüfprotokoll |
Der ACFE 2024 Report to the Nations zeigt, dass Organisationen, die überwiegend auf manuelle oder anlassbezogene Prüfung setzen, Betrug typischerweise erst über interne Kontrollen in rund 37 % der Fälle aufdecken, mit einer durchschnittlichen Verzögerung von etwa 87 Tagen bis zur Entdeckung (ACFE 2024 Report to the Nations). Bei Spesenbelegen mit vergleichsweise geringem Einzelwert bedeutet diese Verzögerung, dass sich Schäden über Monate akkumulieren, bevor überhaupt eine Auffälligkeit gemeldet wird.
Rechtlicher Rahmen in Deutschland
Das Einkommensteuergesetz definiert die Nachweispflichten für Reisekosten und Bewirtung
Reisekosten sind nach den Regelungen zu Werbungskosten im Einkommensteuergesetz (EStG) nur abziehbar, wenn eine beruflich veranlasste Auswärtstätigkeit tatsächlich stattgefunden hat und durch Belege nachgewiesen wird. Für Bewirtungsaufwendungen konkretisiert das Bundesfinanzministerium in seinem BMF-Schreiben die Pflichtangaben auf dem Bewirtungsbeleg: Datum, Ort, Teilnehmer, Anlass und genaue Bezeichnung der Speisen und Getränke (BMF-Schreiben zur Nachweispflicht bei Bewirtungskosten). Bei geschäftlich veranlassten Bewirtungen sind zudem nur 70 % der Kosten als Betriebsausgabe abzugsfähig, die übrigen 30 % gelten steuerlich als privat veranlasst.
Ein gefälschter oder inhaltlich unvollständiger Bewirtungsbeleg gefährdet nicht nur die Erstattung durch den Arbeitgeber, sondern auch die steuerliche Anerkennung der Ausgabe insgesamt — ein doppeltes Risiko, das Unternehmen bei der Belegprüfung oft unterschätzen.
Strafrechtliche Einordnung von Spesenbetrug
Wer einen gefälschten oder inhaltlich falschen Spesenbeleg einreicht, um eine Erstattung zu erlangen, auf die kein Anspruch besteht, erfüllt in der Regel den Tatbestand des Betrugs nach § 263 StGB — Freiheitsstrafe bis zu fünf Jahren oder Geldstrafe, in besonders schweren Fällen bis zu zehn Jahren. Wird der Beleg selbst technisch verändert oder neu erzeugt, kommt zusätzlich § 267 StGB (Urkundenfälschung) mit einer Freiheitsstrafe bis zu fünf Jahren in Betracht.
Arbeitsrechtlich rechtfertigt bereits ein einzelner nachgewiesener Fall von Spesenbetrug in der Regel eine fristlose Kündigung nach § 626 BGB, verbunden mit einem zivilrechtlichen Rückforderungsanspruch des Arbeitgebers. Diese arbeitsrechtliche Härte erklärt, warum Unternehmen an einer belastbaren, nachvollziehbaren Beweisführung interessiert sind — eine bloße Vermutung reicht für eine Kündigung nicht aus.
Was die Betrugserkennung in der Praxis konkret leisten muss
Ein europäischer Vergleichswert verdeutlicht die Dimension: Nach dem PwC France Economic Crime Survey 2025 berichteten 69 % der befragten französischen Unternehmen, in den vergangenen Jahren Opfer von Wirtschaftskriminalität geworden zu sein (PwC Global Economic Crime Survey, France-Ausgabe). Auch wenn sich diese Zahl nicht eins zu eins auf Deutschland übertragen lässt, zeigt sie, dass Wirtschaftsbetrug — einschließlich Spesenbetrug als Unterkategorie der Vermögensdelikte — in vergleichbaren europäischen Volkswirtschaften ein Massenphänomen ist, kein Randproblem.
Der ENISA Threat Landscape 2024 dokumentiert zudem den allgemeinen Anstieg KI-gestützter Fälschungswerkzeuge, die längst nicht mehr auf Identitätsdokumente beschränkt sind, sondern zunehmend auch Alltagsbelege wie Quittungen und Rechnungen betreffen.
Eine belastbare Erkennung braucht drei Ebenen gleichzeitig: strukturelle Bildanalyse zur Erkennung generierter oder manipulierter Bilddaten, dokumentenübergreifende Konsistenzprüfung, um Duplikate und widersprüchliche Angaben über mehrere Abrechnungen hinweg zu finden, und kontextbasierte Bewertung, die unberechtigte Ablehnungen legitimer Spesenabrechnungen reduziert — denn nicht jede unscharfe Handy-Quittung ist ein Betrugsversuch. Für Personalabteilungen, die Spesenabrechnungen im hohen Volumen bearbeiten, ist genau dieses Gleichgewicht zwischen Erkennungsschärfe und Fehlerquote entscheidend, um Mitarbeitervertrauen nicht unnötig zu belasten.
Für Steuerberater und Wirtschaftsprüfer, die Spesenabrechnungen im Rahmen der Jahresabschlussprüfung oder laufenden Buchführung sichten, verschiebt sich die Aufgabe von der Einzelfallprüfung hin zur systematischen Vorprüfung durch automatisierte Werkzeuge, bevor ein Beleg überhaupt in die manuelle Prüfschleife gelangt.
Empfohlenes Prüfprotokoll für Unternehmen
Stufe 1 — Automatisierte Erstprüfung jedes eingereichten Belegs: OCR-Extraktion der Belegdaten, arithmetische Prüfung von Einzelposten und Summe, Duplikatsabgleich gegen die gesamte Belegdatenbank, Metadatenanalyse bei digital eingereichten Bildern oder PDFs.
Stufe 2 — Kontextabgleich bei Auffälligkeiten: Abgleich des Belegdatums mit genehmigten Reisezeiten und Kalendereinträgen, Abgleich mit Kreditkarten- oder Kontobewegungen, Prüfung auf wiederkehrende Namen oder Uhrzeiten über mehrere Belege eines oder mehrerer Mitarbeiter.
Stufe 3 — Manuelle Untersuchung bei Verdachtsfällen: vollständige forensische Prüfung durch die Compliance- oder Personalabteilung, Dokumentation für eine mögliche arbeitsrechtliche Auseinandersetzung, gegebenenfalls Strafanzeige bei eindeutigen Anhaltspunkten für eine Straftat.
Dieses dreistufige Modell folgt derselben Logik, die sich bereits bei der Prüfung gefälschter Gehaltsabrechnungen und gefälschter Kontoauszüge bewährt hat: Automatisierung übernimmt die Breite, menschliche Prüfung übernimmt die Tiefe bei begründetem Verdacht. Wer die forensischen Grundlagen der Bildanalyse vertiefen möchte, findet ergänzende Methodik in unserem Beitrag zur Error-Level-Analyse bei Dokumentenbetrug.
Unternehmen, die eine Prüfstrategie über mehrere Dokumenttypen und Branchen hinweg aufbauen wollen, finden einen strukturierten Einstieg in unserem Leitfaden zur Branchenverifizierung.
Sicherheit und Skalierung der Prüfung
CheckFile deckt mehr als 3.200 Dokumenttypen in 24 OCR-Sprachen und 32 Jurisdiktionen ab, mit einem Verfügbarkeits-SLA-Ziel von 99,94 % — eine Infrastrukturbasis, die auch für Spesenbelege in unterschiedlichsten Formaten und Sprachen greift, von der deutschen Restaurantquittung bis zum ausländischen Taxibeleg auf einer Dienstreise. Details zu Datenschutz und technischer Absicherung der Prüfprozesse finden sich auf unserer Sicherheitsseite, Preisoptionen für unterschiedliche Unternehmensgrößen auf der Tarifseite.
CheckFile analysiert Ihre Akten und meldet Anzeichen KI-generierter Inhalte als Ergänzung zu Ihren bestehenden Kontrollen — als zusätzliche, systematische Prüfschicht, nicht als Ersatz für die fachliche Beurteilung durch Ihre Compliance- oder Personalabteilung. Mehr zur Erkennung KI-generierter und veränderter Dokumente insgesamt finden Sie auf unserer Seite zur Erkennung von Deepfakes und KI-generierten Dokumenten.
Häufig gestellte Fragen
Ist ein einzelner gefälschter Kassenbon überhaupt nachweisbar, wenn Betrag und Datum plausibel wirken?
Ja, in den meisten Fällen. Selbst ein plausibel wirkender Beleg trägt digitale oder physische Spuren — Metadaten bei digitalen Einreichungen, fehlende Übereinstimmung mit Zahlungsdaten, oder Duplikate über mehrere Abrechnungen hinweg. Automatisierte Prüfsysteme finden diese Spuren systematisch, während die reine Sichtprüfung sie in der Regel übersieht.
Zieht eine einmalige Verfehlung bereits arbeitsrechtliche Konsequenzen nach sich?
Ja, ein einzelner nachgewiesener Fall von bewusst gefälschten oder erfundenen Spesenbelegen rechtfertigt in der Regel bereits eine fristlose Kündigung nach § 626 BGB, da der Vertrauensbruch als schwerwiegend gilt. Entscheidend ist dabei die belastbare Beweisführung, nicht die Häufigkeit des Vorfalls.
Woran erkennt ein System KI-generierte Quittungen, die für das menschliche Auge perfekt aussehen?
Diffusionsmodelle hinterlassen charakteristische Muster auf Pixelebene, etwa untypische Kompressionsartefakte oder eine unnatürlich gleichmäßige Textur, die vom natürlichen Rauschen einer echten Fotoaufnahme abweicht. Zusätzlich fehlen bei rein generierten Bildern häufig die Metadaten eines Kassensystems oder einer Kamera, was eine forensische Analyse zuverlässig aufdeckt.
Wie unterscheidet ein System eine legitime, aber unscharfe Handy-Quittung von einem Betrugsversuch?
Kontextbasierte Bewertung berücksichtigt mehrere Faktoren gleichzeitig statt nur die Bildqualität: ob das Beleg-Datum zu einer genehmigten Reise passt, ob der Betrag mit einer Kontobewegung übereinstimmt, und ob ähnliche Muster bereits bei anderen Belegen aufgefallen sind. Eine unscharfe, aber inhaltlich konsistente Quittung wird dadurch nicht automatisch als Betrug eingestuft.
Welche Rolle spielt die 70/30-Regelung bei Bewirtungsbelegen für die Betrugserkennung?
Die steuerliche Regel, wonach nur 70 % geschäftlich veranlasster Bewirtungskosten abzugsfähig sind, betrifft primär die steuerliche Behandlung, nicht direkt die Betrugserkennung. Sie erhöht aber die Bedeutung vollständiger Pflichtangaben auf dem Beleg, da unvollständige Angaben sowohl die interne Erstattung als auch die steuerliche Anerkennung gefährden und damit ein zusätzliches Prüfkriterium liefern.
Reicht eine Stichprobenprüfung bei kleinen Unternehmen aus, oder braucht es automatisierte Systeme schon bei geringem Belegvolumen?
Eine Stichprobenprüfung kann bei sehr kleinem Volumen ausreichen, verliert aber schnell an Wirksamkeit, sobald mehrere Mitarbeiter regelmäßig Spesen einreichen. Automatisierte Systeme skalieren linear mit dem Belegvolumen, ohne dass zusätzliches Prüfpersonal eingestellt werden muss, was sie auch für kleinere Unternehmen mit wachsendem Reiseaufkommen wirtschaftlich sinnvoll macht.
Bleiben Sie informiert
Erhalten Sie unsere Compliance-Analysen und Praxisleitfäden direkt in Ihr Postfach.