Skip to content
KundenreferenzPreiseSicherheitVergleichBlog

Europe

Americas

Oceania

Leitfaden9 min Lesezeit

Gefälschte Dokumente durch LLM und ChatGPT: die neue Betrugsgefahr

ChatGPT und große Sprachmodelle erzeugen unentdeckbare gefälschte Textdokumente. Wie diese Bedrohung funktioniert, welche Dokumente gefälscht werden und wie Sie Ihre Organisation schützen.

Das CheckFile-Team
Das CheckFile-Team·
Illustration for Gefälschte Dokumente durch LLM und ChatGPT: die neue Betrugsgefahr — Leitfaden

Diesen Artikel zusammenfassen mit

Große Sprachmodelle (LLM) — ChatGPT, GPT-4o, Claude, Gemini — haben einen grundlegend neuen Vektor für Dokumentenbetrug eingeführt: die Erzeugung kohärenter, grammatikalisch fehlerfreier, kontextuell plausibler gefälschter Textdokumente ohne Bildmanipulation und ohne erkennbare Artefakte. Wo frühere Betrüger Bilder in Photoshop bearbeiteten, diktieren Betrüger von 2026 Gehaltsabrechnungen, Arbeitsverträge und Kontoauszüge an einen Chatbot. Dieser Leitfaden untersucht die Mechanismen des LLM-Dokumentenbetrugs, die am stärksten gefährdeten Dokumente und wirksame Erkennungsstrategien.

Dieser Artikel dient ausschließlich Informationszwecken. Regulatorische Anforderungen entwickeln sich weiter — konsultieren Sie BaFin oder einen spezialisierten Rechtsberater für Ihre spezifische Situation.

Warum LLMs einen qualitativen Wandel im Dokumentenbetrug darstellen

LLMs unterscheiden sich grundlegend von generativen Bildmodellen (GAN, Stable Diffusion). Sie erzeugen strukturierten Text, kohärente Zahlen und professionelle Formatierungen auf Abruf — keine manipulierten Pixel. Ein Betrüger kann in weniger als zwei Minuten eine überzeugende Gehaltsabrechnung für ein Jahresgehalt von 42.000 € generieren, ohne jegliche Grafikdesignkenntnisse. Das Ergebnis enthält korrekte Lohnsteuerberechnungen auf Basis der deutschen Tarife 2026, Sozialversicherungsbeiträge gemäß den aktuellen Beitragssätzen und Jahresgesamtwerte, die mit dem angegebenen Monatslohn kohärent sind.

Laut ACFE 2024 Report to the Nations beträgt die mediane Erkennungszeit eines nicht bei der Einreichung entdeckten Dokumentenbetrugs 87 Tage. Diese Zahl verdeutlicht die Kosten der fehlenden Blockierung gefälschter Dokumente beim Onboarding. Derselbe Bericht stellt fest, dass 37 % des Betrugs noch immer durch manuelle Überprüfung erkannt wird — genau der Kanal, in dem LLM-generierte Fälschungen darauf ausgelegt sind zu täuschen.

Das ENISA Threat Landscape 2024 identifiziert KI-unterstützten Betrug als eine der fünf wichtigsten Bedrohungen für europäische Organisationen, mit spezifischem Verweis auf die Zunahme synthetischer Textinhalte in Identitätsprüfungs- und Kreditvergabeabläufen.

Vergleich der Dokumentenbetrugstechniken

Technik Angriffsvektor Traditionelle Erkennung Schwierigkeit 2026
Photoshop-Bearbeitung Geänderte Pixel ELA, EXIF-Metadaten Einfach
Modifizierte PDF-Vorlagen Ersetzte Textfelder PDF-Analyse, Metadaten Mittel
GAN / Stable Diffusion Synthetische Bilder Visuelle Artefakte, Kohärenz Schwierig
LLM (ChatGPT, GPT-4o) Vollständig generierter Text Keine klassischen Artefakte Sehr schwierig

Standard-OCR-Prüfungen lesen den Textinhalt, können jedoch nicht erkennen, dass er durch ein LLM generiert wurde. Metadatenprüfungen identifizieren modifizierte PDFs, keine von Grund auf neu erstellten Dokumente. Diese Lücke nutzt der LLM-basierte Betrug aus.

Am stärksten von LLM-Betrug betroffene Dokumente

Gehaltsabrechnungen und Einkommensnachweise

Die Gehaltsabrechnung ist das am häufigsten per LLM gefälschte Dokument in Hypotheken-, Leasing- und Mietanträgen. Ein LLM kann eine vollständige Gehaltsabrechnung mit fiktivem Firmenname und HRB-Nummer (plausibel generiert), korrekten Lohnsteuerberechnungen entsprechend den Tarifen 2026, Sozialversicherungsbeiträgen gemäß aktuellen Beitragssätzen und kumulativen Jahreswerten kohärent mit dem angegebenen Monatsgehalt erzeugen.

Plattformen in den Randbereichen des Internets bieten offen „KI-Gehaltsabrechnungsgeneratoren" an, die nur das Zielgehalt, den Arbeitgebernamen und den Lohnzeitraum erfordern. Die Generierung dauert Sekunden; die resultierende PDF ist für einen menschlichen Prüfer visuell nicht von einer echten Gehaltsabrechnung zu unterscheiden.

Arbeitsverträge und Anstellungsbestätigungen

LLMs generieren vollständige unbefristete oder befristete Arbeitsverträge mit Geheimhaltungsklauseln, Probezeit und Gehaltsstruktur, die mit dem angegebenen Tarifvertrag der Branche kohärent ist. Betrüger nutzen diese als ergänzende Nachweise, wenn Kreditgeber zusätzliche Dokumentation anfordern.

Kontoauszüge

Vollständig durch LLM generierte Kontoauszüge sind schwieriger kohärent zu gestalten (erfordern realistische Transaktionshistorien), aber die häufigste Angriffsvariante kombiniert eine legitime PDF-Vorlage mit durch LLM generierten Transaktionsdaten. Die strukturellen Metadaten der Vorlage bleiben echt; nur der Inhalt wurde ausgetauscht.

Arbeitsreferenzen und berufliche Zertifikate

Arbeitgeberzeugnisse, Berufsakkreditierungszertifikate und Hochschulabschlussbestätigungen werden bei Recruitingbetrug häufig durch LLMs generiert. Diese Dokumente enthalten keine überprüfbare digitale Signatur und sind strukturell einfach zu produzieren.

So erkennen Sie LLM-generierte Dokumente

Linguistische und textuelle Kohärenzanalyse

Durch LLM generierter Text weist statistische Eigenschaften auf, die in authentischen menschlichen Dokumenten fehlen:

  • Einheitliche Perplexität: LLMs produzieren Text mit niedriger Entropie, ohne die Registerwechsel und stilistischen Unvollkommenheiten echter HR-Dokumente
  • Fehlende typografische Variation: echte Dokumente enthalten geschützte Leerzeichen, typografische Anführungszeichen und Ligaturen — die LLMs nicht systematisch einfügen
  • Übermäßige numerische Präzision: KI-generierte Gehaltsabrechnungen zeigen verdächtig runde Zahlen ohne die Rundungsartefakte, die für echte Gehaltsabrechnungssoftware typisch sind

Dokumentenübergreifende Konsistenzvalidierung

Die wertvollste Erkennung erfolgt durch Kreuzvalidierung: Eine durch LLM generierte Gehaltsabrechnung kann einen Arbeitgeber nennen, dessen Adresse nicht mit den Handelsregisterdaten übereinstimmt, oder eine Steuernummer, die zwar formal korrekt formatiert ist, aber nicht beim Finanzamt registriert ist. Diese Signale sind bei der isolierten Prüfung jedes Dokuments unsichtbar — sie erfordern systemische Validierung gegen externe Datenquellen.

CheckFile setzt eine zusätzliche Schicht von KI-Generationssignalen als Ergänzung zu den bestehenden strukturellen Kontrollen ein, kalibriert auf das sektorale Risikoniveau des Kunden. Diese Methodik kombiniert die forensische Analyse einzelner Dokumente mit der Kreuzvalidierung in Registern Dritter (Handelsregister, Bundeszentralamt für Steuern, IBAN-Verifizierungsdienste).

Weiterführende Informationen zu KI-Erkennungstechniken finden Sie in unserem Leitfaden zu KI-Techniken zur Erkennung von Dokumentenbetrug und unserem Artikel darüber wie KI gefälschte Dokumente erstellt.

Spezifische forensische Signale bei LLM-Dokumenten

Signal Beschreibung Erkennungsmethode
Semantische Wiederholung Nahezu identische Formulierungen in mehreren Dokumenten desselben Antragstellers Vektorbasierte Ähnlichkeitsanalyse
Verdächtig runde Beträge Gehälter auf den nächsten Hundert Euro, perfekt gerundete Abzüge Statistische Dezimalstellenprüfung
Nicht verifizierbarer Arbeitgeber Firmenname und Adresse vorhanden, aber nicht im Handelsregister eingetragen Handelsregister-API
Ungültige oder inaktive Steuernummer Plausibles Format, aber nicht beim Bundeszentralamt registriert API BZSt
Anomale Schriftuniformität Einfont-Dokument ohne die gemischten Schriftartsignaturen echter Gehaltsabrechnungssoftware Typografische Metadatenextraktion

Bereit, Ihre Prüfungen zu automatisieren?

Kostenloses Pilotprojekt mit Ihren eigenen Dokumenten. Ergebnisse in 48h.

Kostenloses Pilotprojekt anfragen

Regulatorischer Rahmen: Was deutsche Aufsichtsbehörden verlangen

GwG-Pflichten und KYC-Sorgfaltspflichten

Das Geldwäschegesetz (GwG) verpflichtet alle Verpflichteten, die Identität ihrer Kunden anhand verlässlicher, unabhängiger Quelldokumente zu überprüfen. Die BaFin (Bundesanstalt für Finanzdienstleistungsaufsicht) überwacht die Einhaltung dieser Verpflichtungen durch beaufsichtigte Finanzinstitute.

Die BaFin hat in ihrem Merkblatt zur KI-Nutzung im Finanzsektor vom Oktober 2025 explizit auf die Risiken KI-generierter Dokumentation im KYC-Prozess hingewiesen und Kreditinstitute aufgefordert, ihre Kundensorgfaltspflichten entsprechend anzupassen.

Ab dem 10. Juli 2027 wird die 6. Geldwäscherichtlinie (AMLD6, EU 2024/1640) die GwG-Pflichten auf neue Kategorien von Verpflichteten ausweiten und das Konzept der verstärkten Überprüfung für elektronisch produzierte Dokumente einführen, was implizit auch KI-generierte Dokumente umfasst.

BSI und technische Sicherheitsanforderungen

Das Bundesamt für Sicherheit in der Informationstechnik (BSI) hat in seiner Technischen Richtlinie TR-03147 (Vertrauensniveaus für Identitätsdokumente) Anforderungen veröffentlicht, die auch synthetische und KI-generierte Dokumentenbedrohungen berücksichtigen. Diese Richtlinie ist ein wesentlicher Referenzrahmen für Finanzinstitute beim Aufbau ihrer Dokumentenprüfungsinfrastruktur.

Bundeszentralamt für Steuern und Einkommensverifikation

Für Kreditgeber und professionelle Vermieter bietet das Bundeszentralamt für Steuern (BZSt) Steuerdatenabfragedienste an, die Einkommensdaten direkt verifizieren können, ohne auf die Gehaltsabrechnung als Vertrauensdokument angewiesen zu sein. Diese Direktverifikation eliminiert den LLM-Betrugsvektor bei steuerlich erfassten Einkommen.

Eine wirksame Verteidigung aufbauen

Schritt 1: Alle Dokumenteneingangskanäle kartieren

Jeder Kanal, über den Dokumente in Ihre Organisation gelangen, ist ein potenzieller LLM-Betrugsvektor: Kundenportal, E-Mail, API-Partnerintegrationen, physische Scan-Workflows. Digitale Portale — über die Text direkt eingefügt werden kann — weisen ein höheres LLM-Betrugsrisiko auf als Scans physischer Dokumente.

Schritt 2: Systematische Kreuzvalidierung implementieren

Die Validierung von Arbeitgeberreferenzen im Handelsregister und beim Bundeszentralamt für Steuern erkennt den Großteil der LLM-Fälschungen, da Sprachmodelle keinen Echtzeitzugang zu deutschen öffentlichen Registern haben. Ein Unternehmensname, der nicht im Handelsregister eingetragen ist, ist ein hochzuverlässiges Betrugsignal.

Schritt 3: Eine LLM-Signalerkennungsschicht hinzufügen

KI-generierte Texterkennungstools (Perplexitätsanalyse, Burstiness-Bewertung, stilistischer Fingerabdruck) liefern für jede Einreichung einen LLM-Risikowert. Diese Schicht ersetzt klassische Kontrollen nicht — sie ergänzt sie.

Erfahren Sie, wie CheckFile diese Kontrollen in Ihren Verifizierungs-Workflow integriert, um KI-Generationssignale zu identifizieren, ohne das Benutzererlebnis zu verlangsamen. Unsere Sicherheits- und Compliance-Seite beschreibt die Kontrollarchitektur für in Echtzeit eingereichte Dokumente.

Schritt 4: KYC- und Kreditteams schulen

Compliance-Analysten müssen darin geschult werden, textuelle und visuelle Indikatoren LLM-generierter Dokumente zu erkennen. Fachleute in spezialisierten Foren berichten übereinstimmend, dass typografische Perfektion zu einem Warnsignal geworden ist — das Gegenteil von vor zehn Jahren. Runde Gehaltsbeträge, fehlerfreie Grammatik und das Fehlen jeglicher Formatierungsunregelmäßigkeit sind jetzt verdächtig.

Was Praktiker berichten

Compliance-Verantwortliche, die dieses Thema in Fachforen diskutieren, stellen zwei wiederkehrende Fragen:

„Wie unterscheide ich ein Word-in-PDF-konvertiertes Dokument von einem LLM-generierten?" Die technische Antwort: PDF-Metadatenanalyse (ProductID, CreationDate) und Schriftart-Fingerabdrücke offenbaren in der Regel das verwendete Erstellungstool. Eine Word-zu-PDF-Konvertierung behält Microsoft-Office-Spuren; ein durch LLM generiertes und via Python-Code formatiertes Dokument hinterlässt eine vollständig andere Metadaten-Signatur.

„Machen LLMs vorhersehbare Fehler?" Ja — sie erzeugen Zahlen, die dem Anschein nach kohärent, aber statistisch unwahrscheinlich sind (zu viele runde Gehaltsbeträge, fehlende jährliche Kumulation-Variation). Sie generieren auch standardisierte HR-Formulierungen, die in echten Gehaltsabrechnungen kleinerer Unternehmen fehlen.

Einen umfassenderen Rahmen finden Sie in unserem vollständigen Leitfaden zur Dokumentenprüfung und unserer dedizierten KI- und Deepfake-Dokumentenerkennungsseite.

Häufig gestellte Fragen

Können LLMs wirklich überzeugende Gehaltsabrechnungen generieren?

Ja. Aktuelle LLMs (GPT-4o, Claude 3.5, Gemini 1.5 Pro) produzieren syntaktisch korrekte Gehaltsabrechnungen mit Lohnsteuer- und Sozialversicherungsbeiträgen auf Basis der deutschen Tarife 2026. Die PDF-Formatierung kann anschließend per Code aufgebracht werden, sodass das Dokument für einen menschlichen Prüfer visuell nicht von einer echten Gehaltsabrechnung zu unterscheiden ist. Die Erkennung erfordert forensische Analyse und Kreuzvalidierung der Arbeitgeberdaten im Handelsregister und beim BZSt.

Was ist der Unterschied zwischen LLM-Betrug und visuellem Deepfake?

Visuelle Deepfakes manipulieren Bilder (GAN, Stable Diffusion) und hinterlassen Artefakte, die durch Error Level Analysis (ELA) oder Pixelkohärenzprüfungen erkennbar sind. LLM-Fälschungen sind vollständig textuell — keine visuellen Artefakte, keine Bildmanipulation. Ihre Erkennung erfordert linguistische Analyse und semantische Kohärenzvalidierung statt visueller Forensik.

Sind herkömmliche OCR-Prüfungen ausreichend?

Nein. OCR liest den Textinhalt, kann aber den Ursprung dieses Textes nicht erkennen. Eine LLM-generierte Gehaltsabrechnung besteht alle OCR-Prüfungen, da ihr Textinhalt syntaktisch korrekt ist. Die Erkennung erfordert ergänzende Analysen: linguistische Perplexitätsbewertung, Zahlenkohärenz und Validierung in Registern Dritter.

Welche regulatorischen Pflichten habe ich bei einem erkannten Falschdokument?

Verpflichtete nach dem GwG sind angehalten, der Zentralstelle für Finanztransaktionsuntersuchungen (FIU) eine Verdachtsmeldung zu erstatten, wenn sie wissen oder vermuten, dass ein Kunde Betrug oder Geldwäsche begangen hat. Dies umfasst Dokumentenbetrug, der während des Onboarding-Prozesses aufgedeckt wurde. Die Ablehnung der Geschäftsanbahnung ist die Standardmaßnahme bei bestätigter Fälschung.

Setzt die Annahme einer LLM-Fälschung meine Organisation rechtlichen Risiken aus?

Für von der BaFin beaufsichtigte Kreditinstitute kann die Annahme eines betrügerischen Dokuments in einem Kreditantrag einen Verstoß gegen die GwG-KYC-Pflichten darstellen und aufsichtsrechtliche Maßnahmen nach sich ziehen. Für Vermieter und nicht regulierte Einrichtungen ist die Haftung geringer, der direkte finanzielle Schaden — Mietausfälle, kostspielige Räumungsverfahren — ist jedoch unmittelbar und erheblich.

Um diesen Risikobereich im CheckFile-Angebot einzuordnen, siehe unseren Ansatz zur KI- und Deepfake-Erkennung.

Bleiben Sie informiert

Erhalten Sie unsere Compliance-Analysen und Praxisleitfäden direkt in Ihr Postfach.

Bereit, Ihre Prüfungen zu automatisieren?

Kostenloses Pilotprojekt mit Ihren eigenen Dokumenten. Ergebnisse in 48h.