Leitfaden9 min Lesezeit

Wie KI gefälschte Dokumente erstellt — und wie man sie erkennt

Generative KI-Modelle (GAN, Diffusion, LLM) erzeugen täuschend echte Lohnabrechnungen, Ausweise und Kontoauszüge. Erfahren Sie, wie diese Techniken funktionieren und welche Erkennungsmethoden wirklich greifen — Leitfaden 2026.

Das CheckFile-Team·27. Juni 2026

Illustration for Wie KI gefälschte Dokumente erstellt — und wie man sie erkennt — Leitfaden

Diesen Artikel zusammenfassen mit

Dokumentenfälschung mithilfe künstlicher Intelligenz basiert auf generativen Modellen, die Personalausweise, Gehaltsabrechnungen und Kontoauszüge erzeugen können, die visuell nicht von Originalen zu unterscheiden sind. Diese Werkzeuge sind zugänglich, kostengünstig und erfordern keinerlei grafische Fachkenntnisse. Zu verstehen, wie diese Techniken funktionieren — und wie man sie erkennt — ist 2026 zu einer Kernkompetenz für jeden KYC- oder Compliance-Verantwortlichen geworden.

Dieser Artikel dient ausschließlich zu Informationszwecken. Regulatorische Anforderungen entwickeln sich ständig weiter — wenden Sie sich an die BaFin, Ihren Rechtsberater oder einen spezialisierten Compliance-Berater für auf Ihre Organisation zugeschnittene Beratung.

Wie KI-Modelle gefälschte Dokumente erstellen

Generative KI produziert keine Fälschungen durch Kopieren vorhandener Bilder. Sie lernt die statistische Struktur echter Dokumente und generiert neue Exemplare mit allen charakteristischen grafischen Details, ohne ein identifizierbares Original zu reproduzieren.

Generative adversariale Netzwerke (GAN)

GANs (Generative Adversarial Networks) stellen zwei neuronale Netzwerke gegeneinander: einen Generator, der Dokumentbilder erzeugt, und einen Diskriminator, der versucht, diese von echten Dokumenten zu unterscheiden. Das Training an Tausenden von authentischen und gefälschten Beispielen verfeinert den Generator schrittweise, bis der Diskriminator keinen Unterschied mehr erkennen kann. Auf Dokumentenbetrug angewendet, erzeugen GANs visuell kohärente Personalausweise, Reisepässe und Führerscheine — einschließlich Schriftarten, Sicherheitshintergründen und MRZ-Zonen. Die wesentliche Schwäche: GANs hinterlassen räumliche Frequenzartefakte (charakteristische Oszillationen in Bereichen hohen Gradienten), die mit kalibrierten Sensoren nachweisbar sind.

Diffusionsmodelle und Consumer-Werkzeuge

Diffusionsmodelle (Stable Diffusion, DALL·E, Midjourney) dominieren mittlerweile die Hochauflösungsbildgenerierung. Ihre Fähigkeit, präzisen Textbeschreibungen zu folgen ("deutscher Reisepass, männlich, geboren 1990, Foto 35×45 mm, OCR-B-Schrift"), macht sie besonders geeignet für die Auftragsproduktion von Fälschungen. Seit 2023 kombinieren spezialisierte Tools — die über illegale Foren verbreitet werden — diese Modelle mit vorausgefüllten PDF-Vorlagen der wichtigsten offiziellen europäischen Dokumente. Das Ergebnis: eine lieferbare Fälschung in weniger als einer Stunde, für unter 80 Euro, ohne Vorkenntnisse im Grafikdesign.

LLMs kombiniert mit Dokumentvorlagen

Große Sprachmodelle (LLMs) wie GPT-4 und ihre Open-Source-Äquivalente generieren den textuellen Inhalt von Betrugsdokumenten: Namen, die zum angegebenen Land passen, plausible Adressen, Steuer-Identifikationsnummern, die algorithmische Prüfungen bestehen, und Gehaltsbeträge, die mit dem fiktiven Tarifvertrag übereinstimmen. In Kombination mit Layoutsoftware (LibreOffice, Adobe Acrobat) ermöglichen sie die Serienproduktion gefälschter Gehaltsabrechnungen oder Kontoauszüge.

Laut dem ACFE-Bericht 2024 an die Nationen werden nur 37 % des Dokumentenbetrugs durch direkte menschliche Kontrolle erkannt. Die manuelle Überprüfung ist strukturell unzureichend gegenüber diesen Techniken.

Häufigste durch KI gefälschte Dokumenttypen 2026

Dokumenttyp	Dominante KI-Technik	Charakteristisches Erkennungssignal
Personalausweis / Reisepass	GAN oder Diffusionsmodell	Frequenzartefakte, nicht-konforme Schriftarten
Gehaltsabrechnung	LLM + PDF-Vorlage	Inkonsistenz Sozialabgaben/Nettolohn, Software-Metadaten
Kontoauszug	LLM + Vorlage	Ungültige IBAN, inkonsistente Wertstellungsdaten, fehlende BIC
Zeugnis / Zertifikat	Diffusion + Bearbeitung	Verdächtiges Vektorsiegel, nicht-offizielle Typografie
Lieferantenrechnung	LLM + Vorlage	Ungültige Umsatzsteuer-ID, verdächtig runde Beträge
Adressnachweis	LLM + Anbieterlogo	Nicht-offizieller Briefkopf, Adresse inkonsistent mit Postleitzahldatenbank

Wie Erkennungsmethoden funktionieren

Keine einzelne Erkennungstechnik ist ausreichend. Die Zuverlässigkeit ergibt sich aus ihrer mehrschichtigen Kombination.

Forensische Analyse: ELA und Metadaten

Die Fehlerniveauanalyse (ELA, Error Level Analysis) deckt JPEG-Komprimierungsinkonsistenzen auf: Veränderte Bereiche weisen ein anderes Komprimierungsniveau auf als der Rest des Bildes. Ein KI-generiertes Dokument zeigt typischerweise eine verdächtige Gleichmäßigkeit — entweder zu regelmäßig (synthetisches Bild) oder mit ungleichmäßigen Komprimierungsinseln (Kopier-Einfüge-Operationen).

Die Metadatenanalyse (EXIF für Bilder, XMP/producer für PDFs) legt die verwendete Softwarekette offen: Ein Personalausweis, dessen Metadaten "Adobe Photoshop 2024" als Erstellungswerkzeug angeben, oder eine PDF-Datei, deren Erstellungsdatum vor dem angegebenen Ausstellungsdatum liegt, sind sofort verwertbare Signale.

Im Jahr 2024 identifizierte die ENISA (EU-Agentur für Cybersicherheit) KI-unterstützten Dokumentenbetrug als eine der wichtigsten aufkommenden Bedrohungen in ihrem jährlichen Bedrohungslagebericht.

Erkennung durch spezialisierte ML-Modelle

Faltende neuronale Netze (CNNs), die auf Korpora aus authentischen und gefälschten Dokumenten trainiert wurden, erkennen räumliche Frequenzartefakte, die für das menschliche Auge unsichtbar sind: charakteristische GAN-Oszillationen an Buchstabenrändern, Pixelrasterunregelmäßigkeiten typisch für Diffusionsmodelle, das Fehlen natürlichen Kamerasensorrauschens in synthetisch generierten Gesichtsfotos.

CheckFile setzt eine zusätzliche Schicht von KI-Generierungssignalen als Ergänzung zu bestehenden strukturellen Kontrollen ein — ein Ansatz, der traditionelle Dokumentkohärenzprüfungen ergänzt und entsprechend dem sektoralen Risikoniveau des Kunden kalibriert ist.

Überprüfung physischer Sicherheitsmerkmale

Offizielle Dokumente enthalten Sicherheitsmerkmale, deren digitale Simulation noch immer unvollkommen ist: Beugungshologramme, Offset-Rosettendruck, kinetische Effekttinten, Mikrodruck. Bei der Erfassung über Webcam oder Scanner erzeugen diese Merkmale charakteristische optische Signaturen, die Fälschungen grafisch reproduzieren, aber ohne die physische Dimension — sofort erkennbar durch zertifizierte UV/Infrarot-Sensoren.

Kreuzdatenvalidierung zwischen Dokumenten

Die wirksamste Erkennung kombiniert die Dokumentenanalyse mit der Überprüfung der im Dokument enthaltenen Daten: Dokumentennummer, die im nationalen Register nicht existiert, Inkonsistenz zwischen Geburtsdatum und Sozialversicherungsnummernformat, Arbeitgeber, dessen Handelsregisternummer nicht dem angegebenen Tarifvertrag entspricht, IBAN, deren Ländercode von der angegebenen Bank abweicht. Diese Kreuzprüfungen sind manuell nicht skalierbar durchführbar — sie bilden den Kern einer modernen automatisierten Dokumentenprüfungslösung.

Für einen detaillierten Vergleich von Erkennungsmethoden für synthetische Identitätsdokumente, lesen Sie unsere Analyse zur Deepfake-Dokumentenerkennung.

Bereit, Ihre Prüfungen zu automatisieren?

Kostenloses Pilotprojekt mit Ihren eigenen Dokumenten. Ergebnisse in 48h.

Kostenloses Pilotprojekt anfragen

Das regulatorische Rahmenwerk in Deutschland

Geldwäschegesetz (GwG) und Identifizierungspflichten

Verpflichtete Unternehmen in Deutschland — Kreditinstitute, Versicherungen, Notare, Wirtschaftsprüfer, Immobilienmakler — sind gemäß § 10 Abs. 1 Nr. 1 Geldwäschegesetz (GwG) verpflichtet, die Identität ihrer Kunden anhand verlässlicher Dokumente zu überprüfen. Die BaFin hat in ihren Auslegungs- und Anwendungshinweisen klargestellt, dass diese Pflicht die Bewertung der Zuverlässigkeit der vorgelegten Dokumente umfasst — was ausdrücklich die Erkennung digitaler Fälschungen einschließt.

Das EU-KI-Gesetz (AI Act)

Die EU-KI-Verordnung 2024/1689 (AI Act), in Kraft seit 1. August 2024, verpflichtet in Artikel 50 zur Kennzeichnung aller für die Öffentlichkeit bestimmten KI-generierten synthetischen Inhalte. Systeme zur biometrischen Fernidentifizierung sind als Hochrisikosysteme eingestuft (Anhang III, Nr. 1). Ab dem 2. August 2026 müssen Betreiber Robustheits- und Risikomanagementanforderungen (Artikel 9 bis 15) erfüllen sowie die technische Dokumentation bereithalten.

Das BSI und die KI-Bedrohungslage

Das BSI (Bundesamt für Sicherheit in der Informationstechnik) hat in seinem Lagebericht 2025 ausdrücklich auf die wachsende Bedrohung durch KI-generierte Dokumentenfälschungen hingewiesen und Unternehmen zu technischen Schutzmaßnahmen aufgefordert.

Anwendbare Sanktionen

Der Einsatz gefälschter Dokumente ist in § 267 Strafgesetzbuch (StGB) (Urkundenfälschung) unter Strafe gestellt, mit Freiheitsstrafen bis zu fünf Jahren oder Geldstrafe, bei gewerbsmäßiger Begehung bis zu zehn Jahren Freiheitsstrafe. Verpflichtete Unternehmen, die gefälschte Dokumente nicht erkennen, riskieren BaFin-Bußgelder von bis zu 5 Millionen Euro oder 10 % des Jahresumsatzes bei schwerwiegenden Verstößen gegen das GwG.

Laut dem PwC Global Economic Crime Survey 2024 erlebten 47 % der weltweit befragten Organisationen in den vergangenen zwei Jahren Betrug, wobei Dokumentenbetrug der am schnellsten wachsende Angriffsvektor im Finanzdienstleistungsbereich ist.

Was Fachleute in der Praxis fragen

Compliance-Verantwortliche stellen in Fachforen regelmäßig folgende Fragen:

„Kann eine KI-generierte Gehaltsabrechnung automatisierte OCR-Systeme täuschen?" Ja, in vielen Fällen. LLMs erzeugen konsistente Gehaltszahlen, Arbeitgebernamen und Abzugsberechnungen, die einfache OCR-Extraktion bestehen. Die unterscheidenden Faktoren liegen in Metadaten, statistischen Gehaltsverteilungen und der Kreuzreferenzierung von Arbeitgeberregistrierungsdaten — nicht in der visuellen Inspektion.

„Was sind die zuverlässigsten visuellen Anzeichen eines KI-generierten Dokuments?" Paradoxerweise: übermäßige Bildqualität. KI-generierte Gesichtsfotos zeigen häufig perfekte Schärfe, unnatürliche Gesichtssymmetrie und das Fehlen von Kamerasensorrauschen. Allerdings haben aktuelle Modelle diese Artefakte weitgehend korrigiert — automatisierte forensische Kontrollen sind die einzige zuverlässige Verteidigung im großen Maßstab.

Um die Erkennungsfähigkeit Ihres Teams aufzubauen, lesen Sie unseren Leitfaden dazu, wie Sie Teams schulen, um KI-Dokumente zu erkennen.

Effektive Erkennung in drei Schritten implementieren

Schritt 1 — Risikoexposition kartieren. Ein Online-Kreditantrag ohne persönliche Überprüfung trägt ein strukturell höheres Betrugsrisiko als ein persönlich überreichtes Dokument. Die Risikoanalyse muss Volumen, Erfassungskanal und die Kritikalität der nachgelagerten Entscheidung quantifizieren.

Schritt 2 — Mehrschichtige Lösung implementieren. Effektive Erkennung kombiniert forensische Analyse (ELA, Metadaten), spezialisierte ML-Modelle, Überprüfung von Sicherheitsmerkmalen und Kreuzdatenvalidierung. Einzeltechnologielösungen — nur OCR oder nur Metadatenanalyse — erfassen keine Fälschungen der zweiten Generation.

Schritt 3 — Verfahren für die Prüfung dokumentieren. Die BaFin erwartet vollständige Nachvollziehbarkeit von Prüfentscheidungen: Wer entscheidet, auf welcher Grundlage, mit welchem Instrument, in welchem Zeitrahmen. Diese Dokumentation ist bei Prüfungen erforderlich.

Erfahren Sie, wie CheckFile diese Erkennungsschichten in einen Workflow integriert, der mit Ihren bestehenden KYC-Systemen kompatibel ist — als Ergänzung zu Ihren bestehenden Kontrollen. Sehen Sie sich auch unsere Preise für eine Schätzung basierend auf Ihrem Dokumentenvolumen an.

Für einen vollständigen Überblick über Best Practices zur Dokumentenprüfung, lesen Sie den Leitfaden zur Dokumentenprüfung.

Häufig gestellte Fragen

Was ist genau ein KI-generiertes Dokument?

Ein KI-generiertes Dokument ist eine Datei, deren Inhalt — ganz oder teilweise — von einem generativen KI-Modell (GAN, Diffusionsmodell oder LLM) erstellt wurde. Es kann sich um ein vollständig fiktives Dokument handeln oder um ein echtes Dokument, bei dem bestimmte Felder ersetzt oder verändert wurden. Aktuelle Modelle erzeugen Ergebnisse, die durch visuelle Inspektion nicht von echten Dokumenten zu unterscheiden sind.

Ist die Herstellung gefälschter Dokumente mit KI in Deutschland illegal?

Ja. Die Herstellung oder Verwendung gefälschter Dokumente ist gemäß § 267 StGB (Urkundenfälschung) strafbar, mit Freiheitsstrafe bis zu fünf Jahren oder Geldstrafe. Der Einsatz von KI zur Erzeugung des Dokuments stellt keinen Strafausschließungsgrund dar — der Vorsatz zur Täuschung ist das relevante Tatbestandsmerkmal. Gewerbsmäßige Urkundenfälschung kann zu Freiheitsstrafen bis zu zehn Jahren führen.

Reichen kostenlose Erkennungstools für den professionellen Einsatz aus?

Kostenlose Online-Tools führen typischerweise eine grundlegende forensische Analyse (ELA, Metadaten) durch, die grobe Fälschungen erkennt. Sie sind unzureichend für Fälschungen, die von aktuellen Diffusionsmodellen produziert werden, die minimale erkennbare Artefakte erzeugen. Für professionelle Kontexte mit regulatorischen Verpflichtungen ist eine spezialisierte Lösung erforderlich, die regelmäßig aktualisiert wird.

Welche Dokumenttypen haben das höchste Betrugsrisiko?

Gehaltsabrechnungen für Kreditanträge, Kontoauszüge für Mietverträge und Führerscheine zur Altersverifikation stellen die volumenstärksten Ziele dar. Diese Dokumente verbinden hohe Entscheidungsrisiken mit überwiegend digitalen Einreichungskanälen und schaffen damit optimale Bedingungen für KI-unterstützte Fälschung.

Wie verbessert die Kreuzdatenvalidierung die Erkennungsrate?

Die Kreuzdatenvalidierung überprüft die interne Konsistenz von Daten über mehrere Dokumente in einem Vorgang — zum Beispiel, ob die Handelsregisternummer des Arbeitgebers dem angegebenen Tarifvertrag entspricht, oder ob der Ländercode der IBAN mit der angegebenen Bank übereinstimmt. Diese Schicht erkennt Fälschungen, die visuelle und forensische Analysen bestehen, indem sie logische Inkonsistenzen anstelle von Bildartefakten ausnutzt. Lesen Sie mehr zur CheckFile-Überprüfungsplattform für Implementierungsdetails.

Dieser Artikel dient ausschließlich zu Informationszwecken. Regulatorische Anforderungen variieren je nach Branche und Jurisdiktion. Wenden Sie sich an die BaFin oder einen qualifizierten Compliance-Experten für organisationsspezifische Beratung. Für einen breiteren Überblick, lesen Sie den Leitfaden zur Dokumentenprüfung.

Um diesen Risikobereich im CheckFile-Angebot einzuordnen, siehe unseren Ansatz zur KI- und Deepfake-Erkennung.

Bleiben Sie informiert

Erhalten Sie unsere Compliance-Analysen und Praxisleitfäden direkt in Ihr Postfach.

Bereit, Ihre Prüfungen zu automatisieren?

Kostenloses Pilotprojekt mit Ihren eigenen Dokumenten. Ergebnisse in 48h.

Wie KI gefälschte Dokumente erstellt — und wie man sie erkennt

Wie KI-Modelle gefälschte Dokumente erstellen

Generative adversariale Netzwerke (GAN)

Diffusionsmodelle und Consumer-Werkzeuge

LLMs kombiniert mit Dokumentvorlagen

Häufigste durch KI gefälschte Dokumenttypen 2026

Wie Erkennungsmethoden funktionieren

Forensische Analyse: ELA und Metadaten

Erkennung durch spezialisierte ML-Modelle

Überprüfung physischer Sicherheitsmerkmale

Kreuzdatenvalidierung zwischen Dokumenten

Das regulatorische Rahmenwerk in Deutschland

Geldwäschegesetz (GwG) und Identifizierungspflichten

Das EU-KI-Gesetz (AI Act)

Das BSI und die KI-Bedrohungslage

Anwendbare Sanktionen

Was Fachleute in der Praxis fragen

Effektive Erkennung in drei Schritten implementieren

Häufig gestellte Fragen

Was ist genau ein KI-generiertes Dokument?

Ist die Herstellung gefälschter Dokumente mit KI in Deutschland illegal?

Reichen kostenlose Erkennungstools für den professionellen Einsatz aus?

Welche Dokumenttypen haben das höchste Betrugsrisiko?

Wie verbessert die Kreuzdatenvalidierung die Erkennungsrate?

Bleiben Sie informiert

Bereit, Ihre Prüfungen zu automatisieren?

Verwandte Artikel

Liveness-Erkennung vs. Dokumentenfälschungserkennung: die wichtigsten Unterschiede

Error Level Analysis erklärt: Gefälschte Dokumentbilder erkennen

PDF-Metadaten-Manipulation erkennen: Leitfaden zur Dokumentenprüfung