Checkliste: Anzeichen für KI-generierte oder manipulierte Dokumente
12 konkrete Signale — Metadaten, Text, visuelle Merkmale und Querverweise — zur Erkennung von KI-generierten oder gefälschten Dokumenten. Praxisleitfaden für Compliance- und KYC-Teams.

Diesen Artikel zusammenfassen mit
Ein KI-generiertes oder KI-manipuliertes Dokument hinterlässt charakteristische Spuren auf vier Ebenen: Datei-Metadaten, Textstruktur, visuelle Konsistenz und Überprüfbarkeit der Angaben. Diese Checkliste enthält die 12 zuverlässigsten Signale, nach Fälschungsschwierigkeit geordnet, damit Compliance-, KYC- und Kreditteams verdächtige Unterlagen erkennen, bevor Entscheidungen getroffen werden.
Laut dem ACFE 2024 Report to the Nations werden nur 37 % der Dokumentfälschungen manuell erkannt, mit einer durchschnittlichen Erkennungsverzögerung von 87 Tagen. Generative KI-Tools haben die Zeit zur Erstellung überzeugend gefälschter Dokumente auf Minuten reduziert — was eine systematische Prüfung unerlässlich macht.
Stufe 1 — Datei-Metadaten: Überprüfung in 90 Sekunden
Metadaten sind die erste Schicht, die geprüft werden sollte, denn die meisten KI-Generatoren lassen sie weg oder befüllen sie inkonsistent.
In einem authentischen Dokument einer offiziellen Stelle spiegeln die Metadaten die Produktionskette wider: institutionelle Software, Druckwarteschlange, digitales Zertifikat. Ein KI-generiertes Dokument zeigt typischerweise ein Verbraucherwerkzeug im Feld Producer oder Creator: ChatGPT PDF Export, Canva, PDFCreator oder eine Python-Bibliothek (reportlab, fpdf). Dieses Muster ist in der ENISA Threat Landscape 2024 dokumentiert.
Systematisch zu prüfende Felder:
- Creator / Producer: muss der erwarteten institutionellen Software entsprechen (z. B.
Microsoft Wordfür einen Arbeitsvertrag,SAPfür die Gehaltsabrechnung eines Großunternehmens) - CreationDate vs ModDate: ein Unterschied von nur wenigen Sekunden ist verdächtig; legitime Dokumente haben eine Bearbeitungshistorie
- Author: bei gefälschten Dokumenten oft leer oder mit einem generischen Bezeichner ausgefüllt
- XMP-Metadaten: bei mit einfachen Generierungstools erstellten Dokumenten vollständig absent
Für beigefügte Fotos (KYC-Selfies, Adressnachweise mit Foto): das Fehlen von EXIF-Daten (Gerätemodell, GPS, Aufnahmezeitpunkt) deutet auf ein digital generiertes oder stark beschnittenes Bild hin.
Stufe 2 — Textanomalien typisch für Sprachmodelle
Sprachmodelle wie GPT-4o oder Gemini erzeugen statistisch zu homogenen Text: keine Tippfehler, keine manuellen Korrekturen, keine stilistische Variation zwischen Absätzen. Dieses Signal ist beim ersten Lesen unsichtbar, wird aber bei der Analyse mehrerer Felder desselben Dokuments deutlich.
Zu suchende Signale:
- Einheitliche lexikalische Dichte: eine echte Gehaltsabrechnung enthält Branchenabkürzungen, Tarifvertragsbezeichnungen und nicht standardisierte Berufsbezeichnungen. Eine Fälschung zeigt „sauberen" Text ohne authentischen Fachjargon.
- LLM-Überleitungsphrasen: „Es ist erwähnenswert, dass", „Darüber hinaus", „In diesem Zusammenhang" — Konstruktionen, die in generativem Text im Vergleich zu echten Amtsdokumenten überrepräsentiert sind.
- Zu regelmäßige Referenznummern: zufällig generierte Vertrags-, Rechnungs- oder Steuernummern bestehen oft die Formatprüfung, scheitern aber an der Prüfziffer-Validierung (IBAN: Modulo 97; Steueridentifikationsnummer: eigener Algorithmus der Finanzbehörden).
- Oberflächlich kohärente, aber unmögliche Daten: ein Vertrag unterzeichnet „am 15. März 2024", der auf eine Tarifvertragsversion aus dem Jahr 2025 verweist.
In Compliance-Foren fragen Nutzer häufig: „Wie erkenne ich, ob eine Gehaltsabrechnung mit ChatGPT erstellt wurde?" Die Antwort liegt fast immer darin, zu prüfen, ob die Steueridentifikationsnummer dem Format der Bundeszentralamt für Steuern (BZSt) entspricht, ob die Betriebsnummer des Arbeitgebers bei der Bundesagentur für Arbeit real ist und ob die Abzugskategorien den geltenden Lohnsteuerklassen entsprechen.
Stufe 3 — Visuelle und grafische Signale
Bildgenerierungstools (Midjourney, DALL·E, Stable Diffusion) und automatisierte Layoutmaschinen hinterlassen charakteristische Spuren.
Gemäß EU KI-Verordnung Art. 50 (Verordnung EU 2024/1689) müssen synthetische Inhalte entsprechend gekennzeichnet werden — diese Verpflichtung gilt jedoch nicht rückwirkend für bereits in Umlauf gebrachte Dokumente.
Visuelle Prüfpunkte:
- Zu perfekte Ausrichtung: gedruckte und gescannte Dokumente zeigen eine leichte Rotation (0,5°–2°). Ein digital generiertes Dokument ist perfekt gerade, ohne Perspektivverzerrung.
- Inkonsistente Auflösung und Komprimierung: hochauflösende Logos auf einem Formular mit verschwommenem Fließtext oder umgekehrt.
- Stempel und Unterschriften: ein amtlicher Stempel zeigt Tintenunregelmäßigkeiten und eine leichte Verformung. Ein KI-generierter Stempel ist ein perfekter Kreis mit einer perfekt zentrierten Schrift.
- Fehlende Papiertextur: Fotos echter Dokumente zeigen Papierkörnung, Reflexionen und Schlagschatten. KI-Dokumente sind gleichmäßig flach.
- Fotos in Ausweisdokumenten: zu glatte Haut, übermäßige Gesichtssymmetrie, zu scharfe Haarkanten — Merkmale eines Deepfake-Bildes. Siehe unseren Artikel zur Deepfake-Erkennung in Dokumenten.
Bereit, Ihre Prüfungen zu automatisieren?
Kostenloses Pilotprojekt mit Ihren eigenen Dokumenten. Ergebnisse in 48h.
Kostenloses Pilotprojekt anfragenStufe 4 — Inkonsistenzen bei Querverweis-Daten
Ein Dokument kann nicht isoliert verifiziert werden. Die Konsistenz zwischen internen Feldern und extern verifizierbarer Realität ist die schwierigste Hürde für Fälscher.
Wesentliche Querverweise:
- Handelsregisternummer: Abgleich über das Unternehmensregister — die Nummer muss existieren, dem genannten Unternehmen entsprechen und zum Dokumentdatum aktiv sein
- Adresse: Abgleich über das Bundesmelderegister oder lokale Adressverzeichnisse — eine nicht existierende Anschrift ist ein starkes Signal
- USt-IdNr.: Überprüfung über das EU-VIES-System der Europäischen Kommission oder das Bundeszentralamt für Steuern
- IBAN: der BIC-Code muss einem aktiven Kreditinstitut entsprechen; der IBAN besteht die Modulo-97-Prüfung
Übersichtstabelle: Signale nach Dokumenttyp
| Dokumenttyp | Prioritätssignal | Empfohlene Prüfung |
|---|---|---|
| Gehaltsabrechnung | Korrekter Tarifvertrag, Beiträge gemäß gesetzlichen Sätzen | Sozialversicherungsbeiträge und Lohnsteuertabellen prüfen |
| Kontoauszug | Anfangssaldo = Endsaldo des Vormonats | Mit anderen Auszügen des gleichen Kontos abgleichen |
| Lieferantenrechnung | Gültige Steuernummer, aktive USt-IdNr. | Unternehmensregister + VIES |
| Ausweisdokument | Amtliche Schrift, kohärente MRZ-Zone | Mit ICAO-Referenzmustern vergleichen |
| Adressnachweis | Existierende Adresse, authentisches Anbieterlogo | Adressverzeichnis + visuelle Logoprüfung |
| Handelsregisterauszug | Kohärente Registernummer, Gründungsdatum | Unternehmensregister direkte Abfrage |
| Zeugnis / Zertifikat | Überprüfbare Urkundennummer, Unterschrift der zuständigen Person | Bestätigung durch ausstellende Einrichtung |
Systematisches Prüfverfahren
Compliance- und KYC-Teams, die große Dokumentenmengen verarbeiten — insbesondere im Rahmen der Pflichten des Geldwäschegesetzes (GwG) und der Leitlinien der BaFin — können diese vollständige Checkliste nicht manuell auf jedes Dokument anwenden.
Das empfohlene Verfahren folgt einem dreistufigen Triage-Modell:
- Automatisierte Filterung (Stufen 1 + 4): Metadaten-Extraktion und Prüfziffer-Validierung über API — dieser Schritt kann Hunderte von Dokumenten pro Stunde verarbeiten
- Unterstützte forensische Analyse (Stufen 2 + 3): gezielte Sichtprüfung der vom automatischen Filter markierten Dokumente
- Verstärkte manuelle Prüfung: für Hochrisiko-Dossiers direkte Verifikation bei der ausstellenden Behörde
Unsere Plattform unterstützt mehr als 3.200 Dokumenttypen in 32 Rechtssystemen und ermöglicht so einen strukturellen Echtzeit-Vergleich bei der Prüfung. Besuchen Sie die KI-Dokumentenerkennungsseite, um zu sehen, wie diese Erkennungsschicht in Ihre bestehenden Kontrollen integriert werden kann.
Typische Fehler bei der manuellen Prüfung
Selbst erfahrene Prüfer übersehen regelmäßig drei Kategorien von Fälschungssignalen: erstens Prüfziffer-Fehler, die nur durch algorithmische Kontrolle erkennbar sind; zweitens inkonsistente Lohnsteuertabellen, die ohne aktuellen Zugriff auf die BMF-Veröffentlichungen nicht identifiziert werden können; drittens subtile Metadaten-Abweichungen, die im normalen PDF-Viewer nicht angezeigt werden.
Der PwC Global Economic Crime Survey 2024 zeigt, dass 47 % der deutschen Unternehmen in den letzten zwei Jahren Opfer von Wirtschaftskriminalität wurden — darunter ein wachsender Anteil digitaler Dokumentenfälschungen.
Warum menschliche Erkennung allein nicht ausreicht
KI-Tools generieren mittlerweile Dokumente, die die Sichtprüfung der meisten Analysten bestehen, wie in der ENISA Threat Landscape 2024 dokumentiert. Die Prüfziffer einer Handelsregisternummer, die Struktur der MRZ-Zone eines Reisepasses, die Konsistenz der Sozialabgaben auf einer Gehaltsabrechnung — diese Prüfungen erfordern algorithmische Berechnungen, die das menschliche Auge nicht in Sekunden durchführen kann.
Der Europol Internet Organised Crime Threat Assessment (IOCTA) 2024 verweist auf einen deutlichen Anstieg KI-gestützter Dokumentenfälschungen im europäischen Finanzsektor, die insbesondere digitale Onboarding- und Online-Kreditprozesse zum Ziel haben.
Für vertiefte Einblicke in Generierungstechniken lesen Sie unsere Analyse über wie KI gefälschte Dokumente erstellt und die Bedrohungen durch LLMs wie ChatGPT.
Die Automatisierung dieser Prüfungen mit einer Speziallösung — mit auf Ihren Sektor zugeschnittenen Lösungen — reduziert unentdeckten Betrug bei gleichzeitig reibungslosem Nutzererlebnis. Lesen Sie unseren Leitfaden zur Dokumentenprüfung für einen vollständigen Überblick der verfügbaren Methoden und informieren Sie sich über unsere Preise.
Häufig gestellte Fragen
Kann ein KI-Erkennungstool alle gefälschten Dokumente identifizieren?
Nein. KI-Erkennungstools erzielen gute Ergebnisse bei bekannten Dokumenttypen, stoßen aber bei völlig neuen Formaten oder mit sehr neuen Tools generierten Dokumenten an Grenzen. Die mehrschichtige Erkennung (Metadaten + Struktur + Querverweise) bleibt die robusteste Methode.
Beweist eine gültige Handelsregisternummer in einem Dokument dessen Echtheit?
Nein. Ein Fälscher kann eine existierende Nummer eines echten Unternehmens kopieren. Die Prüfung muss die Nummer mit dem Unternehmensnamen, der Adresse und dem Geschäftszweck in amtlichen Registern abgleichen — nicht nur das Zahlenformat validieren.
Lassen sich Bank-PDF-Kontoauszüge leicht mit KI fälschen?
Ja. LLMs können in Sekunden syntaktisch kohärente Auszüge erstellen. Fälschungssignale sind: nicht-kumulierte Salden zwischen Monaten, zu kurze oder zu lange Transaktionsreferenzen und fehlende Bankreferenznummern im SEPA-Format.
Welche deutsche Rechtsnorm regelt die Dokumentenprüfung im KYC-Kontext?
Dokumentenprüfungspflichten im KYC-Bereich leiten sich aus dem Geldwäschegesetz (GwG), den BaFin-Leitlinien und der bevorstehenden AMLD6-Umsetzung ab. Jedes Verpflichtetes Unternehmen muss Prüfnachweise fünf Jahre nach Beendigung der Geschäftsbeziehung aufbewahren.
Wie wird ein verdächtiges KI-generiertes Dokument gemeldet?
In Deutschland ist der Verdacht auf Geldwäsche im Zusammenhang mit einem gefälschten Dokument der Zentralstelle für Finanztransaktionsuntersuchungen (FIU) über die Goaml-Plattform zu melden. Die Erkennung eines KI-generierten Dokuments kann einen hinreichenden Anfangsverdacht für die Einleitung dieses Verfahrens darstellen.
Um diesen Risikobereich im CheckFile-Angebot einzuordnen, siehe unseren Ansatz zur KI- und Deepfake-Erkennung.
Bleiben Sie informiert
Erhalten Sie unsere Compliance-Analysen und Praxisleitfäden direkt in Ihr Postfach.