Leitfaden7 min Lesezeit

Checkliste: Anzeichen für KI-generierte oder manipulierte Dokumente

12 konkrete Signale — Metadaten, Text, visuelle Merkmale und Querverweise — zur Erkennung von KI-generierten oder gefälschten Dokumenten. Praxisleitfaden für Compliance- und KYC-Teams.

Das CheckFile-Team·29. Juni 2026

Illustration for Checkliste: Anzeichen für KI-generierte oder manipulierte Dokumente — Leitfaden

Diesen Artikel zusammenfassen mit

Ein KI-generiertes oder KI-manipuliertes Dokument hinterlässt charakteristische Spuren auf vier Ebenen: Datei-Metadaten, Textstruktur, visuelle Konsistenz und Überprüfbarkeit der Angaben. Diese Checkliste enthält die 12 zuverlässigsten Signale, nach Fälschungsschwierigkeit geordnet, damit Compliance-, KYC- und Kreditteams verdächtige Unterlagen erkennen, bevor Entscheidungen getroffen werden.

Laut dem ACFE 2024 Report to the Nations werden nur 37 % der Dokumentfälschungen manuell erkannt, mit einer durchschnittlichen Erkennungsverzögerung von 87 Tagen. Generative KI-Tools haben die Zeit zur Erstellung überzeugend gefälschter Dokumente auf Minuten reduziert — was eine systematische Prüfung unerlässlich macht.

Stufe 1 — Datei-Metadaten: Überprüfung in 90 Sekunden

Metadaten sind die erste Schicht, die geprüft werden sollte, denn die meisten KI-Generatoren lassen sie weg oder befüllen sie inkonsistent.

In einem authentischen Dokument einer offiziellen Stelle spiegeln die Metadaten die Produktionskette wider: institutionelle Software, Druckwarteschlange, digitales Zertifikat. Ein KI-generiertes Dokument zeigt typischerweise ein Verbraucherwerkzeug im Feld Producer oder Creator: ChatGPT PDF Export, Canva, PDFCreator oder eine Python-Bibliothek (reportlab, fpdf). Dieses Muster ist in der ENISA Threat Landscape 2024 dokumentiert.

Systematisch zu prüfende Felder:

Creator / Producer: muss der erwarteten institutionellen Software entsprechen (z. B. Microsoft Word für einen Arbeitsvertrag, SAP für die Gehaltsabrechnung eines Großunternehmens)
CreationDate vs ModDate: ein Unterschied von nur wenigen Sekunden ist verdächtig; legitime Dokumente haben eine Bearbeitungshistorie
Author: bei gefälschten Dokumenten oft leer oder mit einem generischen Bezeichner ausgefüllt
XMP-Metadaten: bei mit einfachen Generierungstools erstellten Dokumenten vollständig absent

Für beigefügte Fotos (KYC-Selfies, Adressnachweise mit Foto): das Fehlen von EXIF-Daten (Gerätemodell, GPS, Aufnahmezeitpunkt) deutet auf ein digital generiertes oder stark beschnittenes Bild hin.

Stufe 2 — Textanomalien typisch für Sprachmodelle

Sprachmodelle wie GPT-4o oder Gemini erzeugen statistisch zu homogenen Text: keine Tippfehler, keine manuellen Korrekturen, keine stilistische Variation zwischen Absätzen. Dieses Signal ist beim ersten Lesen unsichtbar, wird aber bei der Analyse mehrerer Felder desselben Dokuments deutlich.

Zu suchende Signale:

Einheitliche lexikalische Dichte: eine echte Gehaltsabrechnung enthält Branchenabkürzungen, Tarifvertragsbezeichnungen und nicht standardisierte Berufsbezeichnungen. Eine Fälschung zeigt „sauberen" Text ohne authentischen Fachjargon.
LLM-Überleitungsphrasen: „Es ist erwähnenswert, dass", „Darüber hinaus", „In diesem Zusammenhang" — Konstruktionen, die in generativem Text im Vergleich zu echten Amtsdokumenten überrepräsentiert sind.
Zu regelmäßige Referenznummern: zufällig generierte Vertrags-, Rechnungs- oder Steuernummern bestehen oft die Formatprüfung, scheitern aber an der Prüfziffer-Validierung (IBAN: Modulo 97; Steueridentifikationsnummer: eigener Algorithmus der Finanzbehörden).
Oberflächlich kohärente, aber unmögliche Daten: ein Vertrag unterzeichnet „am 15. März 2024", der auf eine Tarifvertragsversion aus dem Jahr 2025 verweist.

In Compliance-Foren fragen Nutzer häufig: „Wie erkenne ich, ob eine Gehaltsabrechnung mit ChatGPT erstellt wurde?" Die Antwort liegt fast immer darin, zu prüfen, ob die Steueridentifikationsnummer dem Format der Bundeszentralamt für Steuern (BZSt) entspricht, ob die Betriebsnummer des Arbeitgebers bei der Bundesagentur für Arbeit real ist und ob die Abzugskategorien den geltenden Lohnsteuerklassen entsprechen.

Stufe 3 — Visuelle und grafische Signale

Bildgenerierungstools (Midjourney, DALL·E, Stable Diffusion) und automatisierte Layoutmaschinen hinterlassen charakteristische Spuren.

Gemäß EU KI-Verordnung Art. 50 (Verordnung EU 2024/1689) müssen synthetische Inhalte entsprechend gekennzeichnet werden — diese Verpflichtung gilt jedoch nicht rückwirkend für bereits in Umlauf gebrachte Dokumente.

Visuelle Prüfpunkte:

Zu perfekte Ausrichtung: gedruckte und gescannte Dokumente zeigen eine leichte Rotation (0,5°–2°). Ein digital generiertes Dokument ist perfekt gerade, ohne Perspektivverzerrung.
Inkonsistente Auflösung und Komprimierung: hochauflösende Logos auf einem Formular mit verschwommenem Fließtext oder umgekehrt.
Stempel und Unterschriften: ein amtlicher Stempel zeigt Tintenunregelmäßigkeiten und eine leichte Verformung. Ein KI-generierter Stempel ist ein perfekter Kreis mit einer perfekt zentrierten Schrift.
Fehlende Papiertextur: Fotos echter Dokumente zeigen Papierkörnung, Reflexionen und Schlagschatten. KI-Dokumente sind gleichmäßig flach.
Fotos in Ausweisdokumenten: zu glatte Haut, übermäßige Gesichtssymmetrie, zu scharfe Haarkanten — Merkmale eines Deepfake-Bildes. Siehe unseren Artikel zur Deepfake-Erkennung in Dokumenten.

Bereit, Ihre Prüfungen zu automatisieren?

Kostenloses Pilotprojekt mit Ihren eigenen Dokumenten. Ergebnisse in 48h.

Kostenloses Pilotprojekt anfragen

Stufe 4 — Inkonsistenzen bei Querverweis-Daten

Ein Dokument kann nicht isoliert verifiziert werden. Die Konsistenz zwischen internen Feldern und extern verifizierbarer Realität ist die schwierigste Hürde für Fälscher.

Wesentliche Querverweise:

Handelsregisternummer: Abgleich über das Unternehmensregister — die Nummer muss existieren, dem genannten Unternehmen entsprechen und zum Dokumentdatum aktiv sein
Adresse: Abgleich über das Bundesmelderegister oder lokale Adressverzeichnisse — eine nicht existierende Anschrift ist ein starkes Signal
USt-IdNr.: Überprüfung über das EU-VIES-System der Europäischen Kommission oder das Bundeszentralamt für Steuern
IBAN: der BIC-Code muss einem aktiven Kreditinstitut entsprechen; der IBAN besteht die Modulo-97-Prüfung

Übersichtstabelle: Signale nach Dokumenttyp

Dokumenttyp	Prioritätssignal	Empfohlene Prüfung
Gehaltsabrechnung	Korrekter Tarifvertrag, Beiträge gemäß gesetzlichen Sätzen	Sozialversicherungsbeiträge und Lohnsteuertabellen prüfen
Kontoauszug	Anfangssaldo = Endsaldo des Vormonats	Mit anderen Auszügen des gleichen Kontos abgleichen
Lieferantenrechnung	Gültige Steuernummer, aktive USt-IdNr.	Unternehmensregister + VIES
Ausweisdokument	Amtliche Schrift, kohärente MRZ-Zone	Mit ICAO-Referenzmustern vergleichen
Adressnachweis	Existierende Adresse, authentisches Anbieterlogo	Adressverzeichnis + visuelle Logoprüfung
Handelsregisterauszug	Kohärente Registernummer, Gründungsdatum	Unternehmensregister direkte Abfrage
Zeugnis / Zertifikat	Überprüfbare Urkundennummer, Unterschrift der zuständigen Person	Bestätigung durch ausstellende Einrichtung

Systematisches Prüfverfahren

Compliance- und KYC-Teams, die große Dokumentenmengen verarbeiten — insbesondere im Rahmen der Pflichten des Geldwäschegesetzes (GwG) und der Leitlinien der BaFin — können diese vollständige Checkliste nicht manuell auf jedes Dokument anwenden.

Das empfohlene Verfahren folgt einem dreistufigen Triage-Modell:

Automatisierte Filterung (Stufen 1 + 4): Metadaten-Extraktion und Prüfziffer-Validierung über API — dieser Schritt kann Hunderte von Dokumenten pro Stunde verarbeiten
Unterstützte forensische Analyse (Stufen 2 + 3): gezielte Sichtprüfung der vom automatischen Filter markierten Dokumente
Verstärkte manuelle Prüfung: für Hochrisiko-Dossiers direkte Verifikation bei der ausstellenden Behörde

Unsere Plattform unterstützt mehr als 3.200 Dokumenttypen in 32 Rechtssystemen und ermöglicht so einen strukturellen Echtzeit-Vergleich bei der Prüfung. Besuchen Sie die KI-Dokumentenerkennungsseite, um zu sehen, wie diese Erkennungsschicht in Ihre bestehenden Kontrollen integriert werden kann.

Typische Fehler bei der manuellen Prüfung

Selbst erfahrene Prüfer übersehen regelmäßig drei Kategorien von Fälschungssignalen: erstens Prüfziffer-Fehler, die nur durch algorithmische Kontrolle erkennbar sind; zweitens inkonsistente Lohnsteuertabellen, die ohne aktuellen Zugriff auf die BMF-Veröffentlichungen nicht identifiziert werden können; drittens subtile Metadaten-Abweichungen, die im normalen PDF-Viewer nicht angezeigt werden.

Der PwC Global Economic Crime Survey 2024 zeigt, dass 47 % der deutschen Unternehmen in den letzten zwei Jahren Opfer von Wirtschaftskriminalität wurden — darunter ein wachsender Anteil digitaler Dokumentenfälschungen.

Warum menschliche Erkennung allein nicht ausreicht

KI-Tools generieren mittlerweile Dokumente, die die Sichtprüfung der meisten Analysten bestehen, wie in der ENISA Threat Landscape 2024 dokumentiert. Die Prüfziffer einer Handelsregisternummer, die Struktur der MRZ-Zone eines Reisepasses, die Konsistenz der Sozialabgaben auf einer Gehaltsabrechnung — diese Prüfungen erfordern algorithmische Berechnungen, die das menschliche Auge nicht in Sekunden durchführen kann.

Der Europol Internet Organised Crime Threat Assessment (IOCTA) 2024 verweist auf einen deutlichen Anstieg KI-gestützter Dokumentenfälschungen im europäischen Finanzsektor, die insbesondere digitale Onboarding- und Online-Kreditprozesse zum Ziel haben.

Für vertiefte Einblicke in Generierungstechniken lesen Sie unsere Analyse über wie KI gefälschte Dokumente erstellt und die Bedrohungen durch LLMs wie ChatGPT.

Die Automatisierung dieser Prüfungen mit einer Speziallösung — mit auf Ihren Sektor zugeschnittenen Lösungen — reduziert unentdeckten Betrug bei gleichzeitig reibungslosem Nutzererlebnis. Lesen Sie unseren Leitfaden zur Dokumentenprüfung für einen vollständigen Überblick der verfügbaren Methoden und informieren Sie sich über unsere Preise.

Häufig gestellte Fragen

Kann ein KI-Erkennungstool alle gefälschten Dokumente identifizieren?

Nein. KI-Erkennungstools erzielen gute Ergebnisse bei bekannten Dokumenttypen, stoßen aber bei völlig neuen Formaten oder mit sehr neuen Tools generierten Dokumenten an Grenzen. Die mehrschichtige Erkennung (Metadaten + Struktur + Querverweise) bleibt die robusteste Methode.

Beweist eine gültige Handelsregisternummer in einem Dokument dessen Echtheit?

Nein. Ein Fälscher kann eine existierende Nummer eines echten Unternehmens kopieren. Die Prüfung muss die Nummer mit dem Unternehmensnamen, der Adresse und dem Geschäftszweck in amtlichen Registern abgleichen — nicht nur das Zahlenformat validieren.

Lassen sich Bank-PDF-Kontoauszüge leicht mit KI fälschen?

Ja. LLMs können in Sekunden syntaktisch kohärente Auszüge erstellen. Fälschungssignale sind: nicht-kumulierte Salden zwischen Monaten, zu kurze oder zu lange Transaktionsreferenzen und fehlende Bankreferenznummern im SEPA-Format.

Welche deutsche Rechtsnorm regelt die Dokumentenprüfung im KYC-Kontext?

Dokumentenprüfungspflichten im KYC-Bereich leiten sich aus dem Geldwäschegesetz (GwG), den BaFin-Leitlinien und der bevorstehenden AMLD6-Umsetzung ab. Jedes Verpflichtetes Unternehmen muss Prüfnachweise fünf Jahre nach Beendigung der Geschäftsbeziehung aufbewahren.

Wie wird ein verdächtiges KI-generiertes Dokument gemeldet?

In Deutschland ist der Verdacht auf Geldwäsche im Zusammenhang mit einem gefälschten Dokument der Zentralstelle für Finanztransaktionsuntersuchungen (FIU) über die Goaml-Plattform zu melden. Die Erkennung eines KI-generierten Dokuments kann einen hinreichenden Anfangsverdacht für die Einleitung dieses Verfahrens darstellen.

Um diesen Risikobereich im CheckFile-Angebot einzuordnen, siehe unseren Ansatz zur KI- und Deepfake-Erkennung.

Bleiben Sie informiert

Erhalten Sie unsere Compliance-Analysen und Praxisleitfäden direkt in Ihr Postfach.

Bereit, Ihre Prüfungen zu automatisieren?

Kostenloses Pilotprojekt mit Ihren eigenen Dokumenten. Ergebnisse in 48h.

Checkliste: Anzeichen für KI-generierte oder manipulierte Dokumente

Stufe 1 — Datei-Metadaten: Überprüfung in 90 Sekunden

Stufe 2 — Textanomalien typisch für Sprachmodelle

Stufe 3 — Visuelle und grafische Signale

Stufe 4 — Inkonsistenzen bei Querverweis-Daten

Übersichtstabelle: Signale nach Dokumenttyp

Systematisches Prüfverfahren

Typische Fehler bei der manuellen Prüfung

Warum menschliche Erkennung allein nicht ausreicht

Häufig gestellte Fragen

Kann ein KI-Erkennungstool alle gefälschten Dokumente identifizieren?

Beweist eine gültige Handelsregisternummer in einem Dokument dessen Echtheit?

Lassen sich Bank-PDF-Kontoauszüge leicht mit KI fälschen?

Welche deutsche Rechtsnorm regelt die Dokumentenprüfung im KYC-Kontext?

Wie wird ein verdächtiges KI-generiertes Dokument gemeldet?

Bleiben Sie informiert

Bereit, Ihre Prüfungen zu automatisieren?

Verwandte Artikel

Gefälschte Dokumente durch LLM und ChatGPT: die neue Betrugsgefahr

Wie KI gefälschte Dokumente erstellt — und wie man sie erkennt

Liveness-Erkennung vs. Dokumentenfälschungserkennung: die wichtigsten Unterschiede