Dokumentenfälschung-Erkennung API: Integrationsleitfaden 2026
API zur Erkennung von Dokumentenfälschungen in Ihre Workflows integrieren. OAuth 2.0 Authentifizierung, Endpunkte, Webhooks, Confidence-Scores und DSGVO/BaFin-Compliance.

Diesen Artikel zusammenfassen mit
Eine Dokumentenfälschung-Erkennungs-API ist eine programmatische Schnittstelle, über die Entwickler Ausweisdokumente, Kontoauszüge, Gehaltsabrechnungen oder Verträge einreichen und strukturierte Prüfergebnisse erhalten — Echtheitsprüfungen, Manipulationserkennung, Metadatenanalyse und KI-generierte Inhaltsflags — ohne die zugrundeliegenden forensischen Modelle selbst trainieren zu müssen. Im Jahr 2026 ist diese Technologie keine optionale Ergänzung mehr, sondern eine regulatorische und operative Notwendigkeit: Der ACFE Report to the Nations 2024 dokumentiert, dass manuelle Prüfverfahren nur 37 % der gefälschten Dokumente zuverlässig identifizieren. Gleichzeitig zeigt die PwC Global Economic Crime and Fraud Survey 2025, dass 69 % der deutschen und europäischen Unternehmen in den vergangenen zwei Jahren von Betrug betroffen waren — ein erheblicher Anteil davon über gefälschte Dokumente.
Dieser Leitfaden richtet sich an Backend-Entwickler, Compliance-Architekten und technische Leiter, die eine API zur Erkennung von Dokumentenfälschungen in Produktionsworkflows integrieren möchten. Er behandelt Authentifizierung, Kern-Endpunkte, Webhook-Konfiguration, Confidence-Score-Interpretation und regulatorische Anforderungen gemäß DSGVO, GwG und BaFin.
Warum eine API zur Erkennung von Dokumentenfälschungen integrieren?
Eine API zur Erkennung von Dokumentenfälschungen automatisiert die Prüfung gefälschter, manipulierter oder KI-generierter Dokumente in Echtzeit — und ersetzt fehleranfällige manuelle Prozesse durch skalierbare, auditierbare Entscheidungslogik. Die Entscheidung für eine API-Integration ist 2026 durch drei Faktoren getrieben: steigende Betrugsraten, regulatorische Verschärfungen und technologische Entwicklungen bei synthetischen Medien.
Statistisches Lagebild. Gemäß dem ACFE Report to the Nations 2024 erkennen geschulte Sachbearbeiter im Median nur 37 % der manipulierten Dokumente korrekt — selbst bei regelmäßigen Schulungen. Der mediane Schaden pro Betrugsfall durch gefälschte Dokumente beträgt weltweit 1,7 Millionen US-Dollar. Die PwC Global Economic Crime Survey 2025 zeigt, dass 69 % der befragten Unternehmen in Deutschland und Europa mindestens einen Betrugsvorfall in den letzten 24 Monaten verzeichneten. KI-generierte Dokumentenfälschungen — erzeugt über Deepfake-Werkzeuge und generative Bildmodelle — haben sich in diesem Zeitraum nach Branchenerhebungen mehr als verdoppelt.
Regulatorische Treiber. Das Geldwäschegesetz (GwG) § 8 verpflichtet alle verpflichteten Unternehmen zur Aufzeichnung und Dokumentation ihrer Sorgfaltspflichten bei der Kundenidentifizierung — mit Nachweispflicht gegenüber der BaFin. Die BaFin (Bundesanstalt für Finanzdienstleistungsaufsicht) hat die Anforderungen an automatisierte Erkennungssysteme in ihren MaRisk-Rundschreiben 2023 und 2024 präzisiert. Zusätzlich klassifiziert die KI-Verordnung der EU (Verordnung (EU) 2024/1689) KI-Systeme zur Identitätsdokumentenprüfung im Finanzdienstleistungsbereich als Hochrisiko-KI-Systeme gemäß Art. 6 und Anhang III — mit weitreichenden Konformitätspflichten für Anbieter und Nutzer.
Technische Architektur: Wie die API-Integration funktioniert
Die CheckFile-API kommuniziert über REST over HTTPS und verwendet den OAuth 2.0 Client Credentials Flow für die Maschine-zu-Maschine-Authentifizierung — kein Benutzerlogin erforderlich, kein Browser-Redirect, nur ein programmatischer Token-Austausch zwischen Ihren Servern und dem API-Gateway.
Authentifizierungsablauf. Sie übermitteln client_id und client_secret an den Token-Endpunkt und erhalten ein Bearer-Token mit 3.600 Sekunden Gültigkeit. Dieses Token fügen Sie in den Authorization-Header jedes nachfolgenden Requests ein. Der gesamte Verkehr ist mit TLS 1.3 verschlüsselt; Dokumente werden im Ruhezustand mit AES-256 gesichert, gemäß den Vorgaben aus Art. 32 DSGVO.
# Token anfordern
curl -X POST https://api.checkfile.ai/oauth/token \
-H "Content-Type: application/x-www-form-urlencoded" \
-d "grant_type=client_credentials&client_id=IHRE_CLIENT_ID&client_secret=IHR_SECRET"
# Antwort
{
"access_token": "eyJhbGciOiJSUzI1NiIsInR5cCI6IkpXVCJ9...",
"token_type": "Bearer",
"expires_in": 3600
}
Synchrone vs. asynchrone Verarbeitung. Für einfache Integrationen mit niedrigem Volumen (bis 60 Requests/Minute) eignet sich das synchrone Polling-Muster: Dokument einreichen, document_id empfangen, alle zwei Sekunden den Status abfragen. Für Produktionsworkflows mit höherem Durchsatz ist das asynchrone Webhook-Muster empfohlen: Das Dokument wird eingereicht, die weitere Verarbeitung erfolgt im Hintergrund, und sobald das Ergebnis vorliegt, sendet die API einen signierten HTTP-POST an Ihren konfigurierten Webhook-Endpunkt.
Webhook-Sicherheit. Jede Webhook-Zustellung enthält einen X-CheckFile-Signature-Header mit einem HMAC-SHA256-Hash des Payloads, signiert mit Ihrem Webhook-Secret. Validieren Sie diesen Hash serverseitig vor jeder Weiterverarbeitung, um Replay-Angriffe auszuschließen.
Kern-Endpunkte und Anfrageformat
Der primäre Einreichungsendpunkt lautet POST /v1/documents/analyze für die synchrone und asynchrone Dokumentenanalyse; GET /v1/results/{id} dient dem asynchronen Polling, wenn kein Webhook konfiguriert ist.
| Endpunkt | HTTP-Methode | Beschreibung | Antwortzeit (P50) |
|---|---|---|---|
/v1/documents/analyze |
POST | Dokument zur Fälschungserkennung einreichen | 202 Accepted, sofort |
/v1/results/{id} |
GET | Analyseergebnis per ID abrufen | < 100 ms |
/v1/documents/analyze/batch |
POST | Bis zu 50 Dokumente gleichzeitig einreichen | 202 Accepted, sofort |
/v1/webhooks |
POST | Webhook-Endpunkt registrieren | < 200 ms |
/v1/webhooks/{id} |
DELETE | Webhook-Registrierung entfernen | < 200 ms |
Beispiel-Request (Dokumenteinreichung):
POST /v1/documents/analyze
Content-Type: multipart/form-data
Authorization: Bearer {token}
# Felder:
# file (erforderlich) — Bild oder PDF, max. 20 MB
# document_type (optional) — "personalausweis", "reisepass", "kontoauszug"
# country (optional) — ISO 3166-1 Alpha-2, z. B. "DE"
# webhook_url (optional) — Callback-URL für asynchrone Zustellung
# reference_id (optional) — Ihre interne Vorgangsreferenz
Beispiel-Antwort (Fälschungserkennung abgeschlossen):
{
"document_id": "doc_a4f7e2c9b1",
"status": "completed",
"document_type": "personalausweis",
"country": "DE",
"forgery_analysis": {
"is_forged": false,
"confidence_score": 94,
"risk_level": "low",
"signals": [],
"checks": {
"metadata_consistency": true,
"font_integrity": true,
"mrz_checksum_valid": true,
"deepfake_detected": false,
"print_pattern_authentic": true,
"security_features_present": true
}
},
"extracted_data": {
"full_name": "Klaus Berger",
"date_of_birth": "1985-03-22",
"document_number": "L01X00T47",
"expiry_date": "2032-03-21",
"nationality": "DEU"
},
"processing_time_ms": 3210,
"created_at": "2026-06-19T09:41:00Z",
"completed_at": "2026-06-19T09:41:03.210Z"
}
Die Plattform unterstützt über 3.200 Dokumenttypen in 32 Jurisdiktionen — darunter den deutschen Personalausweis (ePA), Reisepass, Führerschein, Kontoauszüge aller Hauptbanken sowie internationale Äquivalente. Die OCR-Engine verarbeitet Dokumente in 24 Sprachen, was mehrsprachige KYC-Workflows ohne manuelle Sprachvorauswahl ermöglicht.
Bereit, Ihre Prüfungen zu automatisieren?
Kostenloses Pilotprojekt mit Ihren eigenen Dokumenten. Ergebnisse in 48h.
Kostenloses Pilotprojekt anfragenUmgang mit Antworten und Confidence-Scores
Der confidence_score ist ein ganzzahliger Wert von 0 bis 100, der die Sicherheit des Modells über die Authentizität des Dokuments ausdrückt; das risk_level-Feld übersetzt diesen numerischen Wert in vier Handlungsebenen: niedrig, mittel, hoch und kritisch.
| Score-Bereich | Risikoebene | Bedeutung | Empfohlene Maßnahme |
|---|---|---|---|
| 85 – 100 | low |
Dokument sehr wahrscheinlich authentisch | Automatisch freigeben, Ergebnis protokollieren |
| 65 – 84 | medium |
Geringfügige Anomalien festgestellt | Ergebnis in Prüfwarteschlange, optionale Manualprüfung |
| 40 – 64 | high |
Mehrere Auffälligkeiten erkannt | Manuelle Prüfung erforderlich, Vorgang einfrieren |
| 0 – 39 | critical |
Klare Fälschungsindikatoren vorhanden | Vorgang ablehnen, Sicherheitsprotokoll auslösen |
Dokumente mit dem Status review_required (Score 40–64) werden per Webhook an Ihre Prüfwarteschlange weitergeleitet. Das Antwortobjekt enthält in diesem Fall das signals-Array mit maschinenlesbaren Kennzeichnungen — etwa "font_substitution_detected", "mrz_checksum_mismatch" oder "ai_generated_face" — die dem manuellen Prüfer als strukturierter Prüfbericht dienen. Weitere Details zur KI-gestützten Erkennung finden Sie im Artikel KI-Techniken zur Dokumentenbetrug-Erkennung.
Anwendungsfälle nach Branche
API-basierte Dokumentenfälschungserkennung ist branchenübergreifend einsetzbar, sobald Identitäts- oder Finanzdokumente in digitale Workflows eingebunden werden.
| Branche | Typischer Dokumenttyp | Erkennbares Fälschungssignal |
|---|---|---|
| Kreditvergabe / Fintech | Gehaltsabrechnung, Kontoauszug | Schriftart-Substitution, Ziffernmanipulation, Metadaten-Inkonsistenz |
| Versicherungen | Schadensrechnung, Kfz-Zulassung | Pixelartefakte, Stempelfälschung, Datumsmanipulation |
| KYC / Onboarding | Personalausweis, Reisepass | MRZ-Prüfsummenfehler, Deepfake-Foto, fehlende Sicherheitsmerkmale |
| Immobilien | Einkommensnachweis, Mietschuldenfreiheitsbescheinigung | Blanko-Formular-Befüllung, Signaturfälschung, Firmenstempelmissbrauch |
| Personalwesen | Arbeitszeugnis, Hochschulabschluss | Layoutabweichung, fehlendes Briefkopfmerkmal, Druckrasterprüfung |
Für Banken und Finanzinstitute, die regulatorische KYC-Pflichten erfüllen müssen, bietet CheckFile eine spezialisierte Lösung: CheckFile für Banken und KYC. Eine umfassende Übersicht über die gesamte Automatisierungslandschaft der Dokumentenverifizierung liefert der Leitfaden zur Automatisierung der Verifizierung. Ergänzend empfiehlt sich der Integrationsleitfaden für Dokumentenprüfungs-APIs, der die allgemeine API-Architektur im Detail beschreibt.
Compliance: DSGVO, BaFin, GwG und regulatorische Anforderungen
Die KI-Verordnung (EU) 2024/1689, Art. 6 und Anhang III klassifiziert KI-Systeme zur Dokumentenprüfung im Finanzdienstleistungsbereich als Hochrisiko-KI-Systeme — mit verpflichtenden Anforderungen an technische Dokumentation, Risikomanagementsystem, Datengovernance und menschliche Aufsichtsfähigkeiten sowohl für Anbieter als auch für Nutzer.
DSGVO Art. 32 — Technische Sicherheitsmaßnahmen. Die DSGVO (Verordnung (EU) 2016/679, Art. 32) verlangt geeignete technische und organisatorische Maßnahmen zum Schutz personenbezogener Daten bei der Verarbeitung. Die CheckFile-API erfüllt diese Anforderung durch TLS 1.3-Verschlüsselung, AES-256-Verschlüsselung im Ruhezustand, automatische Entfernung personenbezogener Daten aus API-Logs sowie ein konfigurierbares Datenaufbewahrungsfenster von 0 bis 365 Tagen. Ein unterzeichneter Auftragsverarbeitungsvertrag (AVV) gemäß Art. 28 DSGVO wird mit allen Business- und Enterprise-Kunden abgeschlossen. Hinweise zum datenschutzkonformen Umgang mit Ausweisdokumenten finden Sie in den DSGVO-Richtlinien für Ausweisdokumente.
GwG-Pflichten (Sorgfaltspflichten bei der Kundenidentifizierung). Das Geldwäschegesetz (GwG) § 8 verpflichtet alle verpflichteten Unternehmen — Kreditinstitute, Finanzdienstleister, Rechtsanwälte, Notare, Immobilienmakler — zur Aufzeichnung und Aufbewahrung von Belegen über die Identifizierung von Vertragspartnern für mindestens fünf Jahre. Die API stellt für jede Dokumentenprüfung einen unveränderlichen Audit-Datensatz mit Dokument-Hash, Zeitstempel, Prüfergebnis und Client-ID bereit, der direkt als GwG-Dokumentationsnachweis verwendet werden kann.
BaFin-Richtlinien für Finanzinstitute. Die BaFin erwartet von beaufsichtigten Instituten nach MaRisk AT 9 bei der Auslagerung von IT-Dienstleistungen eine vollständige Drittanbieter-Dokumentation: Risikoanalyse, Exit-Strategie, Audit-Rechte und Kontinuitätsnachweise. CheckFile stellt diese Unterlagen für alle Business- und Enterprise-Tarife bereit.
BSI IT-Grundschutz. Das BSI (Bundesamt für Sicherheit in der Informationstechnik) empfiehlt in seinem IT-Grundschutz-Kompendium den Einsatz kryptografisch gesicherter Schnittstellen und auditierter Protokollierungsinfrastruktur für Systeme, die personenbezogene Identitätsdaten verarbeiten. Die API-Architektur von CheckFile ist mit diesen Empfehlungen kongruent und unterstützt die BSI-konforme Dokumentation für Sicherheitskonzepte nach IT-Grundschutz.
Für Organisationen, die KI-generierte Dokumentenfälschungen und Deepfakes gezielt bekämpfen wollen, bietet CheckFile eine spezialisierte Erkennungslösung: Deepfake- und KI-Dokumentenerkennung.
Dieser Artikel dient ausschließlich zu Informationszwecken und stellt keine Rechts-, Finanz- oder Regulierungsberatung dar. Für verbindliche Auskünfte zu GwG-, BaFin- oder DSGVO-Anforderungen wenden Sie sich an qualifizierte Rechts- und Compliance-Experten.
Häufig gestellte Fragen
Was ist eine API zur Erkennung von Dokumentenfälschungen?
Eine API zur Erkennung von Dokumentenfälschungen ist eine programmatische Schnittstelle, über die Softwareanwendungen Dokumente — Ausweise, Kontoauszüge, Zertifikate, Verträge — zur automatisierten Echtheitsprüfung einreichen und strukturierte Ergebnisse mit Confidence-Scores, Risikoebenen und maschinenlesbaren Fälschungssignalen zurückempfangen. Im Unterschied zu manueller Prüfung arbeitet eine solche API in Sekunden, skaliert auf Tausende von Vorgängen pro Stunde und erzeugt einen lückenlosen Audit-Trail für regulatorische Nachweispflichten. Die Plattform analysiert dabei Metadaten, Schriftarten, Sicherheitsmerkmale, MRZ-Prüfsummen und — mit spezialisierten Modellen — KI-generierte Bildmanipulationen.
Wie unterscheidet sich Dokumentenbetrug-Erkennung von Standard-OCR?
Standard-OCR (Optical Character Recognition) extrahiert Text aus einem Dokumentbild — es liest Zeichen, prüft aber nicht, ob das Dokument authentisch ist. Dokumentenbetrug-Erkennung analysiert zusätzlich die Integrität des Dokuments: Schriftarten auf Plausibilität gegenüber echten Vorlagen, Metadaten auf Konsistenz, Sicherheitsmerkmale auf Vorhandensein, Pixelstruktur auf digitale Manipulation und — für Lichtbildausweise wie den deutschen Personalausweis — das Foto auf Deepfake-Indikatoren. Eine OCR-Engine, die "Klaus Berger" aus einem gefälschten Ausweis liest, liefert ein technisch korrektes Ergebnis, während eine Betrugserkennungs-API gleichzeitig feststellt, dass das Dokument mit einem Blanko-Template erstellt wurde.
Ist die API DSGVO- und KI-Verordnungs-konform?
Ja. CheckFile agiert als Auftragsverarbeiter gemäß Art. 28 DSGVO mit unterzeichnetem AVV, EU-basierter Verarbeitungsinfrastruktur und konfigurierbarer Datenaufbewahrung. Die Plattform erfüllt die Anforderungen der KI-Verordnung (EU) 2024/1689 an Hochrisiko-KI-Systeme: vollständige technische Dokumentation, Risikomanagementsystem, Datengovernance-Protokolle und Audit-Logs für menschliche Aufsicht sind standardmäßig in allen Produktionstarifen enthalten. SOC 2 Typ II und ISO 27001-Zertifizierungen decken die API-Infrastruktur ab.
Wie lange dauert die Integration einer Dokumentenfälschung-Erkennungs-API?
Die technische Grundintegration — Token-Austausch, ersten Dokument-Submit, Ergebnis verarbeiten — ist mit den verfügbaren SDKs (Python, Node.js, Java, Go) typischerweise in einem Arbeitstag abgeschlossen. Eine vollständige Produktionsintegration inklusive Webhook-Konfiguration, Fehlerbehandlung, Retry-Logik und internen Freigabeprozessen dauert nach Erfahrungswerten zwei bis fünf Werktage. Organisationen, die parallele Compliance-Dokumentation für BaFin-Auslagerungsnachweise oder DSGVO-Folgenabschätzungen erstellen müssen, sollten zusätzlich zwei bis drei Wochen für den internen Genehmigungsprozess einplanen.
Welche Dateiformate akzeptiert eine API zur Erkennung von Dokumentenfälschungen?
Die CheckFile-API akzeptiert PDF, JPEG, PNG und TIFF mit einer empfohlenen Mindestauflösung von 300 DPI für optimale Erkennungsgenauigkeit. Die maximale Dateigröße pro Dokument beträgt 20 MB. Für Batch-Einreichungen können bis zu 50 Dokumente in einem einzigen Request übermittelt werden. Mehrseiten-PDFs werden vollständig verarbeitet; bei Ausweisdokumenten werden Vorder- und Rückseite als separate Dateien oder als zweiseitiges PDF eingereicht und gemeinsam ausgewertet. Alle Dateiformate werden serverseitig validiert — bei nicht unterstützten Formaten oder unzureichender Auflösung gibt die API strukturierte Fehlercodes mit Korrekturhinweisen zurück.
Um diesen Risikobereich im CheckFile-Angebot einzuordnen, siehe unseren Ansatz zur KI- und Deepfake-Erkennung.
Bleiben Sie informiert
Erhalten Sie unsere Compliance-Analysen und Praxisleitfäden direkt in Ihr Postfach.