Guía11 min de lectura

Documentos falsos con LLM y ChatGPT: la nueva amenaza de fraude

ChatGPT y los modelos de lenguaje generan documentos falsos textuales indetectables. Cómo funciona esta amenaza, qué documentos se falsifican y cómo proteger tu organización.

El equipo CheckFile·28 de junio de 2026

Illustration for Documentos falsos con LLM y ChatGPT: la nueva amenaza de fraude — Guía

Resumir este artículo con

Los grandes modelos de lenguaje (LLM) — ChatGPT, GPT-4o, Claude, Gemini — han introducido un vector de fraude documental radicalmente nuevo: la generación de documentos textuales falsos coherentes, gramaticalmente perfectos y contextualmente plausibles, sin manipulación de imágenes ni artefactos detectables. Donde antes los falsificadores editaban imágenes con Photoshop, los defraudadores de 2026 dictan nóminas, contratos laborales y extractos bancarios a un chatbot. Esta guía examina los mecanismos del fraude documental por LLM, los documentos más vulnerables y las estrategias de detección eficaces.

Este artículo tiene carácter informativo. Los requisitos regulatorios evolucionan — consulte al SEPBLAC o a un asesor jurídico especializado para su situación específica.

Por qué los LLM representan un cambio cualitativo en el fraude documental

Los LLM son fundamentalmente diferentes de los modelos generativos de imágenes (GAN, Stable Diffusion). Producen texto estructurado, cifras coherentes y formatos profesionales bajo demanda — no píxeles manipulados. Un defraudador puede generar una nómina convincente para un salario de 2.800 €/mes en menos de dos minutos, sin ningún conocimiento de diseño gráfico. El resultado incluye las retenciones de IRPF correctas para 2026, las cotizaciones a la Seguridad Social calculadas con los tipos vigentes y la categoría profesional del convenio colectivo correspondiente.

Según el informe ACFE 2024 Report to the Nations, el tiempo medio de detección de un fraude documental no identificado en el momento de entrada es de 87 días. Este dato ilustra el coste de no bloquear los documentos falsos en el onboarding inicial. El mismo informe señala que el 37% del fraude sigue detectándose mediante revisión manual — precisamente el canal donde los falsos generados por LLM están diseñados para engañar.

El ENISA Threat Landscape 2024 identifica el fraude asistido por IA como una de las cinco principales amenazas para las organizaciones europeas, con referencia específica al auge del contenido textual sintético en los flujos de verificación de identidad y crédito.

Comparativa de técnicas de fraude documental

Técnica	Vector de ataque	Detección tradicional	Dificultad 2026
Retoque Photoshop	Píxeles modificados	ELA, metadatos EXIF	Fácil
Plantillas PDF modificadas	Campos de texto reemplazados	Análisis PDF, metadatos	Moderada
GAN / Stable Diffusion	Imágenes sintéticas	Artefactos visuales, coherencia	Difícil
LLM (ChatGPT, GPT-4o)	Texto íntegramente generado	Sin artefactos clásicos	Muy difícil

Los controles OCR tradicionales leen el contenido textual pero no detectan que fue generado por un LLM. Los controles de metadatos identifican PDFs modificados, no documentos creados desde cero. Esta brecha es la que explota el fraude mediante LLM.

Documentos más atacados por el fraude LLM

Nóminas y justificantes de ingresos

La nómina es el documento más frecuentemente falsificado mediante LLM en expedientes de crédito hipotecario, leasing y alquiler. Un LLM puede generar una nómina completa con razón social y CIF del empleador ficticio, retenciones de IRPF calculadas correctamente, cotizaciones a la Seguridad Social (contingencias comunes, desempleo, FOGASA) y acumulados anuales coherentes con la mensualidad declarada.

Plataformas en los márgenes de internet ya ofrecen "generadores de nóminas IA" que solo requieren el salario objetivo, el nombre del empleador y el período de pago. La generación tarda segundos; el PDF resultante es visualmente indistinguible de una nómina auténtica para un revisor humano.

Contratos laborales e indefinidos

Los LLM generan contratos indefinidos o temporales completos, con cláusulas de confidencialidad, período de prueba y estructura salarial coherente con el convenio colectivo del sector declarado. Los defraudadores los usan como evidencia corroborante cuando las entidades financieras solicitan documentación adicional.

Extractos bancarios

Los extractos bancarios generados íntegramente por LLM son más complejos de hacer coherentes (requieren historiales de transacciones realistas), pero el ataque más habitual combina una plantilla PDF legítima con contenido transaccional generado por LLM. Los metadatos estructurales de la plantilla permanecen genuinos; solo el contenido ha sido reemplazado.

Cartas de referencia laboral y credenciales profesionales

Las cartas de referencia, certificados de acreditación profesional y confirmaciones de titulación universitaria son frecuentemente generadas por LLM en fraude de selección de personal. Estos documentos no contienen firma digital verificable y son estructuralmente simples de producir.

Cómo detectar documentos generados por LLM

Análisis lingüístico y coherencia textual

El texto generado por LLM presenta propiedades estadísticas ausentes en los documentos humanos auténticos:

Perplejidad uniforme: los LLM producen texto de baja entropía, sin las variaciones de registro ni las imperfecciones estilísticas propias de los documentos de RR. HH. reales
Ausencia de variación tipográfica: los documentos reales contienen espacios de no separación, comillas tipográficas y ligaduras — que los LLM no insertan sistemáticamente
Precisión numérica excesiva: las nóminas generadas por IA presentan cifras redondas sin los decimales y artefactos de redondeo habituales en el software de nóminas real

Validación cruzada entre documentos

La detección de mayor valor se produce mediante validación cruzada: una nómina generada por LLM puede citar un empleador cuya dirección no coincide con los datos del Registro Mercantil, o un CIF cuyo dígito de control es inválido. Estas señales son invisibles al examinar cada documento de forma aislada — requieren validación sistémica contra fuentes de datos externas.

CheckFile despliega una capa adicional de señales de generación IA como complemento a los controles estructurales existentes, calibrada según el nivel de riesgo sectorial del cliente. Esta metodología combina el análisis forense del documento individual con la validación cruzada en registros de terceros (Registro Mercantil, AEAT, Seguridad Social).

Para ampliar el contexto sobre técnicas de detección, consulte nuestra guía sobre detección de fraude documental con IA y nuestro artículo sobre cómo la IA genera documentos falsos.

Señales forenses específicas de documentos LLM

Señal	Descripción	Método de detección
Repetición semántica	Formulaciones casi idénticas en varios documentos del mismo solicitante	Análisis de similitud vectorial
Cifras sospechosamente redondas	Salarios en centenas exactas, deducciones perfectamente redondas	Control estadístico de decimales
CIF o CNAE incoherente	Código de actividad económica incompatible con el sector declarado	Referencial AEAT / Seguridad Social
Dirección no verificable	Dirección sintácticamente correcta pero no geolocalizable	API Catastro, Padrón Municipal
Uniformidad de fuentes anómala	Documento monofuente sin las variaciones de formato del software de nóminas real	Análisis de metadatos tipográficos

¿Listo para automatizar sus verificaciones?

Piloto gratuito con sus propios documentos. Resultados en 48h.

Solicitar un piloto gratuito

Marco regulatorio: qué exigen los supervisores españoles

Obligaciones PBC/FT y diligencia KYC

La Ley 10/2010 de prevención del blanqueo de capitales y de la financiación del terrorismo exige a los sujetos obligados verificar la identidad de sus clientes sobre la base de documentos fiables, de fuentes independientes y actualizados. El Real Decreto 304/2014 desarrolla reglamentariamente esta obligación, incluyendo los procedimientos de verificación documental.

El SEPBLAC (Servicio Ejecutivo de la Comisión de Prevención del Blanqueo de Capitales e Infracciones Monetarias) ha incluido en su guía de comunicaciones de operaciones sospechosas de 2025 una referencia explícita a los documentos generados por IA como categoría de riesgo emergente que los sujetos obligados deben contemplar en su análisis de riesgo.

A partir del 10 de julio de 2027, la Directiva AMLD6 (UE 2024/1640) ampliará las obligaciones PBC/FT a nuevas categorías de sujetos obligados e introducirá el concepto de verificación reforzada para documentos producidos por vía electrónica, lo que incluye implícitamente los documentos generados por IA.

CNMV y entidades financieras supervisadas

La CNMV (Comisión Nacional del Mercado de Valores) ha emitido circulares recordando a las entidades financieras bajo su supervisión que la evaluación de riesgos emergentes — incluida la falsificación documental mediante IA — forma parte de sus obligaciones de control interno bajo la Directiva MiFID II y la normativa PBC.

Aeat y verificación de documentos fiscales

Para las entidades de crédito y arrendadores profesionales, la AEAT ofrece servicios de consulta de datos fiscales que permiten verificar directamente los ingresos declarados, sin depender de la nómina o el certificado de empresa como documento de confianza. Esta verificación directa elimina el vector de fraude LLM en los ingresos fiscalizados.

Construir una defensa eficaz

Paso 1: Cartografiar todos los canales de entrada documental

Todos los canales por los que los documentos entran en su organización son vectores potenciales de fraude LLM: portal de cliente, correo electrónico, API de socios, flujos de escaneo físico. Los portales digitales — que permiten pegar texto directamente — presentan mayor riesgo de fraude LLM que los escaneos de documentos físicos.

Paso 2: Implementar validación cruzada sistemática

La validación de referencias de empleador en el Registro Mercantil y la AEAT detecta la mayoría de los falsos LLM, dado que los modelos de lenguaje no pueden acceder en tiempo real a los registros públicos españoles. Un CIF que no aparece en el Registro Mercantil es una señal de fraude de alta confianza.

Paso 3: Añadir una capa de detección de señales IA

Las herramientas de detección de texto generado por IA (análisis de perplejidad, puntuación de burstiness, huella estilística) aplicadas a documentos textuales puntúan el riesgo LLM de cada envío. Esta capa no reemplaza los controles clásicos — los complementa.

Descubra cómo CheckFile integra estos controles en su flujo de verificación para identificar señales de generación IA sin ralentizar la experiencia de usuario. Nuestra página de seguridad y cumplimiento detalla la arquitectura de control aplicada a los documentos enviados en tiempo real.

Paso 4: Formar a los equipos de cumplimiento y riesgo

Los analistas KYC deben ser formados para reconocer los indicadores textuales y visuales de documentos generados por LLM. Los profesionales de foros especializados señalan que la perfección tipográfica se ha convertido en una señal de alerta — lo contrario de hace diez años. Los salarios en cifras redondas, la gramática impecable y la ausencia de cualquier imperfección de formato son ahora sospechosos.

Lo que dicen los profesionales

Los responsables de cumplimiento que debaten este tema en foros especializados plantean dos preguntas recurrentes:

"¿Cómo distinguir un documento Word convertido a PDF de uno generado por LLM?" La respuesta técnica: el análisis de metadatos PDF (ProductID, DateCreated) y la huella tipográfica revelan habitualmente la herramienta autora. Un documento Word conserva rastros de Microsoft Office; un documento generado por LLM y formateado por código Python deja una firma de metadatos radicalmente diferente.

"¿Los LLM cometen errores predecibles?" Sí — producen cifras coherentes en apariencia pero estadísticamente improbables (demasiados salarios redondos, ausencia de variación anual en los acumulados). También generan formulaciones de RR. HH. estandarizadas ausentes de las nóminas reales de pymes.

Para un marco más completo, consulte nuestra guía de verificación documental y nuestra página dedicada a la detección de documentos deepfake e IA.

Preguntas frecuentes

¿Pueden los LLM realmente generar nóminas convincentes?

Sí. Los LLM actuales (GPT-4o, Claude 3.5, Gemini 1.5 Pro) producen nóminas sintácticamente correctas con retenciones de IRPF y cotizaciones a la Seguridad Social calculadas según los tipos de 2026. El formato PDF puede aplicarse posteriormente mediante código, haciendo el documento visualmente indistinguible de una nómina auténtica. La detección requiere análisis forense y validación cruzada de datos del empleador en el Registro Mercantil y la AEAT.

¿Cuál es la diferencia entre fraude LLM y deepfake visual?

Los deepfakes visuales manipulan imágenes (GAN, Stable Diffusion) y dejan artefactos detectables mediante ELA (Error Level Analysis) o controles de coherencia de píxeles. Los falsos LLM son íntegramente textuales — sin artefactos visuales ni manipulación de imágenes. Su detección requiere análisis lingüístico y validación de coherencia semántica, no análisis forense visual.

¿Son suficientes los controles OCR tradicionales?

No. El OCR lee el contenido textual pero no detecta el origen de ese texto. Una nómina generada por LLM supera todos los controles OCR porque su contenido es sintácticamente correcto. La detección requiere análisis complementarios: puntuación de perplejidad lingüística, coherencia de cifras y validación en registros de terceros.

¿Qué obligaciones tengo si detecto un documento falso?

Los sujetos obligados bajo la Ley 10/2010 tienen la obligación de comunicar al SEPBLAC cualquier operación sospechosa de estar vinculada a actividades delictivas, incluido el fraude documental detectado durante el proceso de onboarding. La negativa a establecer la relación de negocio o su ruptura es la medida estándar cuando se confirma la falsificación.

¿Expone a mi organización aceptar un falso generado por LLM?

Para las entidades de crédito supervisadas por el Banco de España, aceptar un documento fraudulento en un expediente de crédito puede constituir un incumplimiento de las obligaciones KYC y PBC, susceptible de sanción administrativa. Para arrendadores y entidades no reguladas, la responsabilidad es menor pero el perjuicio directo — impagos, costosos procedimientos de desahucio — es inmediato.

Para situar este riesgo en la oferta CheckFile, consulte nuestro enfoque de detección IA y deepfake.

Manténgase informado

Reciba nuestros análisis de cumplimiento y guías prácticas en su correo.

¿Listo para automatizar sus verificaciones?

Piloto gratuito con sus propios documentos. Resultados en 48h.

Documentos falsos con LLM y ChatGPT: la nueva amenaza de fraude

Por qué los LLM representan un cambio cualitativo en el fraude documental

Comparativa de técnicas de fraude documental

Documentos más atacados por el fraude LLM

Nóminas y justificantes de ingresos

Contratos laborales e indefinidos

Extractos bancarios

Cartas de referencia laboral y credenciales profesionales

Cómo detectar documentos generados por LLM

Análisis lingüístico y coherencia textual

Validación cruzada entre documentos

Señales forenses específicas de documentos LLM

Marco regulatorio: qué exigen los supervisores españoles

Obligaciones PBC/FT y diligencia KYC

CNMV y entidades financieras supervisadas

Aeat y verificación de documentos fiscales

Construir una defensa eficaz

Paso 1: Cartografiar todos los canales de entrada documental

Paso 2: Implementar validación cruzada sistemática

Paso 3: Añadir una capa de detección de señales IA

Paso 4: Formar a los equipos de cumplimiento y riesgo

Lo que dicen los profesionales

Preguntas frecuentes

¿Pueden los LLM realmente generar nóminas convincentes?

¿Cuál es la diferencia entre fraude LLM y deepfake visual?

¿Son suficientes los controles OCR tradicionales?

¿Qué obligaciones tengo si detecto un documento falso?

¿Expone a mi organización aceptar un falso generado por LLM?

Manténgase informado

¿Listo para automatizar sus verificaciones?

Artículos relacionados

Cómo la IA genera documentos falsos — y cómo detectarlos

Detección de vivacidad vs detección de fraude documental: diferencias clave

Análisis de nivel de error (ELA): detectar imágenes falsificadas en documentos