Documentos falsos con LLM y ChatGPT: la nueva amenaza de fraude
ChatGPT y los modelos de lenguaje generan documentos falsos textuales indetectables. Cómo funciona esta amenaza, qué documentos se falsifican y cómo proteger tu organización.

Resumir este artículo con
Los grandes modelos de lenguaje (LLM) — ChatGPT, GPT-4o, Claude, Gemini — han introducido un vector de fraude documental radicalmente nuevo: la generación de documentos textuales falsos coherentes, gramaticalmente perfectos y contextualmente plausibles, sin manipulación de imágenes ni artefactos detectables. Donde antes los falsificadores editaban imágenes con Photoshop, los defraudadores de 2026 dictan nóminas, contratos laborales y extractos bancarios a un chatbot. Esta guía examina los mecanismos del fraude documental por LLM, los documentos más vulnerables y las estrategias de detección eficaces.
Este artículo tiene carácter informativo. Los requisitos regulatorios evolucionan — consulte al SEPBLAC o a un asesor jurídico especializado para su situación específica.
Por qué los LLM representan un cambio cualitativo en el fraude documental
Los LLM son fundamentalmente diferentes de los modelos generativos de imágenes (GAN, Stable Diffusion). Producen texto estructurado, cifras coherentes y formatos profesionales bajo demanda — no píxeles manipulados. Un defraudador puede generar una nómina convincente para un salario de 2.800 €/mes en menos de dos minutos, sin ningún conocimiento de diseño gráfico. El resultado incluye las retenciones de IRPF correctas para 2026, las cotizaciones a la Seguridad Social calculadas con los tipos vigentes y la categoría profesional del convenio colectivo correspondiente.
Según el informe ACFE 2024 Report to the Nations, el tiempo medio de detección de un fraude documental no identificado en el momento de entrada es de 87 días. Este dato ilustra el coste de no bloquear los documentos falsos en el onboarding inicial. El mismo informe señala que el 37% del fraude sigue detectándose mediante revisión manual — precisamente el canal donde los falsos generados por LLM están diseñados para engañar.
El ENISA Threat Landscape 2024 identifica el fraude asistido por IA como una de las cinco principales amenazas para las organizaciones europeas, con referencia específica al auge del contenido textual sintético en los flujos de verificación de identidad y crédito.
Comparativa de técnicas de fraude documental
| Técnica | Vector de ataque | Detección tradicional | Dificultad 2026 |
|---|---|---|---|
| Retoque Photoshop | Píxeles modificados | ELA, metadatos EXIF | Fácil |
| Plantillas PDF modificadas | Campos de texto reemplazados | Análisis PDF, metadatos | Moderada |
| GAN / Stable Diffusion | Imágenes sintéticas | Artefactos visuales, coherencia | Difícil |
| LLM (ChatGPT, GPT-4o) | Texto íntegramente generado | Sin artefactos clásicos | Muy difícil |
Los controles OCR tradicionales leen el contenido textual pero no detectan que fue generado por un LLM. Los controles de metadatos identifican PDFs modificados, no documentos creados desde cero. Esta brecha es la que explota el fraude mediante LLM.
Documentos más atacados por el fraude LLM
Nóminas y justificantes de ingresos
La nómina es el documento más frecuentemente falsificado mediante LLM en expedientes de crédito hipotecario, leasing y alquiler. Un LLM puede generar una nómina completa con razón social y CIF del empleador ficticio, retenciones de IRPF calculadas correctamente, cotizaciones a la Seguridad Social (contingencias comunes, desempleo, FOGASA) y acumulados anuales coherentes con la mensualidad declarada.
Plataformas en los márgenes de internet ya ofrecen "generadores de nóminas IA" que solo requieren el salario objetivo, el nombre del empleador y el período de pago. La generación tarda segundos; el PDF resultante es visualmente indistinguible de una nómina auténtica para un revisor humano.
Contratos laborales e indefinidos
Los LLM generan contratos indefinidos o temporales completos, con cláusulas de confidencialidad, período de prueba y estructura salarial coherente con el convenio colectivo del sector declarado. Los defraudadores los usan como evidencia corroborante cuando las entidades financieras solicitan documentación adicional.
Extractos bancarios
Los extractos bancarios generados íntegramente por LLM son más complejos de hacer coherentes (requieren historiales de transacciones realistas), pero el ataque más habitual combina una plantilla PDF legítima con contenido transaccional generado por LLM. Los metadatos estructurales de la plantilla permanecen genuinos; solo el contenido ha sido reemplazado.
Cartas de referencia laboral y credenciales profesionales
Las cartas de referencia, certificados de acreditación profesional y confirmaciones de titulación universitaria son frecuentemente generadas por LLM en fraude de selección de personal. Estos documentos no contienen firma digital verificable y son estructuralmente simples de producir.
Cómo detectar documentos generados por LLM
Análisis lingüístico y coherencia textual
El texto generado por LLM presenta propiedades estadísticas ausentes en los documentos humanos auténticos:
- Perplejidad uniforme: los LLM producen texto de baja entropía, sin las variaciones de registro ni las imperfecciones estilísticas propias de los documentos de RR. HH. reales
- Ausencia de variación tipográfica: los documentos reales contienen espacios de no separación, comillas tipográficas y ligaduras — que los LLM no insertan sistemáticamente
- Precisión numérica excesiva: las nóminas generadas por IA presentan cifras redondas sin los decimales y artefactos de redondeo habituales en el software de nóminas real
Validación cruzada entre documentos
La detección de mayor valor se produce mediante validación cruzada: una nómina generada por LLM puede citar un empleador cuya dirección no coincide con los datos del Registro Mercantil, o un CIF cuyo dígito de control es inválido. Estas señales son invisibles al examinar cada documento de forma aislada — requieren validación sistémica contra fuentes de datos externas.
CheckFile despliega una capa adicional de señales de generación IA como complemento a los controles estructurales existentes, calibrada según el nivel de riesgo sectorial del cliente. Esta metodología combina el análisis forense del documento individual con la validación cruzada en registros de terceros (Registro Mercantil, AEAT, Seguridad Social).
Para ampliar el contexto sobre técnicas de detección, consulte nuestra guía sobre detección de fraude documental con IA y nuestro artículo sobre cómo la IA genera documentos falsos.
Señales forenses específicas de documentos LLM
| Señal | Descripción | Método de detección |
|---|---|---|
| Repetición semántica | Formulaciones casi idénticas en varios documentos del mismo solicitante | Análisis de similitud vectorial |
| Cifras sospechosamente redondas | Salarios en centenas exactas, deducciones perfectamente redondas | Control estadístico de decimales |
| CIF o CNAE incoherente | Código de actividad económica incompatible con el sector declarado | Referencial AEAT / Seguridad Social |
| Dirección no verificable | Dirección sintácticamente correcta pero no geolocalizable | API Catastro, Padrón Municipal |
| Uniformidad de fuentes anómala | Documento monofuente sin las variaciones de formato del software de nóminas real | Análisis de metadatos tipográficos |
¿Listo para automatizar sus verificaciones?
Piloto gratuito con sus propios documentos. Resultados en 48h.
Solicitar un piloto gratuitoMarco regulatorio: qué exigen los supervisores españoles
Obligaciones PBC/FT y diligencia KYC
La Ley 10/2010 de prevención del blanqueo de capitales y de la financiación del terrorismo exige a los sujetos obligados verificar la identidad de sus clientes sobre la base de documentos fiables, de fuentes independientes y actualizados. El Real Decreto 304/2014 desarrolla reglamentariamente esta obligación, incluyendo los procedimientos de verificación documental.
El SEPBLAC (Servicio Ejecutivo de la Comisión de Prevención del Blanqueo de Capitales e Infracciones Monetarias) ha incluido en su guía de comunicaciones de operaciones sospechosas de 2025 una referencia explícita a los documentos generados por IA como categoría de riesgo emergente que los sujetos obligados deben contemplar en su análisis de riesgo.
A partir del 10 de julio de 2027, la Directiva AMLD6 (UE 2024/1640) ampliará las obligaciones PBC/FT a nuevas categorías de sujetos obligados e introducirá el concepto de verificación reforzada para documentos producidos por vía electrónica, lo que incluye implícitamente los documentos generados por IA.
CNMV y entidades financieras supervisadas
La CNMV (Comisión Nacional del Mercado de Valores) ha emitido circulares recordando a las entidades financieras bajo su supervisión que la evaluación de riesgos emergentes — incluida la falsificación documental mediante IA — forma parte de sus obligaciones de control interno bajo la Directiva MiFID II y la normativa PBC.
Aeat y verificación de documentos fiscales
Para las entidades de crédito y arrendadores profesionales, la AEAT ofrece servicios de consulta de datos fiscales que permiten verificar directamente los ingresos declarados, sin depender de la nómina o el certificado de empresa como documento de confianza. Esta verificación directa elimina el vector de fraude LLM en los ingresos fiscalizados.
Construir una defensa eficaz
Paso 1: Cartografiar todos los canales de entrada documental
Todos los canales por los que los documentos entran en su organización son vectores potenciales de fraude LLM: portal de cliente, correo electrónico, API de socios, flujos de escaneo físico. Los portales digitales — que permiten pegar texto directamente — presentan mayor riesgo de fraude LLM que los escaneos de documentos físicos.
Paso 2: Implementar validación cruzada sistemática
La validación de referencias de empleador en el Registro Mercantil y la AEAT detecta la mayoría de los falsos LLM, dado que los modelos de lenguaje no pueden acceder en tiempo real a los registros públicos españoles. Un CIF que no aparece en el Registro Mercantil es una señal de fraude de alta confianza.
Paso 3: Añadir una capa de detección de señales IA
Las herramientas de detección de texto generado por IA (análisis de perplejidad, puntuación de burstiness, huella estilística) aplicadas a documentos textuales puntúan el riesgo LLM de cada envío. Esta capa no reemplaza los controles clásicos — los complementa.
Descubra cómo CheckFile integra estos controles en su flujo de verificación para identificar señales de generación IA sin ralentizar la experiencia de usuario. Nuestra página de seguridad y cumplimiento detalla la arquitectura de control aplicada a los documentos enviados en tiempo real.
Paso 4: Formar a los equipos de cumplimiento y riesgo
Los analistas KYC deben ser formados para reconocer los indicadores textuales y visuales de documentos generados por LLM. Los profesionales de foros especializados señalan que la perfección tipográfica se ha convertido en una señal de alerta — lo contrario de hace diez años. Los salarios en cifras redondas, la gramática impecable y la ausencia de cualquier imperfección de formato son ahora sospechosos.
Lo que dicen los profesionales
Los responsables de cumplimiento que debaten este tema en foros especializados plantean dos preguntas recurrentes:
"¿Cómo distinguir un documento Word convertido a PDF de uno generado por LLM?" La respuesta técnica: el análisis de metadatos PDF (ProductID, DateCreated) y la huella tipográfica revelan habitualmente la herramienta autora. Un documento Word conserva rastros de Microsoft Office; un documento generado por LLM y formateado por código Python deja una firma de metadatos radicalmente diferente.
"¿Los LLM cometen errores predecibles?" Sí — producen cifras coherentes en apariencia pero estadísticamente improbables (demasiados salarios redondos, ausencia de variación anual en los acumulados). También generan formulaciones de RR. HH. estandarizadas ausentes de las nóminas reales de pymes.
Para un marco más completo, consulte nuestra guía de verificación documental y nuestra página dedicada a la detección de documentos deepfake e IA.
Preguntas frecuentes
¿Pueden los LLM realmente generar nóminas convincentes?
Sí. Los LLM actuales (GPT-4o, Claude 3.5, Gemini 1.5 Pro) producen nóminas sintácticamente correctas con retenciones de IRPF y cotizaciones a la Seguridad Social calculadas según los tipos de 2026. El formato PDF puede aplicarse posteriormente mediante código, haciendo el documento visualmente indistinguible de una nómina auténtica. La detección requiere análisis forense y validación cruzada de datos del empleador en el Registro Mercantil y la AEAT.
¿Cuál es la diferencia entre fraude LLM y deepfake visual?
Los deepfakes visuales manipulan imágenes (GAN, Stable Diffusion) y dejan artefactos detectables mediante ELA (Error Level Analysis) o controles de coherencia de píxeles. Los falsos LLM son íntegramente textuales — sin artefactos visuales ni manipulación de imágenes. Su detección requiere análisis lingüístico y validación de coherencia semántica, no análisis forense visual.
¿Son suficientes los controles OCR tradicionales?
No. El OCR lee el contenido textual pero no detecta el origen de ese texto. Una nómina generada por LLM supera todos los controles OCR porque su contenido es sintácticamente correcto. La detección requiere análisis complementarios: puntuación de perplejidad lingüística, coherencia de cifras y validación en registros de terceros.
¿Qué obligaciones tengo si detecto un documento falso?
Los sujetos obligados bajo la Ley 10/2010 tienen la obligación de comunicar al SEPBLAC cualquier operación sospechosa de estar vinculada a actividades delictivas, incluido el fraude documental detectado durante el proceso de onboarding. La negativa a establecer la relación de negocio o su ruptura es la medida estándar cuando se confirma la falsificación.
¿Expone a mi organización aceptar un falso generado por LLM?
Para las entidades de crédito supervisadas por el Banco de España, aceptar un documento fraudulento en un expediente de crédito puede constituir un incumplimiento de las obligaciones KYC y PBC, susceptible de sanción administrativa. Para arrendadores y entidades no reguladas, la responsabilidad es menor pero el perjuicio directo — impagos, costosos procedimientos de desahucio — es inmediato.
Para situar este riesgo en la oferta CheckFile, consulte nuestro enfoque de detección IA y deepfake.
Manténgase informado
Reciba nuestros análisis de cumplimiento y guías prácticas en su correo.