Las alucinaciones de la IA explicadas: por qué los modelos inventan cosas y cómo verificar la salida
Todo modelo de lenguaje fabrica información a veces. El mecanismo es fundamental para el funcionamiento de la generación basada en transformadores. Esto es lo que es una alucinación, por qué ocurre y cómo verificar las salidas de alto riesgo.
Qué es una alucinación y por qué ocurre
Una alucinación de la IA es una salida formulada con seguridad que es objetivamente incorrecta. El mecanismo es mecánico, no engañoso: los modelos de lenguaje basados en transformadores generan la salida un token cada vez, prediciendo el token siguiente más probable a partir del contexto previo. El modelo no tiene una comprobación de «verdad» independiente: su objetivo es la plausibilidad dentro de los patrones que aprendió durante el entrenamiento. Cuando los datos de entrenamiento no contienen una respuesta directa a una consulta, el modelo genera la salida que suena más plausible, que puede ser errónea. El fenómeno está documentado en todos los modelos principales, incluidos GPT-5, Claude Sonnet y Gemini 3.
Dónde son más frecuentes las alucinaciones
Fechas concretas, estadísticas exactas, referencias de citas, URL, firmas de métodos de API, detalles biográficos sobre figuras no públicas, eventos muy recientes (posteriores a la fecha de corte del entrenamiento del modelo) y el contenido de documentos que no están en la indicación. El patrón es: alta especificidad + baja frecuencia en los datos de entrenamiento = alto riesgo de alucinación.
Qué hacen los asistentes modernos para mitigarlo
Generación aumentada por recuperación (RAG): se le proporcionan al modelo documentos relevantes en el momento de la consulta, de modo que la respuesta se fundamenta en el contenido recuperado en lugar de en la memoria paramétrica. Perplexity usa RAG de forma predeterminada: cada Pro Search recupera y cita fuentes. La búsqueda web de ChatGPT y la búsqueda web de Claude recuperan URL en vivo y las citan. Gemini de Google integra la fundamentación con Search. Las citas convierten la alucinación en un rastro visible que puedes verificar. Verificar las citas sigue siendo responsabilidad del usuario: los modelos generan ocasionalmente citas de aspecto plausible que en realidad no existen.
Cómo verificar las salidas de alto riesgo
(1) Para el código: ejecútalo. El compilador es la comprobación de la verdad. (2) Para las afirmaciones numéricas: pídele al modelo su fuente y verifica la fuente con una segunda búsqueda. (3) Para las citas: haz clic en el enlace. Si la URL da un 404, la cita es errónea. (4) Para los eventos recientes: comprueba la fecha de corte del entrenamiento del modelo y complétala con una herramienta que tenga acceso web en vivo. (5) Para las afirmaciones de alto riesgo: contrástalas con un segundo modelo (Perplexity lo facilita al cambiar de modelo por consulta).
Cuándo ignorar el riesgo
La mayor parte del uso informal es de bajo riesgo. Lluvia de ideas, resumir correos que tú mismo escribiste, redactar código repetitivo, generar ideas: las alucinaciones suelen ser evidentes o irrelevantes. Reserva el esfuerzo de verificación para las salidas en las que equivocarse tiene un coste real: asesoramiento jurídico, información médica, decisiones financieras, afirmaciones objetivas que vayas a publicar o citar. Tratar la salida de la IA como un primer borrador en lugar de una respuesta final es el modelo operativo correcto.
Fuentes
Anthropic sobre las alucinaciones: anthropic.com/news (busca «hallucinations»). Documentación de OpenAI sobre alucinaciones + RAG: openai.com/index/why-language-models-hallucinate. Fundamentación de la IA de Google: ai.google.dev (busca «grounding»). Perplexity Pro Search: perplexity.ai/help-center. Todas las URL consultadas el 30-04-2026.