Alucinações de IA explicadas: por que os modelos inventam coisas e como verificar a saída

Todo modelo de linguagem fabrica informações às vezes. O mecanismo é fundamental para o funcionamento da geração baseada em transformers. Veja o que é a alucinação, por que acontece e como verificar saídas de alto risco.

By Subger Editorial TeamUpdated 30 de abril de 20266 min read

O que é a alucinação e por que ela acontece

Uma alucinação de IA é uma saída afirmada com confiança que está factualmente incorreta. O mecanismo é mecânico, não enganoso: modelos de linguagem baseados em transformers geram a saída um token de cada vez, prevendo o próximo token mais provável dado o contexto anterior. O modelo não tem uma verificação de 'verdade' separada — seu objetivo é a plausibilidade dentro dos padrões que aprendeu durante o treinamento. Quando os dados de treinamento não contêm uma resposta direta a uma consulta, o modelo gera a saída de aparência mais plausível, que pode estar errada. O fenômeno está documentado em todos os principais modelos, incluindo GPT-5, Claude Sonnet e Gemini 3.

Onde a alucinação é mais comum

Datas específicas, estatísticas exatas, referências de citação, URLs, assinaturas de métodos de API, detalhes biográficos sobre figuras não públicas, eventos muito recentes (após o corte de treinamento do modelo) e o conteúdo de documentos que não estão no prompt. O padrão é: alta especificidade + baixa frequência nos dados de treinamento = alto risco de alucinação.

O que os assistentes modernos fazem para mitigar

Geração aumentada por recuperação (RAG): o modelo recebe documentos relevantes no momento da consulta, de modo que a resposta é fundamentada no conteúdo recuperado, e não na memória paramétrica. A Perplexity é RAG por padrão — toda Pro Search recupera e cita fontes. A busca na web do ChatGPT e a busca na web do Claude buscam URLs ao vivo e as citam. O Gemini do Google integra fundamentação com a Busca. As citações transformam a alucinação em um rastro visível que você pode verificar. Verificar as citações continua sendo responsabilidade do usuário — os modelos ocasionalmente geram citações de aparência plausível que na verdade não existem.

Como verificar saídas de alto risco

(1) Para código: execute-o. O compilador é a verificação da verdade. (2) Para afirmações numéricas: peça ao modelo a fonte e verifique a fonte por meio de uma segunda busca. (3) Para citações: clique no link. Se a URL der 404, a citação está errada. (4) Para eventos recentes: verifique a data de corte de treinamento do modelo e complemente com uma ferramenta que tenha acesso à web ao vivo. (5) Para afirmações de alto risco: faça referência cruzada com um segundo modelo (a Perplexity facilita isso ao trocar de modelo por consulta).

Quando ignorar o risco

A maior parte do uso casual é de baixo risco. Brainstorming, resumir e-mails que você mesmo escreveu, redigir código repetitivo, gerar ideias — as alucinações geralmente são óbvias ou sem importância. Reserve o esforço de verificação para saídas em que estar errado tem custo real: aconselhamento jurídico, informações médicas, decisões financeiras, afirmações factuais que você publicará ou citará. Tratar a saída de IA como um primeiro rascunho, e não como uma resposta final, é o modelo operacional correto.

Fontes

Anthropic sobre alucinação: anthropic.com/news (pesquise 'hallucinations'). Documentação de alucinação + RAG da OpenAI: openai.com/index/why-language-models-hallucinate. Fundamentação da IA do Google: ai.google.dev (pesquise 'grounding'). Pro Search da Perplexity: perplexity.ai/help-center. Todas as URLs acessadas em 2026-04-30.