Галлюцинации ИИ: почему модели выдумывают и как проверять вывод
Любая языковая модель иногда фабрикует информацию. Этот механизм фундаментален для того, как работает генерация на основе трансформеров. Вот что такое галлюцинация, почему она возникает и как проверять вывод с высокой ставкой.
Что такое галлюцинация и почему она возникает
Галлюцинация ИИ — это уверенно изложенный вывод, который фактически неверен. Механизм здесь механический, а не намеренно вводящий в заблуждение: языковые модели на основе трансформеров генерируют вывод по одному токену за раз, предсказывая наиболее вероятный следующий токен с учётом предшествующего контекста. У модели нет отдельной проверки «истины» — её цель в том, чтобы быть правдоподобной в рамках выученных при обучении закономерностей. Когда обучающие данные не содержат прямого ответа на запрос, модель генерирует наиболее правдоподобно звучащий вывод, который может оказаться неверным. Это явление задокументировано во всех крупных моделях, включая GPT-5, Claude Sonnet и Gemini 3.
Где галлюцинации наиболее часты
Конкретные даты, точные статистические данные, ссылки на источники, URL, сигнатуры методов API, биографические сведения о непубличных персонах, очень недавние события (после даты завершения обучения модели) и содержимое документов, которых нет в запросе. Закономерность такова: высокая конкретность + низкая частота в обучающих данных = высокий риск галлюцинации.
Что современные ассистенты делают для снижения риска
Генерация с дополнением через поиск (RAG): модели во время запроса передаются релевантные документы, так что ответ опирается на извлечённое содержимое, а не на параметрическую память. Perplexity использует RAG по умолчанию — каждый Pro-поиск извлекает и цитирует источники. Веб-поиск ChatGPT и веб-поиск Claude подгружают живые URL и цитируют их. Google Gemini интегрирует привязку к Поиску (Search grounding). Цитаты превращают галлюцинацию в видимый след, который можно проверить. Проверка цитат остаётся обязанностью пользователя — модели иногда генерируют правдоподобно выглядящие цитаты, которых на самом деле не существует.
Как проверять вывод с высокой ставкой
(1) Для кода: запустите его. Компилятор — это проверка истины. (2) Для числовых утверждений: спросите у модели её источник и проверьте источник вторым поиском. (3) Для цитат: перейдите по ссылке. Если URL выдаёт 404, цитата неверна. (4) Для недавних событий: проверьте дату завершения обучения модели и дополните инструментом с живым доступом в интернет. (5) Для утверждений с высокой ставкой: сверьтесь со второй моделью (Perplexity упрощает это, переключая модель для каждого запроса).
Когда риском можно пренебречь
Большинство повседневных применений — низкоставочные. Мозговой штурм, резюмирование писем, которые вы сами написали, набросок шаблонного кода, генерация идей — галлюцинации тут обычно очевидны или несущественны. Резервируйте усилия по проверке для вывода, где ошибка несёт реальную цену: юридические советы, медицинская информация, финансовые решения, фактические утверждения, которые вы будете публиковать или цитировать. Относиться к выводу ИИ как к первому черновику, а не как к окончательному ответу — правильная модель работы.
Источники
Anthropic о галлюцинациях: anthropic.com/news (поиск «hallucinations»). Документация OpenAI по галлюцинациям + RAG: openai.com/index/why-language-models-hallucinate. Привязка Google AI (grounding): ai.google.dev (поиск «grounding»). Perplexity Pro Search: perplexity.ai/help-center. Все URL открыты 30.04.2026.