Halucinace AI vysvětleny: proč si modely vymýšlejí a jak ověřit výstup
Každý jazykový model si občas vymyslí informace. Tento mechanismus je zásadní pro to, jak funguje generování založené na transformerech. Zde je to, co halucinace je, proč k ní dochází a jak ověřovat výstupy s vysokou mírou rizika.
Co je halucinace a proč k ní dochází
Halucinace AI je sebevědomě uvedený výstup, který je fakticky nesprávný. Mechanismus je mechanický, nikoli záměrně klamavý: jazykové modely založené na transformerech generují výstup po jednom tokenu tak, že předpovídají nejpravděpodobnější další token na základě předchozího kontextu. Model nemá samostatnou kontrolu „pravdy“ — jeho cílem je věrohodnost v rámci vzorců, které se naučil během trénování. Když tréninková data neobsahují přímou odpověď na dotaz, model vygeneruje nejvěrohodněji znějící výstup, který může být chybný. Tento jev je zdokumentován napříč všemi hlavními modely včetně GPT-5, Claude Sonnet a Gemini 3.
Kde je halucinace nejčastější
Konkrétní data, přesné statistiky, citační odkazy, URL, signatury metod API, biografické detaily o neveřejných osobách, velmi nedávné události (po hranici trénovacích dat modelu) a obsah dokumentů, které nejsou ve vstupu. Vzorec je: vysoká specifičnost + nízká frekvence v tréninkových datech = vysoké riziko halucinace.
Co dělají moderní asistenti pro zmírnění
Generování rozšířené o vyhledávání (RAG): modelu jsou v době dotazu poskytnuty relevantní dokumenty, takže odpověď je ukotvena v získaném obsahu místo v parametrické paměti. Perplexity je ve výchozím nastavení RAG — každé Pro Search vyhledává a cituje zdroje. Vyhledávání na webu u ChatGPT i Claude načítá živé URL a cituje je. Google Gemini integruje ukotvení ve vyhledávání. Citace mění halucinaci na viditelnou stopu, kterou můžete ověřit. Ověřování citací zůstává odpovědností uživatele — modely občas vygenerují věrohodně vypadající citace, které ve skutečnosti neexistují.
Jak ověřit výstup s vysokou mírou rizika
(1) U kódu: spusťte ho. Kompilátor je kontrola pravdy. (2) U číselných tvrzení: požádejte model o jeho zdroj a zdroj ověřte druhým vyhledáváním. (3) U citací: klikněte na odkaz. Pokud URL vrátí 404, citace je chybná. (4) U nedávných událostí: zkontrolujte hranici trénovacích dat modelu a doplňte ji nástrojem s živým přístupem na web. (5) U tvrzení s vysokou mírou rizika: porovnejte s druhým modelem (Perplexity to usnadňuje přepínáním modelů u jednotlivých dotazů).
Kdy riziko ignorovat
Většina běžného použití má nízkou míru rizika. Brainstorming, shrnování e-mailů, které jste sami napsali, psaní šablonového kódu, generování nápadů — halucinace jsou obvykle zjevné nebo nepodstatné. Vyhraďte si úsilí na ověřování pro výstupy, u nichž má omyl reálnou cenu: právní rady, zdravotní informace, finanční rozhodnutí, faktická tvrzení, která zveřejníte nebo budete citovat. Správným provozním modelem je zacházet s výstupem AI jako s prvním konceptem, nikoli jako s konečnou odpovědí.
Zdroje
Anthropic o halucinacích: anthropic.com/news (vyhledejte „hallucinations“). Dokumentace OpenAI k halucinacím + RAG: openai.com/index/why-language-models-hallucinate. Ukotvení AI od Googlu: ai.google.dev (vyhledejte „grounding“). Perplexity Pro Search: perplexity.ai/help-center. Všechny URL navštíveny 2026-04-30.