Halucinácie AI vysvetlené: prečo si modely vymýšľajú a ako overiť výstup
Každý jazykový model si občas vymyslí informácie. Tento mechanizmus je zásadný pre to, ako funguje generovanie založené na transformeroch. Tu je to, čo halucinácia je, prečo k nej dochádza a ako overovať výstupy s vysokou mierou rizika.
Čo je halucinácia a prečo k nej dochádza
Halucinácia AI je sebavedome uvedený výstup, ktorý je fakticky nesprávny. Mechanizmus je mechanický, nie zámerne klamlivý: jazykové modely založené na transformeroch generujú výstup po jednom tokene tak, že predpovedajú najpravdepodobnejší ďalší token na základe predchádzajúceho kontextu. Model nemá samostatnú kontrolu „pravdy“ — jeho cieľom je vierohodnosť v rámci vzorov, ktoré sa naučil počas trénovania. Keď tréningové údaje neobsahujú priamu odpoveď na dotaz, model vygeneruje najvierohodnejšie znejúci výstup, ktorý môže byť chybný. Tento jav je zdokumentovaný naprieč všetkými hlavnými modelmi vrátane GPT-5, Claude Sonnet a Gemini 3.
Kde je halucinácia najčastejšia
Konkrétne dátumy, presné štatistiky, citačné odkazy, URL, signatúry metód API, biografické detaily o neverejných osobách, veľmi nedávne udalosti (po hranici tréningových údajov modelu) a obsah dokumentov, ktoré nie sú vo vstupe. Vzorec je: vysoká špecifickosť + nízka frekvencia v tréningových údajoch = vysoké riziko halucinácie.
Čo robia moderní asistenti na zmiernenie
Generovanie rozšírené o vyhľadávanie (RAG): modelu sú v čase dotazu poskytnuté relevantné dokumenty, takže odpoveď je ukotvená v získanom obsahu namiesto v parametrickej pamäti. Perplexity je v predvolenom nastavení RAG — každé Pro Search vyhľadáva a cituje zdroje. Vyhľadávanie na webe pri ChatGPT aj Claude načítava živé URL a cituje ich. Google Gemini integruje ukotvenie vo vyhľadávaní. Citácie menia halucináciu na viditeľnú stopu, ktorú môžete overiť. Overovanie citácií zostáva zodpovednosťou používateľa — modely občas vygenerujú vierohodne vyzerajúce citácie, ktoré v skutočnosti neexistujú.
Ako overiť výstup s vysokou mierou rizika
(1) Pri kóde: spustite ho. Kompilátor je kontrola pravdy. (2) Pri číselných tvrdeniach: požiadajte model o jeho zdroj a zdroj overte druhým vyhľadávaním. (3) Pri citáciách: kliknite na odkaz. Ak URL vráti 404, citácia je chybná. (4) Pri nedávnych udalostiach: skontrolujte hranicu tréningových údajov modelu a doplňte ju nástrojom so živým prístupom na web. (5) Pri tvrdeniach s vysokou mierou rizika: porovnajte s druhým modelom (Perplexity to uľahčuje prepínaním modelov pri jednotlivých dotazoch).
Kedy riziko ignorovať
Väčšina bežného použitia má nízku mieru rizika. Brainstorming, sumarizovanie e-mailov, ktoré ste sami napísali, písanie šablónového kódu, generovanie nápadov — halucinácie sú zvyčajne zjavné alebo nepodstatné. Vyhraďte si úsilie na overovanie pre výstupy, pri ktorých má omyl reálnu cenu: právne rady, zdravotné informácie, finančné rozhodnutia, faktické tvrdenia, ktoré zverejníte alebo budete citovať. Správnym prevádzkovým modelom je zaobchádzať s výstupom AI ako s prvým konceptom, nie ako s konečnou odpoveďou.
Zdroje
Anthropic o halucináciách: anthropic.com/news (vyhľadajte „hallucinations“). Dokumentácia OpenAI k halucináciám + RAG: openai.com/index/why-language-models-hallucinate. Ukotvenie AI od Googlu: ai.google.dev (vyhľadajte „grounding“). Perplexity Pro Search: perplexity.ai/help-center. Všetky URL navštívené 2026-04-30.