Tehisintellekti hallutsinatsioonid seletatuna: miks mudelid asju välja mõtlevad ja kuidas väljundit kontrollida
Iga keelemudel mõtleb mõnikord infot välja. Mehhanism on transformeripõhise genereerimise toimimise jaoks fundamentaalne. Siin on toodud, mis on hallutsinatsioon, miks see tekib ja kuidas kontrollida kõrge panusega väljundit.
Mis on hallutsinatsioon ja miks see tekib
Tehisintellekti hallutsinatsioon on enesekindlalt sõnastatud väljund, mis on faktiliselt vale. Mehhanism on mehaaniline, mitte petlik: transformeripõhised keelemudelid genereerivad väljundit ühe märgendi kaupa, ennustades eelneva konteksti põhjal kõige tõenäolisemat järgmist märgendit. Mudelil ei ole eraldi „tõe“ kontrolli – tema eesmärk on usutavus mustrite raames, mille ta treeningu käigus õppis. Kui treeningandmed ei sisalda päringule otsest vastust, genereerib mudel kõige usutavamalt kõlava väljundi, mis võib olla vale. Nähtus on dokumenteeritud kõigi suurte mudelite puhul, sealhulgas GPT-5, Claude Sonnet ja Gemini 3.
Kus hallutsinatsioonid kõige sagedamini esinevad
Konkreetsed kuupäevad, täpsed statistilised andmed, viiteallikad, URL-id, API meetodite signatuurid, biograafilised andmed mitteavalike isikute kohta, väga hiljutised sündmused (pärast mudeli treeningu lõppkuupäeva) ja selliste dokumentide sisu, mis ei ole viibas. Muster on: kõrge spetsiifilisus + madal sagedus treeningandmetes = kõrge hallutsinatsiooni risk.
Mida tänapäevased assistendid teevad selle leevendamiseks
Otsinguga täiendatud genereerimine (RAG): mudelile antakse päringu hetkel asjakohased dokumendid, nii et vastus tugineb otsitud sisule, mitte parameetrilisele mälule. Perplexity töötab vaikimisi RAG-iga – iga Pro-otsing otsib allikad ja viitab neile. ChatGPT veebiotsing ja Claude'i veebiotsing toovad reaalajas URL-e ja viitavad neile. Google'i Gemini integreerib otsingu maandamise. Viited muudavad hallutsinatsiooni nähtavaks jäljeks, mida saate kontrollida. Viidete kontrollimine jääb kasutaja kohustuseks – mudelid genereerivad aeg-ajalt usutava väljanägemisega viiteid, mida tegelikult ei eksisteeri.
Kuidas kontrollida kõrge panusega väljundit
(1) Koodi puhul: käivitage see. Kompilaator on tõe kontroll. (2) Arvuliste väidete puhul: küsige mudelilt selle allikat ja kontrollige allikat teise otsingu kaudu. (3) Viidete puhul: klõpsake lingil. Kui URL annab vea 404, on viide vale. (4) Hiljutiste sündmuste puhul: kontrollige mudeli treeningu lõppkuupäeva ja täiendage tööriistaga, millel on reaalajaline veebijuurdepääs. (5) Kõrge panusega väidete puhul: võrrelge teise mudeliga (Perplexity teeb selle lihtsaks, vahetades mudelit päringu kaupa).
Millal riski ignoreerida
Suurem osa juhuslikust kasutusest on madala panusega. Ajurünnak, ise kirjutatud e-kirjade kokkuvõtmine, korduvkoodi koostamine, ideede genereerimine – hallutsinatsioonid on seal enamasti ilmsed või ebaolulised. Reserveerige kontrollimise pingutus väljunditele, kus eksimine maksab tegelikku hinda: õigusnõustamine, meditsiiniline teave, finantsotsused, faktilised väited, mida avaldate või tsiteerite. Tehisintellekti väljundi käsitlemine esimese mustandi, mitte lõpliku vastusena on õige tegutsemismudel.
Allikad
Anthropic hallutsinatsioonidest: anthropic.com/news (otsige „hallucinations“). OpenAI hallutsinatsioonide + RAG-i dokumentatsioon: openai.com/index/why-language-models-hallucinate. Google'i tehisintellekti maandamine: ai.google.dev (otsige „grounding“). Perplexity Pro Search: perplexity.ai/help-center. Kõik URL-id avatud 30.04.2026.