Le allucinazioni dell'AI spiegate: perché i modelli inventano e come verificare l'output

Ogni modello linguistico inventa informazioni di tanto in tanto. Il meccanismo è fondamentale per il modo in cui funziona la generazione basata sui transformer. Ecco cos'è un'allucinazione, perché accade e come verificare gli output ad alto rischio.

By Subger Editorial TeamUpdated 30 aprile 20266 min read

Cos'è un'allucinazione e perché accade

Un'allucinazione dell'AI è un output affermato con sicurezza ma fattualmente errato. Il meccanismo è meccanico, non ingannevole: i modelli linguistici basati sui transformer generano l'output un token alla volta prevedendo il token successivo più probabile dato il contesto precedente. Il modello non ha un controllo separato della 'verità' — il suo obiettivo è la plausibilità all'interno degli schemi appresi durante l'addestramento. Quando i dati di addestramento non contengono una risposta diretta a una query, il modello genera l'output dal suono più plausibile, che può essere errato. Il fenomeno è documentato in tutti i principali modelli, inclusi GPT-5, Claude Sonnet e Gemini 3.

Dove le allucinazioni sono più comuni

Date specifiche, statistiche esatte, riferimenti a citazioni, URL, firme di metodi API, dettagli biografici su figure non pubbliche, eventi molto recenti (successivi alla data limite di addestramento del modello) e i contenuti di documenti non presenti nel prompt. Lo schema è: alta specificità + bassa frequenza nei dati di addestramento = alto rischio di allucinazione.

Cosa fanno gli assistenti moderni per mitigare il problema

Generazione aumentata dal recupero (RAG): al modello vengono forniti documenti rilevanti al momento della query, in modo che la risposta sia ancorata ai contenuti recuperati anziché alla memoria parametrica. Perplexity usa il RAG di default — ogni Pro Search recupera e cita le fonti. La ricerca web di ChatGPT e quella di Claude recuperano URL in tempo reale e li citano. Gemini di Google integra il grounding tramite Search. Le citazioni trasformano l'allucinazione in una traccia visibile che puoi verificare. La verifica delle citazioni resta responsabilità dell'utente — i modelli a volte generano citazioni dall'aspetto plausibile che in realtà non esistono.

Come verificare gli output ad alto rischio

(1) Per il codice: eseguilo. Il compilatore è il controllo della verità. (2) Per le affermazioni numeriche: chiedi al modello la sua fonte e verificala con una seconda ricerca. (3) Per le citazioni: clicca sul link. Se l'URL restituisce un 404, la citazione è errata. (4) Per gli eventi recenti: controlla la data limite di addestramento del modello e integra con uno strumento che abbia accesso web in tempo reale. (5) Per le affermazioni ad alto rischio: confronta con un secondo modello (Perplexity lo rende facile permettendo di cambiare modello per ogni query).

Quando ignorare il rischio

La maggior parte dell'uso quotidiano è a basso rischio. Brainstorming, riassunto di email che hai scritto tu stesso, stesura di codice boilerplate, generazione di idee — le allucinazioni sono di solito evidenti o irrilevanti. Riserva lo sforzo di verifica agli output in cui sbagliare ha un costo reale: consulenza legale, informazioni mediche, decisioni finanziarie, affermazioni fattuali che pubblicherai o citerai. Trattare l'output dell'AI come una prima bozza anziché come una risposta definitiva è il modello operativo giusto.

Fonti

Anthropic sulle allucinazioni: anthropic.com/news (cerca 'hallucinations'). Documentazione OpenAI su allucinazioni + RAG: openai.com/index/why-language-models-hallucinate. Grounding dell'AI di Google: ai.google.dev (cerca 'grounding'). Perplexity Pro Search: perplexity.ai/help-center. Tutti gli URL consultati il 2026-04-30.