Giải thích về ảo giác của AI: Vì sao các mô hình bịa đặt và cách kiểm chứng đầu ra

Mọi mô hình ngôn ngữ đôi khi đều bịa đặt thông tin. Cơ chế này là nền tảng cho cách hoạt động của quá trình sinh dựa trên transformer. Đây là ảo giác là gì, vì sao nó xảy ra và cách kiểm chứng đầu ra có rủi ro cao.

By Subger Editorial TeamUpdated 30 tháng 4, 20266 min read

Ảo giác là gì và vì sao nó xảy ra

Ảo giác của AI là một đầu ra được phát biểu đầy tự tin nhưng sai về mặt sự thật. Cơ chế mang tính máy móc, không phải lừa dối: các mô hình ngôn ngữ dựa trên transformer sinh ra đầu ra từng token một bằng cách dự đoán token có khả năng cao nhất tiếp theo dựa trên ngữ cảnh trước đó. Mô hình không có một bước kiểm tra 'sự thật' riêng biệt — mục tiêu của nó là tính hợp lý trong các mẫu mà nó đã học được trong quá trình huấn luyện. Khi dữ liệu huấn luyện không chứa câu trả lời trực tiếp cho một truy vấn, mô hình sinh ra đầu ra nghe có vẻ hợp lý nhất, vốn có thể sai. Hiện tượng này được ghi nhận trên tất cả các mô hình lớn bao gồm GPT-5, Claude Sonnet và Gemini 3.

Ảo giác phổ biến nhất ở đâu

Các ngày tháng cụ thể, số liệu thống kê chính xác, tham chiếu trích dẫn, URL, chữ ký phương thức API, chi tiết tiểu sử về những nhân vật không công khai, các sự kiện rất gần đây (sau thời điểm cắt huấn luyện của mô hình) và nội dung của các tài liệu không có trong câu lệnh. Quy luật là: độ cụ thể cao + tần suất thấp trong dữ liệu huấn luyện = rủi ro ảo giác cao.

Các trợ lý hiện đại làm gì để giảm thiểu

Sinh có tăng cường truy xuất (RAG): mô hình được cấp các tài liệu liên quan tại thời điểm truy vấn để câu trả lời dựa trên nội dung được truy xuất thay vì bộ nhớ tham số. Perplexity dùng RAG theo mặc định — mỗi lượt Tìm kiếm Pro đều truy xuất và trích dẫn nguồn. Tìm kiếm web của ChatGPT và tìm kiếm web của Claude lấy các URL trực tiếp và trích dẫn chúng. Gemini của Google tích hợp việc neo căn cứ theo Tìm kiếm. Trích dẫn biến ảo giác thành một dấu vết hữu hình mà bạn có thể kiểm chứng. Việc kiểm chứng trích dẫn vẫn là trách nhiệm của người dùng — các mô hình đôi khi sinh ra những trích dẫn trông có vẻ hợp lý nhưng thực ra không tồn tại.

Cách kiểm chứng đầu ra có rủi ro cao

(1) Đối với mã: hãy chạy nó. Trình biên dịch là phép kiểm tra sự thật. (2) Đối với các tuyên bố về số liệu: hãy hỏi mô hình về nguồn của nó và kiểm chứng nguồn đó qua một lần tìm kiếm thứ hai. (3) Đối với các trích dẫn: hãy nhấp vào liên kết. Nếu URL trả về lỗi 404 thì trích dẫn đó sai. (4) Đối với các sự kiện gần đây: hãy kiểm tra thời điểm cắt huấn luyện của mô hình và bổ sung bằng một công cụ có quyền truy cập web trực tiếp. (5) Đối với các tuyên bố rủi ro cao: hãy đối chiếu chéo với một mô hình thứ hai (Perplexity giúp việc này dễ dàng bằng cách chuyển đổi mô hình theo từng truy vấn).

Khi nào có thể bỏ qua rủi ro

Hầu hết việc sử dụng thông thường đều rủi ro thấp. Động não, tóm tắt các email do chính bạn viết, soạn mã khuôn mẫu, sinh ý tưởng — ảo giác thường hiển nhiên hoặc không quan trọng. Hãy dành công sức kiểm chứng cho những đầu ra mà việc sai sẽ gây chi phí thực sự: tư vấn pháp lý, thông tin y tế, quyết định tài chính, các tuyên bố sự thật mà bạn sẽ công bố hoặc trích dẫn. Coi đầu ra của AI như một bản nháp đầu tiên thay vì câu trả lời cuối cùng là cách vận hành đúng đắn.

Nguồn

Anthropic về ảo giác: anthropic.com/news (tìm 'hallucinations'). Tài liệu của OpenAI về ảo giác + RAG: openai.com/index/why-language-models-hallucinate. Neo căn cứ AI của Google: ai.google.dev (tìm 'grounding'). Perplexity Pro Search: perplexity.ai/help-center. Tất cả các URL được truy cập ngày 30/04/2026.