Trợ lý AI nào huấn luyện trên dữ liệu nhập của bạn theo mặc định vào năm 2026
Anthropic, OpenAI, Google, Perplexity và Mistral xử lý dữ liệu người dùng nhập theo những cách khác nhau. Đây là những gì chính sách bảo mật của từng nhà cung cấp thực sự nói về việc huấn luyện và lưu giữ.
Vì sao thiết lập mặc định lại quan trọng
Điều khoản dịch vụ của mỗi gói đăng ký AI dành cho người dùng đều quy định liệu nhà cung cấp có được sử dụng cuộc trò chuyện của bạn để huấn luyện các mô hình tương lai hay không. Thiết lập mặc định khác nhau giữa các nhà cung cấp và thay đổi theo thời gian. Hành động hữu ích nhất là kiểm tra Cài đặt → Kiểm soát dữ liệu (hoặc mục tương đương) ngay trong ngày bạn đăng ký, và kiểm tra lại định kỳ — vì các giá trị mặc định có thể thay đổi khi chính sách được điều chỉnh.
Anthropic Claude
Theo anthropic.com/legal/privacy, tài khoản Claude Pro và Max dành cho người dùng cá nhân không huấn luyện mô hình trên dữ liệu nhập của người dùng theo mặc định. Lưu lượng qua API của Anthropic cũng không được dùng để huấn luyện theo mặc định. Điều khoản dành cho doanh nghiệp khác nhau tùy theo hợp đồng. Lập trường mặc định tắt huấn luyện là chặt chẽ nhất trong số các trợ lý lớn có trụ sở tại Mỹ.
OpenAI ChatGPT
Theo openai.com/policies/privacy-policy, các tài khoản ChatGPT dành cho người dùng cá nhân (Free, Plus, Pro) mặc định sử dụng dữ liệu nhập để huấn luyện mô hình. Tùy chọn từ chối được nêu tại Cài đặt → Kiểm soát dữ liệu → 'Cải thiện mô hình cho mọi người'. Tài khoản ChatGPT Team và Enterprise mặc định không huấn luyện. Tùy chọn từ chối có được ghi rõ nhưng đối với người dùng cá nhân thì được bật theo mặc định — ngược lại với lập trường của Anthropic.
Google Gemini
Theo gemini.google/policy-guidelines, hoạt động của người dùng cá nhân trên Google Gemini có thể được dùng để cải thiện các dịch vụ của Google. Thiết lập Hoạt động web và ứng dụng trên tài khoản Google của người dùng kiểm soát việc lưu giữ; tạm dừng nó sẽ hạn chế việc lưu trữ nhưng cách thức tương tác chính xác với dữ liệu huấn luyện lại khác nhau tùy theo bối cảnh Workspace. Hãy xem trực tiếp chính sách áp dụng cho gói cụ thể mà bạn dùng.
Perplexity và Mistral
Theo perplexity.ai/hub/legal/privacy-policy, Perplexity không huấn luyện mô hình trên dữ liệu người dùng theo mặc định ở gói dành cho người dùng cá nhân. Theo mistral.ai/legal/privacy-policy, cách Mistral xử lý Le Chat được nêu trong chính sách bảo mật của họ — hãy đọc trước khi giả định. Việc Mistral đặt trụ sở tại EU (Paris) đồng nghĩa GDPR được áp dụng trực tiếp, đây là một khác biệt mang tính cấu trúc so với các đối thủ có trụ sở tại Mỹ.
Lời khuyên thực tế
Đối với các nội dung nhập nhạy cảm (pháp lý, y tế, nội bộ doanh nghiệp): hãy dùng gói trả phí của nhà cung cấp có mặc định không huấn luyện (Claude Pro, Perplexity Pro), hoặc gói Team / Enterprise của bất kỳ nhà cung cấp nào (những gói này đều mặc định không huấn luyện). Đối với sử dụng hằng ngày: trên thực tế khác biệt về quyền riêng tư là nhỏ; hãy chọn theo năng lực và giá. Đừng bao giờ dán mật khẩu, khóa API hoặc thông tin nhận dạng cá nhân của khách hàng vào bất kỳ gói AI dành cho người dùng cá nhân nào.
Nguồn
Bảo mật của Anthropic: anthropic.com/legal/privacy. Bảo mật của OpenAI: openai.com/policies/privacy-policy. Chính sách AI của Google: gemini.google/policy-guidelines. Bảo mật của Perplexity: perplexity.ai/hub/legal/privacy-policy. Bảo mật của Mistral: mistral.ai/legal/privacy-policy. Tất cả các URL được truy cập ngày 30/04/2026.