ChatGPT - Về chat history and model training, liệu bạn có bị lộ data khi chat không? Chú ý khi sử dụng chức năng Data Controls

Tính năng Data Controls

Tình cờ khi vào phần Settings của ChatGPT, mình đã phát hiện tính năng "Data Controls":

Đọc thêm về mục "Chat history & training" ta phát hiện nếu:

  • On tính năng Chat history & training:

    • Lợi: lưu lại lịch sử chat, sau này có thể xem lại.

    • Hại: data chat này sẽ được dùng để phục vụ mục đích training models của ChatGPT. Điều này có thể ra rò rỉ thông tin cá nhân của người dùng.

  • Off tính năng Chat history & training:

    • Lợi: không cần lo lắng về rò rỉ thông tin. Ngoài ra thông tin đoạn chat vẫn sẽ được lưu lại 30 ngày trước khi bị xóa.

    • Hại: ta phải dùng cách khác để lưu lại lịch sử chat.

Đánh giá

Tại sao có thể rò rỉ thông tin cá nhân khi đưa thông tin này để training ChatGPT?

Hãy xem tuyên bố của ChatGPT:

How does OpenAI use my personal data?

Our large language models are trained on a broad corpus of text that includes publicly available content, licensed content, and content generated by human reviewers. We don’t use data for selling our services, advertising, or building profiles of people—we use data to make our models more helpful for people. ChatGPT, for instance, improves by further training on the conversations people have with it, unless you choose to disable training.

Ở đây có những điểm cần chú ý là:

  • data input cho ChatGPT là được human reviewers, do vậy việc review này cũng có khả năng rò rỉ thông tin.

  • Một phần yên tâm là ChatGPT sẽ không bán data của users mặc dù họ có thể làm vây.

Như vậy chưa chắc chắn là data cá nhân của mình không thể bị lộ.

Giải pháp

Giải pháp có thể tùy vào quyết định của mỗi người:

  • Nếu bạn lưu nội dung Chat ra 1 app khác hoặc không cần lưu lại lịch sử Chat thì không cần lo lắng, cứ Off tính năng "Chat history & training".

  • Nếu bạn không hỏi những câu hỏi chưa thông tin cá nhân, thông tin mật thì không cần lo lắng gì cả. Cứ để On tính năng này cũng được.

  • Nếu dùng ChatGPT API thông qua bên thứ 3 thì hãy chắc chắn rằng nó không lấy chat history, nếu không thì đừng đưa thông tin nhậy cảm ra để hỏi thôi.