ChatGPT đang “gây bão” trên toàn thế giới. Trong vòng hai tháng kể từ khi phát hành, ứng dụng dựa trên Trí tuệ nhân tạo (AI) này đã ghi nhận 100 triệu người dùng, khiến chatbot trở thành ứng dụng có tốc độ phát triển nhanh nhất từng được tung ra.
Người dùng bị thu hút bởi các khả năng nâng cao của ChatGPT - đồng thời cũng lo ngại về khả năng gây ra gián đoạn trong các lĩnh vực khác nhau của ứng dụng này.
Một vấn đề chưa được thảo luận nhiều là những rủi ro về quyền riêng tư mà ChatGPT gây ra cho mỗi chúng ta. Mới đây, Google giới thiệu AI đàm thoại của hãng có tên Bard và nhiều công ty công nghệ chắc chắn sẽ tham gia cuộc đua này. Những công ty công nghệ làm việc về AI đã thực sự bước vào một cuộc đua sôi nổi.
Vấn đề cốt lõi là cuộc đua đó được thúc đẩy bởi chính dữ liệu cá nhân của chúng ta.
ChatGPT dựa trên một mô hình ngôn ngữ lớn đòi hỏi lượng dữ liệu khổng lồ để vận hành và tự cải thiện. Mô hình được huấn luyện trên càng nhiều dữ liệu thì càng có khả năng phát hiện các mẫu tốt hơn, dự đoán điều gì sẽ xảy ra tiếp theo và tạo ra văn bản hợp lý.
OpenAI, công ty đứng sau ChatGPT, đã cung cấp cho công cụ này khoảng 300 tỷ từ được thu thập một cách có hệ thống từ Internet: sách, bài báo, trang web và bài đăng - bao gồm cả thông tin cá nhân thu được mà không có sự đồng ý của người dùng.
Nếu bạn từng viết một bài đăng trên blog, đánh giá sản phẩm hay nhận xét về một bài báo trực tuyến, rất có thể thông tin này đã được ChatGPT sử dụng.
Việc thu thập dữ liệu được sử dụng để đào tại ChatGPT có vấn đề vì một số lý do.
Đầu tiên, không ai trong chúng ta được OpenAI xin phép sử dụng dữ liệu. Đây rõ ràng là hành vi vi phạm quyền riêng tư, đặc biệt khi những dữ liệu nhạy cảm có thể được sử dụng để nhận dạng hoặc xác định vị trí của chúng ta và các thành viên gia đình.
Ngay cả đối với những dữ liệu được công khai, việc OpenAI sử dụng chúng vẫn có thể vi phạm cái được gọi là tính toàn vẹn của văn bản. Đây là một nguyên tắc cơ bản trong các cuộc thảo luận pháp lý về quyền riêng tư, theo đó thông tin của các cá nhân không được tiết lộ bên ngoài bối cảnh gốc của chúng.
Ngoài ra, OpenAI không cung cấp bất cứ quy trình nào cho phép các cá nhân kiểm tra xem công ty có lưu trữ thông tin riêng tư của họ không, hay yêu cầu xóa những dữ liệu đó.
Đây là quyền được đảm bảo theo Quy định bảo vệ dữ liệu chung của châu Âu (GDPR). Thậm chí, đang có những tranh luận về việc liệu ChatGPT có tuân thủ các yêu cầu của GDPR hay không.
“Quyền được lãng quên” này đặc biệt quan trọng trong trường hợp thông tin không chính xác hoặc gây hiểu lầm, điều này là vấn đề dường như thường xuyên xảy ra với ChatGPT.
Ngoài ra, những dữ liệu được OpenAI khai thác để đào tạo ChatGPT có thể là tài sản độc quyền hoặc có bản quyền như các cuốn tiểu thuyết, kịch bản phim, thơ văn, tài liệu nghiên cứu... ChatGPT không xem xét việc bảo vệ bản quyền khi tạo nội dung đầu ra, khiến bất kỳ ai sử dụng kết quả do ứng dụng này cung cấp đều có thể vô tình đạo văn.
Cuối cùng, OpenAI không trả tiền cho những dữ liệu họ thu thập được từ Internet. Các cá nhân, chủ sở hữu trang web và công ty sản xuất những nội dung, dữ liệu này không được chi trả xứng đáng.
Điều này đặc biệt đáng chú ý khi OpenAI gần đây vừa công bố ChatGPT Plus, gói đăng ký trả phí sẽ cung cấp cho khách hàng quyền truy cập liên tục vào công cụ, với thời gian phản hồi nhanh hơn và ưu tiên tiếp cận các tính năng mới. Kế hoạch này dự kiến sẽ giúp OpenAI thu về 1 tỷ USD vào năm 2024.
Một rủi ro khác về quyền riêng tư liên quan đến dữ liệu được cung cấp cho ChatGPT là dưới dạng yêu cầu của người dùng. Khi một người yêu cầu công cụ này trả lời các câu hỏi hoặc thực hiện các tác vụ nhất định, họ có thể vô tình chuyển giao các thông tin nhạy cảm và đưa chúng vào phạm vi tiếp cận công cộng.
Chẳng hạn, một luật sư có thể yêu cầu ChatGPT xem lại bản thảo thỏa thuận ly hôn, hoặc một lập trình viên có thể yêu cầu công cụ kiểm tra một đoạn mã. Thỏa thuận và đoạn mã - cùng với kết quả được xuất ra - sẽ thành một phần trong cơ sở dữ liệu của ChatGPT. Điều này đồng nghĩa chúng có thể được sử dụng để đào tạo thêm công cụ và được đưa vào phản hồi yêu cầu của người khác.
Ngoài điều này, OpenAI còn thu thập nhiều loại thông tin người dùng khác. Theo chính sách quyền riêng tư của công ty, ChatGPT cũng thu thập địa chỉ IP của người dùng, loại trình duyệt và cài đặt, cũng như dữ liệu về tương tác của người dùng với trang web - bao gồm loại nội dung mà người dùng tương tác, tính năng họ sử dụng và hành động họ thực hiện.
Chatbot này cũng thu thập thông tin về các hoạt động duyệt web của người dùng theo thời gian và trên các trang web khác nhau. Đáng báo động, OpenAI có thể chia sẻ thông tin cá nhân của người dùng với các bên thứ ba không xác định mà không cần thông báo để đáp ứng các mục tiêu kinh doanh của họ.
Một số chuyên gia tin rằng ChatGPT là điểm bước ngoặt của AI - hiện thực hóa sự phát triển công nghệ nhằm cách mạng hóa cách chúng ta làm việc, học tập, viết và thậm chí là suy nghĩ. Bất chấp những lợi ích tiềm năng của ChatGPT, cần nhớ rằng OpenAI là một công ty tư nhân hoạt động vì lợi nhuận. Lợi ích và mục tiêu thương mại của họ không nhất thiết phù hợp với nhu cầu chung của xã hội.
Các rủi ro về quyền riêng tư đi kèm với ChatGPT sẽ là một cảnh báo cho thế giới. Và với tư cách là những người tiêu dùng ngày càng nhiều công nghệ AI, chúng ta nên cực kỳ cẩn thận về những thông tin mình chia sẻ với những công cụ như vậy.