Các nhà văn Paul Tremblay và Mona Awad ở Massachusetts cho biết ChatGPT đã khai thác dữ liệu được sao chép từ hàng nghìn cuốn sách mà không được phép, vi phạm bản quyền của tác giả.
Gần đây, một số cáo buộc pháp lý khác đã được đệ trình đối với dữ liệu được sử dụng để huấn luyện các hệ thống AI tiên tiến. Các mục tiêu của vụ kiện đã lập luận rằng các tác phẩm có bản quyền đã bị khai thác trái phép cho việc này.
ChatGPT đã trở thành ứng dụng tiêu dùng phát triển nhanh nhất trong lịch sử vào đầu năm nay, đạt 100 triệu người dùng thường xuyên vào tháng 1 chỉ hai tháng sau khi ra mắt.
ChatGPT và các hệ thống AI tổng quát khác tạo nội dung bằng cách sử dụng một lượng lớn dữ liệu được thu thập từ internet và các nguồn dữ liệu khác. Vụ kiện của Tremblay và Awad cho biết sách là “thành phần chính” vì chúng cung cấp “những ví dụ tốt nhất về cách viết nội dung dài chất lượng cao”.
Khiếu nại ước tính rằng dữ liệu huấn luyện chatbot AI của OpenAI đã kết hợp hơn 300.000 cuốn sách, bao gồm cả từ các nguồn cung cấp bất hợp pháp các đầu sách có bản quyền.
Tremblay và Awad cho biết ChatGPT có thể tạo ra các bản tóm tắt “rất chính xác” về sách của họ, và cho biết rằng chúng đã xuất hiện trong cơ sở dữ liệu của OpenAI.
Mai Anh (theo Reuters)