TechSpot 에 따르면, 미국의 작가 그룹이 Meta를 상대로 소송을 제기하며, 이 회사가 책을 불법적으로 사용하여 생성 AI 모델을 훈련시킨다고 비난했습니다. Meta에서는 저작권 침해를 부인하지만, 새로 공개된 내부 이메일에 따르면 회사의 일부 고위 직원과 엔지니어는 AI 훈련을 돕기 위해 불법 복제된 책을 다운로드하는 것에 대해 논의한 것으로 드러났습니다.
메타 AI는 자사의 AI를 훈련시키기 위해 불법 복제된 책을 다운로드하고 배포했다는 내부 증거를 놓고 법적 분쟁에 휘말렸습니다.
소송 문서는 Meta가 수백만 권의 불법 복제 도서를 보관하는 "LibGen"을 포함한 논란의 여지가 있는 데이터 세트를 사용했다는 것을 보여줍니다. Meta는 이전에 이 데이터 사용이 "공정 사용" 범위에 속한다고 주장했습니다. 그러나 새로운 이메일에 따르면 Meta는 이러한 데이터 파일을 다운로드했을 뿐만 아니라 BitTorrent 네트워크를 통해 배포하기도 했으며, 이는 심각한 법적 문제를 야기했습니다.
이메일에 따르면 Meta는 여러 불법 복제 도서 저장소에서 최소 81.7테라바이트의 데이터를 다운로드하고 공유했는데, 이 중 35.7테라바이트는 Z-Library와 LibGen에서 얻은 것입니다. 원고들은 이를 "놀라운 토런트 캠페인"이라고 불렀는데, Meta는 이 파일을 다운로드했을 뿐만 아니라 대규모로 적극적으로 배포했습니다.
Meta 연구원 Nikolay Bashlykov가 2023년 4월에 보낸 내부 이메일에는 "회사 컴퓨터의 토런트가 다운된 것 같습니다."라는 내용이 적혀 있습니다. 그 발언은 웃는 이모티콘으로 끝났지만, 그로부터 몇 달 만에 그의 어조는 눈에 띄게 바뀌었습니다. 2023년 9월, 바슐리코프는 토렌트 사용 때문에 메타의 법무부에 문의했다고 말했습니다. 즉, 불법 복제 데이터를 "시딩"하는 것은 분명히 불법이라는 뜻입니다.
해당 문서에는 Meta의 CEO인 마크 주커버그가 회사에서 LibGen을 사용한다는 사실을 알고 있었음이 나와 있습니다. 감지를 피하기 위해 Meta는 Facebook의 주요 시스템 외부에 서버를 배치하여 토렌트 및 데이터 배포 활동을 은폐한 것으로 알려졌습니다. 직원 Frank Zhang의 또 다른 내부 이메일은 이 전략을 "스텔스 모드"라는 용어로 언급합니다.
현재 Meta는 생성 AI와 관련된 AI 개발 및 서비스에 많은 투자를 하고 있습니다. 또한 이 회사는 채팅봇과 AI 캐릭터를 자사 소셜 미디어 생태계에 통합하는 것을 고려하고 있습니다. 그러나 새롭게 밝혀진 증거를 고려하면 Meta는 저자들로부터의 소송에 직면하여 "공정 사용" 주장을 방어하는 데 어려움을 겪을 수도 있습니다.
[광고2]
출처: https://thanhnien.vn/meta-bi-cao-buoc-dung-noi-dung-sach-vi-pham-ban-quyen-de-huan-luyen-ai-185250209012630928.htm
Comment (0)