Selon TechSpot , un groupe d'auteurs aux États-Unis a intenté une action en justice contre Meta, accusant l'entreprise d'utiliser illégalement des livres pour former des modèles d'IA génératifs. Alors que Meta nie toute violation du droit d'auteur, des courriels internes récemment publiés montrent que certains cadres supérieurs et ingénieurs de l'entreprise ont discuté du téléchargement de livres piratés pour aider à former l'IA.
Les documents du procès montrent que Meta a utilisé des ensembles de données controversés, notamment « LibGen », un référentiel de millions de livres piratés. Meta a déjà fait valoir que son utilisation de ces données relevait du « fair use ». Cependant, de nouveaux courriels révèlent que Meta a non seulement téléchargé mais également distribué ces fichiers de données via le réseau BitTorrent, soulevant de graves problèmes juridiques.
Selon l'e-mail, Meta a téléchargé et partagé au moins 81,7 téraoctets de données provenant de plusieurs référentiels de livres piratés, dont 35,7 téraoctets de Z-Library et LibGen. Les plaignants ont qualifié cela de « campagne torrent incroyable » où Meta a non seulement téléchargé mais également distribué activement ces fichiers à grande échelle.
Un e-mail interne d'avril 2023 du chercheur de Meta, Nikolay Bashlykov, notait : « Le torrent sur les ordinateurs de l'entreprise semble être en panne. » Bien que la déclaration se termine par un émoji rieur, quelques mois plus tard, son ton a considérablement changé. En septembre 2023, Bashlykov a déclaré avoir contacté le service juridique de Meta en raison de son utilisation de torrents, ce qui signifie que « l'ensemencement » de données piratées est clairement contraire à la loi.
Les documents montrent également que Mark Zuckerberg, PDG de Meta, était au courant de l'utilisation de LibGen par l'entreprise. Pour éviter d'être détecté, Meta aurait déployé des serveurs en dehors du système principal de Facebook pour dissimuler ses activités de torrenting et de distribution de données. Un autre courrier électronique interne de l’employé Frank Zhang fait référence à cette tactique avec le terme « mode furtif ».
Actuellement, Meta investit massivement dans le développement de l’IA et dans les services liés à l’IA générative. L'entreprise cherche également à intégrer des chatbots et des personnages IA dans son écosystème de médias sociaux. Toutefois, au vu des preuves récemment révélées, Meta pourrait avoir du mal à défendre son argument de « fair use » face aux poursuites judiciaires des auteurs.
Source : https://thanhnien.vn/meta-bi-cao-buoc-dung-noi-dung-sach-vi-pham-ban-quyen-de-huan-luyen-ai-185250209012630928.htm
Comment (0)