Meta utilise les publications Facebook et Instagram pour entraîner l'IA

Les informations ci-dessus ont été confirmées par Nick Clegg, président en charge des questions mondiales de Meta, à Reuters dans une interview cette semaine. Ainsi, les données utilisées pour former l'IA « multi-personnalité » (que l'entreprise a introduite le 27 septembre) sont extraites des publications (textes écrits, images) que les utilisateurs publient publiquement sur Facebook et Instagram. Le contenu privé ou le contenu restreint aux amis, à la famille et aux chats ne sont pas autorisés.

Clegg a affirmé que Meta prend les mesures techniques nécessaires pour contrôler les données extraites par l'IA, mais a refusé de donner des détails sur le fonctionnement du modèle. « Nous excluons les ensembles de données qui contiennent beaucoup d'informations personnelles et nous n'utilisons pas les données de sites comme LinkedIn pour former l'IA en raison de problèmes de confidentialité », a souligné le dirigeant de Meta.

Meta dùng bài đăng Facebook, Instagram để huấn luyện AI - Ảnh 1. — Les publications publiques sur Facebook et Instagram utilisées pour former l'IA de Meta

Le PDG de Meta, Mark Zuckerberg, décrit l'assistant Meta AI comme étant capable de « converser comme un humain » grâce à sa construction sur un grand modèle de langage appelé Llama 2, combiné au modèle texte-image Emu. L'assistant de l'entreprise est capable de générer du texte, de l'audio, des images et a accès à des informations en temps réel grâce à un partenariat avec le moteur de recherche Bing de Microsoft - une plateforme qui utilise également la dernière génération de ChatGPT.

Meta AI se compose de 28 chatbots (programmes de réponse automatisés) basés sur le stéréotype de personnes célèbres. Dès le premier jour de test, cet outil a rencontré de nombreuses controverses lorsqu'il a montré des signes de toxicité et de surréaction en raison de sa personnalité... unique. Certains chatbots fournissent des informations racistes et s’immiscent trop profondément dans la vie personnelle des utilisateurs. Le problème est plus grave lorsque les employés de Meta eux-mêmes ont annoncé qu'ils ne testeraient pas cette IA en raison de préoccupations concernant le contenu inhabituel présenté par l'intelligence artificielle de l'entreprise.

L'utilisation par Meta des données des utilisateurs publiées sur les réseaux sociaux pour « alimenter » l'intelligence artificielle soulève également des inquiétudes quant aux questions de droits d'auteur. Lorsqu'on lui a demandé si Meta respectait les mesures visant à éviter de copier du contenu protégé par le droit d'auteur, le représentant de l'entreprise a uniquement mentionné la clause interdisant aux utilisateurs de créer du contenu qui viole la vie privée et les droits de propriété intellectuelle sur la plateforme.

Lien source