Les informations ci-dessus ont été confirmées par Nick Clegg, président en charge des questions mondiales de Meta, à Reuters lors d'une interview cette semaine. Ainsi, les données utilisées pour entraîner l'IA « multi-personnalité » (que l'entreprise a introduite le 27 septembre) sont extraites des publications (textes écrits, images) que les utilisateurs publient publiquement sur Facebook et Instagram. Le contenu privé ou le contenu réservé aux amis, à la famille et aux chats ne sont pas autorisés.
Clegg a affirmé que Meta prend les mesures techniques nécessaires pour contrôler les données exploitées par l'IA, mais a refusé de donner des détails sur le fonctionnement du modèle. « Nous excluons les ensembles de données qui contiennent beaucoup d'informations personnelles et nous n'utilisons pas les données de sites Web comme LinkedIn pour former l'IA en raison de problèmes de confidentialité », a souligné le dirigeant de Meta.
Les publications publiques sur Facebook et Instagram utilisées pour entraîner l'IA de Meta
Le PDG de Meta, Mark Zuckerberg, décrit l'assistant Meta AI comme étant capable de « converser comme un humain » grâce à sa construction sur un grand modèle de langage appelé Llama 2, combiné au modèle texte-image Emu. L'assistant de l'entreprise est capable de générer du texte, de l'audio, des images et a accès à des informations en temps réel grâce à un partenariat avec le moteur de recherche Bing de Microsoft - une plateforme qui utilise également la dernière génération de ChatGPT.
Meta AI se compose de 28 chatbots (programmes de réponse automatisés) basés sur le stéréotype de personnes célèbres. Dès le premier jour de test, cet outil a rencontré de nombreuses controverses lorsqu'il a montré des signes de toxicité et de surréaction en raison de sa personnalité... unique. Certains chatbots fournissent des informations racistes et fouillent trop profondément dans la vie personnelle des utilisateurs. Le problème est plus grave lorsque les employés de Meta eux-mêmes déclarent ne pas tester cette IA en raison de préoccupations concernant le contenu inhabituel fourni par l'intelligence artificielle de l'entreprise.
L'utilisation par Meta des données des utilisateurs publiées sur les réseaux sociaux pour « nourrir » l'intelligence artificielle soulève également des inquiétudes quant aux questions de droits d'auteur. Lorsqu'on lui a demandé si Meta respectait les mesures visant à éviter de copier du contenu protégé par le droit d'auteur, le représentant de l'entreprise a uniquement mentionné la clause interdisant aux utilisateurs de créer du contenu qui viole la vie privée et les droits de propriété intellectuelle sur la plateforme.
Lien source
Comment (0)