Lors d'un test réalisé par une importante organisation d'évaluation de la confiance, l'IA chinoise DeepSeek n'a atteint qu'une précision de 17 %, se classant 10e sur 11 chatbots IA évalués.
Selon Reuters, le 29 janvier (heure locale), l'organisme de notation de confiance NewsGuard a publié un rapport montrant que l'application de chatbot IA DeepSeek de Chine n'atteignait qu'une précision de 17 % pour répondre aux questions liées à la situation de l'actualité.
Ce chiffre est bien inférieur à la moyenne des chatbots occidentaux et se classe au 10e rang sur 11 applications d’IA testées.
Plus précisément, DeepSeek a répété de fausses informations dans 30 % des cas et a fourni des réponses ambiguës ou inutiles dans 53 % des cas. Cela signifie que les informations d'actualité fournies par DeepSeek ont un taux d'échec allant jusqu'à 83 %.
Le taux d'erreur moyen des chatbots occidentaux, y compris les concurrents directs de DeepSeek tels que ChatGPT, Gemini... est d'environ 62%.
NewsGuard a déclaré avoir utilisé 300 questions identiques à poser aux chatbots DeepSeek et Western, dont 30 basées sur 10 éléments de désinformation circulant en ligne.
Faux sujets liés à l'assassinat du PDG d'UnitedHealthcare, Brian Thompson, et au crash du vol d'Azerbaijan Airlines au Kazakhstan.
Il est à noter que dans 3/10 des questions ci-dessus, DeepSeek a inséré arbitrairement le point de vue du gouvernement chinois, même si les questions n’étaient pas liées à la Chine et que le commandement ne mentionnait pas le pays d’un milliard d’habitants.
Selon Reuters, les résultats ont rendu de nombreux experts sceptiques quant à l'affirmation de DeepSeek selon laquelle sa technologie d'IA était « équivalente ou surpassant » OpenAI.
Parallèlement, NewsGuard note que DeepSeek et d’autres chatbots IA peuvent facilement être exploités et « formés » pour diffuser du faux contenu.
Le chatbot de DeepSeek a été lancé le 10 janvier et est rapidement devenu l'application la plus téléchargée sur l'App Store d'Apple.
Cela a rapidement suscité des inquiétudes quant à la possibilité que les États-Unis perdent leur avantage de leadership dans le domaine de l’IA. En réponse à l’essor de DeepSeek, de nombreux investisseurs ont abandonné les actions technologiques américaines, provoquant une chute de la capitalisation du secteur.
DeepSeek n'a pas encore répondu au dernier rapport de NewsGuard.
Source : https://tuoitre.vn/deepseek-chi-dat-17-do-chinh-xac-thua-xa-doi-thu-phuong-tay-20250130115359435.htm
Comment (0)