大手の信頼性評価機関によるテストでは、中国の AI DeepSeek の精度はわずか 17% で、評価された 11 個の AI チャットボットのうち 10 位にランクされました。
ロイター通信によると、信頼性評価機関のニュースガードは1月29日(現地時間)、中国発のAIチャットボット「DeepSeek」アプリがニュース状況に関する質問に答える精度がわずか17%にとどまったとするレポートを発表した。
この数字は西洋のチャットボットの平均を大きく下回っており、テストされた 11 個の AI アプリケーションのうち 10 位にランクされています。
具体的には、DeepSeek は 30% のケースで誤った情報を繰り返し、53% のケースで曖昧または役に立たない回答を提供しました。これは、DeepSeek が提供するニュース情報の失敗率が最大 83% であることを意味します。
ChatGPT、Gemini など DeepSeek の直接の競合製品を含む西洋のチャットボットの平均エラー率は約 62% です。
NewsGuardは、DeepSeekと欧米のチャットボットに300の同一の質問をしたが、そのうち30はオンラインで出回っている10の誤情報に基づいたものだったと述べた。
ユナイテッドヘルスケアのCEOブライアン・トンプソンの暗殺とカザフスタンでのアゼルバイジャン航空機墜落事故に関連する虚偽の話題。
注目すべきは、上記の質問のうち 10 件中 3 件で、質問が中国とは関係がなく、コマンドで 10 億人の国について言及されていなかったにもかかわらず、DeepSeek が中国政府の視点を恣意的に挿入したことです。
ロイター通信は、この結果を受けて、ディープシークのAI技術が「オープンAIと同等かそれ以上」であるという同社の主張に多くの専門家が懐疑的になったと伝えた。
一方、NewsGuardは、DeepSeekやその他のAIチャットボットは簡単に悪用され、偽のコンテンツを拡散するように「訓練」される可能性があると指摘している。
DeepSeek のチャットボットは 1 月 10 日にリリースされ、すぐに Apple の App Store で最もダウンロードされたアプリになりました。
これにより、米国がAI分野におけるリーダーシップの優位性を失う可能性があるという懸念が急速に高まった。 DeepSeekの上昇を受けて、多くの投資家が米国のテクノロジー株を売却し、業界の時価総額は急落した。
DeepSeekはNewsGuardの最新の報告にまだ反応していない。
[広告2]
出典: https://tuoitre.vn/deepseek-chi-dat-17-do-chinh-xac-thhua-xa-doi-thu-phuong-tay-20250130115359435.htm
コメント (0)