주요 신뢰 평가 기관의 테스트에서 중국의 AI DeepSeek은 불과 17%의 정확도를 달성하여 평가된 11개의 AI 챗봇 중 10위를 차지했습니다.
로이터에 따르면 1월 29일(현지 시간) 신뢰도 평가 기관 뉴스가드는 중국의 AI 챗봇 딥시크(DeepSeek) 애플리케이션이 뉴스 상황과 관련된 질문에 답변하는 정확도가 17%에 불과하다는 보고서를 발표했습니다.
이 수치는 서구 챗봇의 평균보다 훨씬 낮으며, 테스트된 11개 AI 애플리케이션 중에서는 10위를 차지했습니다.
구체적으로, DeepSeek은 30%의 경우 거짓 정보를 반복해서 제공했고, 53%의 경우 모호하거나 도움이 되지 않는 답변을 제공했습니다. 즉, DeepSeek이 제공하는 뉴스 정보의 실패율은 최대 83%에 달합니다.
DeepSeek의 직접적인 경쟁자인 ChatGPT, Gemini 등을 포함한 서양 챗봇의 평균 오류율은 약 62%입니다.
NewsGuard는 DeepSeek와 서양 챗봇에게 동일한 질문 300개를 사용했으며, 이 중 30개는 온라인에서 유포되고 있는 10가지 잘못된 정보를 기반으로 한 것이라고 밝혔습니다.
유나이티드헬스케어 CEO 브라이언 톰슨의 암살과 카자흐스탄 아제르바이잔 항공기 추락 사고와 관련된 거짓 주제입니다.
특히, 위 질문 중 10개 중 3개에서 DeepSeek은 질문이 중국과 관련이 없었고 해당 사령부가 인구가 10억 명인 국가를 언급하지 않았음에도 불구하고 임의로 중국 정부의 관점을 삽입했습니다.
로이터는 이 결과를 보고 많은 전문가들이 DeepSeek의 AI 기술이 OpenAI와 "동등하거나 더 뛰어나다"는 주장에 회의적이 되었다고 전했습니다.
한편, NewsGuard는 DeepSeek 및 기타 AI 챗봇이 쉽게 악용되어 거짓 콘텐츠를 퍼뜨리도록 "훈련"될 수 있다고 지적합니다.
DeepSeek의 챗봇은 1월 10일에 출시되었고 곧 Apple 앱 스토어에서 가장 많이 다운로드된 앱이 되었습니다.
이로 인해 미국이 AI 분야에서 주도적 우위를 잃을 수 있다는 우려가 빠르게 확산되었습니다. DeepSeek의 상승에 따라 많은 투자자들이 미국 기술주를 매도했고, 이로 인해 해당 산업의 시가총액이 폭락했습니다.
DeepSeek은 아직 NewsGuard의 최신 보도에 응답하지 않았습니다.
[광고2]
출처: https://tuoitre.vn/deepseek-chi-dat-17-do-chinh-xac-thua-xa-doi-thu-phuong-tay-20250130115359435.htm
Comment (0)