中国のテクノロジー大手テンセントは昨夜(3月21日)、T1推論モデルの最終バージョンを正式に発表し、人工知能(AI)分野でますます激化する競争に新たな一歩を踏み出した。
テンセントの公式WeChatアカウントでの発表によると、アップグレードされたT1モデルは応答速度が速く、長いテキスト文書の処理が優れているとのこと。
テンセントは、知識と推論能力のいくつかの指標で DeepSeek を上回る T1 推論モデルを発表しました。
投稿によると、T1は「明確なコンテンツロジックと整然としたきれいなテキストを維持」でき、「幻覚」(AIが誤った情報を生成する現象)の発生率は「極めて低い」という。
この発表は、中国のAI市場における熾烈な競争の中で行われた。特にDeepSeekが欧米のシステムと同等かそれ以上の性能を持ちながら、大幅に低コストのモデルを発表して以来のことだ。
テンセントは以前、AIアシスタントアプリ「Yuanbao」を含む複数のプラットフォームでT1のベータ版をリリースした。
正式版は、先月末に発表されたテンセントのTurbo Sプラットフォーム言語モデルを搭載する。同社は、Turbo S はライバルの DeepSeek の R1 モデルよりもクエリを高速に処理すると主張している。
投稿に掲載された T1 モデルと DeepSeek R1 を比較したグラフは、Tencent の製品が知識と推論能力のいくつかの指標で優れていることを示しています。
テンセントはここ数カ月、AIへの投資を強化している。同社は木曜日、2024年までAIに多額の投資をしてきた後、2025年まで設備投資を増やす計画を発表した。
T1 はいくつかの重要な人工知能ベンチマークで高い評価を得ています。これにより、このモデルは世界でもトップクラスのモデルとなりました。
最近の評価によると、T1 は大規模言語モデルにおける基本的な推論能力を評価するデータセットである MMLU-Pro で 87.2 点を獲得しました。このスコアはOpenAI o1に次ぐものです。
さらに、T1 は CEval、AIME、Zebra Logic などの公開ベンチマークでも優れたパフォーマンスを発揮しました。これらの基準は、中国語と英語の両方での一般知識と推論力を測定します。
[広告2]
出典: https://www.baogiaothong.vn/tencent-trinh-lang-mo-hinh-suy-luan-t1-vuot-troi-so-voi-deepseek-192250322131611869.htm
コメント (0)