01.aiの創業者でグーグル中国の元責任者であるリー・カイフー氏は、中国本土の企業は、より少ないデータ量で訓練したモデルを構築することでコストを削減し、より少ない計算能力で、より最適化されたハードウェアでトレーニングしたと述べた。

カリフォルニア大学バークレー校スカイラボとLMSYSが最近発表したランキングによると、スタートアップ企業01.aiのYi-Lingtningモデルは、OpenAIとGoogleに次いで、x.AIのGrok-2と並んで3位にランクされました。このランキングは、クエリの回答に対するユーザー スコアに基づいています。

2d82e5b153faa85bf01e3f82affa4e298ec4f24e.avif.jpg
AIのコストを削減することが中国が米国と競争する方法です。写真:FT

01.ai と DeepSeek は、安価で高度なスキルを持つ人材を雇用しながら、モデルのトレーニングに小規模なデータセットに重点を置く戦略を採用している中国本土の AI 企業です。

FTによると、Yi-Lightningの推論コストは100万トークンあたり14セントであるのに対し、OpenAIのo1-mini GPTは26セントだという。一方、GPT 4o のコストは、100万トークンあたり最大 4.4 ドルです。応答を生成するために使用されるトークンの数は、各クエリの複雑さによって異なります。

Yi-Lightningの創設者は、さまざまなユースケースに合わせて微調整する前に、同社が「初期トレーニング」に300万ドルを費やしたことを明らかにした。リー氏は、彼らの目標は「最高のモデルを作ることではなく」、競合モデルを「5~10倍安く」作ることだと語った。

01.ai、DeepSeek、MiniMax、Stepfun が適用した手法は「エキスパート モデリング」と呼ばれ、ドメイン固有のデータセットでトレーニングされた複数のニューラル ネットワークを単純に組み合わせるものです。

研究者たちは、このアプローチはビッグデータ モデルと同じレベルのインテリジェンスをより少ない計算能力で達成するための重要な方法であると考えています。しかし、このアプローチの難しさは、エンジニアが 1 つの一般的なモデルではなく、「複数の専門家」を使用してトレーニング プロセスを調整する必要があることです。

中国企業は、高性能AIチップの入手が困難なため、専門家モデルのトレーニングに使用する高品質のデータセットの開発に目を向け、西側諸国のライバル企業と競争している。

リー氏は、01.aiは書籍をスキャンしたり、オープンウェブではアクセスできないWeChatメッセージアプリの記事を収集するなど、従来とは異なる方法でデータを収集していると述べた。

創業者は、中国は安価で優秀な技術者が大量におり、米国よりも有利な立場にあると考えている。

(FT、ブルームバーグによると)

Metaが「自己評価学習」AIモデルを発表ソーシャルメディア大手のMetaは、AI開発プロセスにおける人間の介入を絞り込むことができる自己評価学習(STE)機能を備えた新しいAIモデルを発表しました。