中国の新興企業が2つの最先端のAIモデルを発表した後、OpenAIのCEOサム・アルトマン氏からGoogleの科学者アンドリュー・ン氏まで、世界で最も優秀なAIの専門家たちはDeepSeekのオープンソースアプローチを高く評価している。

杭州を拠点とする同社は、オープンソースの推論モデルR1で世界のAI業界を驚かせた。

1月20日にリリースされたこのモデルは、ChatGPTの開発元であるOpenAIのクローズドソースモデルと同等のパフォーマンスを示していますが、トレーニングコストははるかに低いと言われています。

ディープシーク WSJ
DeepSeek が開発した AI チャットボットは、世界中で数百万回ダウンロードされています。写真: WSJ

DeepSeek によれば、基礎となる大規模言語モデルである DeepSeek V3 は数週間前にリリースされ、トレーニングにかかる​​コストはわずか 550 万ドルでした。

同社の発表により、テクノロジー企業がAIトレーニング用のグラフィックチップ(GPU)に過剰に投資しているのではないかという疑問が生じ、関連テクノロジー株の売りにつながった。

先週、Redditの「Ask Me Anything」で、アルトマン氏はOpenAIは間違っており、オープンソースに対して別のアプローチを見つける必要があると主張した。

同社は常に非公開のアプローチを採用しており、具体的なトレーニング方法やモデルのエネルギーコストなどの詳細は秘密にしてきた。

「とはいえ、OpenAIの全員がこの見解を共有しているわけではない」し、「現時点ではこれが最優先事項ではない」とOpenAIのCEOは認めた。

グーグル・ブレインの創設者で、百度の元主任科学者アンドリュー・ン氏は、ディープシークとその仲間たちの製品は、中国がAI分野で急速に米国に追いついていることを示していると語った。

「ChatGPTが2022年11月にローンチされたとき、米国は生成AIにおいて中国を大きくリードしていた…しかし実際には、その差は過去2年間で急速に縮まっている」と彼はXに書いた。「Qwen、Kimi、InternVL、DeepSeekなどの中国のモデルにより、中国は明らかに差を縮めており、ビデオ生成などの分野では、中国がリードしているように見える時期もあった。」

Qwenモデルはアリババ社によって開発され、KimiとInterVLはスタートアップ企業のMoonshot AIと上海AIラボの製品である。

ン氏によると、米国がオープンソースをブロックし続ければ、中国がサプライチェーンのこの部分を支配し、多くの企業が最終的に米国の価値観よりも中国の価値観を反映したモデルを採用することになるだろうという。

多くの米国企業が、DeepSeek のモデルを自社製品に適用することを検討している。たとえば、Nvidia の NIM サービス ユーザーは先週から R1 モデルにアクセスできるようになり、Microsoft も Azure クラウド プラットフォームと GitHub で R1 をサポートしています。 Amazon では、顧客が AWS を通じて R1 を使用してアプリケーションを作成できるようにしています。

しかし、DeepSeek の成功を誇張すべきではないと言う専門家もいます。 Metaの主任AI科学者ヤン・ルカン氏は、DeepSeekのおかげで「中国がAIで米国を追い抜く」という考えは間違いだと述べている。

むしろ、「オープンソース モデルは独自のモデルを上回っている」と彼は Threads に書いています。

2023年5月に創業者リャン・ウェンフェン氏のヘッジファンド「ハイフライヤー」からスピンアウトしたスタートアップ企業「ディープシーク」は、実際のコストやAIモデルのトレーニング方法について依然として懐疑的な見方に直面している。

スタートアップ企業の技術報告書によると、復旦大学のコンピュータサイエンス教授である鄭暁青氏は、DeepSeek V3のトレーニング費用にはテストや研究に関連する費用が含まれていないと指摘した。

ディープシークの成功は「技術的な最適化」によるものであり、チップの調達や出荷に大きな影響を与えないと彼は語った。

(サウスカロライナ州立大学モーニングサーキット通信によると)