米国、GPT-o1に似た動作をする超安価なAIモデルを開発

[広告_1]

米国の研究者らが作成したAI（人工知能）モデルs1は、運用コストがわずか50ドルであるにもかかわらず、はるかに高価なOpenAIのo1モデルと同等の推論機能を提供すると言われています。 s1 の登場は、ここ数日シリコンバレーで騒動を巻き起こしている DeepSeek の目覚ましい成功を受けてのものである。

Mỹ tạo ra mô hình AI siêu rẻ hoạt động tương tự GPT-o1- Ảnh 1. — DeepSeekの登場以来、「安価なAI」戦争は激化している

チームは、モデルの構築に使用されたコードとデータとともに、s1 のソースコードを GitHub で公開しました。先週発表された論文では、このモデルの開発プロセスが説明され、適用された巧妙な技術が強調されていました。チームは、新しい推論モデルをゼロから作成するのではなく、既存の言語モデルを使用し、Google の Gemini 2.0 Flash Thinking Experimental モデルから推論機能を抽出して「微調整」プロセスを実行しました。

AIの運用コストは「50ドル以下」

s1 モデルのトレーニングには、16 個の Nvidia H100 GPU を使用してわずか 30 分かかりました。これらの GPU はそれぞれ約 25,000 ドルかかりますが、クラウドコンピューティングサービスのおかげで、このプロセス用に GPU をレンタルするコストは 50 ドル未満です。特に、チームは、最終的な答えを出す前にモデルに「待つ」ように指示するという便利なトリックを発見しました。これにより、推論が改善され、より良い解決策がもたらされました。

s1 は低コストで大きな成果を上げていますが、このモデルのスケーラビリティについては依然として懸念が残っています。 Google のモデルを「教師」として使用すると、S1 が今日の主要な AI モデルと競争できるかどうかという疑問が生じます。特にOpenAIとDeepSeekの間で訴訟が続いていることを考えると、Googleは状況を注視していくと思われる。

[広告2]
出典: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm