(CLO)Facebookの親会社Metaは金曜日、AI開発プロセスにおける人間の介入を減らすことができる「自己学習評価者」を含む一連の新しいAIモデルをリリースすると発表した。
この発表は、Metaが8月に研究論文でこのツールを紹介した後のことで、論文では、OpenAIの新しいモデルに似た「思考連鎖」技術を使用してAIモデルの応答について正確な判断を下す方法について説明していた。この手法は、複雑な問題をより単純な論理的ステップに分解し、科学、プログラミング、数学などの分野で精度を向上させるのに役立ちます。
Meta AI アイコン。写真:ロイター
Metaの研究者は、この評価モデルをトレーニングするために完全にAI生成データを使用し、その段階での人間の介入を完全に排除しました。
2人のMeta研究者によると、AIを使ってAI自体を評価する能力は、自身の間違いから学ぶことができる自律型AIエージェントを開発する可能性を示しているという。
AI分野の多くの専門家は、これらのインテリジェントなデジタルエージェントを、人間の介入なしにさまざまなタスクを実行できるデジタルアシスタントとして想定しています。
自己改善が可能なモデルは、データにラベルを付け、複雑な数学的および文章による回答の正確性を検証するために高度なスキルを持つ専門家を必要とする「人間からのフィードバックによる強化学習」プロセスの必要性を排除する可能性があります。このプロセスは現在、非常にコストがかかり、非効率的です。
「AIが人間よりもどんどん優れるようになり、自らの作業をチェックする能力も向上し、人間の熟練度を超えるようになることを期待しています」とプロジェクトの研究者の一人、ジェイソン・ウェストン氏は語った。
「学習能力と自己評価能力は、AIを超人的なレベルにまで開発するための鍵となる」と彼は付け加えた。
Metaに加えて、GoogleやAnthropicなどの他の企業も、RLAIF(「AIにおけるフィードバックからの強化学習」)の概念に関する研究を発表しています。しかし、Meta とは異なり、これらの企業がモデルを一般向けに公開することはほとんどありません。
カオフォン(ロイター通信による)
[広告2]
出典: https://www.congluan.vn/meta-phat-hanh-mo-hinh-ai-co-the-tu-hoc-va-tu-phat-trien-post317675.html
コメント (0)