(CLO)Facebookの親会社Metaは金曜日、AI開発プロセスにおける人間の介入を減らすことができる「自己学習型評価者」を含む一連の新しいAIモデルをリリースすると発表した。
この発表は、Metaが8月に研究論文でこのツールを紹介し、AIモデルの応答について正確な判断を下すためにOpenAIの新しいモデルに似た「思考連鎖」技術をどのように使用するかについて説明した後に行われた。この手法は、複雑な問題をより単純な論理的ステップに分解し、科学、プログラミング、数学などの分野で精度を向上させるのに役立ちます。
Meta AI アイコン。写真:ロイター
Meta の研究者は、この評価モデルをトレーニングするために完全に AI 生成データを使用し、その段階での人間の介入を完全に排除しました。
2人のMeta研究者によると、AIを使用してAI自体を評価する能力は、自身の間違いから学習できる自律型AIエージェントを開発する可能性を示しているという。
AI 分野の多くの専門家は、これらのインテリジェントなデジタル エージェントを、人間の介入なしにさまざまなタスクを実行できるデジタル アシスタントとして想定しています。
自己改善が可能なモデルは、データにラベルを付け、複雑な数学的および文章による回答の正確さを検証するために高度なスキルを持つ専門家を必要とする「人間からのフィードバックによる強化学習」プロセスの必要性を排除できる可能性があります。このプロセスは現在、非常にコストがかかり、非効率的です。
「AIが人間よりもどんどん優秀になるにつれ、AIが自らの仕事をチェックする能力も向上し、人間の能力を超えるようになることを期待しています」とプロジェクトの研究者の一人、ジェイソン・ウェストン氏は語った。
「学習能力と自己評価能力は、AIを超人的なレベルにまで開発するための鍵となる」と彼は付け加えた。
Meta に加えて、Google や Anthropic などの他の企業も、RLAIF(「AI におけるフィードバックからの強化学習」)の概念に関する研究を発表しています。しかし、Meta とは異なり、これらの企業がモデルを一般向けに公開することはほとんどありません。
カオ・フォン(ロイター通信による)
[広告2]
出典: https://www.congluan.vn/meta-phat-hanh-mo-hinh-ai-co-the-tu-hoc-va-tu-phat-trien-post317675.html
コメント (0)