ソーシャルメディア大手のMetaは、AI開発プロセスにおける人間の介入を縮小できる自己学習評価(STE)機能を備えた新しいAIモデルを発表した。
8月に導入されたこのツールは、OpenAIが最近リリースしたo1モデルに似た「思考トレイン」を使用しており、アルゴリズムがより信頼性の高い判断を下せるようにする。
この手法の原理は、複雑な問題をより小さな論理的ステップに分解し、科学、プログラミング、数学などの難しい分野での応答精度を向上させる可能性を秘めていることです。
現在、AI モデルは一般的に、人間からのフィードバックによる強化学習を経る必要があります。このプロセスは多くの場合、コストがかかり、非効率的であり、データに正確にラベルを付けたり、非常に正確なクエリに対する回答を検証したりするために、人間の専門家の関与が必要になることがよくあります。
「AIが超人的なレベルに近づくにつれ、AIが自らの作業を自己チェックできるようになることを期待しています」とメタの研究チームのジェイソン・ウェストン氏は語った。
Google や Anthropic などの他の企業も、AI フィードバックからの強化学習 (RLAIF) の概念に関する研究を発表しています。しかし、現在のところ、これらのモデルを一般に公開しているのは Meta 社だけです。
さらに、Meta は Segment Anything 画像認識モデルのアップデートもリリースしました。これにより、新しい無機材料の研究に使用できるデータの生成が高速化されます。
先週、フェイスブック傘下の巨大企業は、「パージ」や「ゲット・アウト」などのホラーシリーズで知られる映画製作会社ブラムハウス・プロダクションズと提携し、同社のビデオ生成AIモデル「Movie Gen」をテストした。
Movie Genは、OpenAIやElevenLabsなど、業界をリードする他のスタートアップ企業のサービスと競合し、リアルなビデオとオーディオを作成できると言われています。
(Yahoo Techによると)
[広告2]
出典: https://vietnamnet.vn/meta-ra-mat-mo-hinh-ai-tu-danh-gia-hoc-hoi-2333881.html
コメント (0)