Meta выпускает модель ИИ, которая может «самообучаться» и «саморазвиваться»

(CLO) Meta, материнская компания Facebook, объявила в пятницу о запуске серии новых моделей ИИ, включая «Самообучающийся оценщик», который может сократить вмешательство человека в процесс разработки ИИ.

Анонс был сделан после того, как Meta представила инструмент в исследовательской статье в августе, описав, как он использует технику «мысленной цепочки», похожую на новые модели OpenAI, для вынесения точных суждений об ответах модели ИИ. Этот метод разбивает сложные задачи на более простые логические шаги, помогая повысить точность в таких областях, как наука, программирование и математика.

модель мета-релиза, которая может самостоятельно учиться и самостоятельно развиваться, модель 1 — Значок мета-ИИ. Фото: Рейтер

Для обучения этой рейтинговой модели исследователи использовали исключительно данные, сгенерированные искусственным интеллектом, полностью исключив вмешательство человека на этом этапе.

По словам двух исследователей Meta, возможность использования ИИ для оценки самого ИИ демонстрирует потенциал для разработки автономных агентов ИИ, которые могут учиться на собственных ошибках.

Многие эксперты в области искусственного интеллекта рассматривают этих интеллектуальных цифровых агентов как цифровых помощников, способных выполнять различные задачи без вмешательства человека.

Модели, способные к самосовершенствованию, могут устранить необходимость в процессе «обучения с подкреплением на основе обратной связи с человеком», который требует высококвалифицированных экспертов для маркировки данных и проверки точности сложных математических и письменных ответов. В настоящее время этот процесс очень затратен и неэффективен.

«Мы надеемся, что по мере того, как ИИ будет все больше превосходить людей, он будет лучше проверять свою собственную работу и даже превзойдет человеческий уровень мастерства», — сказал Джейсон Уэстон, один из исследователей проекта.

«Способность к обучению и самооценке является ключом к развитию ИИ до сверхчеловеческого уровня», — добавил он.

Помимо Meta, другие компании, такие как Google и Anthropic, также опубликовали исследования по концепции RLAIF или «Обучение с подкреплением на основе обратной связи в ИИ». Однако, в отличие от Meta, эти компании редко публикуют свои модели для публичного использования.

Као Фонг (по данным Reuters)

Источник: https://www.congluan.vn/meta-phat-hanh-mo-hinh-ai-co-the-tu-hoc-va-tu-phat-trien-post317675.html