(CLO) 페이스북 모회사인 메타는 금요일에 일련의 새로운 AI 모델을 출시한다고 발표했습니다. 여기에는 AI 개발 과정에서 인간의 개입을 줄일 수 있는 "자체 학습 평가기"가 포함됩니다.
이 발표는 Meta가 8월에 연구 논문에서 해당 도구를 소개한 후 나왔으며, 해당 도구가 OpenAI의 새로운 모델과 유사한 "생각 사슬" 기술을 사용하여 AI 모델의 반응에 대한 정확한 판단을 내리는 방법을 설명했습니다. 이 기술은 복잡한 문제를 더 간단한 논리적 단계로 분해하여 과학, 프로그래밍, 수학 등의 분야에서 정확도를 높이는 데 도움이 됩니다.
메타 AI 아이콘. 사진: 로이터
메타 연구원들은 이 평가 모델을 훈련하기 위해 전적으로 AI가 생성한 데이터를 사용했으며, 이 단계에서는 인간의 개입을 완전히 배제했습니다.
두 명의 메타 연구원에 따르면, AI를 사용하여 AI 자체를 평가하는 능력은 자신의 실수로부터 학습할 수 있는 자율적인 AI 에이전트를 개발할 수 있는 잠재력을 보여준다.
AI 분야의 많은 전문가들은 이러한 지능형 디지털 에이전트를 인간의 개입 없이 다양한 작업을 수행할 수 있는 디지털 비서로 생각합니다.
스스로 개선할 수 있는 모델은 복잡한 수학 및 서면 답변의 정확성을 검증하고 데이터에 레이블을 지정하기 위해 고도로 숙련된 전문가가 필요한 '인간 피드백을 통한 강화 학습' 프로세스의 필요성을 없앨 수 있습니다. 이 과정은 현재 매우 비용이 많이 들고 비효율적입니다.
"AI가 인간보다 점점 더 우월해짐에 따라 AI가 자신의 작업을 확인하는 데 더 능숙해지고 심지어 인간의 능력을 능가할 수 있기를 바랍니다." 프로젝트 연구원 중 한 명인 제이슨 웨스턴의 말입니다.
그는 "학습하고 자체 평가하는 능력은 AI를 초인적 수준으로 개발하는 데 중요합니다."라고 덧붙였습니다.
Meta 외에도 Google과 Anthropic과 같은 다른 회사도 RLAIF, 즉 "AI의 피드백을 통한 강화 학습" 개념에 대한 연구를 발표했습니다. 그러나 Meta와 달리 이러한 회사는 자사 모델을 대중에게 공개하는 경우가 거의 없습니다.
카오퐁 (Reuters에 따르면)
[광고2]
출처: https://www.congluan.vn/meta-phat-hanh-mo-hinh-ai-co-the-tu-hoc-va-tu-phat-trien-post317675.html
댓글 (0)