새롭게 출시된 AI 모델에는 다른 AI 모델의 성능을 확인할 수 있는 '자체 학습 평가기' 도구가 있습니다. 특히, 이 도구는 초인적인 지능 덕분에 인공지능 개발에 있어서 인간의 개입을 줄일 수 있을 것으로 기대됩니다.
이번 출시는 Meta가 8월에 보고서를 통해 앱을 소개한 이후에 이루어졌으며, 보고서에서는 해당 도구가 새로 개발된 1 OpenAI의 관행에서 사용하는 것과 동일한 "생각의 사슬" 기술을 사용하여 모델의 응답에 대한 신뢰할 수 있는 판단을 내리는 방식에 대해 자세히 설명했습니다.
이 기술은 복잡한 문제를 더 작은 논리적 단계로 나누어 과학, 코딩, 수학과 같은 과목의 어려운 문제에 대한 응답의 정확도를 높이는 것입니다.
메타 연구원들은 평가 모델을 훈련하기 위해 전적으로 AI가 생성한 데이터를 사용했으며, 그 단계에서는 인간의 개입을 배제했습니다.
AI를 사용하여 AI를 안정적으로 평가하는 능력은 사용자의 실수로부터 학습할 수 있는 자율 AI 에이전트를 구축하는 실행 가능한 경로를 열어줍니다.
AI 분야의 많은 사람들은 이러한 에이전트를 인간의 개입 없이 다양한 작업을 수행할 수 있을 만큼 지능적인 디지털 비서로 생각합니다.
메타는 페이스북과 인스타그램 플랫폼을 중독성 있게 만들어 청소년들에게 정신 건강 문제를 일으킨다는 혐의로 미국 주정부에서 여러 건의 소송을 당하고 있습니다.
오클랜드 소재 미국 지방 법원의 이본 곤잘레스 로저스 판사는 작년에 제기된 두 건의 별도 소송에서 주정부가 제기한 청구를 기각해 달라는 메타의 요청을 기각했습니다. 그 중 하나는 캘리포니아와 뉴욕을 포함한 30개 이상의 주가 관련된 소송이고, 나머지는 플로리다가 제기한 소송입니다.
자체 개선 모델은 오늘날 사용되는, 인간 피드백을 통한 강화 학습이라는 비용이 많이 들고 비효율적인 프로세스의 필요성을 없앨 수 있습니다. 인간 주석자는 복잡한 수학 및 서면 질문에 대한 답을 검증하고 데이터를 정확하게 붙여넣을 수 있는 전문 지식을 가져야 합니다.
"AI가 작업을 확인하는 데 점점 더 능숙해지면서 실제로 인간보다 더 나아지기를 바랍니다. 스스로 학습하고 스스로 할 수 있다는 아이디어는 우리가 보기를 바라는 것입니다." 연구원 중 한 명인 제이슨 웨스턴은 "평가는 AI의 초인적 수준을 달성하는 아이디어에 근본적으로 중요하다"고 말했다.
Google과 Anthropic을 비롯한 다른 회사도 AI의 피드백 강화 학습(RLAIF) 개념에 대한 연구 결과를 발표했습니다. 그러나 Meta와 달리 이러한 회사는 일반적으로 대중이 사용할 수 있는 모델을 공개하지 않습니다.
금요일에 Meta가 출시한 다른 AI 도구에는 회사의 Segment Anything 이미지 인식 모델에 대한 업데이트, LLM 응답 생성 시간을 단축하는 도구, 새로운 무기 재료의 발견을 돕는 데 사용할 수 있는 데이터 세트가 포함됩니다.
[광고2]
출처: https://www.baogiaothong.vn/cong-ty-me-facebook-ra-mat-mo-hinh-ai-giam-sat-mo-hinh-ai-khac-192241019113020535.htm
Comment (0)