페이스북 창립자가 새로운 AI 모델을 개발했습니다.

페이스북의 모회사인 애플은 라마 4 컬렉션에 두 가지 새로운 모델을 추가했다고 발표했습니다. 이 모델들은 현재 웹상의 메타 AI 비서와 왓츠앱, 메신저, 인스타그램에서 사용되고 있으며, 사용자들이 더욱 개인화된 멀티미디어 경험을 만들 수 있도록 지원합니다.

Meta 또는 Hugging Face에서 다운로드할 수 있는 새로운 모델 두 가지, Llama 4 Scout와 Llama 4 Maverick이 출시되었습니다. Meta는 CEO 마크 저커버그가 " 세계 최고 성능의 플랫폼 모델"이라고 부르는 초대형 모델인 Llama 4 Behemoth의 학습 작업을 계속 진행 중이라고 밝혔습니다.

Meta에 따르면 Llama 4 Scout는 최대 1천만 토큰의 컨텍스트 윈도우를 가지고 있으며, 이는 현재 가장 많은 토큰을 처리하는 모델인 Gemini보다 훨씬 더 큰 규모입니다. 이 수치는 AI 모델의 작업 메모리를 나타냅니다.

Meta는 이 모델이 "널리 알려진 여러 벤치마크에서" Google의 Gemma 3 및 Gemini 2.0 Flash-Lite는 물론 Mistral 3.1보다 우수하며 "단일 Nvidia H100 GPU에서도 실행될 수 있다"고 설명합니다.

Llama 4 Maverick의 경우, 회사는 OpenAI의 GPT-4o 및 Google의 Gemini 2.0 Flash와 비교했을 때 유사한 성능을 보인다고 주장했습니다. Maverick은 DeepSeek-V3보다 절반 이하의 매개변수만 사용함에도 불구하고 프로그래밍 및 추론 작업에서 DeepSeek-V3와 비슷한 성능을 보인다고 밝혔습니다.

라마 4 컬렉션의 새로운 모델들을 위한 피규어. 사진: 메타.

한편, 베헤모스는 총 2조 개의 파라미터 중 2,880억 개의 활성 파라미터를 보유하고 있습니다. 아직 공개되지는 않았지만, 메타는 베헤모스가 "여러 STEM 지표에서" 경쟁 모델(특히 GPT-4.5 및 클로드 소네 3.7)을 능가할 잠재력을 가지고 있다고 밝혔습니다.

Meta는 DeepSeek의 성공을 이끈 것과 동일한 "전문가 혼합(Mixture of Experts, MoE)" 아키텍처로 전환했다고 발표했습니다. 이 접근 방식은 각 특정 작업에 필요한 모델 부분만 활성화하여 리소스를 절약합니다. 제품 계획에 대한 자세한 내용은 4월 29일 LlamaCon 컨퍼런스에서 발표될 예정입니다.

라이선스 제한에 대한 비판에도 불구하고, Meta는 이전 모델들과 마찬가지로 Llama 4를 "오픈 소스"라고 계속해서 홍보하고 있습니다. 예를 들어, Llama 4 라이선스는 월간 활성 사용자 수가 7억 명 이상인 상업 조직이 해당 모델을 사용하기 전에 Meta의 허가를 받도록 요구합니다.

2023년 오픈 소스 이니셔티브에 따르면, 이러한 규정으로 인해 "해당 모델은 더 이상 오픈 소스로 분류되지 않게 되었습니다."

출처: https://znews.vn/cha-de-facebook-ra-mo-hinh-ai-moi-post1543744.html