AI 기업들, '작은 언어 모델'로 큰 수익 노린다

[광고1]

Apple, Microsoft, Meta, Google은 모두 최근에 "매개변수"가 적지만 여전히 강력한 기능을 갖춘 새로운 AI 모델을 출시했습니다. 이러한 움직임은 재정적으로 어려움을 겪는 기업이 여전히 AI를 사용하도록 장려하기 위한 기술 그룹의 노력입니다.

소규모 사업 모델로 큰 이익을 창출하려는 기업 이미지 1 — 일러스트: FT

일반적으로 매개변수의 수가 많을수록 AI 소프트웨어의 성능이 좋아지고, 작업이 더욱 복잡하고 섬세해집니다. 이번 주에 발표된 OpenAI의 최신 GPT-4o 모델과 Google의 Gemini 1.5 Pro는 모두 1조 개가 넘는 매개변수를 가지고 있는 것으로 추정됩니다. 한편, Meta는 오픈소스 Llama 모델의 4000억 개의 매개변수 버전을 훈련하고 있습니다.

데이터 및 저작권 책임에 대한 우려로 인해 Meta와 Google과 같은 거대 기술 기업은 불과 수십억 개의 매개변수로 구성된 소규모 언어 모델을 출시하게 되었습니다. 이러한 모델은 저렴하고 에너지 효율적이며 사용자 정의가 가능하고 학습과 실행에 필요한 에너지가 적으며 민감한 데이터가 저장되는 것을 방지할 수 있습니다.

Microsoft의 Azure AI Platform 부사장인 Eric Boyd는 "더 낮은 비용으로 높은 품질을 제공함으로써 실제로 고객이 액세스할 수 있는 애플리케이션이 더 많아집니다."라고 말했습니다. Azure AI Platform은 기업에 AI 모델을 판매합니다.

Google, Meta, Microsoft, 그리고 프랑스의 스타트업 Mistral도 소규모 언어 모델을 출시했지만, 여전히 진전을 보이고 있으며 특정 작업에 더 잘 집중할 수 있습니다.

Meta의 글로벌 업무 담당 사장인 닉 클레그는 Llama 3의 새로운 80억 개의 매개변수 모델은 GPT-4와 유사하다고 말했습니다. Microsoft는 70억 개의 매개변수를 갖춘 소규모 Phi-3 모델이 OpenAI의 이전 버전 모델인 GPT-3.5보다 성능이 우수하다고 말합니다.

마이크로칩은 정보를 클라우드로 전송하는 대신 장치에서 직접 작업을 처리할 수도 있으므로, 정보가 네트워크 내에만 유지되기를 원하는 개인 정보 보호 의식이 강한 고객에게 매력적일 수 있습니다.

법률 회사 애들쇼 고다드의 매니저인 샬럿 마셜은 "저희 고객 중 다수가 생성 AI 제품을 도입할 때 직면한 과제 중 하나는" 데이터 처리 및 전송과 관련된 법적 요구 사항을 준수하는 것이라고 말했습니다. 그녀는 더 작은 모델이 "기업이 규제 및 비용 문제를 극복할 수 있는 기회"를 제공한다고 말했습니다.

작은 모델도 AI 기능을 휴대폰과 같은 기기에서 실행할 수 있게 해줍니다. 구글의 "제미니 나노" 모델은 최신 픽셀 폰과 삼성의 최신 S24 스마트폰에 내장되어 있습니다.

Apple은 또한 자사의 베스트셀러인 iPhone에서 구동될 AI 모델을 개발 중이라고 밝혔습니다. 지난달, 실리콘 밸리의 거대 기업은 텍스트 기반 작업을 수행하도록 설계된 작은 프레임워크인 OpenELM을 출시했습니다.

Microsoft의 Boyd는 더 작은 모델이 "휴대폰과 노트북에 이르기까지 흥미로운 애플리케이션으로 이어질 것"이라고 말했습니다.

OpenAI의 이사인 샘 알트먼은 11월에 다양한 규모의 AI 모델을 고객에게 라이선스하고 있으며 "특정한 목적을 위해" 사용된다고 말했습니다. 그는 "작은 모델이 정말 잘 할 수 있는 일들이 몇 가지 있습니다."라고 말했습니다. 저는 그것에 대해 매우 기쁘네요."

하지만 알트만은 OpenAI가 추론, 계획, 작업 실행 능력을 포함해 확장성을 갖춘 대규모 AI 모델을 구축하는 데 계속 집중할 것이며 궁극적으로 인간 수준의 지능을 달성하는 데 주력할 것이라고 덧붙였다.

황하이 (FT에 따르면)

[광고2]
출처: https://www.congluan.vn/cac-cong-ty-ai-dang-tim-kiem-loi-nhuan-lon-tu-cac-mo-hinh-ngon-ngu-nho-post296219.html