미국, GPT-o1과 유사한 작동 방식을 갖춘 초저가 AI 모델 개발

Báo Thanh niênBáo Thanh niên07/02/2025

[광고1]

미국 연구진이 만든 AI(인공지능) 모델 s1은 운영 비용이 불과 50달러에 불과하다고 하지만, 훨씬 더 비싼 OpenAI의 o1 모델과 동등한 추론 기능을 제공한다고 합니다. s1의 등장은 최근 실리콘 밸리에서 큰 화제를 모은 DeepSeek의 인상적인 성공에 이어 이뤄졌습니다.

Mỹ tạo ra mô hình AI siêu rẻ hoạt động tương tự GPT-o1- Ảnh 1.

DeepSeek의 등장 이후 '저렴한 AI' 전쟁이 더욱 치열해지고 있다

팀은 모델을 구축하는 데 사용된 코드와 데이터와 함께 s1의 소스 코드를 GitHub에 공개했습니다. 지난주에 발표된 논문에서는 이 모델을 개발하는 과정을 설명하면서, 그들이 적용한 뛰어난 기술을 강조했습니다. 새로운 추론 모델로 처음부터 시작하는 대신, 팀은 기존 언어 모델을 사용하고 Google의 Gemini 2.0 Flash Thinking Experimental 모델에서 추론 기능을 추출하여 "미세 조정" 프로세스를 수행했습니다.

AI 운영 비용은 '50달러 미만'

16개의 Nvidia H100 GPU를 사용하여 s1 모델을 훈련하는 데 불과 30분이 걸렸습니다. 각 GPU의 가격은 약 25,000달러이지만, 클라우드 컴퓨팅 서비스 덕분에 이 프로세스를 위해 GPU를 임대하는 비용은 50달러 미만입니다. 특히, 팀은 모델에 최종 답변을 하기 전에 "기다리도록" 지시하는 유용한 요령을 발견했는데, 이를 통해 추론이 개선되고 더 나은 솔루션이 도출되었습니다.

s1은 낮은 비용 측면에서 상당한 성과를 냈지만, 이 모델의 확장성에 대한 우려도 여전히 있습니다. 구글의 모델을 "교사"로 사용하면 s1이 오늘날의 선도적인 AI 모델과 경쟁할 수 있는 능력에 대한 의문이 제기됩니다. 특히 OpenAI와 DeepSeek 간의 소송이 진행 중이기 때문에 Google은 상황을 면밀히 주시할 가능성이 높습니다.


[광고2]
출처: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm

Comment (0)

No data
No data

Event Calendar

Cùng chủ đề

Cùng chuyên mục

Cùng tác giả

No videos available