중국, 미국보다 AI 추론 비용 90% 절감

알리바바, 바이두, 바이트댄스와 같은 기술 대기업들은 추론 AI의 비용을 낮추기 위해 경쟁하고 있으며, 미국의 경쟁업체들이 제시한 가격보다 90%나 낮은 가격을 제시하고 있습니다.

01.ai의 창립자이자 전 구글 차이나 대표인 리카이푸는 중국 본토 기업들은 적은 양의 데이터로 훈련된 모델을 구축함으로써 컴퓨팅 성능은 낮추고 하드웨어를 최적화함으로써 비용을 절감한다고 말했습니다.

UC 버클리 스카이랩과 LMSYS가 최근 발표한 순위에 따르면, 스타트업 01.ai의 Yi-Lingtning 모델은 x.AI의 Grok-2와 공동 3위를 차지했으며, OpenAI와 Google에 이어 4위를 차지했습니다. 이 순위는 사용자가 질의에 답변한 점수를 기반으로 합니다.

2d82e5b153faa85bf01e3f82affa4e298ec4f24e.avif.jpg — AI 비용을 낮추는 것이 중국이 미국과 경쟁하는 방식입니다. 사진: FT

01.ai와 DeepSeek는 저렴하고 고도로 숙련된 인력을 고용하는 한편, 모델을 훈련하기 위해 소규모 데이터 세트에 집중하는 전략을 채택한 중국 본토의 AI 회사입니다.

FT는 Yi-Lightning의 추론 비용이 토큰 100만 개당 14센트인 반면, OpenAI의 o1-mini GPT의 추론 비용은 26센트라고 전했습니다. GPT 4o의 비용은 토큰 100만 개당 최대 4.4달러입니다. 응답을 생성하는 데 사용되는 토큰의 수는 각 쿼리의 복잡성에 따라 달라집니다.

Yi-Lightning 창립자는 회사가 다양한 사용 사례에 맞춰 미세 조정을 하기 전에 "초기 교육"에 300만 달러를 지출했다고 밝혔습니다. 이씨는 "최고의 모델을 만드는 것이 목표가 아니라" "5~10배 더 저렴한" 경쟁력 있는 모델을 만드는 것이 목표라고 말했습니다.

01.ai, DeepSeek, MiniMax, Stepfun이 적용한 방법은 "전문가 모델링"이라고 합니다. 이는 간단히 말해 도메인별 데이터 세트에서 학습된 여러 신경망을 결합하는 것입니다.

연구자들은 이러한 접근 방식이 컴퓨팅 성능은 덜하지만 빅데이터 모델과 동일한 수준의 지능을 달성하는 핵심적인 방법이라고 보고 있습니다. 그러나 이 접근 방식의 어려움은 엔지니어가 단 하나의 일반 모델 대신 "여러 전문가"를 이용해 훈련 과정을 조율해야 한다는 것입니다.

고급 AI 칩을 구하는 데 어려움이 있어 중국 기업은 전문가 모델을 훈련하는 데 사용할 고품질 데이터 세트를 개발하는 데 주력하면서 서구 경쟁사와 경쟁하게 되었습니다.

이씨는 01.ai가 책을 스캔하거나 WeChat 메시징 앱에서 기사를 수집하는 등 오픈 웹에서 접근할 수 없는 비전통적인 데이터 수집 방법을 가지고 있다고 말했습니다.

창업자는 중국이 미국보다 더 나은 위치에 있으며, 저렴한 기술 인재 풀이 거대하다고 믿는다.

(FT, 블룸버그에 따르면)