Расходы на разработку DeepSeek «завышены»

Báo Thanh niênBáo Thanh niên03/02/2025


В своем отчете DeepSeek сообщила, что общая стоимость обучения составила 5,576 млн долларов США, что в основном обусловлено стоимостью аренды графических процессоров Nvidia. Компания также предупреждает, что эта цифра отражает только «формальное обучение» и не включает расходы, связанные с предыдущими исследованиями или экспериментами по архитектуре, алгоритмам и данным. Это сразу же привлекло инвесторов и привело к тому, что акции мировых технологических компаний «испарились» на 1000 миллиардов долларов США всего за один день, 27 января.

Chi phí phát triển DeepSeek bị 'tâng bốc'- Ảnh 1.

Действительно ли эксплуатационные расходы DeepSeek намного выше заявленных?

Теперь отчет исследовательской и консалтинговой компании SemiAnalysis, занимающейся полупроводниковыми исследованиями, предлагает еще один взгляд на стоимость разработки DeepSeek. Компания оценивает расходы DeepSeek на оборудование как значительно превышающие заявленные, подчеркивая, что затраты на исследования и разработки (НИОКР), а также совокупная стоимость владения значительны.

В SemiAnalysis заявили, что создание «синтетических данных» для обучающих моделей потребует «значительного объема вычислений». Кроме того, компаниям также необходимо экспериментировать, разрабатывать новые архитектуры, собирать и очищать данные, а также платить зарплату сотрудникам.

DeepSeek нужно 50 000 графических процессоров вместо чуть более 2 000?

По расчетам экспертов, DeepSeek использует крупномасштабную вычислительную систему, состоящую примерно из 50 000 графических процессоров Hopper, в том числе 10 000 графических процессоров H800 и 10 000 более мощных графических процессоров H100, а также дополнительных графических процессоров H20. Эта цифра противоречит предыдущему заявлению DeepSeek об использовании всего 2048 графических процессоров Nvidia. Общие капитальные затраты на серверы оцениваются в 1,6 млрд долларов США, а эксплуатационные расходы составляют 944 млн долларов США.

Chi phí phát triển DeepSeek bị 'tâng bốc'- Ảnh 2.

SemiAnalysis полагает, что DeepSeek использовал 50 000 графических процессоров Nvidia

DeepSeek был основан в 2023 году Луонгом Ван Фонгом, соучредителем High-Flyer, хедж-фонда в Китае, ориентированного на ИИ. Стартап вырос из исследовательского подразделения фонда в области искусственного интеллекта в апреле 2023 года с целью разработки крупных языковых моделей и достижения общего искусственного интеллекта (AGI).

Интерес к DeepSeek возрос, когда компания выпустила R1 — модель рассуждений, которая конкурирует с o1 от OpenAI, но предлагается с открытым исходным кодом, что позволяет любому разработчику ИИ использовать ее. Однако, как и многие другие китайские чат-боты, DeepSeek также имеет ограничения по некоторым темам.

Генеральный директор OpenAI Сэм Альтман похвалил модель DeepSeek, отметив, что DeepSeek — «несомненно, отличная модель». Однако он также заявил, что имеются доказательства того, что DeepSeek собирал данные OpenAI для работы в «очищенном» виде.



Источник: https://thanhnien.vn/chi-phi-phat-trien-deepseek-bi-tang-boc-185250203151508438.htm

Comment (0)

No data
No data

Event Calendar

Cùng chủ đề

Cùng chuyên mục

Cùng tác giả

Happy VietNam

Tác phẩm Ngày hè

No videos available