Los costes de desarrollo de DeepSeek están 'sobrevalorados'

Báo Thanh niênBáo Thanh niên03/02/2025


En su informe, DeepSeek dijo que el costo total de capacitación fue de 5,576 millones de dólares, debido en gran parte al precio de alquiler de las unidades de procesamiento gráfico de Nvidia. La compañía también advierte que esta cifra sólo refleja la “capacitación formal” y no incluye los costos asociados con investigaciones previas o experimentos sobre arquitectura, algoritmos y datos. Esto atrajo inmediatamente a los inversores y provocó que las acciones de las empresas tecnológicas mundiales se "evaporaran" 1 billón de dólares en un solo día, el 27 de enero.

Chi phí phát triển DeepSeek bị 'tâng bốc'- Ảnh 1.

¿Son los costos operativos de DeepSeek mucho más altos de lo que se afirma?

Ahora, un informe de la empresa de consultoría e investigación de semiconductores SemiAnalysis ofrece otra mirada al costo de desarrollar DeepSeek. La compañía estima que el gasto en hardware de DeepSeek es mucho mayor de lo afirmado, y destaca que los costos de investigación y desarrollo (I+D) y el costo total de propiedad son significativos.

SemiAnalysis dijo que generar “datos sintéticos” para entrenar modelos requeriría “cantidades significativas de cálculo”. Además, las empresas también necesitan experimentar, desarrollar nuevas arquitecturas, recopilar y limpiar datos y pagar a los empleados.

¿DeepSeek necesita 50.000 GPU en lugar de poco más de 2.000 GPU?

Según los cálculos de los expertos, DeepSeek opera un sistema informático a gran escala de aproximadamente 50.000 GPU Hopper, con 10.000 GPU H800 y 10.000 GPU H100 más potentes, junto con GPU H20 adicionales. Esta cifra contradice la afirmación anterior de DeepSeek de utilizar solo 2.048 GPU Nvidia. El gasto total de capital para los servidores se estima en 1.600 millones de dólares, mientras que los gastos operativos ascienden a 944 millones de dólares.

Chi phí phát triển DeepSeek bị 'tâng bốc'- Ảnh 2.

SemiAnalysis cree que DeepSeek utilizó 50.000 GPU Nvidia

DeepSeek fue fundada en 2023 por Luong Van Phong, cofundador de High-Flyer, un fondo de cobertura centrado en IA en China. La startup surgió de la unidad de investigación de inteligencia artificial del fondo en abril de 2023, con el objetivo de desarrollar grandes modelos de lenguaje y lograr inteligencia artificial general (AGI).

El interés en DeepSeek aumentó cuando la compañía lanzó R1, un modelo de razonamiento que compite con o1 de OpenAI, pero que se ofrece como código abierto, lo que permite que cualquier desarrollador de IA lo utilice. Sin embargo, como muchos otros chatbots chinos, DeepSeek también tiene limitaciones en ciertos temas.

El director ejecutivo de OpenAI, Sam Altman, elogió el modelo de DeepSeek y señaló que DeepSeek es "claramente un gran modelo". Sin embargo, también dijo que había evidencia de que DeepSeek había estado recopilando datos de OpenAI para trabajar de manera "destilada".



Fuente: https://thanhnien.vn/chi-phi-phat-trien-deepseek-bi-tang-boc-185250203151508438.htm

Etikett: compartir

Kommentar (0)

No data
No data

Event Calendar

Cùng chủ đề

Cùng chuyên mục

Cùng tác giả

No videos available