DeepSeek está dando un impulso sin precedentes a los esfuerzos de China por reducir su dependencia del ecosistema Nvidia.
Durante años, los desarrolladores de chips chinos han admirado a Nvidia mientras el gigante estadounidense establecía una posición inigualable en la industria gracias a sus capacidades de hardware y al kit de herramientas CUDA propietario que los ingenieros utilizan para desarrollar aplicaciones en las unidades de procesamiento gráfico (GPU) de la compañía.
Aún así, con el lanzamiento de DeepSeek V3 y R1, están ganando más impulso para alejarse de la órbita de Nvidia.
Infinigence AI, un proveedor de plataformas de infraestructura informática, dijo que está trabajando con siete desarrolladores de chips chinos líderes: Biren Technology, Hygon Information Technology, Moore Threads, MetaX, Enflame, Iluvatar CoreX y Ascend.
Durante una visita a China en enero, el CEO de Nvidia, Jensen Huang, dijo que alrededor de 1,5 millones de desarrolladores en el país están usando CUDA. La empresa también se asocia con más de 3.000 empresas emergentes para ayudar a establecer la industria tecnológica aquí.
Exactamente cuántos chips utilizó DeepSeek para entrenar sus modelos V3 y R1 sigue siendo un misterio, pero se ha especulado que los chips de Huawei jugaron un papel clave en el éxito de la startup.
Según Tom's Hardware, los modelos que funcionan con el Huawei Ascend 910C pueden alcanzar el 60% del rendimiento de inferencia del Nvidia H100. Es probable que la dependencia del ecosistema de software de Nvidia disminuya a medida que la inferencia de IA se vuelva más importante en el futuro.
Mientras tanto, los fabricantes de chips chinos están intensificando sus esfuerzos para cumplir con DeepSeek y ayudar a reducir su dependencia de los chips estadounidenses. La Televisión Central de China (CCTV) informó que al menos 15 fabricantes de chips nacionales han adaptado sus productos para acomodarse mejor al entrenamiento y las operaciones de DeepSeek, permitiendo que los modelos de DeepSeek se ejecuten en una “infraestructura informática desarrollada nacionalmente”.
Kunlun Xin, la empresa de chips de inteligencia artificial de Baidu, tardó menos de una semana en adaptar su hardware al modelo de código abierto de DeepSeek, significativamente más rápido que los modelos de código abierto, según el director ejecutivo Ouyang Jian.
La semana pasada, la compañía dijo que comenzó a brindar soporte para los modelos DeepSeek V3 y R1, lo que permitirá a los desarrolladores implementar aplicaciones rápidamente a bajo costo.
Los modelos de inteligencia artificial de DeepSeek se consideran una señal de la flexibilidad de China frente a las medidas de contención de Estados Unidos. Algunas de las predicciones innovadoras de la startup ayudarán a impulsar el desarrollo de la IA en muchas industrias nacionales.
La empresa de diseño de chips Loongson Technology ha respaldado el modelo DeepSeek para que los usuarios puedan ejecutarlo directamente en sus computadoras. La división de computación en la nube de Huawei también se asoció con la startup de infraestructura de inteligencia artificial SiliconFlow para proporcionar los modelos DeepSeek V3 y R1 en su servicio de nube Ascend. Huawei afirma que el rendimiento es comparable al de ejecutar el modelo en GPU de alta gama.
(Según SCMP)
Fuente: https://vietnamnet.vn/deepseek-tao-dong-luc-de-trung-quoc-giam-le-thuoc-nvidia-2370958.html
Kommentar (0)