La empresa de Jack Ma vuelve a atraer la atención

Ant Group de Jack Ma ingresa al mercado de inteligencia artificial de bajo costo de China. Foto: Bloomberg .

Ant Group, una empresa respaldada por el multimillonario Jack Ma, está desarrollando una técnica que podría reducir los costos de capacitación de su tecnología de inteligencia artificial en un 20% utilizando chips semiconductores procedentes de China, según Bloomberg .

La empresa utiliza chips comprados a Alibaba y Huawei, además de aplicar el método de aprendizaje automático Mixture of Experts, visto en DeepSeek R1, para entrenar su IA.

A pesar de los recortes de costos, los resultados de Ant Group son comparables a los de las empresas de IA que utilizan los chips más potentes de la actualidad, como el H800 de Nvidia.

La empresa utiliza principalmente y cambia gradualmente a alternativas de AMD y chips chinos para sus últimos modelos de IA.

Con un software de alto rendimiento, Ant Group gastó hasta 6,35 millones de yuanes ( 880.000 dólares ) para entrenar 1 billón de tokens. Pero con el método de optimización, la cifra se redujo a 5,1 millones de yuanes. Los tokens son unidades de información que un modelo utiliza para aprender sobre el mundo y proporcionar respuestas útiles.

Esto marca el ingreso de Ant a la carrera de IA cada vez más acelerada entre China y Estados Unidos, ya que DeepSeek demostró que los modelos pueden entrenarse por mucho menos que los miles de millones de dólares gastados por OpenAI o Google.

El H800 de Nvidia, si bien no es el chip más avanzado, sigue siendo un procesador potente y su exportación a China está prohibida en Estados Unidos. Por ello, las empresas chinas se están esforzando por encontrar alternativas para mantenerse a la vanguardia en la carrera.

Ant Group publicó anteriormente un estudio en el que afirmaba que sus modelos a veces superaban a los de Meta Platforms en ciertas métricas de evaluación. De ser ciertos, estos modelos marcarían un salto cuántico para la IA china con costos de desarrollo significativamente reducidos.

Este logro es gracias a DeepSeek con su método de aprendizaje automático MoE, que ayuda a aumentar el rendimiento y reducir los costos computacionales. En concreto, este método ayuda a los modelos de IA a descomponer el problema y solo necesitan activar una pequeña parte de los datos que es suficiente para manejar las tareas.

Sin embargo, el entrenamiento de modelos MoE todavía requiere chips de alto rendimiento como las unidades de procesamiento gráfico (GPU) proporcionadas por Nvidia. Del título del artículo de investigación de Ant, “Desarrollo de modelos MoE sin GPU de alta gama”, se puede ver que la empresa está tratando de romper la barrera mencionada anteriormente.

Esto va en contra de la estrategia de Nvidia. El director ejecutivo de la empresa, Jensen Huang, sostiene que la demanda de computación seguirá aumentando incluso a medida que surjan modelos más eficientes como DeepSeek R1.

Él cree que las empresas necesitarán chips más potentes para seguir aumentando sus ingresos, en lugar de chips más baratos para reducir costos. Así, Nvidia sigue fiel a su estrategia de desarrollar GPU con más núcleos de procesamiento, transistores y mayores capacidades de memoria.

Mientras tanto, Ant planea aprovechar los recientes avances en los grandes modelos de lenguaje que ha desarrollado, incluidos Ling-Plus y Ling-Lite, para brindar soluciones de IA para industrias como la atención médica y las finanzas.

La empresa adquirió la plataforma en línea china Haodf.com en 2025 para impulsar sus servicios de inteligencia artificial en el sector de la salud, y también posee la aplicación de asistente de vida de IA Zhixiaobao y el servicio de consultoría financiera de IA Maxiaocai.

En el artículo, Ant afirmó que Ling-Lite superó a uno de los modelos Llama de Meta en una medida clave de comprensión del inglés.

Tanto Ling-Lite como Ling-Plus superaron a los modelos equivalentes de DeepSeek en las pruebas de idioma chino.

Los modelos Ling también se han puesto a disposición del público. Ling-Lite tiene 16,8 mil millones de parámetros, Ling-Plus tiene 290 mil millones, lo que se considera bastante grande en el campo del modelado del lenguaje, en comparación con los 1,800 mil millones de ChatGPT GPT-4.5 y los 671 de DeepSeek R1.

Sin embargo, Ant ha encontrado algunos problemas de estabilidad durante el entrenamiento. La compañía dijo que incluso pequeños cambios en el hardware o la estructura del modelo pueden llevar a un aumento repentino en la tasa de error del modelo.

Fuente: https://znews.vn/cong-ty-cua-jack-ma-lai-gay-chu-y-post1540514.html