Se dice que el modelo de IA (inteligencia artificial) s1 creado por investigadores estadounidenses tiene un costo operativo de solo 50 USD, pero proporciona capacidades de razonamiento equivalentes al modelo o1 de OpenAI, mucho más costoso. La aparición de s1 llega después del impresionante éxito de DeepSeek, que ha causado revuelo en Silicon Valley en los últimos días.
La guerra de la «IA barata» se está volviendo más intensa desde la aparición de DeepSeek
El equipo ha hecho público el código fuente de s1 en GitHub, junto con el código y los datos utilizados para construir el modelo. Un artículo publicado la semana pasada explicó el proceso de desarrollo de este modelo, destacando las inteligentes técnicas que aplicaron. En lugar de empezar desde cero con un nuevo modelo de razonamiento, el equipo utilizó un modelo de lenguaje existente y realizó un proceso de “ajuste” extrayendo las capacidades de razonamiento del modelo experimental Gemini 2.0 Flash Thinking de Google.
Los costes operativos de la IA son “menos de 50 dólares”
El entrenamiento del modelo s1 tomó solo 30 minutos, utilizando 16 GPU Nvidia H100. Si bien cada una de estas GPU cuesta alrededor de 25.000 dólares, el costo de alquilarlas para este proceso es inferior a 50 dólares gracias a los servicios de computación en la nube. En particular, el equipo descubrió un truco útil: ordenar al modelo que “esperara” antes de dar una respuesta final, lo que mejoró su razonamiento y resultó en mejores soluciones.
Aunque s1 ha logrado importantes logros a bajo costo, aún existen preocupaciones sobre la escalabilidad de este modelo. Utilizar el modelo de Google como “maestro” plantea interrogantes sobre la capacidad del s1 para competir con los principales modelos de IA actuales. Es probable que Google siga de cerca la situación, especialmente dada la demanda en curso entre OpenAI y DeepSeek.
Fuente: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
Kommentar (0)