La nueva inteligencia artificial de DeepSeek continúa causando revuelo en el mundo tecnológico con su excelente desempeño. Foto: SCMP . |
DeepSeek presenta oficialmente DeepSeek V3-0324, la última versión de la serie de modelos de lenguaje grande (LLM) V3.
Al igual que las versiones anteriores, este modelo se lanza como código abierto de forma gratuita a través de la plataforma Hugging Face, con mejoras significativas respecto a versiones anteriores, especialmente en las áreas de razonamiento y programación.
En concreto, según OpenRouter, DeepSeek V3-0324 está construido utilizando Mixture of Experts (MoE), un método de aprendizaje automático muy popular en algunos modelos de IA chinos y que tiene 685 mil millones de parámetros.
Según las revisiones iniciales, el modelo muestra un rendimiento impresionante en una variedad de tareas. Mientras tanto, una publicación de Reddit muestra que DeepSeek V3-0324 ha alcanzado al modelo Sonnet 3.7 de Google en una prueba de generación de código de programación.
Las fuentes también indican que DeepSeek V3-0324 es capaz de generar fragmentos de código largos sin errores. AI Analytics Vidhya probó este modelo y registró su capacidad para generar 700 líneas de código sin problemas.
En X, la aplicación DeepSeek V3-0324 también causó un gran revuelo. Para demostrarlo, Deepanshu Sharma publicó un video que muestra cómo este modelo de IA puede generar sin problemas un sitio web completo con más de 800 líneas de código.
DeepSeek se convirtió en la empresa de inteligencia artificial china más destacada en diciembre de 2024 cuando lanzó DeepSeek-V3. Este modelo logra un rendimiento comparable a GPT-4o pero utiliza sólo una fracción de los recursos computacionales.
No mucho después, DeepSeek continuó lanzando el modelo de razonamiento DeepSeek-R1. Según TechCrunch , R1 supera a o1 de OpenAI en puntos de referencia como AIME, MATH-500 y SWE-bench Verified.
Al mismo tiempo, la cifra de 5,6 millones de dólares para entrenar la etapa final del modelo de DeepSeek también es impactante, en comparación con los cientos de millones de dólares que las principales empresas estadounidenses tienen que gastar para entrenar sus modelos.
Fuente: https://znews.vn/at-chu-bai-moi-cua-deepseek-lo-dien-post1540831.html
Kommentar (0)