En el evento anual TechXchange de IBM, la compañía anunció su versión más avanzada de su modelo de IA hasta la fecha, Granite 3.0. Los modelos de lenguaje insignia Granite de tercera generación de IBM superan o igualan a modelos de tamaño similar de proveedores de modelos líderes en múltiples puntos de referencia académicos e industriales, lo que demuestra un rendimiento sólido, transparencia y seguridad.

IBM presenta su modelo de IA más avanzado hasta la fecha, Granite 3.0.
En línea con el compromiso de la empresa con la IA de código abierto, los modelos Granite se lanzan bajo la licencia permisiva Apache 2.0, lo que los hace únicos en la combinación de rendimiento, flexibilidad y autonomía que ofrecen a los clientes empresariales y a la comunidad en general.
Los nuevos modelos de lenguaje Granite 3.0 8B y 2B están diseñados como modelos “insignia” para la IA empresarial y ofrecen un sólido rendimiento para tareas como recuperación, generación aumentada (RAG), clasificación, resumen, extracción de entidades y uso de herramientas. Estos modelos compactos y flexibles están diseñados para personalizarse con datos comerciales e integrarse perfectamente en una variedad de entornos comerciales o flujos de trabajo.
Si bien muchos modelos de lenguaje grandes (LLM) se entrenan con datos disponibles públicamente, la gran mayoría de los datos empresariales permanecen sin explotar. Al combinar un pequeño modelo Granite con datos empresariales, específicamente utilizando la revolucionaria técnica de alineación InstructLab (presentada por IBM y RedHat en mayo), IBM cree que las empresas pueden lograr un rendimiento específico de tareas equivalente al de modelos más grandes a una fracción del costo (según un rango de costos 3 a 23 veces más bajos que los modelos de frontera grandes en algunas pruebas de concepto tempranas).
Modelo de IA de Granite 3.0.
El lanzamiento de Granite 3.0 reafirma el compromiso de IBM de generar transparencia, seguridad y confianza en los productos de IA. El informe técnico de Granite 3.0 y la guía del usuario responsable proporcionan una descripción de los conjuntos de datos utilizados para entrenar estos modelos, detalles de los pasos de filtrado, limpieza y curación aplicados, junto con resultados completos sobre el rendimiento del modelo en los principales puntos de referencia académicos y empresariales.
Los modelos "Granite 3.0" son de código abierto, similares a otras versiones de la familia Granite AI de IBM. Este enfoque difiere del de competidores como Microsoft, que cobra a los clientes por el acceso a los modelos. A cambio, IBM ofrece una herramienta de pago llamada Watsonx, que ayuda a ejecutar modelos dentro de los centros de datos después de haberlos personalizado.
Varias variantes de los nuevos modelos Granite están disponibles a partir de hoy para uso comercial en la plataforma Watsonx. Algunos de estos modelos también estarán disponibles en el kit de herramientas de software de Nvidia, lo que permitirá a las empresas incorporar modelos de IA.
Los nuevos modelos Granite fueron entrenados utilizando unidades de procesamiento gráfico (GPU) H100 de Nvidia, líder en chips de IA, dijo Darío Gil, director de investigación de IBM.
(Según IBM, Reuters)
Fuente: https://www.baogiaothong.vn/ibm-phat-hanh-mo-hinh-ai-moi-cho-doanh-nghiep-uu-viet-hon-microsoft-192241021144242992.htm
Kommentar (0)