VinBigdata anunció el 21 de agosto la construcción exitosa de un gran modelo en idioma vietnamita, creando una base para dominar la tecnología de inteligencia artificial generativa.
Los modelos de lenguaje grandes (LLM) son modelos entrenados utilizando técnicas de aprendizaje profundo en grandes conjuntos de datos de texto o imágenes. Este modelo es capaz de comprender conocimientos, generar texto y realizar diversas tareas de procesamiento del lenguaje natural. Esta se considera la clave para el desarrollo de la tecnología de IA generativa, capaz de crear nuevos contenidos e ideas en muchas formas diferentes (texto, imágenes, sonidos...).
Con la construcción exitosa de un gran modelo de idioma vietnamita, VinBigdata integrará tecnología para hacer de VinBase (una plataforma integral de inteligencia artificial multicognitiva) una plataforma de IA generativa en Vietnam, al tiempo que proporcionará soluciones de desarrollo basadas en esta tecnología como el chatbot de IA generativa, el callbot o el asistente virtual ViVi de nueva generación... Esta tecnología ayuda a aumentar la naturalidad de la comunicación de las máquinas, al tiempo que ayuda a los usuarios a buscar y sintetizar información de forma más rápida y sencilla que antes.
Profesor Vu Ha Van - Director científico de la empresa VinBigdata. Foto: VinBigdata
El profesor Vu Ha Van, director científico de la empresa VinBigdata, dijo que en el mundo ha habido una serie de grandes corporaciones que han investigado y lanzado con éxito productos basados en grandes modelos de lenguaje como OpenAI con ChatGPT o Google con Bard. En Vietnam, VinBigdata recibe inversiones de Vingroup para construir un gran modelo en idioma vietnamita. Según el Sr. Van, este modelo se centra en resolver tres problemas fundamentales: mejorar la precisión, reducir los costos de infraestructura y garantizar la seguridad.
"En lugar de necesitar alrededor de 175 mil millones de parámetros como ChatGPT, VinBigdata puede crear un gran modelo de lenguaje con varios miles de millones de parámetros pero aún tiene la capacidad de generar documentos altamente auténticos, centrándose en datos vietnamitas y conocimiento vietnamita", dijo el líder de la unidad.
El dominio de la tecnología, el autodesarrollo desde los primeros pasos y la construcción de un gran modelo en idioma vietnamita se considera un paso adelante para ayudar a VinBigdata a llevar la tecnología de IA generativa al ecosistema de productos y servicios del mercado. Actualmente, la empresa está aplicando inicialmente la nueva tecnología en la línea de productos VinBase KB (VinBase Knowledge Base Portal). El producto es capaz de recuperar información y generar automáticamente respuestas basadas en información recopilada de conjuntos de datos extremadamente grandes en el sistema de conocimiento.
El representante de VinBigdata compartió en el evento el anuncio de la IA Generativa. Foto: VinBigdata
Se espera que en diciembre de este año, los miembros de Vingroup lancen dos líneas de productos principales: VinBase2.0 y la aplicación ViGPT. VinBase 2.0 es una plataforma de inteligencia artificial multicognitiva con soluciones para empresas y agencias gubernamentales. Mientras tanto, la aplicación ViGPT es presentada por la compañía como "versión vietnamita de ChatGPT", abierta al acceso y pruebas de la comunidad. Con ViGPT, los usuarios pueden hacer y responder preguntas sobre información específica sobre Vietnam (regulaciones, documentos legales) o información local (historia, literatura, lugares pintorescos, especialidades locales).
La sociedad anónima VinBigdata dispone de un sistema de base de datos de hasta 3.500 Terabytes. El sistema tiene cientos de miles de horas de datos de voz, imágenes e información que se limpian, procesan, clasifican y utilizan para el entrenamiento de IA y la infraestructura de I+D. La infraestructura consta de docenas de clústeres de servidores NvidiaDGX A100. La empresa también cuenta con un equipo de profesores, científicos y expertos en tecnología vietnamitas de todo el mundo.
Hoai Phuong
Enlace de origen
Kommentar (0)