Al salir de EE. UU. para regresar a casa, Nguyen Hoang Quan y sus colegas de VILM desarrollaron un sistema de inteligencia artificial (IA) gratuito para que los vietnamitas lo utilicen en campos de atención al cliente, con más de cientos de miles de descargas por mes.
En junio de 2023, Nguyen Hoang Quan, de 25 años, y sus colegas Pham Nhut Huy, de 23 años, ingeniero de inteligencia artificial en ZaloAI, y Dao Minh Dung, de 24 años, estudiante de doctorado en la Universidad de Cork, Irlanda, cofundaron la organización sin fines de lucro VILM, con el deseo de ayudar a los vietnamitas a experimentar la tecnología de IA más avanzada de la manera más óptima.
Después de casi 6 meses de investigación y aplicación, el equipo desarrolló con éxito tres modelos de IA gratuitos, incluidos OpenHermes, VinaLlama y Vistral. Estos son los estudios fundamentales para desarrollar sistemas de IA que puedan comprender y actuar según la intención del usuario (modelo de gran acción). Estos modelos se aplican en campos tecnológicos como el control de máquinas, robots para ayudar mejor a personas discapacitadas sin cuidadores o ayudar a los programadores a corregir errores, asistentes virtuales para atender a los clientes o responder preguntas de forma gratuita.
OpenHermes alcanza las 85.000 descargas al mes, ubicándose entre los 10 modelos de lenguaje más descargados en HuggingFace (el sitio de intercambio de modelos de IA más grande del mundo). Captura de pantalla
El modelo OpenHermes es un modelo de lenguaje grande que admite inglés como ChatGPT, pero con puntuaciones superiores. Permiten a los usuarios descargar modelos a sus computadoras personales para utilizarlos sin necesidad de Internet. En particular, el volumen de datos de entrenamiento de OpenHermes es solo 1/100 del volumen de datos de entrenamiento de ChatGPT de OpenAI. Actualmente, la aplicación recibe más de 50.000 descargas al mes. OpenHermes-2.5 y OpenHermes-2.5-Vision están siendo utilizados por más de 40 startups en Silicon Valley (EE.UU.),
VinaLlama y Vistral son dos modelos de lenguaje enfocados en atender al mercado vietnamita, con el objetivo de ayudar a los usuarios nacionales a experimentar la tecnología de inteligencia artificial más avanzada con mayor facilidad.
Hoang Quan estudió en EE. UU. durante 7 años y trabajó en OpenAI como ingeniero de investigación para el modelo de inteligencia artificial ChatGPT, aunque no se había graduado de la universidad. En 2022, trabajó como ingeniero de datos para el producto Bing Chat de Microsoft y OpenAI con un ingreso de miles de dólares. En 2023, frente a una ola de despidos en el sector tecnológico en EE. UU., Quan se dio cuenta de que el mercado laboral posterior a la graduación era muy sombrío, pero al ver oportunidades en Vietnam, decidió regresar a casa.
1. Nguyen Hoang Quan (nacido el 10 de junio de 1961) es un ex miembro de la Foto: NVCC
En VILM, Quan es un ingeniero jefe principalmente responsable de investigar técnicas de mejora de datos y entrenamiento de IA. Mientras Nhat Huy asume el papel de investigación técnica al entrenar IA, Minh Dung propone nuevos métodos en la investigación teórica.
Quan explicó que los grandes modelos de lenguaje actuales, como ChatGPT (Large Language Model), solo pueden proporcionar salida de texto, mientras que los humanos tienen muchas formas de comunicarse y adquirir conocimientos. Por eso, el equipo pretende crear un sistema que pueda operar de forma flexible entre diferentes tipos de entrada y salida (pueda recibir y emitir tipos de datos como idioma, imágenes, vídeos, audio), no sólo detenerse en el nivel del lenguaje.
Para lograr el objetivo de crear modelos de acción de gran tamaño, el equipo tuvo que superar dos problemas: seguridad y velocidad. Las aplicaciones de IA actuales utilizan principalmente datos de los usuarios y los envían a los servidores de empresas como OpenAI para su procesamiento, lo que genera problemas de seguridad. El equipo se centró en crear modelos de IA que fueran lo suficientemente pequeños y rápidos para ser procesados directamente en dispositivos móviles, al tiempo que equilibraban el rendimiento y la velocidad para evitar afectar la experiencia del usuario.
El equipo experimental utilizó datos generados por la IA para permitir que la propia IA aprendiera, en lugar de utilizar datos de fuentes reales. Al principio tuvieron dificultades para encontrar recursos computacionales (computadoras para entrenar a la IA), pero luego convencieron a grandes empresas y laboratorios de todo el mundo para que los patrocinaran.
Quan dijo que la fabricación de estos productos ayuda principalmente a las personas a acceder a aplicaciones de IA de forma rápida y con una calidad no inferior a ChatGPT o Bing Chat y hace que la investigación y la creación de modelos de IA en el futuro sean más sencillas. En lugar de utilizar ChatGPT, que está limitado al idioma y la cultura vietnamitas, las empresas vietnamitas pueden descargar VinaLlama en vietnamita.
El modelo de lenguaje VinaLlama maneja fácilmente un problema de matemáticas en vietnamita. En la imagen se muestra una demostración del producto VinaLlama para resolver problemas de matemáticas. Captura de pantalla.
El Sr. Dang Hai Loc, fundador de la plataforma de creación de chatbots de inteligencia artificial Mindmaid, dijo que, desde la perspectiva de un desarrollador de aplicaciones de inteligencia artificial, se dio cuenta de que el costo y la privacidad de los datos son los dos problemas que más preocupan a las empresas al implementar aplicaciones de inteligencia artificial. La solución más satisfactoria a este problema son los modelos LLM de código abierto, que pueden ejecutarse en la infraestructura empresarial y pueden aprender (ajustarse) con los propios datos de la empresa. Por lo tanto, los modelos LLM de código abierto vietnamitas como VinaLlama, Vistral... son muy valiosos para promover aplicaciones de IA en Vietnam.
"Estos modelos de código abierto también permiten que más programadores y entusiastas de la tecnología accedan al campo de la ingeniería de IA con solo una MacBook en lugar de tener que invertir en una costosa infraestructura de GPU (tarjeta gráfica). Esto también promoverá la fuerza de ingenieros de IA en Vietnam, un rol que tendrá una gran demanda en el futuro cercano", dijo el Sr. Loc.
Según Quan, los vietnamitas tienen una muy buena base en teoría científica, son buenos en IA y ChatGPT también tiene recursos humanos que participan en la investigación, pero tienen más dificultades para ponerse al día rápidamente con la ola de tecnología en constante cambio. "Lo que los vietnamitas necesitan es experiencia en la fabricación de productos para los usuarios finales para comprender verdaderamente los problemas que enfrentan a fin de orientar adecuadamente su investigación", dijo Quan sobre el motivo de investigar modelos de IA gratuitos para apoyar a los vietnamitas en tecnología. Dijo que ha colaborado con muchos grupos internacionales y siempre está dispuesto a colaborar con grupos de investigación en Vietnam.
Nhu Quynh
Enlace de origen
Kommentar (0)