El profesor Vu Ha Van, director científico de VinBigdata, compartió lo anterior durante un debate con periodistas en el marco del reciente evento de lanzamiento de ViGPT.

anhvuhavan.jpg
Profesor Vu Ha Van, director científico de VinBigdata.

ViGPT necesita contribuciones de técnicos y de la comunidad.

El profesor Vu Ha Van dijo que las grandes empresas como Google, al desarrollar los principales idiomas, elegirán el inglés o el francés como idioma principal. Aunque también existe el vietnamita, los resultados de búsqueda o las búsquedas serán relativamente lentos en comparación con otros idiomas. Hasta cierto punto, las respuestas de estos grandes modelos lingüísticos a las preguntas del vietnamita no serán completas ni precisas.

Por ello, desde VinBigdata esperamos que con el tiempo ViGPT los supere en precisión en cuestiones directamente relacionadas con la cultura, la historia, la geografía... información con características y propiedades únicas del pueblo vietnamita. Esto es lo que los creadores del modelo del idioma vietnamita quieren y buscan en el futuro cuando hagan preguntas a los vietnamitas: será una mejor fuente de comparación que las extranjeras.

Profundizando, el Director de Ciencia de VinBigdata analizó, por ejemplo, una pregunta en un período político “sensible” sobre la historia de Truong Sa y Hoang Sa, es muy difícil para nosotros garantizar que la respuesta de Google o OpenAI no lleve el sesgo político de los fundadores o personas detrás de estas empresas. Aquí tenemos otras opciones en Vietnam, sería mejor si pensáramos en eso.

“Nuestro propósito al construir un gran modelo lingüístico para el pueblo vietnamita es brindarles las mejores respuestas, no podemos conocer su propósito”, compartió el profesor Vu Ha Van.

Es cierto que hay muchas cosas que ViGPT actualmente no puede hacer tan bien como ChatGPT o Google Bard, porque la tasa de inversión de estas empresas y el tiempo que lleva implementarlas son miles de veces mayores. Pero el profesor Vu Ha Van dijo que para algunas preguntas que están sesgadas hacia Vietnam, como "¿De quién es la bandera bordada con seis palabras doradas?", ViGPT responderá que es la de Tran Quoc Toan, mientras que las otras versiones pueden estar equivocadas. En el futuro, con preguntas tan profundas como ésta, ViGPT funcionará mejor si cuenta con retroalimentación de los usuarios nacionales.

“Si los usuarios simplemente critican, o piensan que este gran modelo de lenguaje sigue siendo estúpido cuando mi hijo de 10 años sabe preguntas que no sabe, o hacen preguntas capciosas para demostrar que somos más inteligentes que la IA. Somos más inteligentes que la IA, pero no es por cualquier motivo: aquí no hacemos mejor el producto, sino que hacemos más tristes a las personas que lo hacen. "Por lo tanto, VinBigdata necesita la contribución conjunta del personal técnico y la comunidad. Necesitamos la compañía del pueblo vietnamita para perfeccionar el producto de modo que no sea solo una herramienta de servicio, sino también el orgullo del pueblo vietnamita", enfatizó el profesor Vu Ha Van.

Dispuesto a apoyar y acompañar el modelo de lengua vietnamita

En declaraciones a VietNamNet , representantes de empresas emergentes que trabajan en IA en Vietnam dijeron que están listos para apoyar y acompañar el modelo de idioma vietnamita de VinBigdata.

ViGPT.jpg
Apoyar y acompañar a ViGPT es esencial para desarrollar un modelo amplio de lengua vietnamita.

El Sr. Dinh Tran Tuan Linh, Director de Tecnología de Unikon Joint Stock Company, propietaria de la plataforma Aicontent.vn, dijo que actualmente no son muchos los países de Asia que han hecho esfuerzos para entrenar con éxito sus propios modelos lingüísticos de gran escala, siendo China, Corea y Japón los líderes. Por lo tanto, ViGPT es una señal importante para los esfuerzos del pueblo vietnamita por invertir en tecnología de punta. Según Dinh Tran Tuan Linh, todo viaje de mil millas debe comenzar con los primeros pasos. Como pionero en la aplicación de la IA, Unikon está dispuesto a contribuir, probar, dar retroalimentación e incluso utilizar ViGPT de manera experimental en algunos proyectos de escala adecuada.

Mientras tanto, el Sr. Dang Huu Son, cofundador de Lovinbot, dijo que el hecho de que VinBigdata escuche a la comunidad y los comentarios de los expertos es algo muy bueno para desarrollar un gran modelo de lenguaje específicamente para el pueblo vietnamita. Como técnico, el Sr. Dang Huu Son también brindó comentarios al equipo técnico de VinBigdata después de usar el producto.

Según el Sr. Dang Huu Son, un producto recién lanzado no se puede completar de inmediato, pero tampoco puede recibir el apoyo total de la comunidad de inmediato, porque el pueblo vietnamita ha pensado durante mucho tiempo que Vietnam no puede hacer esa tecnología, por lo que aún necesita tiempo. Al mismo tiempo, VinBigdata necesita tener instrucciones específicas sobre cómo la comunidad puede apoyarse y acompañarse mejor entre sí.

El Sr. Dang Huu Loc, fundador de la plataforma Mindmaid, también compartió que actualmente hay muy pocos países en el mundo que hayan construido un modelo de lengua nativa. Incluso países ricos con una fuerte tecnología de la información, como India, o países con un PIB mayor que Vietnam, como Indonesia o Oriente Medio, no pueden hacerlo sólo porque quieren, porque también depende de las características del idioma. Por lo tanto, desde una perspectiva más amplia, Vietnam tiene una ventaja estratégica en la construcción de un gran modelo de lengua indígena, y esto será una ventaja estratégica para que el pueblo vietnamita compita a nivel mundial.

Según el Sr. Dang Huu Loc, cualquier esfuerzo por construir un gran modelo de idioma vietnamita es valioso y necesita ser comentado de manera específica para hacer que el modelo sea más completo cada día, en lugar de utilizar algunas deficiencias actuales para negar todos los esfuerzos de las unidades de tecnología nacionales. Los vietnamitas también deberían difundir más ampliamente la importancia de la tecnología de grandes lenguajes en la era de la IA y discutir más sobre cómo aplicarla para crear valor para ellos mismos y para las empresas vietnamitas, en lugar de comparar los grandes modelos de lenguajes vietnamitas con los mejores grandes modelos de lenguajes del mundo actual. Debido a que los lenguajes grandes son IA general, es posible que no sean buenos para un problema, pero pueden ser adecuados para otro problema específico. En particular, el gran modelo de lenguaje vietnamita tendrá una mayor ventaja en los problemas relacionados con la comprensión y generación del vietnamita.

La versión comunitaria de ViGPT se proporcionará de forma gratuita a organizaciones sin fines de lucro . VinBigdata proporcionará de forma gratuita la versión comunitaria de ViGPT a organizaciones sin fines de lucro. Sin embargo, las unidades que utilicen esta versión tendrán que pagar costos de infraestructura como la nube y otros recursos durante la implementación.