Después de trabajar para una gran organización de inteligencia artificial en EE. UU., ¿por qué decidió regresar a casa para unirse a VinBigdata?
Durante el tiempo que trabajé en los EE. UU., aunque participé en muchos proyectos gubernamentales de gran envergadura, los resultados que logré fueron a menudo sólo unos pocos pasos en un gran procedimiento de procesamiento. De hecho, muchas veces, debido a los estrictos procedimientos de confidencialidad de los proyectos, ni siquiera sé cómo se utilizan las soluciones que he desarrollado.
En 2017, regresé a Vietnam cuando estaba en la etapa de desarrollo y había muchos problemas sobre big data e inteligencia artificial que necesitaban resolverse. Acepté la invitación del Profesor Vu Ha Van para realizar conjuntamente el objetivo de desarrollar soluciones tecnológicas vietnamitas para servir a la vida del pueblo vietnamita. Considero que mi regreso a Vietnam tiene mucho más significado porque podré resolver problemas con mayor impacto.
El Dr. Dao Duc Minh en un taller
En la estrategia de desarrollo de la inteligencia artificial, ¿qué papel e influencia juega el big data, señor?
Los datos juegan un papel enorme y valioso en el entrenamiento de la inteligencia artificial. El entrenamiento de un modelo de inteligencia artificial de alta calidad generalmente comienza con el entrenamiento de un gran conjunto de datos. Por lo tanto, para tener una inteligencia artificial de calidad, primero necesitamos tener buenos datos.
Los buenos datos deben ser de la calidad adecuada en términos de cantidad, escala, calidad, variedad y universalidad. El proceso de recopilar y procesar miles de horas de datos, desde el paso de limpieza de datos sin procesar hasta la creación de datos de la más alta calidad para alimentar modelos de inteligencia artificial, es muy costoso y complejo. Por el contrario, para analizar grandes volúmenes de datos, necesitamos utilizar inteligencia artificial para garantizar la capacidad de procesar datos con precisión a gran escala, creando así mejores resultados decisivos o predictivos.
Por ejemplo, en el proceso de desarrollo de un producto de asistente virtual para los vietnamitas (ViVi), tuvimos que recopilar y procesar decenas de miles de horas de datos de audio de alta calidad, de cientos de miles de voces de diferentes regiones, edades y géneros diversos, con contenido que abarca cientos de campos...
O más recientemente, el lanzamiento de ViGPT: "La primera versión vietnamita de ChatGPT para usuarios finales", desarrollada a partir del Gran Modelo de Lenguaje completamente propiedad de VinBigdata. Este modelo está entrenado con 600 GB de datos vietnamitas ajustados de varios dominios. Con nuestro conocimiento del idioma y los datos vietnamitas, encontramos un nuevo enfoque para acortar el tiempo de lanzamiento de ViGPT en solo 9 meses después del nacimiento de ChatGPT.
Ésta es la resonancia entre el big data y la inteligencia artificial.
¿Cuál es su opinión sobre vincular la investigación con el valor práctico para servir a la comunidad?
- Creo que la investigación tecnológica sólo es verdaderamente exitosa cuando realmente entra en la vida, resuelve problemas sociales y mejora la vida de las personas.
Para crear productos comerciales prácticos que resuelvan problemas empresariales y sociales, debemos prestar siempre atención y hacernos la pregunta: ¿qué valor aportarán los datos a la vida?
Hasta ahora, hemos investigado y desarrollado una variedad de productos y soluciones para diversas industrias y campos, típicamente ViGPT, VinDr, que proporciona soluciones de IA en el diagnóstico de imágenes médicas, VinBase, una plataforma de inteligencia bioartificial, o Vizone, un conjunto de soluciones de análisis de imágenes inteligentes.
Con personal clave de VinBigdata en un evento de Vingroup Corporation
La cuarta revolución industrial se está desarrollando con fuerza a escala global. ¿Qué ventajas cree usted que tiene Vietnam?
En comparación con revoluciones anteriores, creo que Vietnam tiene actualmente muchas ventajas para abrirse paso en esta revolución industrial 4.0, ayudando a mejorar la posición del país en el mapa mundial. Las dos claves para lograr este objetivo son los datos y las personas.
Vietnam tiene actualmente casi 100 millones de habitantes, de los cuales un alto porcentaje de jóvenes utilizan teléfonos y ordenadores personales. Además, contamos con reputados expertos en inteligencia artificial y personal joven y de calidad en tecnologías de la información y una muy buena base en matemáticas.
Entonces, ¿cuáles son las limitaciones?
La primera limitación evidente es que, a pesar de contar con una gran población, aún tenemos dificultades para dominar los datos, en concreto para estandarizarlos y sincronizarlos en las instalaciones, unidades de negocio y administraciones.
Además, también nos enfrentamos a otras limitaciones, como los recursos de inversión limitados, especialmente la inversión en infraestructura informática de alto rendimiento.
En su opinión, ¿qué importancia tiene el papel del dominio de los datos vietnamitas en el proceso de creación y dominio de la tecnología para servir a la vida del pueblo vietnamita?
Actualmente existen muchos productos de inteligencia artificial líderes en el mundo, típicamente productos de aplicaciones de IA que generan modelos de lenguaje grandes como ChatGPT de OpenAI o Bard de Google. Sin embargo, el vietnamita no es el grupo lingüístico principal para el desarrollo de estos productos.
Por lo tanto, la calidad del contenido específico en vietnamita que se devuelve a los usuarios se ve más o menos afectada y tiene una alta posibilidad de errores, y lo que es más peligroso, errores en los conocimientos básicos.
Como vietnamitas, tenemos la ventaja de acceder a nuestras propias fuentes de datos. Sólo nosotros tenemos la capacidad de comprender las características de los datos vietnamitas, las necesidades y características del pueblo vietnamita. Por lo tanto, dominar los datos vietnamitas es realmente la clave para dominar las tecnologías fundamentales, que son las tecnologías que servirán al pueblo vietnamita.
Formación interna para miembros de VinBigdata
¿Cómo acceder a fuentes de datos específicas, especialmente cuando la mayoría de los vietnamitas utilizan hoy sitios de redes sociales desde el extranjero?
El hecho es que hoy en día la mayor fuente de datos humanos (no sólo de los vietnamitas) está en Internet y en las redes sociales. Sin embargo, todavía podemos acceder y recopilar datos de diferentes fuentes, en función de la comprensión de las características de los datos vietnamitas, dependiendo de las características establecidas por cada proyecto.
Por ejemplo, los modelos GPT de OpenAI tienen cientos o incluso billones de parámetros, se entrenan con cantidades masivas de datos y cuestan miles de millones de dólares. En comparación con ellos, hemos elegido una dirección completamente diferente en función de nuestra investigación, capacidades y recursos: es decir, crear un modelo de idioma vietnamita con una arquitectura de solo unos pocos miles de millones de parámetros, entrenado en un conjunto de datos vietnamitas de 600 GB que recopilamos y refinamos nosotros mismos, pero con capacidades equivalentes en términos de capacidad de procesamiento del vietnamita. Los resultados muestran que nuestra arquitectura desarrollada internamente puede autooptimizarse, acortar el tiempo de entrenamiento del modelo de lenguaje, reducir costos y al mismo tiempo garantizar la calidad del modelo.
¿Cuáles son los desafíos que usted y su equipo han enfrentado en el proceso de investigación y desarrollo de productos de inteligencia artificial?
El primer desafío es sin duda el tiempo. La ola de tecnología de inteligencia artificial está avanzando muy rápido y se encuentra en un período de auge. En todo el mundo, las empresas tecnológicas líderes han lanzado rápidamente productos altamente completos que se actualizan y mejoran constantemente. Si somos lentos y no entregamos los productos a tiempo, definitivamente nos quedaremos atrás.
Por otro lado, si queremos crear productos que puedan aplicarse y resolver problemas sociales prácticos, también debemos considerar encontrar y desarrollar las características sobresalientes, especiales y únicas del producto.
Presentación en el Día de la Inteligencia Artificial de Vietnam (AI4VN 2023)
De hecho, muchas personas y organizaciones en Vietnam y en todo el mundo han sufrido grandes pérdidas por filtraciones de datos. ¿Cómo ve las cuestiones de seguridad de los datos?
Se puede decir que cualquier aplicación hoy en día proviene de datos. Al trabajar con datos, por un lado, debemos garantizar el objetivo de aplicar los datos para crear la mejor tecnología para la vida y, por otro lado, debemos garantizar la seguridad de los datos para las personas y las organizaciones.
El factor humano es un eslabón muy importante en el proceso de seguridad de datos. Incluyen desarrolladores, usuarios de productos y usuarios. Para los desarrolladores, la conciencia de la seguridad de los datos debe estar presente desde el comienzo mismo de la recopilación y el procesamiento de datos.
A menudo, cuando no sucede nada, no somos conscientes de la importancia de la seguridad de los datos. Pero si ocurre una violación de datos, el daño podría ser enorme. Las violaciones de datos pueden ocurrir debido a problemas técnicos o a ataques intencionales de robo de datos. Cuando se filtran datos, la información de individuos u organizaciones puede ser utilizada por personas malintencionadas con fines ilegales, mientras que las empresas pueden sufrir pérdidas financieras para solucionar problemas relacionados e incluso dañar su marca.
El Dr. Dao Duc Minh y el equipo de VinBigdata en un evento
Después de la aspiración de dominar la tecnología para servir al pueblo vietnamita, ¿habrá pasos para avanzar hacia el mundo?
Cualquier organización o empresa que quiera llevar sus productos al mercado internacional debe cumplir con estándares internacionales. VinBigdata tiene fortalezas en soluciones y tecnología, por lo que establecer una visión para conquistar el mundo es natural.
Por supuesto, para implementar muchos productos y aplicaciones diferentes, es necesario contar con el apoyo de unidades internacionales con muchos años de experiencia y entendimiento de usuarios de todo el mundo.
¡Gracias!
Fuente: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm
Kommentar (0)