Al entrar al vestíbulo del aeropuerto, en medio del bullicio de personas que regresaban de un viaje de negocios, Ho Minh Duc se detuvo unos segundos cuando escuchó una voz femenina familiar y suave que leía un anuncio en el sistema.
El personal de Vbee trabaja en la sede de la empresa en Hanoi - Foto: NVCC
Sonrió, sintiéndose aliviado y feliz como si hubiera reencontrado a un pariente. Ese "pariente" es una de las 20 voces de IA con las que Duc y el equipo de Vbee han "comido y dormido" durante muchos días y meses, poniendo todo su corazón en cada línea de sonido, cuidando cada matiz de la voz para hacerlas cada vez más naturales y humanas.
Arranque accidentado
No sé cuántas veces el CEO Ho Minh Duc y la CTO Nguyen Thi Thu Trang, los dos fundadores de Vbee Data Solutions and Services Joint Stock Company, han experimentado tal sentimiento de alegría y orgullo.
Conocieron a "conocidos especiales" en muchas situaciones diferentes: voces claras en los altavoces de la escuela, voces cálidas en los edificios o voces profesionales en las centralitas automáticas de muchas empresas.
Las ideas de Vbee ya no son sólo el resultado de algoritmos y códigos, sino que están entrando en la vida, haciendo contribuciones silenciosas pero poderosas en muchos campos.
Desde introducciones de libros y doblajes de películas hasta anuncios automatizados en centros de llamadas, Vbee da nueva vida a la tecnología de voz.
Como "madre" de la tecnología TTS central, la Dra. Nguyen Thi Thu Trang siempre aspira a acercar los productos de la tecnología de síntesis de voz vietnamita (la tecnología a la que ha dedicado mucho esfuerzo desde su tesis doctoral en la Universidad París 11) a los usuarios reales.
Los primeros días de Vbee estuvieron llenos de dificultades. A pesar de ser gratuito durante los primeros dos años, su motor de texto a voz (TTS) sólo atrajo a un pequeño grupo de usuarios. Pero entonces el COVID-19 resultó ser un punto de inflexión inesperado.
Ante las estrictas normas de distanciamiento social, empresas como FE Credit, Momo, Viet Credit, Sacombank... tienen que encontrar formas de llegar a miles de clientes. Fue entonces cuando Vbee entró en escena: desde recordatorios de deuda hasta respuestas automáticas, su producto se convirtió rápidamente en la solución óptima. En ese momento, los asistentes virtuales y los agentes virtuales generaban el 80% de los ingresos de Vbee.
Cuando la pandemia pasó y la economía mundial cayó, Vbee enfrentó nuevos desafíos. La ola de IA generativa (GenAI) y las tendencias de contenido digital han revivido los motores TTS. Hoy, desde TikTok hasta YouTube y Facebook, las voces de inteligencia artificial de Vbee están en todas partes.
"Hoy en día, gran parte del contenido TTS lo ofrecemos nosotros", compartió con orgullo el Sr. Ho Minh Duc. Actualmente, la base de usuarios real de Vbee ha superado los 2 millones y este número sigue aumentando constantemente un 20% cada mes.
Vbee ha entrenado más de 20 voces corporativas de alta calidad y, si cuenta las voces personalizadas, han creado más de 200 voces de IA diferentes.
Con la nueva tecnología de transcripción de voz que se investigó y probó recientemente, una nueva voz ahora solo necesita 3 minutos de datos grabados para entrenarse en lugar de 4 a docenas de horas de grabación como hace dos años.
El director ejecutivo Ho Minh Duc y la directora de tecnología Nguyen Thi Thu Trang, dos fundadores de Vbee Data Solutions and Services Joint Stock Company - Foto: NVCC
"Entendemos mejor el vietnamita"
En la carrera por la tecnología de síntesis de voz, el director ejecutivo Ho Minh Duc prevé un momento en el que los esfuerzos de innovación tecnológica alcanzarán gradualmente sus límites.
Según él, Vbee no sólo está desarrollando tecnología básica para procesar el habla vietnamita, sino que también ha estado construyendo un sistema tecnológico capaz de comprender profundamente el idioma vietnamita, con todas las sutilezas, tonos y cultura única que sólo los verdaderos vietnamitas pueden comprender plenamente.
Como líder en el mercado TTS en Vietnam, los dos líderes de Vbee creen que su herramienta se ha convertido en el estándar para la lectura de voz con inteligencia artificial para vietnamita. Los usuarios no sólo aprecian la precisión sino que también sienten la "emoción" en cada voz desarrollada por Vbee.
En vietnamita, por ejemplo, la palabra "callejón" tiene muchos nombres diferentes según la región, como "hèm", "kiệt", "xếc"; cada palabra tiene un matiz diferente que la IA necesita comprender.
Para lograrlo, Vbee ha invertido mucho en la recopilación de conjuntos de datos de muestra, así como en potentes sistemas de servidor para el entrenamiento de IA.
"Para ayudar a la IA a comprender y procesar correctamente cada matiz regional, tuvimos que construir innumerables conjuntos de muestras, y el costo del servidor de procesamiento también fue muy alto", compartió el director ejecutivo, Ho Minh Duc.
La Dra. Nguyen Thi Thu Trang ha pasado más de 15 años investigando la tecnología TTS central de Vbee para decodificar los tonos y las características gramaticales del vietnamita. Para ella, su lengua materna es un mundo sutil lleno de matices expresivos.
"Mi lengua vietnamita es muy compleja e interesante, los tonos son los más difíciles y diferentes de muchos otros idiomas populares del mundo. Cuanto más entienda el idioma, más preciso será mi modelo", explicó.
Vbee está afirmando poco a poco que será una parte indispensable de las herramientas y dispositivos con software de procesamiento de idioma vietnamita integrado en la era de la tecnología.
En cada palabra, cada voz, el equipo de Vbee no solo investiga y desarrolla tecnología, sino que también se esfuerza por crear una verdadera "emoción vietnamita" en sus voces de IA.
El nombre Vbee es una abreviatura de la frase "Vietnamese BE your Eyes" (Sé tus ojos en vietnamita), que se origina de mi deseo inicial de construir una herramienta que se convierta en los "ojos" de las personas con discapacidad visual. Pero en la tendencia de desarrollo actual, cuando muchas personas quieren pasar a escuchar más que a ver, creemos que Vbee también se convertirá en los "ojos" de todos.
Dra. Nguyen Thi Thu Trang (profesora de la Facultad de Tecnología de la Información de la Universidad de Ciencia y Tecnología de Hanoi, fundadora y directora tecnológica de Vbee Company)
Encuentro de amantes de los audiolibros
Vbee nació del destino de la Dra. Nguyen Thi Thu Trang con la comunidad de ciegos. Desde sus días de estudiante, ha participado en la grabación de audiolibros y en el desarrollo de un lector vietnamita para apoyar a las personas con discapacidad visual.
Estas experiencias la inspiraron a desarrollar un software de lectura vietnamita: el predecesor de Vbee. En 2018, ella y el Sr. Ho Minh Duc, compañero de clase en la Universidad de Ciencia y Tecnología de Hanoi con experiencia en el proyecto Socbay.com y en la digitalización de audiolibros, fundaron Vbee, una empresa pionera en el campo de la conversión de texto a voz en Vietnam.
Logros destacados de Vbee
- Primer premio del Desafío de Innovación Qualcomm Vietnam 2024
- Premio Especial Tuoi Tre Start-up Award 2023
- Startup ganadora en el programa acelerador Grab Venture Ignite 2020
- Primer premio del Talento Vietnamita 2018, segundo premio del Talento Vietnamita 2020
- Certificado de Tecnología Básica Vietnamita en el Programa Nacional de Transformación Digital 2025 - 2030 del Ministerio de Información y Comunicaciones
- Proyecto ganador del Vietnam Digital Media Award 2018 y del Vingroup Fund 2019.
Visión regional
Después de afirmar su posición en el mercado vietnamita, Vbee apunta a expandirse al sudeste asiático con planes de llevar su tecnología TTS a países como Laos, Tailandia, Camboya y Filipinas para 2026.
Según la Dra. Nguyen Thi Thu Trang, el rápido avance de la tecnología actual con la aparición de modelos multilingües facilitará el desarrollo de herramientas TTS para otros idiomas.
Actualmente, está investigando tecnologías de voz para tailandés, chino e inglés, abriendo nuevos pasos para Vbee en el mercado internacional.
Fuente: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm
Kommentar (0)