Al entrar en la sala de espera del aeropuerto, en medio de la multitud que regresaba de viajes de negocios, Ho Minh Duc se detuvo unos segundos al oír una voz femenina suave y familiar que leía un anuncio por el sistema.
El personal de Vbee está trabajando en la sede central de la empresa en Hanói. Foto: Proporcionada por la empresa.
Sonrió, sintiéndose aliviado y feliz, como si se reencontrara con un ser querido. Ese "ser querido" era uno de los 20 actores de voz con inteligencia artificial con los que Duc y el equipo de Vbee habían trabajado incontables días y meses, dedicando todo su esfuerzo a cada matiz del sonido y perfeccionando cada uno de ellos para que sonaran cada vez más naturales y humanos.
El accidentado camino de las empresas emergentes
El director ejecutivo Ho Minh Duc y la directora de tecnología Nguyen Thi Thu Trang, los dos fundadores de Vbee Data Services and Solutions Joint Stock Company, han experimentado esa alegría y orgullo innumerables veces.
Se reencontraron con estos "conocidos especiales" en diversas circunstancias: las voces claras que se oían por los altavoces de las escuelas, los tonos cálidos en los edificios o las voces profesionales de los sistemas telefónicos automatizados de muchas empresas.
Las creaciones de Vbee ya no son solo el resultado de algoritmos y código; están entrando de lleno en la vida real, haciendo contribuciones discretas pero poderosas en muchos campos.
Desde reseñas de libros y doblaje de películas hasta anuncios automatizados en centros de llamadas, Vbee ha insuflado nueva vida a la tecnología de voz.
Como "madre" de esa tecnología central de síntesis de voz, la Dra. Nguyen Thi Thu Trang siempre ha aspirado a llevar a los usuarios reales los productos derivados de la tecnología de síntesis de voz vietnamita, una tecnología a la que ha dedicado mucha pasión desde su tesis doctoral en la Universidad Paris 11.
Los inicios de Vbee estuvieron plagados de desafíos. A pesar de ser gratuita durante los dos primeros años, su herramienta de conversión de texto a voz (TTS) solo atrajo a un pequeño grupo de usuarios. Pero entonces, inesperadamente, la COVID-19 se convirtió en un punto de inflexión.
Ante las estrictas normas de distanciamiento social, empresas como FE Credit, Momo, Viet Credit, Sacombank , etc., tuvieron que buscar maneras de llegar a miles de clientes. Fue entonces cuando Vbee vio una oportunidad: desde recordatorios de pago hasta respuestas automatizadas, su producto se convirtió rápidamente en la solución óptima. En ese momento, los asistentes virtuales y los agentes de centros de llamadas virtuales generaban hasta el 80 % de los ingresos de Vbee.
A medida que la pandemia remitía y la economía global se contraía, Vbee se enfrentó a un nuevo desafío. La ola de IA generativa (GenAI) y la tendencia del contenido digital revitalizaron la herramienta de síntesis de voz. Hoy en día, desde TikTok hasta YouTube y Facebook, las voces de IA de Vbee están por todas partes.
«Gran parte del contenido actual de texto a voz lo proporcionamos nosotros», compartió con orgullo Ho Minh Duc. Actualmente, la base de usuarios activos de Vbee ha superado los 2 millones, y esta cifra sigue aumentando de forma constante en un 20 % cada mes.
Vbee ha entrenado más de 20 voces corporativas de alta calidad, y si se incluyen las voces personalizadas, han creado más de 200 voces de IA diferentes.
Gracias a la nueva tecnología de transcripción de voz, recientemente investigada y puesta en marcha para pruebas, ahora se necesitan solo 3 minutos de grabación de datos para entrenar una nueva voz, en lugar de las 4 a 10 horas de grabación que se requerían hace dos años.
El director ejecutivo Ho Minh Duc y la directora de tecnología Nguyen Thi Thu Trang, los dos fundadores de Vbee Data Services and Solutions Joint Stock Company. Foto: Proporcionada por la empresa.
"Tenemos una ventaja en nuestro conocimiento del idioma vietnamita."
En la carrera por la tecnología de síntesis de voz, el director ejecutivo Ho Minh Duc prevé que llegará un punto en el que los esfuerzos por innovar en la tecnología alcanzarán gradualmente sus límites.
Según él, Vbee no solo está desarrollando tecnología central para el procesamiento del habla vietnamita, sino que también está construyendo un sistema tecnológico capaz de comprender profundamente el idioma vietnamita, con todas sus sutilezas, tonos y cultura única que solo los verdaderos vietnamitas pueden comprender plenamente.
Como empresa líder en el mercado de síntesis de voz en Vietnam, los dos directivos de Vbee creen que su herramienta se ha convertido en el referente para las locuciones con IA en vietnamita. Los usuarios no solo aprecian la precisión, sino que también perciben la "emoción" en cada voz generada por Vbee.
En vietnamita, por ejemplo, incluso una sola palabra como "ngõ" (callejón) tiene muchos nombres diferentes según la región, como "hẻm", "kiệt" y "xẹc"; cada palabra conlleva un matiz distinto que la IA necesita comprender.
Para lograrlo, Vbee ha invertido mucho en la recopilación de conjuntos de datos de muestra, así como en un potente sistema de servidores para el entrenamiento de la IA.
"Para que la IA pudiera comprender y procesar correctamente información con tales matices regionales, tuvimos que crear innumerables conjuntos de muestras, y el coste de los servidores de procesamiento también fue muy elevado", compartió el director ejecutivo Ho Minh Duc.
La Dra. Nguyen Thi Thu Trang ha dedicado más de 15 años a investigar la tecnología central de síntesis de voz de Vbee para descifrar los tonos y la gramática característicos del idioma vietnamita. Para ella, su lengua materna es un mundo sutil, repleto de matices expresivos.
"El vietnamita es un idioma muy complejo e interesante; los tonos son el aspecto más difícil y diferente al de muchos otros idiomas comunes en el mundo. Cuanto más comprenda el idioma, más preciso será mi modelo", explicó.
Vbee se está consolidando gradualmente como una parte indispensable de las herramientas y dispositivos que integran software de procesamiento del idioma vietnamita en la era tecnológica.
En cada palabra y en cada voz, el equipo de Vbee no solo explora y desarrolla tecnología, sino que también se esfuerza por crear una auténtica "emoción vietnamita" en sus voces de IA.
El nombre Vbee es una abreviatura de "Be your Eyes" (sé tus ojos en vietnamita), que surge de mi deseo inicial de crear una herramienta que sirviera como "ojos" para las personas con discapacidad visual. Sin embargo, en el mundo actual en desarrollo, donde muchas personas priorizan el oído sobre la vista, creemos que Vbee también se convertirá en "ojos" para todos.
Dra. Nguyen Thi Thu Trang (Profesora titular de la Facultad de Tecnologías de la Información y las Comunicaciones de la Universidad de Ciencia y Tecnología de Hanoi, fundadora y directora de tecnología de la empresa Vbee)
Un encuentro de entusiastas de los audiolibros
Vbee nació de la profunda conexión de la Dra. Nguyen Thi Thu Trang con la comunidad de personas con discapacidad visual. Desde sus años de estudiante, ha participado en la grabación de audiolibros y en el desarrollo de sistemas de conversión de texto a voz en vietnamita para apoyar a las personas con discapacidad visual.
Estas experiencias la inspiraron a desarrollar un software vietnamita de conversión de texto a voz, precursor de Vbee. En 2018, ella y su compañero de clase Ho Minh Duc, también estudiante de la Universidad de Ciencia y Tecnología de Hanoi con experiencia en el proyecto Socbay.com y la digitalización de audiolibros, fundaron Vbee, pionera en el campo de la conversión de texto a voz en Vietnam.
Los logros sobresalientes de Vbee
- Ganador del primer premio del Qualcomm Vietnam Innovation Challenge 2024
- Premio especial en los Youth Start-up Award 2023
- La startup gana el programa de aceleración Grab Venture Ignite 2020.
- Primer premio en los Premios al Talento de Vietnam 2018, segundo premio en los Premios al Talento de Vietnam 2020.
- Certificada como tecnología básica vietnamita en el Programa Nacional de Transformación Digital 2025-2030 del Ministerio de Información y Comunicaciones.
- El proyecto ganó el Premio de Medios Digitales de Vietnam 2018 y el Premio de Financiación Vingroup 2019.
Visión regional
Tras haberse consolidado en el mercado vietnamita, Vbee aspira a expandirse al sudeste asiático, con planes para llevar su tecnología de síntesis de voz a países como Laos, Tailandia, Camboya y Filipinas para 2026.
Según la Dra. Nguyen Thi Thu Trang, el rápido avance de la tecnología actual, con la aparición de modelos multilingües, facilitará el desarrollo de herramientas de síntesis de voz para otros idiomas.
Actualmente, está investigando tecnologías de voz para tailandés, chino e inglés, abriendo nuevas vías para Vbee en el mercado internacional.
Fuente: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm






Kommentar (0)