El concurso VLSP sobre procesamiento del habla y el idioma vietnamita es parte de la conferencia internacional anual sobre procesamiento del habla y el idioma vietnamita organizada por el club VLSP, una rama de la Asociación de Vietnam para la Tecnología de la Información. VLSP 2023 organiza 10 competiciones sobre procesamiento de voz y texto, reuniendo a destacados investigadores, expertos y unidades de desarrollo tecnológico. Al participar en el Procesamiento del habla y del idioma vietnamita 2023, Viettel AI ganó a lo grande con el primer premio en 2 categorías: Reconocimiento de voz y Reconocimiento de emociones del habla; Traducción automática vietnamita - lao.

En el cual, el reconocimiento automático de voz es uno de los problemas importantes del procesamiento de voz para convertir las señales de voz de entrada en el texto correspondiente. Este año, con una innovación en la estructura de las categorías de competencia, los equipos tuvieron que realizar dos problemas al mismo tiempo: reconocimiento de voz y reconocimiento de emociones del habla. Viettel AI no solo superó este desafío para ganar el primer lugar, sino que también impresionó con una puntuación sobresaliente de 89,18% (los equipos siguientes obtuvieron 83,40% y 78,45% respectivamente).

Según el representante de Viettel AI, el punto clave que conduce a este resultado de precisión sobresaliente es que Viettel AI dominó la tecnología de forma temprana. En lugar de utilizar modelos de resultados de investigación disponibles, Viettel AI ha desarrollado desde cero un modelo específico para el procesamiento del habla vietnamita y ha actualizado y optimizado continuamente su eficiencia. Combinado con el establecimiento de un ciclo de entrenamiento que puede manejar todos los datos en diferentes condiciones de calidad, los ingenieros construyeron con éxito un modelo que puede reconocer tanto el texto como la emoción de una oración con alta precisión, en condiciones de datos limitadas.

aaaaaaaaaaaaa.jpg
Los ingenieros de la plataforma de asistente virtual de Viettel AI participan en las categorías de Reconocimiento de voz y Reconocimiento de emociones del habla.

La tecnología de procesamiento avanzado de voz ha aportado una eficiencia significativa a los productos de inteligencia artificial de Viettel, como los sistemas de asistentes virtuales y las centralitas virtuales que pueden reconocer la voz con hasta un 95 % de precisión e identificar las intenciones del cliente con hasta un 96 % de precisión. En particular, los resultados de las investigaciones tecnológicas sobre reconocimiento de voz y emociones de la competencia abrirán nuevas aplicaciones en atención al cliente, extracción de información de llamadas de centralita, etc. Las quejas y llamadas negativas de los clientes a la centralita a menudo representan una pequeña cantidad de los cientos de miles de llamadas a la línea de ayuda cada día, pero tienen un gran impacto en la calidad del servicio. En lugar de gastar dinero en contratar personas para escuchar y marcar estas llamadas como antes, la centralita virtual Viettel Cyberbot podrá identificar y gestionar automáticamente las quejas de los clientes tan pronto como reciban la llamada.

A través de la competencia, Viettel AI afirma su determinación de ser pionero en el desarrollo y la aplicación de las tecnologías de procesamiento de voz más avanzadas para mejorar la calidad de los productos y servicios.

Quoc Tuan