Vbee et l'effort pour donner des ailes à la langue vietnamienne

Báo Tuổi TrẻBáo Tuổi Trẻ17/02/2025

En entrant dans le hall de l'aéroport, au milieu de l'agitation des gens revenant d'un voyage d'affaires, Ho Minh Duc s'est arrêté quelques secondes lorsqu'il a entendu une voix féminine familière et douce lire une annonce sur le système.


Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 1.

Le personnel de Vbee travaille au siège de l'entreprise à Hanoi - Photo : NVCC

Il sourit, se sentant soulagé et heureux comme s’il avait rencontré à nouveau un membre de sa famille. Ce « parent » est l'une des 20 voix d'IA avec lesquelles Duc et l'équipe Vbee ont « mangé et dormi » pendant plusieurs jours et mois, mettant tout leur cœur dans chaque ligne sonore, prenant soin de chaque nuance de la voix pour les rendre de plus en plus naturelles et humaines.

Démarrage cahoteux

Je ne sais pas combien de fois le PDG Ho Minh Duc et le directeur technique Nguyen Thi Thu Trang - les deux fondateurs de Vbee Data Solutions and Services Joint Stock Company - ont éprouvé un tel sentiment de joie et de fierté.

Ils ont rencontré des « connaissances spéciales » dans des situations très diverses : des voix claires sur les haut-parleurs des écoles, des voix chaleureuses dans les bâtiments ou des voix professionnelles provenant des standards automatiques de nombreuses entreprises.

Les créations de Vbee ne sont plus seulement le résultat d’algorithmes et de codes, mais entrent réellement dans la vie, apportant des contributions silencieuses mais puissantes à de nombreux domaines.

Des introductions de livres au doublage de films en passant par les annonces automatisées des centres d’appels, Vbee insuffle une nouvelle vie à la technologie vocale.

En tant que « mère » de la technologie TTS de base, le Dr Nguyen Thi Thu Trang aspire toujours à apporter les produits de la technologie de synthèse vocale vietnamienne - la technologie à laquelle elle a consacré beaucoup d'efforts depuis sa thèse de doctorat à l'Université Paris 11 - aux vrais utilisateurs.

Les débuts de Vbee ont été remplis de difficultés. Bien qu'il ait été gratuit pendant les deux premières années, leur moteur de synthèse vocale (TTS) n'a attiré qu'un petit groupe d'utilisateurs. Mais la COVID-19 s’est avérée être un tournant inattendu.

Face à des règles strictes de distanciation sociale, des entreprises comme FE Credit, Momo, Viet Credit, Sacombank... doivent trouver des moyens d'atteindre des milliers de clients. C'est à ce moment-là que Vbee est entré en scène : des rappels de dettes aux réponses automatisées, leur produit est rapidement devenu la solution optimale. À cette époque, les assistants virtuels et les agents virtuels rapportaient 80 % des revenus de Vbee.

Lorsque la pandémie est passée et que l’économie mondiale s’est effondrée, Vbee a été confronté à de nouveaux défis. La vague de l’IA générative (GenAI) et les tendances en matière de contenu numérique ont relancé les moteurs de synthèse vocale. Aujourd'hui, de TikTok à YouTube, en passant par Facebook, les voix IA de Vbee sont partout.

« Aujourd'hui, nous fournissons beaucoup de contenu TTS », a fièrement partagé M. Ho Minh Duc. Actuellement, la base d'utilisateurs réelle de Vbee a dépassé les 2 millions, et ce nombre continue d'augmenter régulièrement de 20 % chaque mois.

Vbee a formé plus de 20 voix d'entreprise de haute qualité, et si vous comptez les voix personnalisées, ils ont créé plus de 200 voix d'IA différentes.

Grâce à la nouvelle technologie de transcription vocale qui a été récemment étudiée et testée, une nouvelle voix n'a désormais besoin que de 3 minutes de données enregistrées pour s'entraîner au lieu de 4 à des dizaines d'heures d'enregistrement comme il y a deux ans.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 2.

Le PDG Ho Minh Duc et la directrice technique Nguyen Thi Thu Trang - deux fondateurs de Vbee Data Solutions and Services Joint Stock Company - Photo : NVCC

« Nous comprenons mieux le vietnamien »

Dans la course à la technologie de synthèse vocale, le PDG Ho Minh Duc voit un moment où les efforts d'innovation technologique atteindront progressivement leurs limites.

Selon lui, Vbee ne développe pas seulement une technologie de base pour le traitement de la parole vietnamienne, mais construit également un système technologique capable de comprendre en profondeur la langue vietnamienne - avec toutes les subtilités, les tons et la culture unique que seuls les vrais Vietnamiens peuvent pleinement comprendre.

En tant que leader sur le marché TTS au Vietnam, les deux dirigeants de Vbee estiment que leur outil est devenu la norme pour la lecture vocale IA pour le vietnamien. Les utilisateurs apprécient non seulement la précision mais ressentent également « l’émotion » dans chaque voix développée par Vbee.

En vietnamien, par exemple, le seul mot « ruelle » a de nombreux noms différents selon la région, tels que « hèm », « kiệt », « xếc » - chaque mot a une nuance différente que l'IA doit comprendre.

Pour y parvenir, Vbee a investi massivement dans la collecte d’échantillons de données ainsi que dans de puissants systèmes de serveurs pour la formation de l’IA.

« Pour aider l'IA à comprendre et à traiter correctement chaque nuance régionale, nous avons dû créer d'innombrables ensembles d'échantillons, et le coût du serveur de traitement était également très élevé », a partagé le PDG Ho Minh Duc.

Le Dr Nguyen Thi Thu Trang a passé plus de 15 ans à rechercher la technologie TTS de base de Vbee pour décoder les tons et les caractéristiques grammaticales du vietnamien. Pour elle, sa langue maternelle est un monde subtil plein de nuances expressives.

« Ma langue vietnamienne est très complexe et intéressante, les tons sont les plus difficiles et différents de beaucoup d'autres langues populaires dans le monde. Plus je comprends la langue, plus mon modèle sera précis », a-t-elle expliqué.

Vbee affirme progressivement qu'il deviendra un élément indispensable des outils et appareils dotés d'un logiciel intégré de traitement de la langue vietnamienne à l'ère de la technologie.

Dans chaque mot, chaque voix, l'équipe Vbee non seulement recherche et développe une technologie, mais s'efforce également de créer une véritable « émotion vietnamienne » dans ses voix d'IA.

Le nom Vbee est une abréviation de l'expression « Vietnamien BE your Eyes », issue de mon désir initial de construire un outil qui devienne les « yeux » des malvoyants. Mais dans la tendance de développement actuelle, alors que de nombreuses personnes souhaitent passer à l'écoute plutôt qu'à la vue, nous pensons que Vbee deviendra également les « yeux » de tout le monde.

Dr. Nguyen Thi Thu Trang (Maître de conférences, École des technologies de l'information, Université des sciences et technologies de Hanoi, fondatrice et directrice technologique de la société Vbee)

Rencontre des amateurs de livres audio

Vbee est né du destin du Dr Nguyen Thi Thu Trang avec la communauté des aveugles. Depuis ses années d'étudiante, elle a participé à l'enregistrement de livres audio et au développement d'un lecteur vietnamien pour aider les malvoyants.

Ces expériences l’ont inspirée à développer un logiciel de lecture vietnamien – le prédécesseur de Vbee. En 2018, elle et M. Ho Minh Duc - un camarade de classe de l'Université des sciences et technologies de Hanoi avec l'expérience du projet Socbay.com et de la numérisation de livres audio - ont fondé Vbee, un pionnier dans le domaine de la conversion de texte en parole au Vietnam.

Les réalisations exceptionnelles de Vbee

- Premier prix du Qualcomm Vietnam Innovation Challenge 2024

- Prix spécial Tuoi Tre Start-up Award 2023

- Start-up gagnante du programme d'accélération Grab Venture Ignite 2020

- Premier prix du Talent Vietnamien 2018, deuxième prix du Talent Vietnamien 2020

- Certificat de technologie de base vietnamienne dans le cadre du programme national de transformation numérique 2025-2030 du ministère de l'Information et des Communications

- Projet gagnant du Vietnam Digital Media Award 2018 et du Vingroup Fund 2019.

Vision régionale

Après avoir affirmé sa position sur le marché vietnamien, Vbee souhaite s'étendre en Asie du Sud-Est avec pour objectif d'apporter sa technologie TTS à des pays comme le Laos, la Thaïlande, le Cambodge et les Philippines d'ici 2026.

Selon le Dr Nguyen Thi Thu Trang, l’avancée rapide de la technologie aujourd’hui avec l’émergence de modèles multilingues facilitera le développement d’outils TTS pour d’autres langues.

Actuellement, elle effectue des recherches sur les technologies vocales pour le thaï, le chinois et l'anglais, ouvrant ainsi de nouvelles perspectives pour Vbee sur le marché international.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 3. Une start-up vietnamienne honorée au AI Summit de Paris

Enfarm, une start-up de technologie d'intelligence artificielle (IA) pour l'agriculture vietnamienne, est l'un des quatre représentants asiatiques parmi les 50 projets présentés au AI Action Summit à Paris (France) les 10 et 11 février.



Source: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm

Comment (0)

No data
No data

Même sujet

Même catégorie

Même auteur

Chiffre

Les journaux étrangers vantent la « Baie d'Ha Long terrestre » du Vietnam
Les pêcheurs de la province de Quang Nam ont capturé des dizaines de tonnes d'anchois en jetant leurs filets toute la nuit à Cu Lao Cham.
Le meilleur DJ du monde explore Son Doong et dévoile une vidéo à succès
Phuong « Singapour » : une jeune fille vietnamienne fait sensation en cuisinant près de 30 plats par repas

No videos available