En entrant dans la salle d'attente de l'aéroport, au milieu de la foule animée revenant de voyages d'affaires, Ho Minh Duc s'arrêta quelques secondes lorsqu'il entendit une voix féminine douce et familière lire une annonce sur le système.
Le personnel de Vbee travaille au siège social de l'entreprise à Hanoï - Photo : Fournie par l'entreprise.
Il sourit, soulagé et heureux, comme s'il retrouvait un être cher. Cet « être cher » était l'un des 20 acteurs vocaux IA avec lesquels Duc et l'équipe Vbee avaient travaillé pendant d'innombrables jours et mois, mettant tout leur cœur dans chaque nuance sonore et travaillant avec soin chaque nuance pour les rendre toujours plus naturelles et humaines.
Le parcours semé d'embûches des start-ups
Le PDG Ho Minh Duc et la directrice technique Nguyen Thi Thu Trang – les deux fondateurs de la société par actions Vbee Data Services and Solutions – ont éprouvé une telle joie et une telle fierté à maintes reprises.
Ils retrouvaient ces « connaissances particulières » dans diverses circonstances : les voix claires diffusées par les haut-parleurs de l'école, les tonalités chaleureuses dans les bâtiments ou les voix professionnelles des systèmes téléphoniques automatisés de nombreuses entreprises.
Les créations de Vbee ne sont plus seulement le fruit d'algorithmes et de code ; elles s'intègrent véritablement à la vie réelle, apportant des contributions discrètes mais puissantes à de nombreux domaines.
Des critiques de livres au doublage de films en passant par les annonces automatisées des centres d'appels, Vbee a insufflé une nouvelle vie à la technologie vocale.
En tant que « mère » de cette technologie TTS fondamentale, le Dr Nguyen Thi Thu Trang a toujours aspiré à mettre à la disposition des utilisateurs réels des produits dérivés de la technologie de synthèse vocale vietnamienne – une technologie à laquelle elle a consacré beaucoup de passion depuis sa thèse de doctorat à l’Université Paris 11.
Les débuts de VBee ont été semés d'embûches. Malgré sa gratuité pendant les deux premières années, son outil de synthèse vocale (TTS) n'a attiré qu'un petit nombre d'utilisateurs. Mais la COVID-19 a constitué un tournant inattendu.
Face aux strictes mesures de distanciation sociale, des entreprises comme FE Credit, Momo, Viet Credit, Sacombank , etc., ont dû trouver des solutions pour rester en contact avec leurs milliers de clients. C'est alors que Vbee a su saisir une opportunité : des rappels de paiement aux réponses automatisées, son produit s'est rapidement imposé comme la solution idéale. À cette époque, les assistants virtuels et les agents de centres d'appels virtuels généraient jusqu'à 80 % du chiffre d'affaires de Vbee.
Avec le recul de la pandémie et le ralentissement de l' économie mondiale, Vbee a dû relever un nouveau défi. L'essor de l'intelligence artificielle générative (GenAI) et la popularité croissante des contenus numériques ont relancé l'outil de synthèse vocale. Aujourd'hui, de TikTok à YouTube en passant par Facebook, les voix de synthèse vocale de Vbee sont omniprésentes.
« Une grande partie du contenu TTS actuel est fournie par nos soins », a fièrement déclaré Ho Minh Duc. À ce jour, Vbee compte plus de 2 millions d'utilisateurs actifs et ce nombre continue de croître régulièrement de 20 % par mois.
Vbee a formé plus de 20 voix d'entreprise de haute qualité, et si l'on inclut les voix sur commande, ils ont créé plus de 200 voix d'IA différentes.
Grâce à une nouvelle technologie de transcription vocale récemment mise au point et testée, une nouvelle voix ne nécessite plus que 3 minutes d'enregistrement pour l'entraînement, au lieu de 4 à 10 heures comme c'était le cas il y a deux ans.
Le PDG Ho Minh Duc et la directrice technique Nguyen Thi Thu Trang – les deux fondateurs de la société par actions Vbee Data Services and Solutions – Photo : Fournie par l’entreprise.
« Notre compréhension de la langue vietnamienne nous confère un avantage. »
Dans la course à la technologie de synthèse vocale, le PDG Ho Minh Duc entrevoit un point où les efforts d'innovation technologique atteindront progressivement leurs limites.
Selon lui, Vbee ne se contente pas de développer une technologie de traitement de la parole vietnamienne de base, mais construit également un système technologique capable de comprendre en profondeur la langue vietnamienne – avec toutes ses subtilités, ses intonations et sa culture unique que seuls les vrais Vietnamiens peuvent pleinement appréhender.
En tant que leader du marché de la synthèse vocale au Vietnam, les deux dirigeants de Vbee estiment que leur outil est devenu la référence en matière de voix off IA en vietnamien. Les utilisateurs apprécient non seulement la précision, mais aussi l'émotion qui se dégage de chaque voix créée par Vbee.
En vietnamien, par exemple, même un seul mot comme « ngõ » (ruelle) a de nombreux noms différents selon la région, tels que « hẻm », « kiệt » et « xẹc » — chaque mot portant une nuance distincte que l'IA doit comprendre.
Pour ce faire, Vbee a investi massivement dans la collecte d'ensembles de données d'exemple ainsi que dans un système de serveurs puissant pour l'entraînement de l'IA.
« Pour permettre à l'IA de comprendre et de traiter correctement des informations présentant de telles nuances régionales, nous avons dû constituer d'innombrables ensembles d'échantillons, et le coût des serveurs de traitement était également très élevé », a expliqué le PDG Ho Minh Duc.
Le Dr Nguyen Thi Thu Trang a consacré plus de 15 ans à la recherche sur la technologie TTS de VBee afin de déchiffrer les intonations et la grammaire distinctives de la langue vietnamienne. Pour elle, sa langue maternelle est un monde subtil, riche en nuances expressives.
« Le vietnamien est une langue très complexe et intéressante ; les tons constituent l’aspect le plus difficile et diffèrent de ceux de nombreuses autres langues courantes dans le monde. Plus je comprendrai la langue, plus mon modèle sera précis », a-t-elle expliqué.
Vbee s'impose progressivement comme un élément indispensable des outils et appareils intégrant des logiciels de traitement du langage vietnamien à l'ère technologique.
Dans chaque mot et chaque voix, l'équipe Vbee n'explore et ne développe pas seulement la technologie, mais s'efforce également de créer une véritable « émotion vietnamienne » dans ses voix d'IA.
Le nom VBee est l'abréviation de « Vietnamese BE your Eyes » (sois tes yeux en vietnamien), né de mon désir initial de créer un outil qui servirait d'« yeux » aux personnes malvoyantes. Cependant, dans le monde en développement d'aujourd'hui, où beaucoup privilégient l'ouïe à la vue, nous pensons que VBee deviendra également un outil précieux pour tous.
Dr. Nguyen Thi Thu Trang (Maître de conférences à l'École des technologies de l'information et des communications de l'Université des sciences et technologies de Hanoï, fondatrice et directrice technique de la société Vbee)
Un rassemblement de passionnés de livres audio
Vbee est né de l'engagement profond de la docteure Nguyen Thi Thu Trang auprès de la communauté des personnes malvoyantes. Depuis ses études, elle participe à l'enregistrement de livres audio et au développement de systèmes de synthèse vocale vietnamiens destinés à aider les personnes malvoyantes.
Ces expériences l'ont incitée à développer un logiciel de synthèse vocale vietnamien, précurseur de Vbee. En 2018, elle et son camarade de classe Ho Minh Duc, également étudiant à l'Université des sciences et technologies de Hanoï et fort d'une expérience acquise sur le projet Socbay.com et dans la numérisation de livres audio, ont fondé Vbee, pionnière dans le domaine de la synthèse vocale au Vietnam.
Les réalisations exceptionnelles de Vbee
- Premier prix du Qualcomm Vietnam Innovation Challenge 2024
- Prix spécial du concours Youth Start-up Award 2023
- La startup remporte le programme d'accélération Grab Venture Ignite 2020.
- Premier prix aux Vietnam Talent Awards 2018, deuxième prix aux Vietnam Talent Awards 2020.
- Certifiée comme technologie de base vietnamienne dans le cadre du Programme national de transformation numérique 2025-2030 du ministère de l'Information et des Communications.
- Le projet a remporté le Vietnam Digital Media Award 2018 et le Vingroup Funding Award 2019.
Vision régionale
Après s'être implantée sur le marché vietnamien, Vbee ambitionne de s'étendre à l'Asie du Sud-Est, avec l'intention de déployer sa technologie TTS dans des pays comme le Laos, la Thaïlande, le Cambodge et les Philippines d'ici 2026.
Selon le Dr Nguyen Thi Thu Trang, les progrès technologiques rapides d'aujourd'hui, avec l'émergence de modèles multilingues, faciliteront le développement d'outils de synthèse vocale pour d'autres langues.
Actuellement, elle effectue des recherches sur les technologies vocales pour le thaï, le chinois et l'anglais, ouvrant ainsi de nouvelles perspectives pour Vbee sur le marché international.
Source : https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm






Comment (0)