Vbee und der Versuch, der vietnamesischen Sprache Flügel zu verleihen

Báo Tuổi TrẻBáo Tuổi Trẻ17/02/2025

Als er inmitten des Trubels der von einer Geschäftsreise zurückkehrenden Menschen die Flughafenlobby betrat, hielt Ho Minh Duc einige Sekunden inne, als er eine vertraute, sanfte Frauenstimme hörte, die eine Durchsage über das System vorlas.


Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 1.

Die Mitarbeiter von Vbee arbeiten in der Firmenzentrale in Hanoi - Foto: NVCC

Er lächelte und fühlte sich erleichtert und glücklich, als hätte er einen Verwandten wieder getroffen. Dieser „Verwandte“ ist eine von 20 KI-Stimmen, mit denen Duc und das Vbee-Team viele Tage und Monate lang „geschlafen und gegessen“ haben, wobei sie ihr ganzes Herzblut in jede Klanglinie gesteckt und sich um jede Nuance der Stimme gekümmert haben, um sie immer natürlicher und menschlicher zu machen.

Holpriger Start

Ich weiß nicht, wie oft CEO Ho Minh Duc und CTO Nguyen Thi Thu Trang – die beiden Gründerinnen der Vbee Data Solutions and Services Joint Stock Company – ein solches Gefühl der Freude und des Stolzes erlebt haben.

In vielen unterschiedlichen Situationen trafen sie „besondere Bekannte“: klare Stimmen aus den Lautsprecheranlagen von Schulen, warme Stimmen in Gebäuden oder professionelle Stimmen aus den automatischen Telefonzentralen vieler Unternehmen.

Die Geisteskinder von Vbee sind nicht mehr nur das Ergebnis von Algorithmen und Codes, sondern erwachen tatsächlich zum Leben und leisten stille, aber wirkungsvolle Beiträge in vielen Bereichen.

Von Bucheinführungen über die Synchronisierung von Filmen bis hin zu automatisierten Callcenter-Ansagen haucht Vbee der Sprachtechnologie neues Leben ein.

Als „Mutter“ der TTS-Kerntechnologie ist Dr. Nguyen Thi Thu Trang stets bestrebt, Produkte der vietnamesischen Sprachsynthesetechnologie – der Technologie, in die sie seit ihrer Doktorarbeit an der Universität Paris 11 viel Mühe investiert hat – den echten Anwendern näherzubringen.

Die Anfangstage von Vbee waren voller Härten. Obwohl die Text-to-Speech-Engine (TTS) in den ersten beiden Jahren kostenlos war, konnte sie nur eine kleine Gruppe von Benutzern anlocken. Doch dann stellte sich COVID-19 als unerwarteter Wendepunkt heraus.

Angesichts strenger Vorschriften zur sozialen Distanzierung müssen Unternehmen wie FE Credit, Momo, Viet Credit, Sacombank ... Wege finden, Tausende von Kunden zu erreichen. An dieser Stelle kam Vbee ins Spiel: Von Schuldenerinnerungen bis hin zu automatisierten Antworten wurde ihr Produkt schnell zur optimalen Lösung. Damals machten virtuelle Assistenten und virtuelle Agenten 80 % des Umsatzes von Vbee aus.

Als die Pandemie vorüber war und die Weltwirtschaft ins Stocken geriet, stand Vbee vor neuen Herausforderungen. Die Welle der generativen KI (GenAI) und digitale Inhaltstrends haben TTS-Engines wiederbelebt. Heute sind die KI-Stimmen von Vbee überall zu hören, von TikTok über YouTube bis hin zu Facebook.

„Viele der heutigen TTS-Inhalte werden von uns bereitgestellt“, erzählte Herr Ho Minh Duc stolz. Derzeit liegt die tatsächliche Benutzerbasis von Vbee bei über 2 Millionen, und diese Zahl steigt weiterhin jeden Monat stetig um 20 %.

Vbee hat über 20 hochwertige Unternehmensstimmen trainiert und wenn man benutzerdefinierte Stimmen mitzählt, hat das Unternehmen über 200 verschiedene KI-Stimmen erstellt.

Mit der neuen Sprachtranskriptionstechnologie, die kürzlich erforscht und getestet wurde, sind zum Trainieren einer neuen Stimme jetzt nur noch drei Minuten aufgezeichneter Daten erforderlich, statt wie noch vor zwei Jahren vier bis Dutzende Stunden Aufzeichnung.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 2.

CEO Ho Minh Duc und Chief Technology Officer Nguyen Thi Thu Trang – zwei Gründer der Vbee Data Solutions and Services Joint Stock Company – Foto: NVCC

„Wir verstehen Vietnamesisch besser“

Im Wettlauf um die Sprachsynthese-Technologie sieht CEO Ho Minh Duc eine Zeit kommen, in der die technologischen Innovationsbemühungen allmählich an ihre Grenzen stoßen werden.

Ihm zufolge entwickelt Vbee nicht nur eine Kerntechnologie zur Verarbeitung vietnamesischer Sprache, sondern baut auch ein Technologiesystem auf, das ein tiefes Verständnis der vietnamesischen Sprache ermöglicht – mit all ihren Feinheiten, Tönen und der einzigartigen Kultur, die nur echte Vietnamesen vollständig verstehen können.

Als führendes Unternehmen im TTS-Markt in Vietnam sind die beiden Leiter von Vbee davon überzeugt, dass ihr Tool zum Standard für das KI-gestützte Sprachlesen für Vietnamesisch geworden ist. Benutzer schätzen nicht nur die Genauigkeit, sondern spüren auch die „Emotion“ in jeder von Vbee entwickelten Stimme.

Im Vietnamesischen beispielsweise hat allein das Wort „Gasse“ je nach Region viele verschiedene Namen, etwa „hèm“, „kiệt“, „xếc“ – jedes Wort hat eine andere Nuance, die die KI verstehen muss.

Um dies zu erreichen, hat Vbee stark in das Sammeln von Beispieldatensätzen sowie in leistungsstarke Serversysteme für das KI-Training investiert.

„Damit die KI jede regionale Nuance richtig verstehen und verarbeiten kann, mussten wir zahllose Beispielsätze erstellen und auch die Kosten für den Verarbeitungsserver waren sehr hoch“, erklärte CEO Ho Minh Duc.

Dr. Nguyen Thi Thu Trang hat mehr als 15 Jahre damit verbracht, die TTS-Kerntechnologie von Vbee zu erforschen, um die Tonfälle und Grammatikmerkmale des Vietnamesischen zu entschlüsseln. Für sie ist ihre Muttersprache eine subtile Welt voller ausdrucksstarker Nuancen.

„Meine vietnamesische Sprache ist sehr komplex und interessant, die Töne sind die schwierigsten und unterscheiden sich von vielen anderen populären Sprachen der Welt. Je besser ich die Sprache verstehe, desto genauer wird mein Modell sein“, erklärte sie.

Vbee behauptet zunehmend, dass sie im Technologiezeitalter ein unverzichtbarer Bestandteil von Werkzeugen und Geräten mit integrierter vietnamesischer Sprachverarbeitungssoftware sein werden.

Das Vbee-Team erforscht und entwickelt nicht nur Technologie in jedem Wort und jeder Stimme, sondern ist auch bestrebt, in seinen KI-Stimmen eine echte „vietnamesische Emotion“ zu erzeugen.

Der Name Vbee ist eine Abkürzung des Satzes „Vietnamese BE your Eyes“ (Vietnamese sind deine Augen) und stammt aus meinem ursprünglichen Wunsch, ein Werkzeug zu bauen, das zu den „Augen“ von Sehbehinderten wird. Aber angesichts der aktuellen Entwicklungstendenz, bei der viele Menschen mehr aufs Zuhören als aufs Sehen umsteigen wollen, glauben wir, dass Vbee auch zum „Auge“ aller werden wird.

Dr. Nguyen Thi Thu Trang (Dozentin, School of Information Technology, Hanoi University of Science and Technology, Gründerin und Technologiedirektorin der Vbee Company)

Treffen der Hörbuchliebhaber

Vbee entstand aus dem Schicksal von Dr. Nguyen Thi Thu Trang mit der Blindengemeinschaft. Seit ihrem Studium beteiligt sie sich an der Aufnahme von Hörbüchern und der Entwicklung eines vietnamesischen Lesegeräts zur Unterstützung Sehbehinderter.

Diese Erfahrungen inspirierten sie zur Entwicklung einer vietnamesischen Lesesoftware – dem Vorgänger von Vbee. Im Jahr 2018 gründete sie zusammen mit Herrn Ho Minh Duc – einem Kommilitonen an der Hanoi University of Science and Technology mit Erfahrung aus dem Socbay.com-Projekt und der Digitalisierung von Hörbüchern – Vbee, einen Pionier auf dem Gebiet der Text-to-Speech-Konvertierung in Vietnam.

Herausragende Leistungen von Vbee

- Erster Preis der Qualcomm Vietnam Innovation Challenge 2024

- Sonderpreis Tuoi Tre Start-up Award 2023

- Gewinner-Start-up im Accelerator-Programm Grab Venture Ignite 2020

- Erster Preis von Vietnamese Talent 2018, zweiter Preis von Vietnamese Talent 2020

- Zertifikat für vietnamesische Kerntechnologie im Nationalen Programm zur digitalen Transformation 2025 - 2030 des Ministeriums für Information und Kommunikation

– Gewinnerprojekt beim Vietnam Digital Media Award 2018 und Vingroup Fund 2019.

Regionale Vision

Nachdem Vbee seine Position auf dem vietnamesischen Markt gefestigt hat, strebt das Unternehmen eine Expansion nach Südostasien an und plant, seine TTS-Technologie bis 2026 in Länder wie Laos, Thailand, Kambodscha und die Philippinen zu bringen.

Laut Dr. Nguyen Thi Thu Trang wird der schnelle technologische Fortschritt und die Entstehung mehrsprachiger Modelle die Entwicklung von TTS-Tools für andere Sprachen erleichtern.

Derzeit erforscht sie Sprachtechnologien für Thailändisch, Chinesisch und Englisch und eröffnet Vbee damit neue Möglichkeiten auf dem internationalen Markt.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 3. Vietnamesisches Start-up auf dem AI Summit Paris ausgezeichnet

Enfarm, ein Start-up für künstliche Intelligenz (KI)-Technologie für die vietnamesische Landwirtschaft, ist einer von vier asiatischen Vertretern unter den 50 Projekten, die am 10. und 11. Februar auf dem AI Action Summit in Paris (Frankreich) vorgestellt wurden.


[Anzeige_2]
Quelle: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm

Kommentar (0)

No data
No data

Gleiches Thema

Gleiche Kategorie

Gleicher Autor

Figur

Ausländische Zeitungen loben Vietnams „Ha Long Bucht an Land“
Fischer aus der Provinz Quang Nam fingen Dutzende Tonnen Sardellen, indem sie in Cu Lao Cham die ganze Nacht lang ihre Netze auswarfen.
Der weltbeste DJ erkundet Son Doong und präsentiert ein Video mit Millionenaufrufen
Phuong „Singapur“: Vietnamesisches Mädchen sorgt für Aufsehen, als sie fast 30 Gerichte pro Mahlzeit kocht

No videos available