Vbee и попытка дать крылья вьетнамскому языку

Báo Tuổi TrẻBáo Tuổi Trẻ17/02/2025

Войдя в вестибюль аэропорта, среди суеты людей, возвращающихся из командировки, Хо Мин Дык остановился на несколько секунд, услышав знакомый, нежный женский голос, зачитывающий объявление в системе.


Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 1.

Сотрудники Vbee работают в штаб-квартире компании в Ханое. Фото: NVCC

Он улыбнулся, чувствуя облегчение и радость, словно снова встретил родственника. Этот «родственник» — один из 20 голосов искусственного интеллекта, с которыми Дюк и команда Vbee «ели и спали» в течение многих дней и месяцев, вкладывая всю душу в каждую звуковую линию, заботясь о каждом нюансе голоса, чтобы сделать их все более естественными и похожими на человеческие.

Неровный старт

Я не знаю, сколько раз генеральный директор Хо Минь Дык и технический директор Нгуен Тхи Тху Транг — два основателя акционерной компании Vbee Data Solutions and Services — испытывали подобное чувство радости и гордости.

Они встречали «особых знакомых» в самых разных ситуациях: четкие голоса из школьных громкоговорителей, теплые голоса в зданиях или профессиональные голоса из автоматических коммутаторов многих предприятий.

Детища Vbee уже не просто результат работы алгоритмов и кодов, они действительно входят в жизнь, внося тихий, но весомый вклад во многие области.

От предисловий к книгам, озвучивания фильмов до автоматизированных объявлений в колл-центрах — Vbee вдыхает новую жизнь в голосовые технологии.

Доктор Нгуен Тхи Тху Транг, являясь «матерью» базовой технологии синтеза речи, всегда стремилась донести до реальных пользователей продукты вьетнамской технологии синтеза речи — технологии, которой она посвятила много усилий с момента защиты докторской диссертации в Университете Париж 11.

Первые дни Vbee были полны трудностей. Несмотря на то, что их движок преобразования текста в речь (TTS) был бесплатным в течение первых двух лет, он привлек лишь небольшую группу пользователей. Но затем COVID-19 оказался неожиданным поворотным моментом.

Столкнувшись со строгими правилами социального дистанцирования, таким компаниям, как FE Credit, Momo, Viet Credit, Sacombank... приходится искать способы охватить тысячи клиентов. Именно тогда на сцену вышел Vbee: от напоминаний о долгах до автоматизированных ответов — их продукт быстро стал оптимальным решением. В то время виртуальные помощники и виртуальные агенты приносили Vbee 80% дохода.

Когда пандемия прошла и мировая экономика пошла на спад, перед Vbee возникли новые проблемы. Волна генеративного искусственного интеллекта (GenAI) и тенденции цифрового контента возродили движки TTS. Сегодня голоса искусственного интеллекта Vbee можно услышать повсюду — от TikTok до YouTube и Facebook.

«Большую часть контента TTS сегодня предоставляем мы», — с гордостью поделился г-н Хо Минь Дык. В настоящее время фактическая база пользователей Vbee превысила 2 миллиона, и это число продолжает стабильно расти на 20% каждый месяц.

Vbee обучил более 20 высококачественных корпоративных голосов, а если считать и пользовательские голоса, то они создали более 200 различных голосов ИИ.

Благодаря новой технологии транскрипции голоса, которая была недавно исследована и протестирована, для обучения нового голоса теперь требуется всего 3 минуты записанных данных вместо 4 или десятков часов записи, как два года назад.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 2.

Генеральный директор Хо Минь Дык и главный технический директор Нгуен Тхи Тху Транг — два основателя акционерной компании Vbee Data Solutions and Services — Фото: NVCC

«Мы лучше понимаем вьетнамский язык»

Генеральный директор Хо Минь Дык видит время, когда в гонке за технологией синтеза речи усилия по внедрению технологических инноваций постепенно достигнут своего предела.

По его словам, Vbee не только разрабатывает базовую технологию для обработки вьетнамской речи, но и создает технологическую систему, способную глубоко понимать вьетнамский язык — со всеми тонкостями, тонами и уникальной культурой, которую могут полностью понять только настоящие вьетнамцы.

Будучи лидером на рынке TTS во Вьетнаме, два руководителя Vbee считают, что их инструмент стал стандартом для голосового чтения с использованием искусственного интеллекта для вьетнамского языка. Пользователи не только ценят точность, но и чувствуют «эмоции» в каждом голосе, разработанном Vbee.

Например, во вьетнамском языке одно только слово «alley» имеет много разных названий в зависимости от региона, например, «hèm», «kiệt», «xếc» — каждое слово имеет свой нюанс, который ИИ должен понимать.

Чтобы добиться этого, Vbee вложила значительные средства в сбор выборочных наборов данных, а также в мощные серверные системы для обучения ИИ.

«Чтобы помочь ИИ правильно понимать и обрабатывать каждый региональный нюанс, нам пришлось создать бесчисленное количество наборов образцов, а стоимость сервера обработки также была очень высокой», — поделился генеральный директор Хо Минь Дык.

Доктор Нгуен Тхи Тху Транг более 15 лет исследовала основную технологию TTS Vbee для расшифровки тонов и грамматических особенностей вьетнамского языка. Для нее родной язык — это тонкий мир, полный выразительных нюансов.

«Мой вьетнамский язык очень сложный и интересный, тоны самые сложные и отличаются от многих других популярных языков в мире. Чем больше я понимаю язык, тем точнее будет моя модель», — пояснила она.

Vbee постепенно утверждает, что в технологическую эпоху они станут неотъемлемой частью инструментов и устройств со встроенным программным обеспечением для обработки вьетнамского языка.

В каждом слове, в каждом голосе команда Vbee не только исследует и разрабатывает технологии, но и стремится создать по-настоящему «вьетнамские эмоции» в своих голосах ИИ.

Название Vbee — это сокращение от фразы «Vietnamese BE your Eyes» («Вьетнамцы — ваши глаза»), которая возникла из моего изначального желания создать инструмент, который станет «глазами» для людей с нарушениями зрения. Но в нынешней тенденции развития, когда многие люди хотят больше слушать, чем видеть, мы считаем, что Vbee также станет «глазами» каждого.

Доктор Нгуен Тхи Тху Транг (преподаватель факультета информационных технологий Ханойского университета науки и технологий, основатель и технический директор компании Vbee)

Встреча любителей аудиокниг

Vbee родился из судьбы доктора Нгуен Тхи Тху Транг в сообществе слепых. Еще со студенческих лет она принимала участие в записи аудиокниг и разработке книги для чтения на вьетнамском языке для поддержки людей с нарушениями зрения.

Этот опыт вдохновил ее на разработку программного обеспечения для чтения на вьетнамском языке — предшественника Vbee. В 2018 году она и г-н Хо Минь Дык — однокурсник по Ханойскому университету науки и технологий, имеющий опыт работы над проектом Socbay.com и оцифровкой аудиокниг — основали компанию Vbee, пионера в области преобразования текста в речь во Вьетнаме.

Выдающиеся достижения Vbee

- Первый приз конкурса Qualcomm Vietnam Innovation Challenge 2024

- Специальный приз Tuoi Tre Start-up Award 2023

- Победивший стартап в программе Grab Venture Ignite 2020 Accelerator

- Первая премия Vietnamese Talent 2018, вторая премия Vietnamese Talent 2020

- Сертификат основных вьетнамских технологий в Национальной программе цифровой трансформации 2025–2030 гг. Министерства информации и коммуникаций

- Проект-победитель на Vietnam Digital Media Award 2018 и Vingroup Fund 2019.

Региональное видение

Укрепив свои позиции на вьетнамском рынке, Vbee намерена расширить свое присутствие в Юго-Восточной Азии и планирует к 2026 году внедрить свою технологию TTS в такие страны, как Лаос, Таиланд, Камбоджа и Филиппины.

По словам доктора Нгуен Тхи Тху Транг, стремительное развитие технологий сегодня, сопровождающееся появлением многоязычных моделей, упростит разработку инструментов TTS для других языков.

В настоящее время она исследует речевые технологии для тайского, китайского и английского языков, открывая новые возможности для Vbee на международном рынке.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 3. Вьетнамский стартап отмечен на саммите AI Summit в Париже

Enfarm, стартап в области технологий искусственного интеллекта (ИИ) для сельского хозяйства Вьетнама, является одним из четырех представителей Азии среди 50 проектов, представленных на саммите AI Action Summit в Париже (Франция) 10 и 11 февраля.



Источник: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm

Комментарий (0)

No data
No data

Та же тема

Та же категория

Тот же автор

Фигура

Иностранные газеты хвалят вьетнамскую «залив Халонг на суше»
Рыбаки из провинции Куангнам выловили десятки тонн анчоусов, забрасывая сети всю ночь в Ку Лао Чам.
Лучший диджей мира исследует Son Doong и демонстрирует видео, набравшее миллион просмотров
Фыонг «Сингапур»: вьетнамская девушка производит фурор, когда готовит около 30 блюд за один прием пищи

No videos available