Vbee와 베트남어에 날개를 달아주는 노력

Báo Tuổi TrẻBáo Tuổi Trẻ17/02/2025

출장에서 돌아오는 사람들로 북적거리는 공항 로비에 들어서던 호민득 씨는 시스템에서 친숙하고 상냥한 여성 목소리가 안내 방송을 읽어주는 것을 듣고 몇 초간 멈췄다.


Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 1.

Vbee 직원들이 하노이에 있는 회사 본사에서 일하고 있다 - 사진: NVCC

그는 마치 친척을 다시 만난 것처럼 안도감과 행복감을 느끼며 미소지었다. 그 "친척"은 Duc과 Vbee 팀이 여러 날, 여러 달 동안 "먹고 잤던" 20개의 AI 음성 중 하나이며, 모든 음성 라인에 온 마음을 쏟고 음성의 모든 뉘앙스를 처리하여 점점 더 자연스럽고 인간과 비슷하게 만들었습니다.

울퉁불퉁한 시작

Vbee 데이터 솔루션 및 서비스 주식회사의 두 창립자인 CEO 호 민 덕과 CTO 응우옌 티 투 짱이 이런 기쁨과 자부심을 몇 번이나 느꼈는지 모르겠습니다.

그들은 다양한 상황에서 "특별한 지인"을 만났습니다. 학교의 확성기 시스템에서 들리는 또렷한 목소리, 건물 안에서 들리는 따뜻한 목소리, 많은 회사의 자동 교환기에서 들리는 전문적인 목소리 등이 있었습니다.

Vbee의 아이디어는 더 이상 단순히 알고리즘과 코드의 결과가 아니라, 실제로 삶에 적용되어 많은 분야에 조용하지만 강력한 기여를 하고 있습니다.

책 소개, 영화 더빙부터 자동 콜센터 안내까지 Vbee는 음성 기술에 새로운 활력을 불어넣습니다.

핵심 TTS 기술의 "어머니"인 Nguyen Thi Thu Trang 박사는 항상 베트남어 음성 합성 기술의 제품을 제공하기를 열망합니다. 이 기술은 그녀가 파리 11 대학교에서 박사 학위를 받은 이후로 많은 노력을 기울인 기술입니다.

Vbee의 초창기는 힘든 시기였습니다. 처음 2년 동안은 무료였지만, 텍스트 음성 변환(TTS) 엔진을 통해 관심을 얻은 사용자는 소수에 불과했습니다. 하지만 코로나19는 예상치 못한 전환점이 되었습니다.

엄격한 사회적 거리두기 규정에 직면하여 FE Credit, Momo, Viet Credit, Sacombank 등의 기업은 수천 명의 고객에게 다가갈 방법을 찾아야 합니다. 바로 그때 Vbee가 등장했습니다. 부채 알림부터 자동 응답까지, Vbee의 제품은 곧바로 최적의 솔루션이 되었습니다. 당시 가상 비서와 가상 에이전트는 Vbee 수익의 80%를 가져왔습니다.

팬데믹이 지나가고 세계 경제가 침체되자 Vbee는 새로운 어려움에 직면했습니다. 생성적 AI(GenAI) 열풍과 디지털 콘텐츠 트렌드로 인해 TTS 엔진이 부활했습니다. 오늘날 TikTok에서 YouTube, Facebook까지 Vbee의 AI 음성이 모든 곳에 있습니다.

"오늘날 많은 TTS 콘텐츠를 우리가 제공합니다." 호 민 득 씨가 자랑스럽게 공유했습니다. 현재 Vbee의 실제 사용자 수는 200만 명을 돌파했으며, 이 숫자는 매달 20%씩 꾸준히 증가하고 있습니다.

Vbee는 20개 이상의 고품질 기업 음성을 훈련시켰고, 맞춤형 음성까지 포함하면 200개 이상의 다양한 AI 음성을 만들어냈습니다.

최근 연구되고 테스트된 새로운 음성 전사 기술을 사용하면 2년 전에는 4~10시간 동안 녹음해야 했던 새로운 음성을 이제 3분 분량의 녹음 데이터로 훈련할 수 있습니다.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 2.

CEO Ho Minh Duc과 최고 기술 책임자 Nguyen Thi Thu Trang - Vbee Data Solutions and Services 주식회사의 두 창립자 - 사진: NVCC

"우리는 베트남어를 더 잘 이해합니다"

음성 합성 기술 경쟁에서 CEO Ho Minh Duc은 기술 혁신 노력이 점차 한계에 도달할 시점이 올 것으로 예상합니다.

그에 따르면 Vbee는 베트남어 음성 처리를 위한 핵심 기술을 개발하는 것뿐만 아니라 베트남어를 심층적으로 이해할 수 있는 기술 시스템을 구축해 왔습니다. 즉, 진정한 베트남 사람만이 완전히 이해할 수 있는 모든 미묘함, 어조 및 고유한 문화를 이해해 왔습니다.

베트남 TTS 시장의 선두주자로서 Vbee의 두 리더는 자사 도구가 베트남어 AI 음성 판독의 표준이 되었다고 믿습니다. 사용자는 Vbee가 개발한 각 음성의 정확성을 높이 평가할 뿐만 아니라 "감정"도 느낄 수 있습니다.

예를 들어 베트남어에서는 "골목"이라는 단어 하나만 해도 지역에 따라 "hèm", "kiệt", "xếc" 등 여러 가지 다른 이름이 있습니다. 각 단어에는 AI가 이해해야 할 다른 뉘앙스가 있습니다.

그러한 목표를 달성하기 위해 Vbee는 샘플 데이터 세트를 수집하는 데 많은 투자를 했고, AI 훈련을 위한 강력한 서버 시스템에도 투자했습니다.

"AI가 각 지역적 뉘앙스를 올바르게 이해하고 처리할 수 있도록 돕기 위해 우리는 수많은 샘플 세트를 구축해야 했고, 처리 서버 비용도 매우 높았습니다." 호 민 득 CEO가 공유했습니다.

Nguyen Thi Thu Trang 박사는 베트남어의 음조와 문법적 특성을 해석하기 위한 Vbee의 핵심 TTS 기술을 15년 이상 연구해 왔습니다. 그녀에게 모국어는 표현력이 풍부한 뉘앙스로 가득 찬 미묘한 세계입니다.

"제 베트남어는 매우 복잡하고 흥미롭습니다. 음조가 가장 어렵고 세계의 다른 많은 인기 언어와 다릅니다. 제가 언어를 더 많이 이해할수록 제 모델이 더 정확해질 것입니다."라고 그녀는 설명했습니다.

Vbee는 점차 기술 시대에 베트남어 처리 소프트웨어가 통합된 도구와 장치의 없어서는 안 될 부분이 될 것이라고 주장하고 있습니다.

Vbee팀은 모든 단어, 모든 목소리에서 기술을 연구하고 개발할 뿐만 아니라 AI 목소리에서 진정한 "베트남 감정"을 창조하기 위해 노력합니다.

Vbee라는 이름은 "베트남의 BE your Eyes"라는 문구의 약자로, 시각 장애인의 "눈"이 되는 도구를 만들고 싶다는 원래의 소망에서 유래되었습니다. 하지만 오늘날의 개발 추세에 따라 많은 사람들이 보는 것보다 듣는 것을 더 중시하기 때문에 Vbee도 모든 사람의 '눈'이 될 것이라고 믿습니다.

Nguyen Thi Thu Trang 박사(하노이 과학 기술 대학 정보 기술부 강사, Vbee 회사 설립자 겸 기술 이사)

오디오북 애호가들의 모임

Vbee는 시각 장애인 커뮤니티와 함께한 응우옌 티 투 트랑 박사의 운명에서 탄생했습니다. 그녀는 학생 시절부터 오디오북 녹음과 시각 장애인을 지원하기 위한 베트남어 독서기 개발에 참여해 왔습니다.

이러한 경험을 통해 그녀는 베트남어 독서 소프트웨어를 개발하게 되었는데, 이것이 바로 Vbee의 전신입니다. 2018년, 그녀는 하노이 과학기술대학의 급우이자 Socbay.com 프로젝트와 오디오북 디지털화에 경험이 있는 호 민 득 씨와 함께 베트남에서 텍스트-음성 변환 분야의 선구자인 Vbee를 설립했습니다.

Vbee의 뛰어난 업적

- Qualcomm Vietnam Innovation Challenge 2024 1등 수상

- 특별상 Tuoi Tre Start-up Award 2023

- Grab Venture Ignite 2020 엑셀러레이터 프로그램에서 스타트업 우승

- 2018년 베트남 인재상 1등, 2020년 베트남 인재상 2등

- 정보통신부 2025~2030 국가 디지털 전환 프로그램의 베트남 핵심 기술 인증서

- 2018년 베트남 디지털 미디어 어워드와 2019년 빈그룹 펀드에서 수상한 프로젝트입니다.

지역 비전

Vbee는 베트남 시장에서의 입지를 굳힌 후, 2026년까지 라오스, 태국, 캄보디아, 필리핀 등의 국가에 TTS 기술을 도입해 동남아시아로 사업을 확장할 계획입니다.

Nguyen Thi Thu Trang 박사에 따르면, 오늘날 다국어 모델이 등장하면서 기술이 급속히 발전함에 따라 다른 언어에 대한 TTS 도구를 개발하는 것이 더 쉬워질 것입니다.

현재 그녀는 태국어, 중국어, 영어 음성 기술을 연구하며 Vbee가 국제 시장에서 새로운 길을 열도록 돕고 있습니다.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 3. 베트남 스타트업, 파리 AI 서밋에서 영예 수상

베트남 농업용 인공지능(AI) 기술 스타트업인 엔팜(Enfarm)은 2월 10일과 11일 파리(프랑스)에서 열린 AI 액션 서밋에서 소개된 50개 프로젝트 중 4개 아시아 대표 프로젝트 중 하나다.


[광고2]
출처: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm

댓글 (0)

No data
No data

같은 태그

같은 카테고리

같은 저자

수치

외신, 베트남 '육지의 하롱베이' 극찬
광남성의 어부들은 꾸라오참에서 밤새 그물을 던져 수십 톤의 멸치를 잡았습니다.
세계 최고의 DJ가 손동을 탐험하고 100만 뷰 영상을 선보입니다.
푸옹 "싱가포르": 베트남 소녀, 한 끼에 30가지 요리를 만들어 화제

No videos available