เมื่อก้าวเข้าไปในบริเวณที่นั่งรอผู้โดยสารของสนามบิน ท่ามกลางฝูงชนที่พลุกพล่านซึ่งกำลังเดินทางกลับจากภารกิจทางธุรกิจ โฮ มินห์ ดึ๊ก หยุดชะงักไปชั่วครู่เมื่อได้ยินเสียงผู้หญิงที่คุ้นเคยและนุ่มนวลกำลังอ่านประกาศจากระบบเสียง
พนักงานของ Vbee กำลังทำงานอยู่ที่สำนักงานใหญ่ของบริษัทใน กรุงฮานอย - ภาพ: จัดหาโดยบริษัท
เขายิ้มอย่างโล่งใจและมีความสุข ราวกับได้กลับมาพบกับคนที่เขารัก "คนที่เขารัก" คนนั้นคือหนึ่งในนักพากย์เสียง AI 20 คนที่ดุ๊กและทีม Vbee ใช้เวลาหลายวันและหลายเดือนในการทำงานร่วมกัน ทุ่มเทหัวใจลงไปในทุกรายละเอียดของเสียง และสร้างสรรค์แต่ละส่วนอย่างพิถีพิถันเพื่อให้เสียงเหล่านั้นดูเป็นธรรมชาติและเหมือนมนุษย์มากขึ้นเรื่อยๆ
เส้นทางที่ขรุขระของธุรกิจสตาร์ทอัพ
ซีอีโอ โฮ มินห์ ดึ๊ก และซีทีโอ เหงียน ถิ ทู ตรัง สองผู้ก่อตั้งบริษัท วีบี ดาต้า เซอร์วิสเซส แอนด์ โซลูชั่นส์ จำกัด (มหาชน) ต่างเคยประสบกับความสุขและความภาคภูมิใจเช่นนี้มาแล้วนับครั้งไม่ถ้วน
พวกเขาได้พบกับ "คนรู้จักพิเศษ" เหล่านี้อีกครั้งในสถานการณ์ต่างๆ เช่น เสียงที่ชัดเจนจากลำโพงของโรงเรียน น้ำเสียงที่อบอุ่นในอาคาร หรือเสียงที่เป็นมืออาชีพจากระบบโทรศัพท์อัตโนมัติของธุรกิจหลายแห่ง
สิ่งประดิษฐ์ของ Vbee ไม่ได้เป็นเพียงผลลัพธ์จากอัลกอริทึมและโค้ดอีกต่อไป แต่ได้เข้ามามีบทบาทในชีวิตจริงอย่างแท้จริง และสร้างคุณูปการอย่างเงียบๆ แต่ทรงพลังในหลายๆ สาขา
จากบทวิจารณ์หนังสือและการพากย์เสียงภาพยนตร์ ไปจนถึงการประกาศอัตโนมัติในศูนย์บริการลูกค้า Vbee ได้สร้างชีวิตชีวาใหม่ให้กับเทคโนโลยีเสียง
ในฐานะ "ผู้ให้กำเนิด" เทคโนโลยี TTS หลักนั้น ดร. เหงียน ถิ ทู ตรัง มีความมุ่งมั่นที่จะนำผลิตภัณฑ์ที่ได้จากเทคโนโลยีการสังเคราะห์เสียงพูดภาษาเวียดนาม ซึ่งเป็นเทคโนโลยีที่เธอทุ่มเทความรักและความตั้งใจอย่างมากมาตั้งแต่ทำวิทยานิพนธ์ปริญญาเอกที่มหาวิทยาลัยปารีส 11 มาสู่ผู้ใช้งานจริง
ช่วงแรกๆ ของ Vbee เต็มไปด้วยความท้าทาย แม้ว่าจะให้บริการฟรีในช่วงสองปีแรก แต่เครื่องมือแปลงข้อความเป็นเสียง (TTS) ของพวกเขากลับดึงดูดผู้ใช้ได้เพียงกลุ่มเล็กๆ เท่านั้น แต่แล้วโควิด-19 ก็กลายเป็นจุดเปลี่ยนที่ไม่คาดคิด
เมื่อเผชิญกับมาตรการเว้นระยะห่างทางสังคมที่เข้มงวด ธุรกิจต่างๆ เช่น FE Credit, Momo, Viet Credit, Sacombank เป็นต้น ต้องหาวิธีเข้าถึงลูกค้าหลายพันราย นั่นคือโอกาสที่ Vbee ได้รับ: ตั้งแต่การแจ้งเตือนหนี้ไปจนถึงการตอบกลับอัตโนมัติ ผลิตภัณฑ์ของพวกเขากลายเป็นโซลูชันที่เหมาะสมที่สุดอย่างรวดเร็ว ในเวลานั้น ผู้ช่วยเสมือนและตัวแทนศูนย์บริการลูกค้าเสมือนสร้างรายได้ให้กับ Vbee มากถึง 80%
เมื่อสถานการณ์โรคระบาดคลี่คลายลงและ เศรษฐกิจ โลกตกต่ำ Vbee ก็เผชิญกับความท้าทายใหม่ กระแสปัญญาประดิษฐ์เชิงสร้างสรรค์ (GenAI) และกระแสคอนเทนต์ดิจิทัลได้ฟื้นคืนชีพเครื่องมือ TTS (Text-to-Site) ขึ้นมาอีกครั้ง ปัจจุบัน เสียง AI ของ Vbee ปรากฏอยู่ทุกหนทุกแห่ง ตั้งแต่ TikTok ไปจนถึง YouTube และ Facebook
"เนื้อหา TTS ส่วนใหญ่ในปัจจุบันนั้นจัดทำโดยพวกเราเอง" โฮ มินห์ ดึ๊ก กล่าวอย่างภาคภูมิใจ ปัจจุบันฐานผู้ใช้งาน Vbee มีมากกว่า 2 ล้านคน และจำนวนนี้ยังคงเพิ่มขึ้นอย่างต่อเนื่องเดือนละ 20%
Vbee ได้ฝึกฝนเสียงพากย์คุณภาพสูงของบริษัทต่างๆ กว่า 20 เสียง และหากรวมเสียงพากย์ที่สั่งทำพิเศษด้วยแล้ว พวกเขาสร้างเสียงพากย์ AI ที่แตกต่างกันกว่า 200 เสียง
ด้วยเทคโนโลยีการถอดเสียงพูดแบบใหม่ที่เพิ่งได้รับการวิจัยและเปิดตัวเพื่อทดสอบ ทำให้ปัจจุบันการบันทึกเสียงเพื่อฝึกฝนใช้เวลาเพียง 3 นาทีเท่านั้น แทนที่จะใช้เวลา 4-10 ชั่วโมงเหมือนเมื่อสองปีก่อน
ซีอีโอ โฮ มินห์ ดึ๊ก และซีทีโอ เหงียน ถิ ทู ตรัง - สองผู้ก่อตั้งบริษัท วีบี ดาต้า เซอร์วิสเซส แอนด์ โซลูชั่นส์ จำกัด (ภาพ: จัดหาโดยบริษัท)
"เราได้เปรียบตรงที่เรามีความเข้าใจภาษาเวียดนามเป็นอย่างดี"
ในการแข่งขันด้านเทคโนโลยีการสังเคราะห์เสียงพูด ซีอีโอ โฮ มินห์ ดึ๊ก มองเห็นจุดหนึ่งที่ความพยายามในการคิดค้นนวัตกรรมทางเทคโนโลยีจะค่อยๆ ถึงขีดจำกัด
เขากล่าวว่า Vbee ไม่เพียงแต่พัฒนาเทคโนโลยีการประมวลผลเสียงพูดภาษาเวียดนามขั้นพื้นฐานเท่านั้น แต่ยังสร้างระบบเทคโนโลยีที่สามารถเข้าใจภาษาเวียดนามอย่างลึกซึ้ง ทั้งรายละเอียดปลีกย่อย โทนเสียง และวัฒนธรรมที่เป็นเอกลักษณ์ ซึ่งมีเพียงชาวเวียดนามแท้ๆ เท่านั้นที่จะเข้าใจได้อย่างถ่องแท้
ในฐานะบริษัทชั้นนำในตลาด TTS (Text-to-Side) ในเวียดนาม ผู้บริหารทั้งสองของ Vbee เชื่อว่าเครื่องมือของพวกเขาได้กลายเป็นมาตรฐานสำหรับการพากย์เสียงด้วย AI ในภาษาเวียดนาม ผู้ใช้ไม่เพียงแต่ชื่นชมความแม่นยำเท่านั้น แต่ยังสัมผัสได้ถึง "อารมณ์" ในแต่ละเสียงที่ Vbee สร้างขึ้นอีกด้วย
ยกตัวอย่างเช่น ในภาษาเวียดนาม แม้แต่คำเดียวอย่าง "ง่อ" (ตรอก) ก็ยังมีชื่อเรียกที่แตกต่างกันไปขึ้นอยู่กับภูมิภาค เช่น "หืม" "เกียต" และ "แซก" ซึ่งแต่ละคำมีความหมายแฝงที่ AI จำเป็นต้องเข้าใจ
เพื่อให้บรรลุเป้าหมายนี้ Vbee ได้ลงทุนอย่างมากในการรวบรวมชุดข้อมูลตัวอย่าง รวมถึงลงทุนในระบบเซิร์ฟเวอร์ที่มีประสิทธิภาพสูงเพื่อใช้ในการฝึกฝน AI
ซีอีโอ โฮ มินห์ ดึ๊ก กล่าวว่า "เพื่อให้ AI สามารถเข้าใจและประมวลผลข้อมูลที่มีความแตกต่างกันในแต่ละภูมิภาคได้อย่างถูกต้อง เราต้องสร้างชุดข้อมูลตัวอย่างจำนวนนับไม่ถ้วน และค่าใช้จ่ายของเซิร์ฟเวอร์ประมวลผลก็สูงมากเช่นกัน"
ดร. เหงียน ถิ ทู ตรัง ได้อุทิศเวลามากกว่า 15 ปีในการวิจัยเทคโนโลยี TTS หลักของ Vbee เพื่อถอดรหัสเสียงวรรณยุกต์และไวยากรณ์ที่เป็นเอกลักษณ์ของภาษาเวียดนาม สำหรับเธอแล้ว ภาษาแม่ของเธอคือโลกที่ละเอียดอ่อนซึ่งเต็มไปด้วยความแตกต่างทางอารมณ์ที่สื่อความหมายได้หลากหลาย
“ภาษาเวียดนามเป็นภาษาที่ซับซ้อนและน่าสนใจมาก วรรณยุกต์เป็นส่วนที่ยากที่สุดและแตกต่างจากภาษาทั่วไปอื่นๆ ในโลกหลายภาษา ยิ่งฉันเข้าใจภาษานี้มากเท่าไหร่ แบบจำลองของฉันก็จะยิ่งแม่นยำมากขึ้นเท่านั้น” เธอกล่าวอธิบาย
Vbee กำลังค่อยๆ สร้างชื่อเสียงให้ตัวเองในฐานะส่วนสำคัญที่ขาดไม่ได้ของเครื่องมือและอุปกรณ์ที่ผสานรวมซอฟต์แวร์ประมวลผลภาษาเวียดนามในยุคเทคโนโลยี
ในทุกคำพูดและทุกน้ำเสียง ทีมงาน Vbee ไม่เพียงแต่สำรวจและพัฒนาเทคโนโลยีเท่านั้น แต่ยังมุ่งมั่นที่จะสร้าง "อารมณ์ความรู้สึกแบบเวียดนาม" ที่แท้จริงในเสียง AI ของพวกเขาด้วย
ชื่อ Vbee เป็นคำย่อมาจาก "Vietnamese BE your Eyes" ซึ่งมาจากความปรารถนาเริ่มต้นของผมที่จะสร้างเครื่องมือที่จะทำหน้าที่เป็น "ดวงตา" สำหรับผู้พิการทางสายตา อย่างไรก็ตาม ในโลกที่กำลังพัฒนาในปัจจุบัน ซึ่งหลายคนให้ความสำคัญกับการได้ยินมากกว่าการมองเห็น เราเชื่อว่า Vbee จะกลายเป็น "ดวงตา" สำหรับทุกคนด้วยเช่นกัน
ดร. เหงียน ถิ ทู ตรัง (อาจารย์อาวุโส คณะเทคโนโลยีสารสนเทศและการสื่อสาร มหาวิทยาลัยวิทยาศาสตร์และเทคโนโลยีฮานอย ผู้ก่อตั้งและประธานเจ้าหน้าที่ฝ่ายเทคโนโลยี บริษัท วีบี)
การรวมตัวของผู้ชื่นชอบหนังสือเสียง
Vbee ถือกำเนิดขึ้นจากความผูกพันอย่างลึกซึ้งของ ดร. เหงียน ถิ ทู ตรัง กับชุมชนผู้พิการทางสายตา ตั้งแต่สมัยเรียน เธอได้มีส่วนร่วมในการบันทึกเสียงหนังสือเสียงและพัฒนาระบบแปลงข้อความภาษาเวียดนามเป็นเสียงพูดเพื่อช่วยเหลือผู้พิการทางสายตา
ประสบการณ์เหล่านี้เป็นแรงบันดาลใจให้เธอพัฒนาซอฟต์แวร์แปลงข้อความเป็นเสียงภาษาเวียดนาม ซึ่งเป็นต้นกำเนิดของ Vbee ในปี 2018 เธอและเพื่อนร่วมชั้น โฮ มินห์ ดึ๊ก ซึ่งเป็นนักศึกษาจากมหาวิทยาลัยวิทยาศาสตร์และเทคโนโลยีฮานอยเช่นกัน และมีประสบการณ์จากโครงการ Socbay.com และการแปลงหนังสือเสียงเป็นดิจิทัล ได้ร่วมกันก่อตั้ง Vbee ซึ่งเป็นผู้บุกเบิกในด้านการแปลงข้อความเป็นเสียงในเวียดนาม
ความสำเร็จอันโดดเด่นของ Vbee
- ผู้ชนะเลิศรางวัลที่หนึ่งของการแข่งขันนวัตกรรม Qualcomm Vietnam Innovation Challenge 2024
- รางวัลพิเศษจากงานประกาศรางวัลธุรกิจสตาร์ทอัพเยาวชนยอดเยี่ยมประจำปี 2023
- สตาร์ทอัพชนะโครงการเร่งพัฒนาธุรกิจ Grab Venture Ignite 2020
- รางวัลสูงสุดจากงาน Vietnam Talent Awards ปี 2018 และรางวัลรองชนะเลิศอันดับสองจากงาน Vietnam Talent Awards ปี 2020
- ได้รับการรับรองให้เป็นเทคโนโลยีหลักของเวียดนามในโครงการปฏิรูปดิจิทัลแห่งชาติ ปี 2025-2030 ของกระทรวงสารสนเทศและการสื่อสาร
- โครงการนี้ได้รับรางวัล Vietnam Digital Media Award 2018 และรางวัล Vingroup Funding Award 2019
วิสัยทัศน์ระดับภูมิภาค
หลังจากสร้างฐานที่มั่นคงในตลาดเวียดนามแล้ว Vbee ตั้งเป้าที่จะขยายไปยังเอเชียตะวันออกเฉียงใต้ โดยมีแผนจะนำเทคโนโลยี TTS ไปใช้ในประเทศต่างๆ เช่น ลาว ไทย กัมพูชา และฟิลิปปินส์ภายในปี 2026
ดร. เหงียน ถิ ทู ตรัง กล่าวว่า ความก้าวหน้าอย่างรวดเร็วของเทคโนโลยีในปัจจุบัน โดยเฉพาะการเกิดขึ้นของโมเดลหลายภาษา จะทำให้การพัฒนาเครื่องมือ TTS สำหรับภาษาอื่นๆ ทำได้ง่ายขึ้น
ปัจจุบัน เธอกำลังวิจัยเทคโนโลยีเสียงสำหรับภาษาไทย จีน และอังกฤษ ซึ่งจะเปิดโอกาสใหม่ๆ ให้กับ Vbee ในตลาดต่างประเทศ
[โฆษณา_2]
ที่มา: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm







การแสดงความคิดเห็น (0)