การแข่งขันการประมวลผลภาษาและการพูดภาษาเวียดนาม (VLSP) เป็นส่วนหนึ่งของการประชุมนานาชาติประจำปีเกี่ยวกับการประมวลผลภาษาและการพูดภาษาเวียดนาม ซึ่งจัดโดย VLSP Club ซึ่งเป็นสาขาของสมาคมเทคโนโลยีสารสนเทศเวียดนาม VLSP 2023 จัดการแข่งขันด้านการประมวลผลคำพูดและข้อความจำนวน 10 รายการ โดยมีนักวิจัย ผู้เชี่ยวชาญ และหน่วยงานพัฒนาเทคโนโลยีชั้นนำมารวมกัน

แม้ว่านี่จะเป็นครั้งที่สี่ที่ Viettel AI เข้าร่วมการแข่งขันและเคยคว้าชัยชนะมาแล้วสามครั้ง แต่วิศวกรของ Viettel ยังคงพบกับความยากลำบากมากมายเนื่องจากโครงสร้างประเภทการแข่งขันที่เปลี่ยนแปลงไป

โดยเฉพาะอย่างยิ่งเมื่อเทียบกับปีที่แล้ว หมวดหมู่การจดจำเสียงพูดและการจดจำอารมณ์ในปีนี้ได้รวมเข้าด้วยกันเป็นหมวดหมู่เดียว ทีมงานต้องแก้ปัญหาสองข้อในเวลาเดียวกันเพื่อให้แน่ใจว่าสามารถจดจำทั้งข้อความและอารมณ์ของประโยคได้ ซึ่งทำให้ปริมาณงานและความยากเพิ่มขึ้นเป็นสองเท่า

ใช้ประโยชน์จากข้อมูลทุกประเภท ไม่ว่าจะคุณภาพต่ำหรือสูง

นอกจากการเปลี่ยนโครงสร้างของหมวดหมู่แล้ว การสอบในปีนี้ยังมุ่งเน้นไปที่การสร้างแบบจำลองตั้งแต่เริ่มต้นโดยมีเงื่อนไขข้อมูลที่จำกัด รวมถึงข้อมูลดิบ ไม่ได้ติดป้ายกำกับ และข้อมูลคุณภาพต่ำ การทดสอบให้ข้อมูลสี่กลุ่มด้วยคุณภาพและรูปแบบที่แตกต่างกัน มีชุดข้อมูลที่ประกอบด้วยเฉพาะเสียงที่ไม่มีป้ายกำกับ ชุดข้อมูลที่ประกอบด้วยเฉพาะเสียงและข้อความ ชุดข้อมูลที่มีอารมณ์และเสียงที่มีคุณภาพสูง มีป้ายกำกับดี และชุดข้อมูลที่มีอารมณ์และเสียงที่มีคุณภาพต่ำ ชุดข้อมูลแต่ละชุดได้รับการกำหนดไว้อย่างชัดเจนสำหรับแต่ละวัตถุประสงค์และหมวดหมู่การสอบ โดยมีระยะเวลารวมกันมากกว่า 300 ชั่วโมงสำหรับชุดข้อมูลทั้งหมด นี่เป็นตัวเลขที่ค่อนข้างน้อยเมื่อเทียบกับชุดข้อมูลมาตรฐานสำหรับการฝึกการจดจำเสียงพูด ซึ่งโดยทั่วไปจะต้องใช้เวลานานถึง 1,000-2,000 ชั่วโมงหรือมากกว่านั้น

แต่ละทีมมีเวลาในการทำงานและส่งงานของตนเองไม่ถึง 2 เดือน แต่ในความเป็นจริงแล้ว เวลาที่ใช้สำหรับการค้นคว้าวิธีแก้ปัญหานั้นน้อยกว่านี้มากเนื่องจากขาดแคลนทรัพยากร

“ในปีนี้ Viettel AI ได้ทุ่มทรัพยากรโครงสร้างพื้นฐานคอมพิวเตอร์จำนวนมากเพื่อค้นคว้าเทคโนโลยีใหม่ ๆ เช่นเดียวกับการพัฒนาผลิตภัณฑ์ ขณะที่การจดจำเสียงพูดเป็นเทคโนโลยีที่ต้องใช้ทรัพยากรฮาร์ดแวร์จำนวนมาก” คุณ Dang Dinh Son วิศวกรปัญญาประดิษฐ์ แพลตฟอร์มผู้ช่วยเสมือน Viettel AI กล่าว

ภาพที่ 1.jpg
กลุ่มวิศวกรรมปัญญาประดิษฐ์ กลุ่มแพลตฟอร์มผู้ช่วยเสมือน เป็นตัวแทนของ Viettel AI ที่เข้าร่วมในประเภทการจดจำเสียงพูดและการจดจำอารมณ์ในการพูด - VLSP 2023

เมื่อเผชิญกับสภาวะที่มีปริมาณและคุณภาพของข้อมูลที่ต่ำ ทีมวิจัยจึงตัดสินใจทันทีที่จะใช้ทัศนคติว่า "จำเป็นต้องใช้ข้อมูลทั้งหมด ไม่ว่าข้อมูลจะมีคุณภาพสูงหรือต่ำก็ตาม" ในการดำเนินการนี้ จำเป็นต้องสร้างวงจรการฝึกอบรมที่ประมวลผลข้อมูลทั้งหมด รวมถึงโมเดลเพียงหนึ่งเดียวที่สามารถแก้ไขปัญหาต่างๆ ได้มากมาย แทนที่จะใช้โมเดลจำนวนมาก

ผลลัพธ์จากการเป็นผู้เชี่ยวชาญด้านเทคโนโลยีชั้นนำ

ในบริบทของการขาดข้อมูลและการขาดทรัพยากร ทีมวิจัยจึงตัดสินใจสร้างกระบวนการประมวลผลที่เรียบง่าย ไม่ซับซ้อน แต่สำคัญ คือ ต้องมีความละเอียดรอบคอบในทุกรายละเอียด

วิศวกร AI ของ Viettel ศึกษาการวิจัยล่าสุดจากการประชุมและวารสารชั้นนำทั่วโลกอย่างรอบคอบเพื่อค้นหาแนวทาง ทีมวิจัยได้สร้างวงจรการฝึกอบรมเพื่อประมวลผลข้อมูลที่มีทั้งหมดโดยการผสมผสานวิธีการประมวลผลข้อมูลเพื่อฝึกโมเดลอย่างมีประสิทธิภาพ วงจรนี้ประกอบด้วยสามขั้นตอน: การสร้างแบบจำลองก่อนการฝึกอบรมเพื่ออธิบายคุณลักษณะของเสียงโดยไม่ต้องใช้ป้ายกำกับ การปรับแต่งแบบจำลองก่อนการฝึกอบรมสำหรับปัญหาสองประการของการจดจำเสียงพูดและการจดจำอารมณ์ และการอนุมาน

“ประสบการณ์จากการแก้ปัญหาการขาดข้อมูลระหว่างการพัฒนาและการใช้งานผลิตภัณฑ์รุ่นก่อนๆ ยังช่วยให้ทีมงานสามารถค้นหาวิธีการตัดสินใจได้อย่างมีนัยสำคัญ ในทางกลับกัน ความรู้และผลลัพธ์ที่ได้รับจากการทดสอบยังมีศักยภาพที่จะนำไปใช้กับผลิตภัณฑ์ Viettel AI ได้ทันที ดังนั้นกระบวนการทำงานขณะทำการทดสอบจึงค่อนข้างราบรื่น” นายบุ้ย เตียน ดัต วิศวกรแพลตฟอร์มผู้ช่วยเสมือนจริงของ Viettel AI กล่าว

ผลลัพธ์ก็คือ Viettel AI ไม่เพียงแต่คว้ารางวัลชนะเลิศในประเภทการจดจำเสียงพูดและการจดจำอารมณ์คำพูดเท่านั้น แต่ยังได้รับคะแนนที่น่าประทับใจถึง 89.18% อีกด้วย (ทีมถัดมาได้คะแนน 83.40% และ 78.45% ตามลำดับ)

นายซอน กล่าวว่า ปัจจัยหลักอยู่ที่โมเดลการประมวลผลเสียงพูดสำหรับภาษาเวียดนามโดยเฉพาะ ซึ่ง Viettel AI ได้พัฒนามาเป็นเวลานาน

“แทนที่จะใช้โมเดลและคำสั่งจากผลการวิจัยที่มีอยู่ Viettel AI กลับเลือกที่จะสร้างและพัฒนาโมเดลของตัวเองสำหรับการประมวลผลคำพูดภาษาเวียดนาม โมเดลนี้ได้รับการอัปเดตและปรับปรุงอย่างต่อเนื่อง และมีประสิทธิภาพมากขึ้นเรื่อยๆ” นายซอนกล่าว

ไม่เพียงแต่หยุดอยู่แค่กรอบการทำงานของการแข่งขันเท่านั้น โซลูชั่นของ Viettel AI นี้ยังจะเป็นพื้นฐานในการอัปเกรดผลิตภัณฑ์สวิตช์บอร์ดเสมือนจริง ผู้ช่วยเสมือนของ Viettel ช่วยระบุอารมณ์ของลูกค้าได้แม่นยำยิ่งขึ้นในบทสนทนา จึงสามารถให้ข้อเสนอแนะหรือเลือกเฉดสีของคำพูดที่เหมาะสมได้ วิธีนี้จะทำให้การสนทนาระหว่างมนุษย์กับ AI กลายเป็นเรื่องเป็นธรรมชาติมากขึ้น และช่วยปรับปรุงประสบการณ์ของผู้ใช้ นอกจากนี้ ยังมีการเปิดแอปพลิเคชันใหม่ๆ มากมายในด้านการดูแลลูกค้า เช่น การสร้างระบบอัตโนมัติเพื่อระบุข้อร้องเรียนของลูกค้า และอุทธรณ์ไปยังสวิตช์บอร์ดเพื่อการจัดการอย่างทันท่วงทีหรือเพื่อใช้ประโยชน์จากข้อมูล

ภาพที่ 2.jpg
คุณ Bui Tien Dat วิศวกรแพลตฟอร์มผู้ช่วยเสมือนจาก Viettel AI เป็นตัวแทนทีมงานในการนำเสนอผลการวิจัยในงานประชุม

ตัวแทนหน่วยงานกล่าวว่า Viettel AI จะพัฒนาเทคโนโลยีอย่างต่อเนื่อง อัพเกรดผลิตภัณฑ์อย่างต่อเนื่องเพื่อเพิ่มความแม่นยำ ปรับปรุงประสบการณ์ผู้ใช้ และประสิทธิภาพของผลิตภัณฑ์

ก๊วกตวน