การแข่งขันการประมวลผลภาษาและการพูดภาษาเวียดนาม (VLSP) เป็นส่วนหนึ่งของการประชุมนานาชาติประจำปีเกี่ยวกับการประมวลผลภาษาและการพูดภาษาเวียดนาม ซึ่งจัดโดย VLSP Club ซึ่งเป็นสาขาของสมาคมเทคโนโลยีสารสนเทศเวียดนาม VLSP 2023 จัดการแข่งขันด้านการประมวลผลคำพูดและข้อความจำนวน 10 รายการ โดยมีนักวิจัย ผู้เชี่ยวชาญ และหน่วยงานพัฒนาเทคโนโลยีชั้นนำมารวมกัน
แม้ว่านี่จะเป็นครั้งที่สี่ที่ Viettel AI เข้าร่วมการแข่งขันและเคยคว้าชัยชนะมาแล้วสามครั้ง แต่วิศวกรของ Viettel ยังคงพบกับความยากลำบากมากมายเนื่องจากโครงสร้างประเภทการแข่งขันที่เปลี่ยนแปลงไป
โดยเฉพาะอย่างยิ่งเมื่อเทียบกับปีที่แล้ว หมวดหมู่การจดจำเสียงพูดและการจดจำอารมณ์ในปีนี้ได้รวมเข้าเป็นหมวดหมู่เดียว ทีมงานต้องแก้ปัญหาสองข้อในเวลาเดียวกันเพื่อให้แน่ใจว่าสามารถจดจำทั้งข้อความและอารมณ์ของประโยคได้ ซึ่งทำให้ปริมาณงานและความยากเพิ่มขึ้นเป็นสองเท่า
ใช้ประโยชน์จากข้อมูลทุกประเภท ไม่ว่าจะคุณภาพต่ำหรือสูง
นอกจากการเปลี่ยนโครงสร้างของหมวดหมู่แล้ว การสอบในปีนี้ยังมุ่งเน้นไปที่การสร้างแบบจำลองตั้งแต่เริ่มต้นโดยมีเงื่อนไขข้อมูลที่จำกัด รวมถึงข้อมูลดิบ ไม่ได้ติดป้ายกำกับ และข้อมูลคุณภาพต่ำ การทดสอบให้ข้อมูลสี่กลุ่มด้วยคุณภาพและรูปแบบที่แตกต่างกัน มีชุดข้อมูลที่ประกอบด้วยเฉพาะเสียงที่ไม่มีป้ายกำกับ ชุดข้อมูลที่ประกอบด้วยเฉพาะเสียงและข้อความ ชุดข้อมูลที่มีอารมณ์และเสียงที่มีคุณภาพสูง มีป้ายกำกับดี และชุดข้อมูลที่มีอารมณ์และเสียงที่มีคุณภาพต่ำ ชุดข้อมูลแต่ละชุดได้รับการกำหนดไว้อย่างชัดเจนสำหรับแต่ละวัตถุประสงค์และหมวดหมู่การสอบ โดยมีระยะเวลารวมกันมากกว่า 300 ชั่วโมงสำหรับชุดข้อมูลทั้งหมด นี่เป็นตัวเลขที่ค่อนข้างน้อยเมื่อเทียบกับชุดข้อมูลมาตรฐานสำหรับการฝึกการจดจำเสียงพูด ซึ่งโดยทั่วไปจะต้องใช้เวลานานถึง 1,000-2,000 ชั่วโมงหรือมากกว่านั้น
แต่ละทีมมีเวลาในการทำงานและส่งงานของตนเองไม่ถึง 2 เดือน แต่ในความเป็นจริงแล้ว เวลาที่ใช้สำหรับการค้นคว้าวิธีแก้ปัญหานั้นน้อยกว่านี้มากเนื่องจากขาดทรัพยากร
“ในปีนี้ Viettel AI ได้ทุ่มทรัพยากรโครงสร้างพื้นฐานคอมพิวเตอร์จำนวนมากเพื่อค้นคว้าเทคโนโลยีใหม่ ๆ เช่นเดียวกับการพัฒนาผลิตภัณฑ์ ขณะที่การจดจำเสียงพูดเป็นเทคโนโลยีที่ต้องใช้ทรัพยากรฮาร์ดแวร์จำนวนมาก” คุณ Dang Dinh Son วิศวกรปัญญาประดิษฐ์ แพลตฟอร์มผู้ช่วยเสมือน Viettel AI กล่าว
เมื่อเผชิญกับสภาวะที่มีปริมาณและคุณภาพของข้อมูลที่ต่ำ ทีมวิจัยจึงตัดสินใจทันทีว่า "จำเป็นต้องใช้ข้อมูลทั้งหมด ไม่ว่าข้อมูลจะมีคุณภาพสูงหรือต่ำก็ตาม" ในการดำเนินการนี้ จำเป็นต้องสร้างวงจรการฝึกอบรมที่ประมวลผลข้อมูลทั้งหมด รวมถึงโมเดลเพียงหนึ่งเดียวที่สามารถแก้ไขปัญหาต่างๆ ได้มากมาย แทนที่จะใช้โมเดลจำนวนมาก
ผลลัพธ์จากการเป็นผู้เชี่ยวชาญเทคโนโลยีชั้นนำ
ในบริบทของการขาดข้อมูลและการขาดทรัพยากร ทีมวิจัยจึงตัดสินใจสร้างกระบวนการประมวลผลที่เรียบง่าย ไม่ซับซ้อน แต่สำคัญ คือ ต้องมีความละเอียดรอบคอบในทุกรายละเอียด
วิศวกร AI ของ Viettel ศึกษาการวิจัยล่าสุดจากการประชุมและวารสารชั้นนำทั่วโลกอย่างรอบคอบเพื่อค้นหาแนวทาง ทีมวิจัยได้สร้างวงจรการฝึกอบรมที่ช่วยประมวลผลข้อมูลที่มีอยู่ทั้งหมดโดยการผสมผสานวิธีการประมวลผลข้อมูลเพื่อฝึกอบรมโมเดลอย่างมีประสิทธิภาพ วงจรประกอบด้วยสามขั้นตอน: การสร้างแบบจำลองก่อนการฝึกอบรมเพื่อกำหนดลักษณะคำพูดโดยไม่ต้องใช้ป้ายกำกับ การปรับแต่งแบบจำลองก่อนการฝึกอบรมสำหรับงานสองงานของการจดจำคำพูดและการจดจำอารมณ์ และการอนุมาน
“ประสบการณ์จากการแก้ไขปัญหาการขาดแคลนข้อมูลในระหว่างการพัฒนาและการปรับใช้ผลิตภัณฑ์ก่อนหน้านี้ยังมีส่วนสำคัญในการช่วยให้ทีมงานค้นหาวิธีการตัดสินใจ” ในทางกลับกัน ความรู้และผลลัพธ์ที่ได้จากการทดสอบยังมีศักยภาพที่จะนำไปปรับใช้กับผลิตภัณฑ์ Viettel AI ได้ทันที ดังนั้นกระบวนการทำงานขณะทำการทดสอบจึงค่อนข้างเอื้ออำนวย" นาย Bui Tien Dat วิศวกรแพลตฟอร์มผู้ช่วยเสมือนจริงของ Viettel AI กล่าว
ด้วยเหตุนี้ Viettel AI ไม่เพียงแต่คว้ารางวัลชนะเลิศในประเภทการจดจำเสียงพูดและการจดจำอารมณ์คำพูดเท่านั้น แต่ยังได้รับคะแนนที่น่าประทับใจถึง 89.18% อีกด้วย (ทีมถัดมาได้คะแนน 83.40% และ 78.45% ตามลำดับ)
นายซอน กล่าวว่า ปัจจัยหลักอยู่ที่โมเดลการประมวลผลเสียงพูดสำหรับภาษาเวียดนามโดยเฉพาะ ซึ่ง Viettel AI ได้พัฒนามาเป็นเวลานาน
แทนที่จะใช้โมเดลและคำสั่งจากผลการวิจัยที่มีอยู่ Viettel AI เลือกที่จะสร้างและพัฒนาโมเดลของตัวเองสำหรับการประมวลผลคำพูดภาษาเวียดนาม โมเดลนี้ได้รับการอัปเดตและปรับปรุงอย่างต่อเนื่องและมีประสิทธิภาพมากขึ้น" นายซอนกล่าว
ไม่เพียงแต่หยุดอยู่แค่กรอบการทำงานของการแข่งขันเท่านั้น โซลูชั่นของ Viettel AI นี้ยังจะเป็นพื้นฐานในการอัปเกรดผลิตภัณฑ์สวิตช์บอร์ดเสมือนจริง ผู้ช่วยเสมือนของ Viettel ช่วยระบุอารมณ์ของลูกค้าได้แม่นยำยิ่งขึ้นในบทสนทนา จึงสามารถให้ข้อเสนอแนะหรือเลือกเฉดสีของคำพูดที่เหมาะสมได้ วิธีนี้จะทำให้การสนทนาระหว่างมนุษย์กับ AI กลายเป็นเรื่องธรรมชาติมากขึ้น และช่วยปรับปรุงประสบการณ์ของผู้ใช้ นอกจากนี้ ยังมีการเปิดตัวแอปพลิเคชันใหม่ๆ มากมายในด้านการดูแลลูกค้า เช่น การสร้างระบบอัตโนมัติเพื่อระบุข้อร้องเรียนของลูกค้าและอุทธรณ์ไปยังสวิตช์บอร์ดเพื่อการจัดการอย่างทันท่วงทีหรือเพื่อใช้ประโยชน์จากข้อมูล
ตัวแทนหน่วยงานกล่าวว่า Viettel AI จะพัฒนาเทคโนโลยีอย่างต่อเนื่อง อัพเกรดผลิตภัณฑ์อย่างต่อเนื่องเพื่อเพิ่มความแม่นยำ ปรับปรุงประสบการณ์ผู้ใช้ และประสิทธิภาพของผลิตภัณฑ์
ก๊วกตวน
แหล่งที่มา
การแสดงความคิดเห็น (0)