Pho GPT ย่อมาจาก Pho - Generative Pre-trained Transformer เป็นโครงการโมเดลภาษาขนาดใหญ่ที่มุ่งเน้นไปที่ภาษาเวียดนาม โดยดำเนินการโดยทีมวิศวกร VinAI ซึ่งเป็นสมาชิกของ Vingroup Corporation
“ตามทัน” เทคโนโลยีโลก
Pho GPT ใช้โค้ดโอเพ่นซอร์สแทนซอฟต์แวร์ที่เป็นกรรมสิทธิ์ เช่น ChatGPT ของ OpenAI ซึ่งหมายความว่าซอร์สโค้ดของ Pho GPT เป็นสาธารณะและผู้ใช้สามารถมีส่วนร่วมพัฒนา Pho GPT ได้ผ่านแอปพลิเคชันที่กำหนดเอง
ตามการแนะนำของ VinAI Pho GPT มีพารามิเตอร์ 7.5 พันล้านตัว ซึ่งสร้างขึ้นบนแพลตฟอร์มการถอดรหัส Transformer โมเดลนี้ได้รับการฝึกฝนตั้งแต่เริ่มต้นโดยใช้เทคนิคที่ล้ำสมัย เช่น Flash Attention และการประมาณความยาวบริบท AliBi
เทคนิคเหล่านี้ไม่เพียงช่วยให้ Pho GPT เข้าใจบริบทได้อย่างลึกซึ้งยิ่งขึ้น แต่ยังเพิ่มความสามารถของแอพพลิเคชั่นในการสนทนาและโต้ตอบอย่างเป็นธรรมชาติระหว่างการใช้งานอีกด้วย สิ่งนี้ทำให้โมเดลนี้เป็นเครื่องมือที่มีความหลากหลายและทำงานได้หลายอย่างพร้อมกัน สามารถตอบสนองความต้องการภาษาของผู้ใช้ที่หลากหลายได้
คุณบุ้ย ไห่ หุ่ง กรรมการผู้จัดการทั่วไปของ VinAI |
นาย Bui Hai Hung กรรมการผู้จัดการทั่วไปของ VinAI แบ่งปันเกี่ยวกับความสำคัญของการกำเนิด Pho GPT ว่าเป้าหมายของโครงการคือการพัฒนารูปแบบที่คล้ายกับ ChatGPT สำหรับภาษาเวียดนามและวัฒนธรรมเวียดนาม Pho GPT มีความสามารถในการทำความเข้าใจและเขียนข้อความเวียดนามได้ในลักษณะที่เหนือกว่าเทคโนโลยีภาษารุ่นก่อนหน้า นอกจากนี้ โมเดลดังกล่าวยังได้รับการฝึกฝนตั้งแต่เริ่มต้นด้วยชุดข้อมูลของเวียดนาม ซึ่งเป็นอิสระจากโมเดลอื่นๆ ในโลก ช่วยให้มั่นใจได้ว่าจะเชี่ยวชาญเทคโนโลยีหลักขั้นสูงสำหรับเวียดนาม
เป็นที่น่าสังเกตว่า ในขณะที่โลกกำลังฮือฮาเกี่ยวกับการกำเนิดของ Chat GPT หนึ่งปีต่อมา Pho GPT ก็ปรากฏตัวในเวียดนามด้วย นายบุ้ย ไห่ หุ่ง กล่าวว่า VinAI เป็นผู้บุกเบิกในเอเชียตะวันออกเฉียงใต้ที่เปิดตัวโมเดลภาษาขนาดใหญ่ด้วยโค้ดโอเพนซอร์ส ไม่กี่สัปดาห์ต่อมา ผลิตภัณฑ์ที่คล้ายกันก็ได้เปิดตัวในสิงคโปร์
การยกระดับ AI ของเวียดนาม
ผลลัพธ์ของการเปรียบเทียบเวอร์ชัน Pho GPT-7B5-Instruct กับ ChatGPT ที่เป็นแบบจำลองแหล่งปิด (GPT-3.5-turbo) และแบบจำลองแหล่งเปิดอื่นๆ แสดงให้เห็นว่า Pho GPT อยู่ในอันดับที่สอง ตามหลัง ChatGPT ในหมวดหมู่การประเมินผลส่วนใหญ่
Pho GPT มีความแตกต่างมากมายเมื่อเทียบกับโมเดลภาษาอื่น โดยเฉพาะ ChatGPT ออกแบบมาเพื่อทำความเข้าใจและเขียนภาษาเวียดนามได้อย่างเป็นธรรมชาติ สะท้อนบริบท ไวยากรณ์ คำศัพท์ และการแสดงออกของชาวเวียดนาม สามารถโต้ตอบกับผู้ใช้ในหัวข้อที่เกี่ยวข้องกับวัฒนธรรมเวียดนาม ประวัติศาสตร์ ภูมิศาสตร์ สังคม ความบันเทิง กีฬา ฯลฯ
นอกจากนี้ Pho GPT ยังเป็นโอเพ่นซอร์สและมีความยืดหยุ่น ผู้ใช้สามารถพัฒนาแอปพลิเคชันที่กำหนดเองและไม่ซ้ำใครโดยเฉพาะแอปพลิเคชันที่ต้องการความปลอดภัยสูงโดยไม่ต้องพึ่งพาแหล่งซอฟต์แวร์ที่เป็นกรรมสิทธิ์
ในเวลาเดียวกันความสำคัญของ Pho GPT ก็คือประสิทธิภาพสูงและการประหยัดต้นทุนด้วยการฝึกอบรมโดยใช้เทคนิคเพิ่มประสิทธิภาพล่าสุด ช่วยลดขนาดและเพิ่มความเร็วของแอปพลิเคชัน GPT Pho ยังสามารถทำงานบนแพลตฟอร์มคอมพิวเตอร์ขนาดเล็กได้ ช่วยลดต้นทุนและประหยัดทรัพยากร
Pho GPT ได้รับการฝึกฝนด้วยคลังข้อมูลของเวียดนามขนาดสูงสุดถึง 41GB ซึ่งรวมถึงข้อความ Wikipedia ขนาด 1GB และตัวแปรขนาด 40GB ที่ลบข้อมูลที่ซ้ำกันออกจากชุดข้อมูลข่าว ได้รับการฝึกฝนโดยใช้ไลบรารี llm-foundry ของ Mosaicml llm ทำให้ Pho GPT สามารถสร้างข้อความบางส่วนตามคำขอของผู้ใช้ เช่น บทความ บทกวี เพลง เรียงความ สุนทรพจน์ บทนำ... นอกจากนี้ Pho GPT ยังสามารถสร้างเนื้อหาที่สร้างสรรค์และตลกขบขัน เช่น เรื่องสั้น ความเห็น สุภาษิต ข้อความ ทวีต มีม... ในเวลาเดียวกัน ยังโต้ตอบกับผู้ใช้ในหัวข้อต่างๆ เช่น เหตุการณ์ปัจจุบัน การศึกษา สุขภาพ การท่องเที่ยว อาหาร กีฬา ความบันเทิง... นอกจากนี้ Pho GPT ยังสามารถตอบคำถามของผู้ใช้ ให้ข้อมูล คำแนะนำ การสนับสนุน และตอบคำถาม...
นอกจากนี้ Pho GPT ยังสามารถแปลข้อความหรือประเภทข้อความที่หลากหลาย เช่น เอกสารทางการ เอกสารทางการค้า เอกสารวิชาการ เอกสารวรรณกรรม... จากภาษาเวียดนามเป็นภาษาอื่นและในทางกลับกัน
คุณสมบัติที่โดดเด่นอีกประการหนึ่งก็คือ Pho GPT วิเคราะห์และประมวลผลข้อความต่างๆ เช่น การสรุป การจัดหมวดหมู่ การติดฉลาก การสกัดข้อมูล การตรวจจับอารมณ์ การตรวจจับข้อผิดพลาด การปรับปรุงรูปแบบการเขียน เป็นต้น
ในอนาคตทีมพัฒนา Pho GPT กล่าวว่าพวกเขาจะปรับปรุงโมเดลนี้ต่อไปและขยายโครงการไปยังภาษาอื่นๆ โดยเฉพาะในภูมิภาคเอเชียตะวันออกเฉียงใต้
“การถือกำเนิดของ Pho GPT ถือเป็นครั้งแรกที่เวียดนามมีโอกาส “ตามทัน” โลกในสาขาเทคโนโลยีขั้นสูงนี้ และเป็นเจ้าของโมเดลภาษาขนาดใหญ่ที่มีโค้ดโอเพนซอร์สโดยเฉพาะสำหรับคนเวียดนาม โดยปรับให้เหมาะสมสำหรับภาษาเวียดนาม และไม่ขึ้นอยู่กับโลก” “นี่คือความภาคภูมิใจของ Vin AI โดยเฉพาะ และคนเวียดนามโดยทั่วไป” ตัวแทน VinAI กล่าวเสริม
นาย Tran Duy Dong รัฐมนตรีช่วยว่าการกระทรวงการวางแผนและการลงทุน ได้แสดงความคิดเห็นเกี่ยวกับศักยภาพและโอกาสในการพัฒนาของ Pho GPT ในอนาคตอันใกล้นี้ โดยเน้นย้ำว่า “AI จะเป็นหนึ่งในสาขาที่เวียดนามมีศักยภาพในการพัฒนาอย่างแข็งแกร่งและจะตามทันระดับโลกได้ในไม่ช้านี้” กระทรวงจะสนับสนุนและอยู่เคียงข้างชุมชน AI โดยเฉพาะและชุมชนวิทยาศาสตร์และเทคโนโลยีโดยทั่วไป เพื่อพัฒนาระบบนิเวศนวัตกรรมที่ครอบคลุมและมีพลวัต ซึ่งจะนำไปสู่การพัฒนาประเทศโดยรวม”
แหล่งที่มา
การแสดงความคิดเห็น (0)