VinBigdata ประกาศเมื่อวันที่ 21 สิงหาคมว่าได้สร้างโมเดลภาษาเวียดนามขนาดใหญ่สำเร็จ ซึ่งถือเป็นการสร้างรากฐานสำหรับการเชี่ยวชาญเทคโนโลยี AI เชิงสร้างสรรค์
Large Language Models (LLM) คือโมเดลที่ได้รับการฝึกฝนโดยใช้เทคนิคการเรียนรู้เชิงลึกกับชุดข้อมูลข้อความหรือรูปภาพขนาดใหญ่ โมเดลนี้มีความสามารถในการทำความเข้าใจความรู้ สร้างข้อความ และดำเนินการงานการประมวลผลภาษาธรรมชาติต่างๆ ถือเป็นกุญแจสำคัญในการพัฒนาเทคโนโลยี Generative AI ที่สามารถสร้างเนื้อหาและไอเดียใหม่ๆ ได้ในหลายรูปแบบ (ข้อความ รูปภาพ เสียง เป็นต้น)
ด้วยการสร้างแบบจำลองภาษาเวียดนามขนาดใหญ่ที่ประสบความสำเร็จ VinBigdata จะบูรณาการเทคโนโลยีเพื่อทำให้ VinBase (แพลตฟอร์มปัญญาประดิษฐ์แบบหลายความรู้ที่ครอบคลุม) กลายเป็นแพลตฟอร์ม AI เชิงสร้างสรรค์ในเวียดนาม ในขณะเดียวกันก็มอบโซลูชันการพัฒนาที่ใช้เทคโนโลยีนี้ เช่น แชทบอท AI เชิงสร้างสรรค์ คอลบอท หรือผู้ช่วยเสมือน ViVi รุ่นใหม่... เทคโนโลยีนี้ช่วยเพิ่มความเป็นธรรมชาติของการสื่อสารของเครื่องจักร ในขณะที่สนับสนุนให้ผู้ใช้ค้นหาและสังเคราะห์ข้อมูลได้เร็วและง่ายขึ้นกว่าเดิม
ศาสตราจารย์ Vu Ha Van ผู้อำนวยการฝ่ายวิทยาศาสตร์ของบริษัท VinBigdata ภาพ: VinBigdata
ศาสตราจารย์ Vu Ha Van ผู้อำนวยการฝ่ายวิทยาศาสตร์ บริษัท VinBigdata กล่าวว่า ในโลกนี้มีองค์กรขนาดใหญ่จำนวนหลายแห่งที่ประสบความสำเร็จในการทำการวิจัยและเปิดตัวผลิตภัณฑ์ที่ใช้โมเดลภาษาขนาดใหญ่ เช่น OpenAI ที่ใช้ ChatGPT หรือ Google ที่ใช้ Bard ในเวียดนาม VinBigdata ได้รับการลงทุนจาก Vingroup เพื่อสร้างโมเดลภาษาเวียดนามขนาดใหญ่ ตามที่นายแวนกล่าว โมเดลนี้มุ่งเน้นไปที่การแก้ไขปัญหาหลักสามประการ ได้แก่ การปรับปรุงความแม่นยำ การลดต้นทุนโครงสร้างพื้นฐาน และการรับประกันความปลอดภัย
"แทนที่จะต้องใช้พารามิเตอร์กว่า 175 พันล้านตัวอย่างเช่น ChatGPT นั้น VinBigdata สามารถสร้างโมเดลภาษาขนาดใหญ่ที่มีพารามิเตอร์กว่าหลายพันล้านตัวได้ แต่ยังคงมีความสามารถในการสร้างเอกสารที่มีความถูกต้องสูง โดยเน้นที่ข้อมูลและความรู้ของเวียดนาม" หัวหน้าหน่วยงานกล่าว
การเชี่ยวชาญเทคโนโลยี การพัฒนาตัวเองตั้งแต่ก้าวแรก การสร้างโมเดลภาษาเวียดนามขนาดใหญ่ ถือเป็นก้าวสำคัญที่จะช่วยให้ VinBigdata นำเทคโนโลยี AI เชิงสร้างสรรค์มาสู่ระบบนิเวศของผลิตภัณฑ์และบริการในตลาด ปัจจุบัน บริษัทกำลังเริ่มนำเทคโนโลยีใหม่มาประยุกต์ใช้กับผลิตภัณฑ์ VinBase KB (VinBase Knowledge Base Portal) ผลิตภัณฑ์นี้มีความสามารถในการดึงข้อมูลและสร้างคำตอบโดยอัตโนมัติโดยอิงจากข้อมูลที่รวบรวมจากชุดข้อมูลขนาดใหญ่มากในระบบความรู้
ตัวแทนของ VinBigdata กล่าวในงานประกาศเปิดตัว Generative AI ภาพ: VinBigdata
คาดว่าในเดือนธันวาคมปีนี้ สมาชิก Vingroup จะเปิดตัวผลิตภัณฑ์หลักสองกลุ่ม ได้แก่ VinBase2.0 และแอปพลิเคชัน ViGPT VinBase 2.0 เป็นแพลตฟอร์ม AI แบบหลายองค์ความรู้พร้อมโซลูชันสำหรับธุรกิจและหน่วยงานภาครัฐ ในขณะเดียวกัน บริษัทได้เปิดตัวแอปพลิเคชัน ViGPT ในชื่อ "ChatGPT เวอร์ชันเวียดนาม" และเปิดให้ชุมชนเข้าถึงและทำการทดสอบได้ ด้วย ViGPT ผู้ใช้สามารถถามและตอบคำถามเกี่ยวกับข้อมูลเฉพาะเกี่ยวกับเวียดนาม (กฎระเบียบ เอกสารทางกฎหมาย) หรือข้อมูลในท้องถิ่น (ประวัติศาสตร์ วรรณกรรม สถานที่ท่องเที่ยว อาหารพิเศษประจำท้องถิ่น)
บริษัท VinBigdata Joint Stock มีระบบฐานข้อมูลสูงสุดถึง 3,500 เทราไบต์ ระบบมีข้อมูลเสียง รูปภาพ และข้อมูลจำนวนหลายแสนชั่วโมงที่ได้รับการทำความสะอาด ประมวลผล จัดประเภท และใช้สำหรับการฝึกอบรม AI และโครงสร้างพื้นฐานการวิจัยและพัฒนา โครงสร้างพื้นฐานประกอบด้วยคลัสเตอร์เซิร์ฟเวอร์ NvidiaDGX A100 จำนวนหลายสิบคลัสเตอร์ บริษัทนี้เป็นเจ้าของทีมศาสตราจารย์ นักวิทยาศาสตร์ และผู้เชี่ยวชาญด้านเทคโนโลยีชาวเวียดนามจากทั่วทุกมุมโลก
ห่วยฟอง
ลิงค์ที่มา
การแสดงความคิดเห็น (0)