Trang chủKhoa học - Công nghệCông nghệ sốZalo AI công bố bộ tiêu chuẩn đánh giá năng lực tiếng...

Zalo AI công bố bộ tiêu chuẩn đánh giá năng lực tiếng Việt miễn phí


VMLU (Vietnamese Multitask Language Understanding) do Zalo AI phối hợp với Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST) xây dựng nhằm giúp cộng đồng nghiên cứu và phát triển AI ở Việt Nam có thêm công cụ đánh giá chất lượng đầu ra của các mô hình Generative AI tiếng Việt.

Theo đó, đây là bộ tiêu chuẩn đánh giá tiếng Việt đa khía cạnh, đa cấp độ và đáp ứng đa dạng nhu cầu nhất trên thị trường hiện nay với 10.880 câu hỏi trắc nghiệm xoay quanh 58 chủ đề khác nhau.

zalo ai.jpg
Bộ tiêu chuẩn đánh giá năng lực tiếng Việt được các kỹ sư Zalo AI phối hợp với viện JAIST nghiên cứu và phát triển nhằm đánh giá khả năng hiểu, vận dụng ngôn ngữ tiếng Việt của các mô hình AI, đặc biệt là Generative AI.

Tại sao AI Việt Nam cần một bộ tiêu chuẩn đánh giá năng lực tiếng Việt hoàn chỉnh?

Sự phát triển bùng nổ của ChatGPT đã tạo ra một cuộc đua mới: Generative AI (Trí tuệ nhân tạo tạo sinh). Theo số liệu thống kê, kể từ thời điểm ChatGPT được giới thiệu, trên thế giới hiện có khoảng 16.000 mô hình tương tự như ChatGPT ra đời.

Việt Nam cũng không đứng ngoài xu thế đó khi có rất nhiều nhóm nghiên cứu với quy mô, tiềm lực khác nhau cũng đang muốn thử nghiệm với Generative AI sử dụng tiếng Việt. Điều này đã kéo theo nhu cầu về một bộ đánh giá năng lực tiếng Việt cho chính các mô hình AI này để đo lường mức độ nắm tri thức cũng như tư duy ngôn ngữ tiếng Việt.

Trên thị trường hiện nay, hầu hết các nhóm nghiên cứu LLM ở Việt Nam đều phải tự xây dựng bộ công cụ đánh giá với chuẩn mực riêng cho mô hình của mình. Đây là những bộ đánh giá nội bộ, chưa được công khai ra thị trường. Bộ đánh giá của Zalo AI hướng đến nhu cầu tổng quát, có thể làm tiêu chuẩn chung cho các mô hình LLM và được cung cấp ra cho cộng đồng AI. Điều này vừa giúp những nhóm nghiên cứu nhỏ có thể tiếp cận được bộ dữ liệu đánh giá toàn diện vừa để các bên có thể so sánh kết quả lẫn nhau. Từ đó, tạo ra động lực hoàn thiện hơn mô hình.

Tạo động lực cho AI Việt Nam gia nhập làn sóng Generative AI thế giới

Tháng 11/2023, Zalo AI chính thức công bố bộ tiêu chuẩn đánh giá năng lực tiếng Việt VMLU. Đây là bộ tiêu chuẩn được các kỹ sư Zalo AI phối hợp với viện JAIST nghiên cứu và phát triển nhằm đánh giá khả năng hiểu và vận dụng ngôn ngữ tiếng Việt của các mô hình AI, đặc biệt là Generative AI.

Sự ra đời của VMLU đã tạo động lực cho các cá nhân, startup hay các nhóm nghiên cứu nhỏ trong việc phát triển ra các mô hình AI tiếng Việt mới. Điều này tạo điều kiện cho các nghiên cứu mới, đặt nền móng đo lường sự chính xác và nâng cấp kết quả của các mô hình cơ bản, giúp hoàn thiện quá trình phát triển các ứng dụng AI ngôn ngữ Việt, do chính người Việt tạo ra để phục vụ người Việt.

Đây cũng là một trong những yếu tố quan trọng thúc đẩy sự phát triển Generative AI Việt Nam đi nhanh hơn, bắt kịp với làn sóng phát triển AI trên thế giới.

Bộ tiêu chuẩn đánh giá năng lực tiếng Việt gồm những gì?

Theo đó, đây là bộ tiêu chuẩn đánh giá tiếng Việt đa khía cạnh, đa cấp độ và đáp ứng đa dạng nhu cầu nhất trên thị trường nghiên cứu và phát triển Generative AI Việt Nam, hướng đến 2 phần chính: Dữ liệu (test dataset) và bộ công cụ tiêu chuẩn đánh giá, làm cơ sở để kiểm tra đối với các mô hình AI ứng dụng ngôn ngữ Việt.

Cụ thể, bộ dữ liệu bao gồm 10.880 câu hỏi trắc nghiệm xoay quanh 58 chủ đề khác nhau. Mỗi chủ đề có khoảng 200 câu hỏi và được phân bổ trên 4 lĩnh vực bao gồm: STEM, Khoa học xã hội, Khoa học nhân văn và một danh mục rộng “Mở rộng”. Với khối dữ liệu này, VMLU có sự phân tầng độ khó với 4 cấp bậc: Tiểu học, Trung học cơ sở, Trung học phổ thông và Chuyên nghiệp – cho đại học và sau đại học. Từ đó, bộ công cụ giúp đánh giá hiệu quả năng lực ngôn ngữ tiếng Việt của các mô hình AI về cả kiến thức sơ đẳng lẫn giải quyết các vấn đề phức tạp.

Bên cạnh đó, để giúp các nhóm nghiên cứu dễ dàng đánh giá năng lực các mô hình AI tiếng Việt của mình, đội ngũ kĩ sư Zalo AI thiết kế kèm theo hướng dẫn để các nhóm có thể sử dụng một cách nhanh chóng và đơn giản.

Đóng góp cho cộng đồng AI Việt Nam

Bộ tiêu chuẩn VMLU ra đời chính là một sản phẩm được nghiên cứu nhằm hướng đến mục đích đóng góp và phát triển cộng đồng nghiên cứu AI Việt Nam nói riêng cũng như cộng đồng công nghệ thông tin nói chung, không thu phí bất kỳ người dùng, nhóm nghiên cứu hay doanh nghiệp nào.

Trước đó, Zalo AI đã thực hiện, triển khai và tổ chức hàng loạt các cuộc thi, chương trình cho cộng đồng AI Việt Nam như: Zalo AI Challenge, Zalo AI Hackathon, Zalo AI Summit… Những hoạt động này không chỉ tạo sân chơi cho cộng đồng AI Việt mà còn khuyến khích việc ứng dụng AI vào cuộc sống, giải quyết các bài toán cấp thiết của xã hội, phục vụ cho nhu cầu của hàng triệu người Việt Nam.

Tiến sĩ Châu Thành Đức, Trưởng bộ phận nghiên cứu Zalo AI – Giảng viên Trường Đại học Khoa học tự nhiên, Đại học Quốc gia TP Hồ Chí Minh khẳng định: “Zalo AI luôn hướng tới sự đóng góp cho cộng đồng AI Việt Nam, tạo động lực để AI Việt Nam phát triển. Từ đó, kỳ vọng ngày càng có nhiều sản phẩm AI của người Việt, cho người Việt”.



Nguồn

Cùng chủ đề

Việt Nam là quốc gia cởi mở về thể chế số

Theo Bộ trưởng Nguyễn Mạnh Hùng, Việt Nam là quốc gia cởi mở trong xây dựng thể chế, lắng nghe ý kiến doanh nghiệp, nhất là doanh nghiệp nước ngoài. Chiều 21/3, tại trụ sở Bộ TT&TT, Bộ trưởng Nguyễn Mạnh Hùng đã có buổi tiếp đoàn Hội đồng kinh doanh Hoa Kỳ - ASEAN (USABC). Đây là khối các doanh nghiệp có nhiều ý kiến đóng góp nhất với Bộ TT&TT về các vấn đề xây dựng thể chế,...

Tiến sĩ Ngô Di Lân: Tôi lạc quan với ‘canh bạc’ trí tuệ nhân tạo

(Dân trí) - Một cán bộ nghiên cứu của ngành Ngoại giao sử dụng trí tuệ nhân tạo (AI) như thế nào, và vì sao anh lại ví AI như "canh bạc"? Đây là những câu hỏi dành cho tiến sĩ Ngô Di Lân, nhân vật từng nổi tiếng trong giới du học sinh khi viết thư ngỏ gửi Bộ trưởng Giáo dục và Đào tạo cho rằng học sinh, sinh viên Việt Nam yếu kém "tư duy phê phán"....

Liên Hiệp Quốc thông qua nghị quyết về trí tuệ nhân tạo

Đại Hội đồng Liên Hiệp Quốc lần đầu thông qua nghị quyết về bảo vệ nhân quyền, bảo vệ dữ liệu cá nhân và giám sát các rủi ro do trí tuệ nhân tạo (AI) gây ra. Nghị quyết do Mỹ bảo trợ được thông qua hôm 21/3 với sự đồng thuận của hơn 120 quốc gia thành viên mà không cần bỏ phiếu. Nghị quyết đặt mục tiêu thúc đẩy các hệ thống AI an toàn, bảo mật...

Sinh viên làm thiết bị chống ngủ gật khi lái xe

Bằng thiết bị đeo tai đo sóng não kết nối với phần mềm trên điện thoại, nhóm sinh viên Bách khoa Hà Nội giúp phát hiện sớm cơn buồn ngủ của tài xế và khiến họ tỉnh táo trở lại. Những ngày này, Nguyễn Tuấn Đạt, sinh viên năm hai ngành Công nghệ thông tin Việt - Nhật, trường Công nghệ thông tin và Truyền thông, Đại học Bách khoa Hà Nội cùng các bạn trong nhóm, tất bật...

Nổi bật

Mới nhất

Cùng tác giả

Khoảnh khắc mỗi năm chỉ xuất hiện một lần trên dòng sông Đà hùng vĩ

Những ngày cuối tháng ba, sông Đà chảy qua địa phận tỉnh Hòa Bình có màu nước xanh trong cuộn chảy, hai bên bờ là khung cảnh hoang sơ, hùng vĩ. Sông Đà chảy trên địa phận tỉnh Hoà Bình dài khoảng 93km và có khoảng 70km chảy trên địa phận các xã vùng cao thuộc huyện Đà Bắc có diện tích mặt nước khoảng 6.000ha. Sông Đà không chỉ cung ứng nước cho các hoạt động nông nghiệp, công nghiệp…...

Trung tâm công nghệ Thẩm Quyến xuất siêu sang Mỹ bất chấp cuộc chiến công nghệ

Xuất khẩu của trung tâm công nghệ phía nam Trung Quốc tăng vọt do nhu cầu về xe điện và hàng loạt thoả thuận với những quốc gia tham gia Sáng kiến Vành đai & Con đường. Các nhà phân tích cho rằng, những số liệu thương mại khả quan của Thẩm Quyền là tín hiệu tốt cho mục tiêu tăng trưởng kinh tế Trung Quốc khoảng 5% mà Bắc Kinh đặt ra trong năm nay, cũng như là...

Thịt bò Kobe nổi tiếng giá siêu rẻ trên 'chợ mạng', chất lượng ra sao?

Sự thật về 'thịt bò Kobe thượng hạng' bán la liệt với giá siêu rẻ Bò Kobe là loại thịt bò của Nhật Bản ngon nổi tiếng thế giới. Tại Việt Nam, có rất nhiều loại thịt bò Kobe khác nhau, giá từ 2-15 triệu đồng/kg, thường được sử dụng tại các nhà hàng, khách sạn sang trọng. Gần đây, “chợ mạng” xuất hiện la liệt các loại thịt bò Kobe lại được rao bán với mức giá siêu rẻ,...

Bài đọc nhiều

Cùng chuyên mục

Mới nhất

Đội tuyển Việt Nam: Đừng để người hâm mộ quay lưng !

Sau những thất bại liên tiếp của đội tuyển Việt Nam (VN) gần đây dưới thời HLV Troussier, điều khiến nhiều người lo lắng nhất không phải là số phận của vị HLV người Pháp mà là sự thờ ơ và quay lưng của người hâm mộ bóng đá VN với đội tuyển nước nhà. Trong những bình luận trên...

Thủ tướng yêu cầu hoàn thành cầu Rạch Miễu 2 vào tháng 9/2025

TIỀN GIANG-Kiểm tra dự án cầu Rạch Miễu 2, Thủ tướng Phạm Minh Chính đề nghị hoàn thành công trình dịp Quốc khánh 2/9/2025, sớm 7 tháng so với dự kiến. Yêu cầu được người đứng đầu Chính phủ đưa ra tại hội nghị công bố quy hoạch và xúc tiến đầu tư tỉnh Tiền Giang vào sáng 24/3. "Mục...

Hồng Diễm bị “Trạm cứu hộ trái tim” làm khó

Những vai diễn Hồng Diễm đảm nhận, dù là con nhà nghèo hay tiểu thư nhà giàu, nhân vật vẫn nhiều lần rơi nước mắt, bất lực trước số phận.Đến "Trạm cứu hộ trái tim", sự lặp lại càng rõ nét hơn ở những tập đầu phim. Với cùng đề tài gia đình, liên tục lên sóng trong...

Bên trong căn cứ địa vang danh bốn bể ở TPHCM

Địa đạo Củ Chi được xây dựng hoàn toàn bằng sức người, với những công cụ thô sơ và dựa trên kinh nghiệm truyền thống, tri thức dân gian trong thời kỳ chiến tranh. Địa đạo Củ Chi là một hệ thống đường hầm phòng thủ trong lòng đất ở...

Đoàn đại biểu giải thưởng Lý Tự Trọng dâng hương tưởng niệm Chủ tịch Hồ Chí Minh

TPO - Tại Khu di tích Quốc gia đặc biệt Kim Liên (huyện Nam Đàn, Nghệ An), đoàn công tác T.Ư Đoàn và các đại biểu đã bày tỏ lòng thành kính, biết ơn vô hạn công lao to lớn của Chủ tịch Hồ Chí Minh . ...

Mới nhất