Trang chủKhoa học - Công nghệCông nghệ sốZalo AI công bố bộ tiêu chuẩn đánh giá năng lực tiếng...

Zalo AI công bố bộ tiêu chuẩn đánh giá năng lực tiếng Việt miễn phí


VMLU (Vietnamese Multitask Language Understanding) do Zalo AI phối hợp với Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST) xây dựng nhằm giúp cộng đồng nghiên cứu và phát triển AI ở Việt Nam có thêm công cụ đánh giá chất lượng đầu ra của các mô hình Generative AI tiếng Việt.

Theo đó, đây là bộ tiêu chuẩn đánh giá tiếng Việt đa khía cạnh, đa cấp độ và đáp ứng đa dạng nhu cầu nhất trên thị trường hiện nay với 10.880 câu hỏi trắc nghiệm xoay quanh 58 chủ đề khác nhau.

zalo ai.jpg
Bộ tiêu chuẩn đánh giá năng lực tiếng Việt được các kỹ sư Zalo AI phối hợp với viện JAIST nghiên cứu và phát triển nhằm đánh giá khả năng hiểu, vận dụng ngôn ngữ tiếng Việt của các mô hình AI, đặc biệt là Generative AI.

Tại sao AI Việt Nam cần một bộ tiêu chuẩn đánh giá năng lực tiếng Việt hoàn chỉnh?

Sự phát triển bùng nổ của ChatGPT đã tạo ra một cuộc đua mới: Generative AI (Trí tuệ nhân tạo tạo sinh). Theo số liệu thống kê, kể từ thời điểm ChatGPT được giới thiệu, trên thế giới hiện có khoảng 16.000 mô hình tương tự như ChatGPT ra đời.

Việt Nam cũng không đứng ngoài xu thế đó khi có rất nhiều nhóm nghiên cứu với quy mô, tiềm lực khác nhau cũng đang muốn thử nghiệm với Generative AI sử dụng tiếng Việt. Điều này đã kéo theo nhu cầu về một bộ đánh giá năng lực tiếng Việt cho chính các mô hình AI này để đo lường mức độ nắm tri thức cũng như tư duy ngôn ngữ tiếng Việt.

Trên thị trường hiện nay, hầu hết các nhóm nghiên cứu LLM ở Việt Nam đều phải tự xây dựng bộ công cụ đánh giá với chuẩn mực riêng cho mô hình của mình. Đây là những bộ đánh giá nội bộ, chưa được công khai ra thị trường. Bộ đánh giá của Zalo AI hướng đến nhu cầu tổng quát, có thể làm tiêu chuẩn chung cho các mô hình LLM và được cung cấp ra cho cộng đồng AI. Điều này vừa giúp những nhóm nghiên cứu nhỏ có thể tiếp cận được bộ dữ liệu đánh giá toàn diện vừa để các bên có thể so sánh kết quả lẫn nhau. Từ đó, tạo ra động lực hoàn thiện hơn mô hình.

Tạo động lực cho AI Việt Nam gia nhập làn sóng Generative AI thế giới

Tháng 11/2023, Zalo AI chính thức công bố bộ tiêu chuẩn đánh giá năng lực tiếng Việt VMLU. Đây là bộ tiêu chuẩn được các kỹ sư Zalo AI phối hợp với viện JAIST nghiên cứu và phát triển nhằm đánh giá khả năng hiểu và vận dụng ngôn ngữ tiếng Việt của các mô hình AI, đặc biệt là Generative AI.

Sự ra đời của VMLU đã tạo động lực cho các cá nhân, startup hay các nhóm nghiên cứu nhỏ trong việc phát triển ra các mô hình AI tiếng Việt mới. Điều này tạo điều kiện cho các nghiên cứu mới, đặt nền móng đo lường sự chính xác và nâng cấp kết quả của các mô hình cơ bản, giúp hoàn thiện quá trình phát triển các ứng dụng AI ngôn ngữ Việt, do chính người Việt tạo ra để phục vụ người Việt.

Đây cũng là một trong những yếu tố quan trọng thúc đẩy sự phát triển Generative AI Việt Nam đi nhanh hơn, bắt kịp với làn sóng phát triển AI trên thế giới.

Bộ tiêu chuẩn đánh giá năng lực tiếng Việt gồm những gì?

Theo đó, đây là bộ tiêu chuẩn đánh giá tiếng Việt đa khía cạnh, đa cấp độ và đáp ứng đa dạng nhu cầu nhất trên thị trường nghiên cứu và phát triển Generative AI Việt Nam, hướng đến 2 phần chính: Dữ liệu (test dataset) và bộ công cụ tiêu chuẩn đánh giá, làm cơ sở để kiểm tra đối với các mô hình AI ứng dụng ngôn ngữ Việt.

Cụ thể, bộ dữ liệu bao gồm 10.880 câu hỏi trắc nghiệm xoay quanh 58 chủ đề khác nhau. Mỗi chủ đề có khoảng 200 câu hỏi và được phân bổ trên 4 lĩnh vực bao gồm: STEM, Khoa học xã hội, Khoa học nhân văn và một danh mục rộng “Mở rộng”. Với khối dữ liệu này, VMLU có sự phân tầng độ khó với 4 cấp bậc: Tiểu học, Trung học cơ sở, Trung học phổ thông và Chuyên nghiệp – cho đại học và sau đại học. Từ đó, bộ công cụ giúp đánh giá hiệu quả năng lực ngôn ngữ tiếng Việt của các mô hình AI về cả kiến thức sơ đẳng lẫn giải quyết các vấn đề phức tạp.

Bên cạnh đó, để giúp các nhóm nghiên cứu dễ dàng đánh giá năng lực các mô hình AI tiếng Việt của mình, đội ngũ kĩ sư Zalo AI thiết kế kèm theo hướng dẫn để các nhóm có thể sử dụng một cách nhanh chóng và đơn giản.

Đóng góp cho cộng đồng AI Việt Nam

Bộ tiêu chuẩn VMLU ra đời chính là một sản phẩm được nghiên cứu nhằm hướng đến mục đích đóng góp và phát triển cộng đồng nghiên cứu AI Việt Nam nói riêng cũng như cộng đồng công nghệ thông tin nói chung, không thu phí bất kỳ người dùng, nhóm nghiên cứu hay doanh nghiệp nào.

Trước đó, Zalo AI đã thực hiện, triển khai và tổ chức hàng loạt các cuộc thi, chương trình cho cộng đồng AI Việt Nam như: Zalo AI Challenge, Zalo AI Hackathon, Zalo AI Summit… Những hoạt động này không chỉ tạo sân chơi cho cộng đồng AI Việt mà còn khuyến khích việc ứng dụng AI vào cuộc sống, giải quyết các bài toán cấp thiết của xã hội, phục vụ cho nhu cầu của hàng triệu người Việt Nam.

Tiến sĩ Châu Thành Đức, Trưởng bộ phận nghiên cứu Zalo AI – Giảng viên Trường Đại học Khoa học tự nhiên, Đại học Quốc gia TP Hồ Chí Minh khẳng định: “Zalo AI luôn hướng tới sự đóng góp cho cộng đồng AI Việt Nam, tạo động lực để AI Việt Nam phát triển. Từ đó, kỳ vọng ngày càng có nhiều sản phẩm AI của người Việt, cho người Việt”.



Nguồn

Cùng chủ đề

Con người-Kỹ sư “GenZ” của Zalo AI giới thiệu nghiên cứu tại hội nghị khoa học hàng đầu thế giới

Công trình nghiên cứu giúp tăng độ chính xác của các mô hình nhận dạng tiếng nói trong thời gian thực (Streaming Automatic Speech Recognition) của Lê Duy Khánh - kỹ sư “GenZ” của Zalo AI - sẽ lần đầu được công bố tại Hội nghị khoa học quốc tế, diễn ra tại Hy Lạp vào tháng 9/2024 tới đây. Với đề tài "Improving Streaming Speech Recognition With Time-Shifted Contextual Attention And Dynamic Right Context Masking (Cải thiện nhận dạng...

Cách tạo ảnh phong cách Euro với Zalo AI ấn tượng nhất

Bạn đã biết cách tạo ra một ảnh độc đáo để chia sẻ với bạn bè thể hiện niềm đam mê bóng đá của mình chưa? Cùng tạo ảnh phong cách Euro với Zalo AI qua bài viết!

Ban cố vấn của Zalo AI Challenge quy tụ những chuyên gia hàng đầu

Trải qua 6 lần tổ chức, Zalo AI Challenge luôn nhận được sự quan tâm và góp sức từ cộng đồng chuyên môn. Các chuyên gia cố vấn của cuộc thi sẽ theo sát toàn bộ quá trình cuộc thi và đóng vai trò quan trọng trong việc định hướng chuyên môn cũng như tư vấn cho các đội thi, góp phần phát hiện những nhân tố tài năng của ngành AI Việt Nam. Ban cố vấn cuộc thi...

Cách tạo ảnh avatar cá nhân siêu đẹp bằng Zalo AI

Zalo chính thức ra mắt tính năng AI Avatar giúp người dùng có thể tự tạo ảnh bằng AI dựa trên bức ảnh thật của mình ngay trên điện thoại. Vậy cách tạo ảnh AI trên Zalo như thế nào? Dưới đây là hướng dẫn chi tiết cách tạo ảnh bằng Zalo AI, cùng theo dõi nhé.

Nổi bật

Mới nhất

Cùng tác giả

200 ngày bứt tốc hoàn thành nhà ga T3 sân bay Tân Sơn Nhất

Chiều 17/9, Tổng Công ty Cảng hàng không Việt Nam (ACV) tổ chức lễ sơ kết thi đua 120 ngày đêm hoàn thành kết cấu thép mái chính nhà ga T3 Cảng hàng không quốc tế (sân bay) Tân Sơn Nhất, đồng thời tiếp tục phát động 90 ngày đêm hoàn thành toàn bộ mái, tường kính và đóng điện công trình. Dự án xây dựng nhà ga hành khách T3 gồm 4 hạng mục chính: Nhà ga hành...

Miền Trung sắp xảy ra đợt mưa lớn diện rộng

Chiều nay (17/9), Trung tâm dự báo khí tượng thủy văn quốc gia cho biết, áp thấp nhiệt đới trên Biển Đông di chuyển nhanh, vẫn giữ khả năng mạnh lên thành bão trong tối và đêm nay.  Đáng lưu ý, hoàn lưu trước áp thấp nhiệt đới/bão có thể gây mưa rào và giông cho khu vực Trung Trung Bộ ngay ngày 18/9. Thời gian để ứng phó với áp thấp nhiệt đới/bão lần này ngắn hơn nhiều...

Nếu đưa nhà giáo ra khỏi viên chức nhà nước sẽ là một thiệt thòi rất lớn

Ngày 17/9, Hiệp hội Khoa học hành chính Việt Nam tổ chức hội thảo góp ý dự thảo Luật Nhà giáo. TS Trần Anh Tuấn, Chủ tịch Hiệp hội Khoa học hành chính Việt Nam, nguyên Thứ trưởng Bộ Nội vụ cho biết, để thực hiện 1 trong 3 đột phá chiến lược nhiệm kỳ Đại hội 13 là phát triển nguồn nhân lực (nhất là nguồn nhân lực chất lượng cao), đội ngũ thầy, cô giáo giữ vai...

Cưỡng chế hộ dân ở Quảng Bình không chịu bàn giao hơn 3.000m2 đất cho cao tốc

Ngày 17/9, UBND huyện Lệ Thủy đã tổ chức buổi cưỡng chế thu hồi 3.058,9m2 đất đối với hộ gia đình bà Nguyễn Thị Nguyệt và ông Hồ Đăng Ánh (trú tại xã Phú Thuỷ). Việc cưỡng chế thu hồi đất để bàn giao cho đơn vị thi công dự án xây dựng công trình đường bộ cao tốc Bắc - Nam phía Đông giai đoạn 2021 – 2025. Theo đó, chính quyền đã giải tỏa toàn bộ tài sản...

Miền Trung sắp xảy ra đợt mưa lớn diện rộng, Bắc và Nam Bộ vẫn mưa to cục bộ

Chiều nay (17/9), Trung tâm dự báo khí tượng thủy văn quốc gia cho biết, áp thấp nhiệt đới trên Biển Đông di chuyển nhanh, vẫn giữ khả năng mạnh lên thành bão trong tối và đêm nay.  Đáng lưu ý, hoàn lưu trước áp thấp nhiệt đới/bão có thể gây mưa rào và giông cho khu vực Trung Trung Bộ ngay ngày 18/9. Thời gian để ứng phó với áp thấp nhiệt đới/bão lần này ngắn hơn nhiều...

Bài đọc nhiều

Sẽ tắt sóng 2G từ ngày 15/10

Trong bối cảnh còn hơn 3 triệu thuê bao chưa đổi thiết bị, Bộ TT-TT đã quyết định lùi thời gian tắt sóng 2G thêm 1 tháng. Như vậy, đến ngày 15/10 tới đây sẽ chính thức tắt sóng 2G. Cụ thể, ngày 13/9 vừa qua, Bộ TT-TT đã ban hành thông tư số 10 về ngưng hiệu lực thi hành một số nội dung của thông tư 03 và 04 - liên quan đến quy hoạch các băng...

Apple bắt đầu bán các mẫu iPad Pro và iPad Air 2022 hàng tân trang

Theo đó, các mẫu tân trang của các sản phẩm được bán gồm iPad Pro 11 inch thế hệ thứ tư với chip M2, iPad Pro 12.9 inch thế hệ thứ sáu với chip M2 và iPad Air thế hệ thứ năm với chip M1. Các sản phẩm tân trang được giảm giá từ 15% đến 20% so với giá gốc và có sẵn với nhiêu dung lượng lưu trữ cũng như tùy chọn màu sắc. Apple cho biết:...

iPhone 16 Pro có tốc độ 5G nhanh hơn 26%

Theo đó, tốc độ tải xuống 5G trung bình tăng 23,7% đối với iPhone 16 Pro và 16 Pro Max trên 3 nhà mạng lớn tại Mỹ. Khách hàng của Verizon nhận được sự cải thiện đáng kể với tốc độ 26,4% theo sau là AT&T và T-Mobile. Tốc độ tải lên cũng tăng trung bình 22,1% trên cả 3 mạng. Như vậy, người dùng có thể mong đợi tốc độ tải lên đạt mức trên 30Mbps. Phone 16 bản...

OpenAI ra mắt mô hình AI đầu tiên có khả năng lập luận

Trong một bài đăng trên blog của OpenAI, công ty cho biết vừa ra mắt mô hình AI đầu tiên có khả năng lập luận. Mô hình mới Open o1 được thiết kế để dành nhiều thời gian hơn để tính toán câu trả lời trước khi trả lời các truy vẫn của người dùng. Với mô hình này, các công cụ của OpenAI sẽ có thể giải quyết các vấn đề nhiều bước, bao gồm các câu...

Cùng chuyên mục

Kính viễn vọng không gian James Webb và phát hiện mới về các thiên hà thuở sơ khai

Một nghiên cứu mới cho thấy, các lỗ đen có thể là nguyên nhân khiến cho những hiểu biết trước đây về các thiên hà sơ khai thuở vũ trụ mới hình thành là thiếu chính xác.

5 lỗ hổng bảo mật trong sản phẩm Microsoft đang bị khai thác

Mới đây, Microsoft đã phát hành danh sách bản vá tháng 9 với 79 lỗ hổng an toàn thông tin trong các sản phẩm của mình. Từ thông tin ghi nhận về các lỗ hổng bảo mật trong sản phẩm của Microsoft thì Trung tâm giám sát an toàn không gian mạng quốc gia đã chỉ ra 13 lỗ hổng bảo mật bảo mật ảnh hưởng mức cao và nghiêm trọng. Trong đó, 8 lỗ hổng cho phép các đối...

Chính thức phát động Hội thi Sáng tạo Kỹ thuật Hà Nội lần thứ 2

Hội thi Sáng tạo Kỹ thuật TP Hà Nội được tổ chức nhằm thúc đẩy phong trào lao động sáng tạo của các cấp, các ngành, các tổ chức và cá nhân trong lĩnh vực khoa học kỹ thuật, thúc đẩy việc áp dụng có hiệu quả các đề tài, giải pháp kỹ thuật vào sản xuất và đời sống, góp phần phát triển kinh tế - xã hội. Qua đó nhằm tôn vinh các tập thể, cá...

Khai trương mô hình quản trị thông minh của Học viện Chính trị quốc gia Hồ Chí Minh

Sáng 17/9, trong chuỗi các sự kiện chào mừng 75 năm truyền thống, Học viện Chính trị quốc gia Hồ Chí Minh tổ chức khai trương "Mô hình quản trị thông minh tại Học viện Chính trị quốc gia Hồ Chí Minh", khởi động tiến trình chuyển đổi số toàn diện Học viện và...

Huawei chuẩn bị ra mắt hệ điều hành mới, cạnh tranh với Android và iOS

Hãng công nghệ Trung Quốc Huawei sẽ chính thức phát hành hệ điều hành mới HarmonyOS Next vào cuối tháng 9 này và không còn hỗ trợ các ứng dụng Android.

Mới nhất

Hơn 30 doanh nghiệp được kết nối cung cầu với nhà phân phối

Chiều ngày 17/9, trong chuỗi sự kiện tại Hội chợ thương mại Festival Huế năm 2024, Trung tâm Xúc tiến đầu tư, Thương mại và Hỗ trợ doanh nghiệp tỉnh Thừa Thiên Huế đã tổ chức hội nghị kết nối cung cầu giữa tỉnh Thừa Thiên Huế với các tỉnh, thành phố năm 2024....

Các Bộ trưởng ASEAN thông qua Tuyên bố về tăng cường kết nối chuỗi cung ứng

Sáng ngày 16/9/2024, các Hội nghị trong khuôn khổ Hội nghị Bộ trưởng Kinh tế ASEAN lần thứ 56 (AEM 56) đã khai mạc tại Viêng Chăn, Lào, dưới sự chủ trì của Bộ trưởng Bộ Công Thương Lào Malaithong Kommasith cùng sự tham dự của Bộ trưởng Kinh tế các nước thành viên...

Giá cà phê tăng cao trước vụ thu hoạch do thiếu hàng?

Dự báo giá cà phê ngày 18/9/2024, tại thị trường trong nước tiếp đà giảm. Theo Tổng cục Hải quan, trong tháng 8/2024 Việt Nam xuất đi 76.214 tấn cà phê, giảm 5,5% so với cùng kỳ năm 2023. Lũy kế 8 tháng đầu năm xuất khẩu chưa tới 1,1 triệu tấn, giảm hơn...

Phát huy vai trò của hệ thống báo Đảng trong bảo vệ nền tảng tư tưởng của Đảng

Các đồng chí chủ trì hội thảo: Lê Quốc Minh, Ủy viên Trung ương Đảng, Tổng Biên tập Báo Nhân Dân, Phó Trưởng Ban Tuyên giáo Trung ương, Chủ tịch Hội nhà báo Việt Nam; Lê Văn Lợi, Phó Giám đốc Học viện Chính trị quốc gia Hồ Chí Minh; Phạm Minh Sơn, Giám đốc Học viện...

Mới nhất