(CLO) Meta, công ty mẹ của Facebook, thông báo hôm thứ Sáu rằng họ đang ra mắt một loạt mô hình AI mới, bao gồm một “Bộ Đánh Giá Tự Học” có khả năng giảm bớt sự can thiệp của con người trong quá trình phát triển AI.
Thông báo này được đưa ra sau khi Meta giới thiệu công cụ này trong một bài nghiên cứu vào tháng 8, trong đó mô tả cách công cụ này sử dụng kỹ thuật “chuỗi tư duy” tương tự như các mô hình mới của OpenAI để đưa ra những đánh giá chính xác về phản hồi của mô hình AI. Kỹ thuật này chia nhỏ các vấn đề phức tạp thành các bước logic đơn giản hơn, giúp cải thiện độ chính xác trong các lĩnh vực như khoa học, lập trình và toán học.
Các nhà nghiên cứu của Meta đã sử dụng hoàn toàn dữ liệu do AI tạo ra để huấn luyện mô hình đánh giá này, loại bỏ hoàn toàn sự can thiệp của con người trong giai đoạn đó.
Khả năng sử dụng AI để đánh giá chính AI cho thấy tiềm năng phát triển các tác nhân AI tự động, có khả năng học hỏi từ những sai lầm của chính mình, theo hai nhà nghiên cứu của Meta chia sẻ.
Nhiều chuyên gia trong lĩnh vực AI hình dung về các tác nhân số thông minh này như những trợ lý kỹ thuật số có khả năng thực hiện một loạt các nhiệm vụ mà không cần sự can thiệp của con người.
Các mô hình có khả năng tự cải thiện có thể loại bỏ nhu cầu về quy trình ‘Học Tăng Cường Từ Phản Hồi Của Con Người’, vốn yêu cầu các chuyên gia có chuyên môn cao để gán nhãn dữ liệu và xác minh tính chính xác của các câu trả lời về toán học và viết lách phức tạp. Quy trình này hiện tại thường rất tốn kém và không hiệu quả.
Jason Weston, một trong các nhà nghiên cứu của dự án, cho biết: “Chúng tôi hy vọng rằng khi AI trở nên ngày càng siêu việt hơn con người, nó sẽ tự kiểm tra công việc của mình tốt hơn, thậm chí vượt qua trình độ của con người”.
Ông cũng nói thêm rằng: “Khả năng tự học và tự đánh giá là yếu tố then chốt để phát triển AI đạt đến mức độ siêu nhân”.
Ngoài Meta, các công ty khác như Google và Anthropic cũng đã công bố nghiên cứu về khái niệm RLAIF, hay “Học Tăng Cường Từ Phản Hồi Của AI”. Tuy nhiên, không giống như Meta, các công ty này ít khi công bố các mô hình của mình để công chúng sử dụng.
Cao Phong (theo Reuters)
Nguồn: https://www.congluan.vn/meta-phat-hanh-mo-hinh-ai-co-the-tu-hoc-va-tu-phat-trien-post317675.html