Các mô hình AI vừa phát hành có công cụ “Trình đánh giá tự học”, có thể kiểm tra hoạt động của các mô hình AI khác. Đặc biệt, công cụ này hứa hẹn sẽ giảm sự tham gia của con người trong quá trình phát triển trí tuệ nhân tạo nhờ trí tuệ siêu phàm.
Việc phát hành diễn ra sau khi Meta giới thiệu ứng dụng này trong một báo cáo hồi tháng 8, trong đó nêu chi tiết cách công cụ dựa vào cùng một kỹ thuật “chuỗi suy nghĩ” được sử dụng bởi các mô hình 1 mới phát hành của OpenAI để đưa ra phán đoán đáng tin cậy về phản hồi của các mô hình.
Kỹ thuật đó bao gồm việc chia các vấn đề phức tạp thành các bước logic nhỏ hơn, cải thiện độ chính xác của các phản hồi đối những các vấn đề khó trong các môn học như khoa học, mã hóa và toán học.
Các nhà nghiên cứu của Meta đã sử dụng hoàn toàn dữ liệu do AI tạo ra để đào tạo mô hình đánh giá, đồng thời loại bỏ yếu tố đầu vào của con người ở giai đoạn đó.
2 nhà nghiên cứu của Meta đứng sau dự án này cho biết với Reuters, khả năng sử dụng AI để đánh giá AI một cách đáng tin cậy mở ra một con đường khả thi hướng tới việc xây dựng các tác nhân AI tự chủ có thể học hỏi từ chính những sai lầm của mình.
Nhiều người trong lĩnh vực AI hình dung những tác nhân như vậy là trợ lý kỹ thuật số đủ thông minh để thực hiện một loạt các nhiệm vụ mà không cần sự can thiệp của con người.
Meta đang đối mặt với một số vụ kiện của các tiểu bang Hoa Kỳ cáo buộc công ty này gây ra các vấn đề về sức khỏe tâm thần ở thanh thiếu niên bằng cách khiến nền tảng Facebook và Instagram trở nên gây nghiện.
Thẩm phán Tòa án Quận Hoa Kỳ tại Oakland, Yvonne Gonzalez Rogers đã bác bỏ yêu cầu của Meta nhằm loại bỏ các khiếu nại do các tiểu bang đưa ra trong hai vụ kiện riêng biệt được đệ trình vào năm ngoái, một vụ liên quan đến hơn 30 tiểu bang bao gồm California và New York và vụ còn lại do Florida đệ trình.
Các mô hình tự cải thiện có thể cắt giảm nhu cầu về một quy trình thường tốn kém và thiếu hiệu quả được sử dụng ngày nay có tên là Học tăng cường từ phản hồi của con người, quy trình này đòi hỏi đầu vào từ các anotator của con người phải có chuyên môn chuyên sâu để dán dữ liệu chính xác và xác minh đáp án cho các câu hỏi toán học và viết phức tạp.
“Chúng tôi hy vọng, khi AI trở nên siêu phàm hơn, nó sẽ ngày càng giỏi hơn trong việc kiểm tra công việc của mình, để nó thực sự tốt hơn người bình thường. Ý tưởng về việc tự học và có khả năng tự đánh giá về cơ bản là rất quan trọng đối với ý tưởng đạt được cấp độ siêu phàm của AI”, Jason Weston, một trong những nhà nghiên cứu cho biết.
Các công ty khác bao gồm Google và Anthropic cũng đã công bố nghiên cứu về khái niệm RLAIF, hoặc Học tăng cường từ phản hồi của AI. Tuy nhiên, không giống như Meta, những công ty đó thường không phát hành các mô hình để sử dụng công cộng.
Các công cụ AI khác do Meta phát hành vào thứ Sáu bao gồm bản cập nhật cho mô hình Segment Anything – Phân đoạn bất kỳ nhận dạng hình ảnh của công ty, một công cụ giúp tăng tốc thời gian tạo phản hồi LLM và bộ dữ liệu có thể được sử dụng để hỗ trợ khám phá các vật liệu vô cơ mới.
Nguồn: https://www.baogiaothong.vn/cong-ty-me-facebook-ra-mat-mo-hinh-ai-giam-sat-mo-hinh-ai-khac-192241019113020535.htm