Theo TechSpot, OpenAI đang gặp nhiều thách thức khi phát triển ChatGPT-5, mô hình ngôn ngữ lớn thế hệ mới. ChatGPT-5 với tên mã là “Project Orion”, đã trải qua 18 tháng phát triển nhưng chưa đạt được tiến triển đáng kể.
Mặc dù OpenAI đã hoàn thành ít nhất hai giai đoạn huấn luyện ban đầu, những kết quả đạt được không khả quan như mong đợi. Một trong những nguyên nhân chính là dữ liệu huấn luyện không đủ đa dạng và chất lượng chưa cao. Việc sử dụng dữ liệu từ internet công cộng đã đạt giới hạn, khiến công ty phải tìm kiếm giải pháp thay thế như tạo dữ liệu tổng hợp hoặc thuê người sản xuất dữ liệu thủ công.
Việc tạo dữ liệu từ con người tuy mang lại chất lượng tốt hơn nhưng gặp phải những trở ngại về thời gian và chi phí. Chẳng hạn, để tạo ra một tỉ token (đơn vị văn bản được mô hình AI xử lý) dữ liệu, cần khoảng 1.000 người viết 5.000 từ mỗi ngày trong nhiều tháng. Trong khi đó, phương pháp dùng dữ liệu tổng hợp – do các mô hình AI hiện tại tạo ra – lại tiềm ẩn rủi ro về chất lượng, làm tăng nguy cơ xuất hiện vòng lặp dữ liệu kém hiệu quả.
Ngoài vấn đề dữ liệu, quá trình huấn luyện ChatGPT-5 còn gặp trở ngại về mặt kỹ thuật. Giai đoạn chạy thử nghiệm ban đầu diễn ra chậm hơn dự kiến, dẫn đến việc huấn luyện trên quy mô lớn sẽ mất nhiều thời gian và đẩy chi phí tăng cao. Điều này làm dấy lên câu hỏi về tính khả thi của việc phát triển một mô hình vượt trội so với GPT-4, vốn đã tiêu tốn hàng tỉ USD để hoàn thiện.
Thêm vào đó, tình trạng bất ổn nội bộ tại OpenAI cũng ảnh hưởng không nhỏ đến tiến độ của dự án. Cuối năm 2023, CEO Sam Altman từng bị tạm thời cách chức, dẫn đến sự ra đi của hơn 20 nhân sự chủ chốt trong năm nay. Altman đã thừa nhận rằng việc phát hành phiên bản GPT-4o trước đó là nguyên nhân chính khiến ChatGPT-5 bị trì hoãn.
Sự chậm trễ và chi phí tăng cao khiến OpenAI phải chịu áp lực lớn từ các nhà đầu tư, đặc biệt là Microsoft – đối tác lớn nhất của công ty. Với hàng tỉ USD đã đổ vào lĩnh vực AI, OpenAI buộc phải chứng minh ChatGPT-5 có những cải tiến vượt bậc so với phiên bản tiền nhiệm. Tuy nhiên, khi nguồn dữ liệu huấn luyện ngày càng khan hiếm, mục tiêu này trở nên khó khăn.
Hiện tại, tương lai của ChatGPT-5 vẫn chưa rõ ràng. OpenAI sẽ cần giải quyết các thách thức hiện tại và tìm cách tối ưu hóa nguồn lực để duy trì vị thế trong cuộc đua công nghệ trí tuệ nhân tạo.
Nguồn: https://thanhnien.vn/openai-doi-mat-kho-khan-lon-khi-phat-trien-chatgpt-5-1852412232345532.htm