Giới chuyên gia nhận định rằng chính Mỹ đã tạo động lực giúp Trung Quốc thành công trong việc phát triển trí tuệ nhân tạo (AI) với chi phí thấp. Điều này xảy ra khi Washington hạn chế Bắc Kinh tiếp cận các dòng chip tiên tiến nhưng đắt đỏ.
Trong bối cảnh các tập đoàn công nghệ Mỹ tuyên bố chi hàng trăm tỉ USD để phát triển mô hình AI tiên tiến nhất, start-up DeepSeek của Trung Quốc lại chứng minh điều ngược lại: chỉ cần vài triệu USD.
Cái khó ló cái khôn
"Khi ChatGPT ra mắt vào tháng 11-2022, Mỹ vẫn dẫn đầu về AI tạo sinh. Tuy nhiên trong vòng hai năm qua, khoảng cách này đã dần bị xóa nhòa" - giáo sư Andrew Ng, một trong 100 nhân vật có ảnh hưởng nhất đến AI toàn cầu năm 2023, chia sẻ với báo South China Morning Post (SCMP).
Ông đưa ra nhận định này trong bối cảnh DeepSeek, một start-up AI Trung Quốc, gây bất ngờ khi ra mắt mô hình AI miễn phí sánh ngang với ChatGPT vào tháng 1-2025.
Theo ông Ng, với sự xuất hiện của các mô hình như Qwen, Kimi, InternVL và DeepSeek, Trung Quốc không chỉ thu hẹp khoảng cách mà còn dần dẫn đầu trong một số lĩnh vực AI. Báo China Daily nhấn mạnh rằng DeepSeek tận dụng mã nguồn mở để phát triển công cụ AI, cho phép hợp tác và thử nghiệm rộng rãi, thúc đẩy đột phá nhanh hơn trong ngành công nghiệp này.
So sánh với các tập đoàn công nghệ AI của Mỹ, DeepSeek có chi phí phát triển công khai chưa đến 6 triệu USD. Điều này thách thức lập luận rằng cần hàng tỉ USD để đào tạo AI như các công ty Mỹ vẫn tuyên bố.
Dù bị hạn chế tiếp cận chip tiên tiến do lệnh cấm của Washington, DeepSeek chứng minh rằng ngành AI không nhất thiết phải phụ thuộc vào các ông lớn như Nvidia. Chatbot của Trung Quốc chỉ cần khoảng 2.000 chip không quá phức tạp để phát triển, trong khi mô hình AI Llama 3.1 mới nhất của Meta đòi hỏi đến 16.000 chip H100 tiên tiến của Nvidia.
Ngay sau khi phát hành, chatbot của DeepSeek nhanh chóng vươn lên dẫn đầu bảng xếp hạng App Store của Apple, vượt qua ChatGPT. Đến ngày 20-1, DeepSeek ra mắt mô hình mã nguồn mở R1, được đánh giá có tính năng tương đương với mô hình mã nguồn đóng ChatGPT. Điều đáng chú ý, CEO Sam Altman của OpenAI cũng khen ngợi cách tiếp cận của DeepSeek.
Không cần quá nhiều tiền để phát triển AI?
Ngày 3-2, báo Independent đưa tin một nhóm nghiên cứu Mỹ đã tái tạo chatbot AI của DeepSeek chỉ với vài chục USD, củng cố xu hướng phát triển AI chi phí thấp. Nhóm nghiên cứu tại Đại học California, Berkeley, tuyên bố đã sao chép mô hình R1 của DeepSeek với chi phí chưa đến 30 USD.
"Chúng tôi đã tái tạo DeepSeek R1-Zero trong trò chơi CountDown và nó hoạt động tốt", nghiên cứu sinh tiến sĩ Jiayi Pan chia sẻ trên nền tảng X. Ông Pan kỳ vọng dự án này sẽ giúp AI trở nên dễ tiếp cận hơn.
Thành công của DeepSeek và dự án của nhóm ông Pan cho thấy chi phí đào tạo AI có thể thấp hơn nhiều so với con số hàng trăm tỉ USD mà các tập đoàn công nghệ Mỹ tuyên bố.
Giới chuyên gia công nghệ nhận định rằng DeepSeek có thể tác động mạnh mẽ đến cách thức xây dựng và sử dụng AI trong tương lai. Nhà khoa học AI của Meta Platforms, Yann LeCun, cho rằng không nên hiểu rằng "Trung Quốc đang vượt qua Mỹ về AI" nhờ DeepSeek. Theo ông, cách diễn đạt đúng phải là: "Các mô hình nguồn mở đang vượt qua các mô hình độc quyền" - theo bài viết trên SCMP.
DeepSeek thay đổi cách tiếp cận, không phải "kẻ thay đổi cuộc chơi"
Ông Đặng Hữu Sơn - phó viện trưởng Viện Nghiên cứu ứng dụng công nghệ và phát triển nguồn nhân lực, đồng sáng lập kiêm CEO LovinBot AI - nhận định: DeepSeek khó có thể trở thành "kẻ thay đổi cuộc chơi" trong lĩnh vực AI về lâu dài.
Theo ông Sơn, DeepSeek đã hoàn thành xuất sắc nhiệm vụ quan trọng nhất: làm thay đổi cách tiếp cận của giới đầu tư và doanh nghiệp về xu hướng "bình dân hóa" công nghệ AI - hướng đến chi phí thấp, dễ tiếp cận. Tuy nhiên về dài hạn, họ sẽ đối mặt với thách thức lớn về chi phí đầu tư và cạnh tranh khốc liệt để duy trì chất lượng mô hình.
Việc ra mắt DeepSeek - mô hình AI giá rẻ, hiệu quả sử dụng tài nguyên thấp và mã nguồn mở - đã gây chú ý, buộc các "ông lớn" AI Mỹ phải nhìn nhận lại chiến lược của mình. Trường hợp này tương tự như Temu, chọn chiến lược giá rẻ để cạnh tranh.
Tuy vậy các chuyên gia đánh giá DeepSeek không thực sự vượt trội về hiệu suất so với các mô hình cao cấp khác và có những hạn chế trong xử lý tác vụ phức tạp.
Một điểm đặc biệt của DeepSeek là cho phép người dùng thấy "quá trình suy nghĩ" khi suy luận. Tuy nhiên điều này lại mở ra lỗ hổng bảo mật nghiêm trọng. Các chuyên gia đã chỉ ra rằng DeepSeek dễ bị tấn công bằng nhiều chiến thuật, từ thao túng ngôn ngữ đơn giản đến các "prompt" phức tạp do chính AI tạo ra.
Hơn nữa, việc tối ưu chi phí khiến DeepSeek phải cắt giảm một số cơ chế bảo vệ. Điều này làm hệ thống dễ bị khai thác bởi các chiến thuật tinh vi, dẫn đến nguy cơ trả về thông tin không mong muốn hoặc bị thao túng hành vi.
Tại Việt Nam, bài học từ DeepSeek mở ra cơ hội phát triển AI giá hợp lý nhưng vẫn cần đảm bảo an toàn. LovinBot AI hiện đang nghiên cứu nhưng chưa tích hợp DeepSeek, dù chi phí thấp và mã nguồn mở, bởi yêu cầu quan trọng nhất vẫn là bảo mật thông tin và tránh nguy cơ thao túng nội dung.
Nguồn: https://tuoitre.vn/trung-quoc-pha-gia-ai-20250205001728107.htm
Bình luận (0)