Chi phí phát triển DeepSeek bị 'tâng bốc'

Trong báo cáo của mình, DeepSeek cho biết tổng chi phí đào tạo lên tới 5,576 triệu USD, chủ yếu do giá thuê các đơn vị xử lý đồ họa của Nvidia. Công ty cũng cảnh báo con số này chỉ phản ánh "đào tạo chính thức" và không bao gồm các chi phí liên quan đến nghiên cứu trước đó hay các thí nghiệm về kiến trúc, thuật toán và dữ liệu. Điều này ngay lập tức thu hút giới đầu tư và khiến cổ phiếu các công ty công nghệ toàn cầu "bốc hơi" 1.000 tỉ USD chỉ trong ngày 27.1.

Chi phí phát triển DeepSeek bị 'tâng bốc'- Ảnh 1. — Chi phí hoạt động của DeepSeek cao hơn nhiều so với tuyên bố?

Giờ đây, báo cáo từ công ty nghiên cứu và tư vấn về chất bán dẫn SemiAnalysis lại mang đến một cái nhìn khác về chi phí phát triển DeepSeek. Công ty này ước tính chi tiêu cho phần cứng của DeepSeek cao hơn nhiều so với tuyên bố, đồng thời nhấn mạnh chi phí nghiên cứu và phát triển (R&D) cũng như tổng chi phí sở hữu là rất đáng kể.

SemiAnalysis cho biết việc tạo ra "dữ liệu tổng hợp" cho mô hình đào tạo sẽ yêu cầu "lượng tính toán đáng kể". Hơn nữa, các công ty cũng cần phải thử nghiệm, phát triển kiến trúc mới, thu thập và làm sạch dữ liệu, cũng như trả lương cho nhân viên.

DeepSeek cần đến 50.000 GPU thay vì chỉ hơn 2.000 GPU?

Theo tính toán, các chuyên gia cho biết DeepSeek vận hành một hệ thống điện toán quy mô lớn gồm khoảng 50.000 GPU Hopper, với 10.000 GPU H800 và 10.000 GPU H100 mạnh hơn, cùng với các GPU H20 bổ sung. Con số này trái ngược với tuyên bố chỉ sử dụng 2.048 GPU Nvidia mà DeepSeek đưa ra trước đó. Tổng chi phí vốn cho máy chủ ước tính khoảng 1,6 tỉ USD, trong khi chi phí hoạt động lên tới 944 triệu USD.

Chi phí phát triển DeepSeek bị 'tâng bốc'- Ảnh 2. — SemiAnalysis tin rằng 50.000 GPU của Nvidia đã được DeepSeek sử dụng

DeepSeek được thành lập vào năm 2023 bởi Lương Văn Phong, đồng sáng lập của High-Flyer, một quỹ đầu cơ tập trung vào AI tại Trung Quốc. Công ty khởi nghiệp này đã phát triển từ đơn vị nghiên cứu AI của quỹ vào tháng 4.2023, với mục tiêu phát triển các mô hình ngôn ngữ lớn và đạt được trí tuệ nhân tạo tổng quát (AGI).

Sự quan tâm đối với DeepSeek gia tăng khi công ty phát hành R1, một mô hình lý luận cạnh tranh với o1 của OpenAI, nhưng được cung cấp dưới dạng mã nguồn mở, điều này cho phép bất kỳ nhà phát triển AI nào cũng có thể sử dụng. Tuy nhiên, giống như nhiều chatbot Trung Quốc khác, DeepSeek cũng có những hạn chế về một số chủ đề nhất định.

CEO Sam Altman của OpenAI đã ca ngợi mô hình của DeepSeek khi nhấn mạnh DeepSeek "rõ ràng là một mô hình tuyệt vời". Tuy nhiên, ông cũng cho biết có bằng chứng cho thấy DeepSeek đã thu thập dữ liệu của OpenAI để hoạt động theo phương pháp "chưng cất".

Nguồn: https://thanhnien.vn/chi-phi-phat-trien-deepseek-bi-tang-boc-185250203151508438.htm