DNVN – Ngày 18/11, tờ The Information đưa tin rằng chip AI Blackwell của Nvidia đang gặp sự cố quá nhiệt trên máy chủ, làm dấy lên lo ngại từ một số khách hàng về việc thiếu thời gian để vận hành các trung tâm dữ liệu mới.
Siêu máy tính của Tập đoàn Nvidia. Ảnh minh họa:
REUTERS/TTXVN
Theo nguồn tin nội bộ, GPU Blackwell đã xảy ra hiện tượng
tăng nhiệt quá mức khi hoạt động trong tủ máy chủ có khả năng chứa tới 72
chip.
Nvidia đã yêu cầu các nhà cung cấp thay đổi cấu trúc tủ máy
chủ nhiều lần để khắc phục vấn đề nhiệt độ, dựa trên phản hồi từ các kỹ sư của
Nvidia và những khách hàng hiểu rõ về vấn đề này cung cấp cho The
Information.
Phát ngôn viên của Nvidia trong một thông báo đã khẳng định
rằng công ty đang hợp tác chặt chẽ với các nhà cung cấp dịch vụ đám mây lớn và
đội ngũ kỹ thuật nhằm giải quyết sự cố. Nvidia cho rằng các điều chỉnh kỹ thuật
này là điều bình thường và nằm trong kế hoạch dự trù.
Vào tháng Ba, Nvidia đã giới thiệu dòng chip Blackwell, dự
kiến sẽ ra mắt vào quý II/2024. Tuy nhiên, kế hoạch này đã bị trì hoãn, gây ảnh
hưởng đến những khách hàng lớn như Meta Platforms (Facebook), Google thuộc
Alphabet và Microsoft.
Chip Blackwell được định hướng trở thành sản phẩm tiên phong
trong xử lý đồ họa và trí tuệ nhân tạo. Với thiết kế gồm hai ô silicon liên kết,
dòng chip này được Nvidia tuyên bố có thể nâng cao hiệu suất xử lý lên đến 30 lần
so với thế hệ cũ, đặc biệt trong các ứng dụng như chatbot. Sản phẩm được kỳ vọng
sẽ đóng vai trò quan trọng trong các trung tâm dữ liệu lớn và các ứng dụng AI
đòi hỏi sức mạnh tính toán cao.
Thanh Mai (t/h)
Nguồn: https://doanhnghiepvn.vn/cong-nghe/chip-ai-blackwell-cua-nvidia-gap-van-de-qua-nhiet-tren-may-chu/20241119090620652