엔비디아의 새로운 '트럼프 카드'가 공개됐다

엔비디아는 연례 GTC 컨퍼런스에서 인공지능(AI) 칩 시장을 장악하기 위한 경쟁에서 자사의 최신 제품 라인인 블랙웰 울트라(Blackwell Ultra)와 베라 루빈(Vera Rubin) 두 가지를 발표했습니다.

CEO 젠슨 황에 따르면, 블랙웰 울트라는 2025년 하반기에 출시될 예정입니다. 한편, 차세대 GPU 아키텍처인 베라 루빈은 2026년에 출시되고, 루빈 울트라는 2027년에 출시될 예정입니다.

이러한 발표는 엔비디아의 우수한 기술력을 보여줄 뿐만 아니라, 회사의 제품 출시 전략이 2년에서 1년 주기로 바뀌는 것을 의미합니다.

Blackwell Ultra: Blackwell 플랫폼에서의 큰 진전

2024년에는 블랙웰 AI 칩이 주목을 받았습니다. 이 칩 대기업에 따르면, GB200과 같은 블랙웰 아키텍처 기반 프로세서는 AI를 적용하는 기업에 엄청난 성능 업그레이드를 가져다준다고 합니다.

그러나 복잡한 설계의 대량 생산과 관련된 지연으로 인해 블랙웰이 대량으로 출하되기 시작한 것은 얼마 전의 일입니다.

업계에는 해당 플랫폼의 설계 결함에 대한 소문이 떠돌았습니다. 2024년 3분기의 초기 납품 기간은 2025년으로 연기되었습니다. 재무 보고서가 발표된 후 회의에서 NVIDIA 투자자의 절반이 Blackwell의 문제에 대해 의문을 제기했습니다.

젠슨 황은 행사 연설에서 "보상"의 일환으로 이 칩 제품군의 업그레이드 버전인 블랙웰 울트라를 소개했습니다.

엔비디아의 새로운 GPU 로드맵. 사진: 엔비디아.

특히, Blackwell Ultra는 Blackwell 아키텍처의 업그레이드 버전으로, 점점 복잡해지는 AI 작업을 위해 성능과 메모리를 최적화하는 데 중점을 두고 있습니다.

Blackwell Ultra는 완전히 새로운 아키텍처는 아니지만 여전히 이전 세대에 비해 상당한 개선을 제공합니다. 특히, AI 분야에서 Nvidia의 성공을 위한 기반을 마련한 칩 라인인 H100(2022년 출시)에 비해 개선이 두드러집니다.

이에 따라 단일 Blackwell Ultra 칩은 Blackwell과 동등한 20페타플롭스의 AI 성능을 발휘하지만, 최대 288GB의 HBM3e 메모리를 탑재할 수 있습니다. 이 업그레이드는 블랙웰의 192GB 저장 용량보다 상당히 증가했습니다. 이는 데이터에 빠르게 액세스해야 하는 대규모 AI 모델에 특히 중요합니다.

H100과 비교했을 때 Blackwell Ultra는 1.5배의 FP4 추론 성능을 제공하고 "AI 추론"을 상당히 가속화합니다.

Blackwell Ultra를 사용하는 NVL72 클러스터는 대용량 DeepSeek-R1 671B 언어 모델을 실행하고 단 10초 만에 답변을 반환할 수 있는데, 이는 H100의 1.5분보다 훨씬 빠른 속도입니다. 특히, 이 새로운 칩은 초당 최대 1,000개의 토큰을 처리할 수 있으며, 이는 H100보다 10배 더 높습니다.

엔비디아에 따르면, 주요 고객들은 호퍼보다 3배 더 많은 블랙웰 칩을 구매했으며, 이는 아키텍처에 대한 강한 자신감과 수요를 보여줍니다.

2026년 차세대 GPU 아키텍처

블랙웰 울트라에 이어 이 칩 대기업은 2026년 하반기에 출시될 예정인 Vera Rubin이라는 차세대 GPU 아키텍처를 공개했습니다. 이 시스템은 두 가지 주요 구성 요소로 구성됩니다. Vera CPU(Olympus 아키텍처를 기반으로 한 Nvidia의 첫 번째 맞춤형 CPU 디자인)와 Rubin GPU입니다.

The Verge 에 따르면, Vera CPU는 2024년 Grace Blackwell 칩에 사용된 CPU보다 두 배 더 빠르게 설계되었습니다.

DGX Station 데스크톱 마더보드에는 Nvidia의 Blackwell Ultra GPU가 통합되어 있습니다. 사진: 엔비디아.

루빈 GPU는 추론 수행 시 50페타플롭스의 성능을 제공할 것을 약속하며, 이는 현재 블랙웰 칩의 20페타플롭스보다 두 배 이상 높습니다. Rubin은 또한 AI 개발자에게 중요한 사양인 최대 288GB의 빠른 메모리를 지원합니다.

또한, 주목할 만한 변화는 엔비디아가 루빈을 통해 GPU의 개념을 새롭게 정의한다는 것입니다. 여러 구성 요소로 조립된 단일 칩을 GPU로 간주하는 대신, Nvidia는 구성 요소를 결합하면 각 구성 요소를 별도의 GPU라고 부릅니다. 즉, Rubin 칩은 하나의 칩에 최대 두 개의 GPU를 탑재할 수 있다는 의미입니다.

마지막으로, 세계 최대의 GPU 제조업체는 2027년 하반기에 Rubin Ultra(Rubin Next라고도 함)를 출시할 계획입니다. Rubin Ultra는 단일 칩에 두 개의 Rubin GPU가 연결되어 최대 100페타플롭스의 FP4 성능을 제공하므로 성능 면에서 엄청난 도약을 이룰 것입니다.

비교해보면, 이 성능은 Rubin GPU의 두 배입니다. 또한 루빈 울트라의 메모리도 1TB로 대폭 업그레이드됐습니다.

프레젠테이션을 마치며, 엔비디아는 2028년 출시 예정인 베라 루빈 이후의 칩 아키텍처가 유명한 이론 물리학자 리처드 파인만의 이름을 따서 파인만이라고 명명될 것이라고 말하며 장기 개발 로드맵을 공개했습니다.

2026년과 2027년에 출시될 예정인 Vera Rubin이라는 차세대 GPU 아키텍처를 사용한 듀오의 성능. 사진: Nvidia.

이러한 새로운 발표는 엔비디아가 AI 붐으로 큰 혜택을 얻고 있는 상황에서 나왔습니다. ChatGPT가 출시된 이후, 엔비디아가 AI 개발 분야에서 GPU를 주도하면서 회사 매출이 6배나 증가했습니다.

AI 컴퓨팅 성능에 대한 수요는 빠른 속도로 증가하고 있으며, CEO 젠슨 황은 이러한 수요를 충족시키기 위해서는 2024년까지 예상보다 100배 더 많은 컴퓨팅 성능이 필요할 것이라고 생각합니다.

GTC 2025에서 주목할 점 중 하나는 엔비디아가 중국의 DeepSeek를 포함한 선도적인 AI 기업과 긴밀히 협력하고 있다는 것입니다. DeepSeek의 R1 모델을 사용하여 새로운 칩을 벤치마킹한 결과, 이 반도체 대기업은 복잡한 추론 작업에서의 성능에 집중하고 있음을 알 수 있습니다.

출처: https://znews.vn/at-chu-bai-moi-cua-nvidia-da-lo-dien-post1539279.html