본문 바로가기

엔비디아-마이크로소프트-AMD-인텔

엔비디아, 'AI 추론 시대'를 위한 블랙웰 울트라 AI 칩 공개(2025.03.19)

2025.03.19

 

블랙웰 울트라 칩-->.HBB3E 12단x 12개=36GBx12개=432GB

GB300 슈퍼칩-->2개의 블랙웰 울트라 칩+1개의 그레이스 CPU

GB300 NVL72 rack server--> 이 서버는 72개의 GB300 슈퍼칩을 결합한 것.

 

DGX SuperPod--> DGX 슈퍼팟은 여러 개의 NVL72 서버를 하나의 AI 슈퍼컴퓨터로 통합한 시스템이다.

                                288개의 그레이스(Grace) CPU, 576개의 블랙웰 울트라(Blackwell Ultra) GPU,

                               그리고 300TB의 엄청난 메모리가 포함될 예정이다.

 

 

---------------------------------------------------------------

Nvidia unveils Blackwell Ultra AI chip for 'age of AI reasoning'

 

Nvidia unveils Blackwell Ultra AI chip for 'age of AI reasoning'

엔비디아, 'AI 추론 시대'를 위한 블랙웰 울트라 AI 칩 공개

 

Nvidia (NVDA) CEO Jensen Huang announced the company's next-generation Blackwell Ultra AI chip during its annual GTC event in San Jose, Calif., on Tuesday.

 

엔비디아(NVDA)의 CEO 젠슨 황은 화요일 캘리포니아주 산호세에서 열린 연례 GTC 행사에서 차세대 블랙웰 울트라(Blackwell Ultra) AI 칩을 발표했다.

 

In addition to the Blackwell Ultra chip, Nvidia also announced its GB300 superchip, which combines two Blackwell Ultras with the company's Grace central processing unit (CPU).

 

엔비디아는 블랙웰 울트라 칩과 함께 GB300 슈퍼칩도 공개했다. 이 슈퍼칩은 두 개의 블랙웰 울트라 칩과

엔비디아의 그레이스(Grace) 중앙처리장치(CPU)를 결합한 것이다.

 

The chips are designed to power AI systems for customers ranging from hyperscalers like Amazon (AMZN), Google (GOOGGOOGL), Microsoft (MSFT), and Meta (META) to research labs around the world.

 

이 칩들은 아마존(AMZN), 구글(GOOG, GOOGL), 마이크로소프트(MSFT), 메타(META)와 같은 하이퍼스케일 기업부터 전 세계 연구소까지 다양한 고객의 AI 시스템을 지원하도록 설계되었다.

 

 

 

 

According to Nvidia, the Blackwell Ultra offers 1.5 times the performance of Blackwell and represents a 50x increase in data center revenue opportunity versus its Hopper chip, thanks to its improved AI capabilities.

 

엔비디아에 따르면, 블랙웰 울트라(Blackwell Ultra)는 기존 블랙웰(Blackwell) 칩보다 1.5배 높은 성능을 제공하며, 향상된 AI 기능 덕분에 데이터 센터 수익 기회를 기존 호퍼(Hopper) 칩 대비 50배 증가시킬 것으로 예상된다.

 

Nvidia says the Blackwell Ultra is designed for the "age of AI reasoning," a type of AI processing that mimics how humans think and reach conclusions. It broke into the mainstream when DeepSeek debuted its R1 AI model. OpenAI's o1 and Google's Gemini 2.0 Flash Thinking are also reasoning models.

 

엔비디아는 블랙웰 울트라가 "AI 추론(AI reasoning) 시대"를 위해 설계되었다고 밝혔다.

AI 추론은 인간이 사고하고 결론을 도출하는 방식을 모방하는 AI 처리 방식이다.

 

이 개념은 딥시크(DeepSeek)가 R1 AI 모델을 공개하면서 본격적으로 주목받기 시작했다.

또한, 오픈AI(OpenAI)의 o1 모델과 구글(Google)의 Gemini 2.0 Flash Thinking도 AI 추론 모델에 해당한다.

 

DeepSeek initially sent a shock through Wall Street when it said that it developed its AI models at a fraction of the cost that Silicon Valley heavyweights spend while using below-top-of-the-line chips. But Nvidia has fought back against that assertion, saying that reasoning models benefit from using powerful GPUs, which allow them to provide better responses to user queries faster.

 

딥시크(DeepSeek)는 실리콘밸리의 거대 기술 기업들이 사용하는 최상급 칩이 아닌 저사양 칩을 활용하면서도 AI 모델을 훨씬 낮은 비용으로 개발했다고 발표해 월가에 충격을 안겼다.

그러나 엔비디아는 이에 반박하며, 추론(AI reasoning) 모델은 강력한 GPU를 사용할 때 더욱 빠르고 정확한 응답을 제공할 수 있다고 주장했다.

 

Like Blackwell, the Blackwell Ultra will slot into Nvidia's massive NVL72 rack server that combines 72 GB300 superchips, which the company says provides improved efficiency and serviceability.

 

블랙웰(Blackwell)과 마찬가지로 블랙웰 울트라(Blackwell Ultra) 역시 엔비디아의 대형 NVL72 랙 서버에 탑재된다. 이 서버는 72개의 GB300 슈퍼칩을 결합한 것으로, 엔비디아는 이를 통해 효율성과 유지보수성이 향상되었다고 설명했다.

 

According to the company, the GB300 NVL72 can handle 1,000 tokens per second when using DeepSeek’s R1 AI model. That's up from 100 tokens per second when using Nvidia's Hopper chip. That means the GB300 NVL72 can answer users' questions in about 10 seconds, versus the 1.5 minutes it took Hopper. In other words, Blackwell Ultra is a major step up from older Hopper systems.

 

엔비디아에 따르면, GB300 NVL72는 딥시크(DeepSeek)의 R1 AI 모델을 사용할 때 초당 1,000개의 토큰을 처리할 수 있다. 이는 기존 호퍼(Hopper) 칩을 사용할 때의 초당 100개 토큰보다 10배 향상된 성능이다.

 

즉, GB300 NVL72는 사용자 질문에 약 10초 만에 응답할 수 있으며, 기존 호퍼 칩이 1분 30초(90초) 걸렸던 것과 비교하면 압도적인 성능 향상을 보여준다. 다시 말해, 블랙웰 울트라는 기존 호퍼 시스템보다 크게 발전한 AI 칩이다.

 

On top of that, Nvidia says it will also offer the GB300 in its DGX SuperPod, the company's AI supercomputer that combines a series of NLV72 servers into a single AI powerhouse. The SuperPods will include a staggering 288 Grace CPUs with 576 Blackwell Ultra GPUs and an incredible 300TB of memory.

 

또한, 엔비디아는 **GB300을 DGX 슈퍼팟(DGX SuperPod)**에서도 제공할 계획이라고 밝혔다. DGX 슈퍼팟은 여러 개의 NVL72 서버를 하나의 AI 슈퍼컴퓨터로 통합한 시스템이다.

 

이 슈퍼팟에는 288개의 그레이스(Grace) CPU, 576개의 블랙웰 울트라(Blackwell Ultra) GPU, 그리고 300TB의 엄청난 메모리가 포함될 예정이다.


Nvidia's Blackwell chip is now in full production and, according to the company, has been its fastest ramp-up in history. In its most recent quarter, Nvidia said Blackwell contributed $11 billion to its $39.3 billion in total revenue.

 

한편, 엔비디아는 블랙웰(Blackwell) 칩이 현재 완전한 생산 단계에 돌입했으며, 자사 역사상 가장 빠른 생산 확대 속도를 기록하고 있다고 밝혔다.

최근 분기 실적에서 엔비디아는 블랙웰 칩이 393억 달러의 총 매출 중 110억 달러를 차지했다고 발표했다.

 

Despite the strong quarterly performance, Nvidia's stock price has been stung by fears that hyperscalers are overspending on AI without notching sufficient returns on their investments. President Trump's threat to enact a 25% tariff on semiconductors produced overseas and the potential for further export controls haven't helped either.

Shares of Nvidia are off 11% year to date, though it's up 36% over the past 12 months.

 

강력한 분기 실적에도 불구하고, 엔비디아의 주가는 하이퍼스케일 기업들이 AI에 과도하게 투자하고 있지만 충분한 수익을 내지 못하고 있다는 우려로 인해 타격을 받고 있다.

 

여기에 트럼프 전 대통령이 해외에서 생산된 반도체에 25% 관세를 부과하겠다고 위협한 것추가적인 수출 규제 가능성도 투자 심리에 부정적인 영향을 미쳤다.

 

올해 들어 엔비디아의 주가는 11% 하락했지만, 지난 12개월 기준으로는 36% 상승했다.

 

--------------------------------------

Nvidia GTC: Here's what Wall Street is saying about Jensen Huang's performance

 

Stifel analyst Ruben Roy

Rating: Buy

Price Target: $180

 

Stifel 애널리스트 루벤 로이
투자의견: 매수(Buy)
목표주가: 180달러

 

"The GTC keynote featured updates on next-gen Blackwell Ultra, Rubin, and Rubin Ultra architectures. The keynote also featured the launch of Dynamo — NVDA's inferencing software designed for the optimization of reasoning models within data centers, which was described as the operating system for AI Factories.

 

"GTC 기조연설에서는 차세대 블랙웰 울트라(Blackwell Ultra), 루빈(Rubin), 루빈 울트라(Rubin Ultra) 아키텍처에 대한 업데이트가 포함되었다. 또한, **AI 팩토리의 운영체제(OS)**로 설명된 Dynamo가 발표되었는데, 이는 데이터 센터 내 추론(AI inferencing) 모델 최적화를 위한 NVDA의 새로운 추론 소프트웨어다.

 

As was widely expected, Mr. Huang also touched on scale-out networking with the formal announcement of silicon photonics/co-packaged optics Quantum-X and Spectrum-X switches. On the enterprise infrastructure front, NVDA announced the DGX Spark and DGX Station PCs, offering AI capabilities and performance in a desktop form factor.

 

예상대로 젠슨 황 CEO는 실리콘 포토닉스/공패키지 광학(silicon photonics/co-packaged optics) 기반의 Quantum-X 및 Spectrum-X 스위치를 공식 발표하며 **확장형 네트워킹(scale-out networking)**에 대해서도 언급했다.

기업용 인프라 부문에서는 DGX Spark 및 DGX Station PC가 공개되었으며, 이는 데스크톱 폼팩터에서 AI 기능과 성능을 제공하는 제품이다.

 

"Continued full-stack infrastructure development is targeted at evolving reasoning models and agentic AI, which NVDA believes will drive 10-100x compute intensity.

 

엔비디아는 AI 추론 모델 및 **에이전틱 AI(agentic AI)**의 발전에 맞춰 풀스택(Full-stack) 인프라 개발을 지속하고 있으며, 이를 통해 컴퓨팅 집약도를 10~100배 증가시킬 것으로 예상하고 있다.

 

We continue to view NVDA's innovation on AI infrastructure positively within the backdrop of a broader accelerated computing market which is forecast to drive data center capex to ~$1 trillion annually by the end of the decade."

 

우리는 가속 컴퓨팅 시장이 지속적으로 성장하는 가운데, AI 인프라 분야에서 엔비디아의 혁신을 긍정적으로 평가한다.

현재 데이터 센터 자본 지출(CapEx)은 2030년까지 연간 약 1조 달러 규모에 이를 것으로 전망된다."

 

Citi analyst Atif Malik

Rating: Buy Price

Target: $163

Citi 애널리스트 아티프 말릭
투자의견: 매수(Buy)
목표주가: 163달러

 

"Jensen Huang delivered GTC keynote today. Three key points jumped out to us:

"젠슨 황 CEO는 오늘 GTC 기조연설을 진행했다. 우리가 주목한 세 가지 핵심 포인트는 다음과 같다.

 

1) Nvidia is adding more color to its total addressable market expectations with total annual capex reaching $1 trillion by 2028 as both inference and training continue to require more compute.

 

엔비디아는 총 유효 시장(TAM) 전망을 보다 구체적으로 제시했다. 2028년까지 데이터 센터 연간 자본 지출(CapEx)이 1조 달러에 이를 것으로 예상되며, 이는 추론(AI inferencing)과 학습(training) 모두에서 더 많은 컴퓨팅 성능이 필요하기 때문이다.

 

 

2) Blackwell is not only back on track, it is outperforming expectations with units (individual dies) from top 4 US hyperscalers already reaching 3.6 million in 2025, 2.8x vs. Hopper's peak year.

 

블랙웰(Blackwell)은 정상 궤도로 복귀했을 뿐만 아니라 기대치를 초과하는 성과를 보이고 있다.

미국 4대 하이퍼스케일 기업에서 2025년까지 블랙웰 개별 다이(die) 출하량이 360만 개에 이를 전망이며,

이는 호퍼(Hopper) 칩이 정점에 달했던 시기의 2.8배에 해당한다.

 

3) The company reminded investors that it is leading inference and is not stepping its foot off the gas with a blisteringly fast compute road-map (B300, Rubin, Rubin Ultra), software leadership (e.g. Dynamo) and networking innovation (CPO).

 

엔비디아는 투자자들에게 AI 추론 시장을 선도하고 있으며, 이 분야에서 더욱 공격적인 행보를 이어가고 있다는 점을

 

강조했다.

  • 초고속 컴퓨팅 로드맵(B300, 루빈(Rubin), 루빈 울트라(Rubin Ultra))
  • 소프트웨어 리더십(Dynamo)
  • 네트워킹 혁신(CPO, Co-Packaged Optics) 등을 통해 지속적인 발전을 추진하고 있다.

 

"Net-net, we came out of the keynote reassured in Nvidia's leadership which if anything seems to be expanding. We view positively Nvidia's push for inference which per company comments now requires significantly more compute."

 

결론적으로, 이번 기조연설을 통해 엔비디아의 리더십이 더욱 강화되고 있음을 확인할 수 있었다. 특히, AI 추론 부문에서 엔비디아가 강력한 입지를 구축하고 있으며, 이 분야는 이제 이전보다 훨씬 더 많은 컴퓨팅 성능을 요구하는 단계로 진입했다고 판단한다."

 

KeyBanc analyst John Vinh

\Rating: Overweight

Price Target: $190

 

KeyBanc 애널리스트 존 빈
투자의견: 비중 확대(Overweight)
목표주가: 190달러

 

"Nvidia CEO Jensen Huang kicked off GTC with a keynote speech with announcements largely in line with expectations heading into the event. We'd highlight the following key takeaways, including:

 

"엔비디아 CEO 젠슨 황은 GTC 기조연설을 통해 주요 발표를 진행했으며, 대부분은 사전 기대와 부합하는 내용이었다. 우리는 다음과 같은 핵심 내용을 강조하고 싶다.

 

1) Announced Blackwell Ultra (GB300) NVL72, which is expected to be 1.5x performance of GB200 NVL72 and is expected to be available in 2H25;

 

블랙웰 울트라(Blackwell Ultra) GB300 NVL72 발표

  • 기존 GB200 NVL72 대비 1.5배 성능 향상
  • 2025년 하반기(2H25) 출시 예정

2) Announced Vera Rubin NVL144, with Vera being the next-gen ARM-based CPU and Rubin being the next generation GPU; with 144 GPUs per rack and performance expected to be 3.3x GB300 NVL72 and expected 2H26;

 

베라 루빈(Vera Rubin) NVL144 발표

  • 베라(Vera): 차세대 ARM 기반 CPU
  • 루빈(Rubin): 차세대 GPU
  • 랙당 144개 GPU 탑재, GB300 NVL72 대비 3.3배 성능 향상
  • 2026년 하반기(2H26) 출시 예정

and 3) Announced co-packaged optical (CPO) at 1.6TB, which is expected to ship in the second half of the year.

 

  1. 1.6TB 대역폭의 공패키지 광학(CPO, Co-Packaged Optical) 발표
    • 올해 하반기 출시 예정

"Additional thoughts from GTC include: 1) NVDA continues to push the envelope on performance with its annual cadence roadmap, such that it remains the clear leader in AI, in our view;

 

GTC에서 추가로 주목할 점은 다음과 같다.

  1. 엔비디아는 연간 로드맵을 기반으로 성능 한계를 지속적으로 뛰어넘고 있으며, AI 분야에서 확고한 리더십을 유지하고 있다.

 

and 2) Blackwell Ultra (GB300) uses the same rack architecture as GB200, and as such we expect a rather seamless transition as NVDA will unlikely have to go through the same learning curve in ramping GB200 NVL72, which should allow NVDA to accelerate GB NVL rack shipments in the second half of the year."

 

블랙웰 울트라(Blackwell Ultra, GB300)는 기존 GB200과 동일한 랙 아키텍처를 사용한다. 따라서, GB200 NVL72를 확장할 때 겪었던 학습 곡선을 다시 거칠 필요가 없어 GB NVL 랙 출하 속도를 더욱 가속화할 수 있을 것으로 예상된다. 이에 따라 올해 하반기 GB NVL 랙 출하량이 증가할 가능성이 높다.