화웨이의 반도체 자회사인 하이실리콘(HiSilicon)은 최근 고대역폭 메모리(HBM)를 통합한 새로운 ARM 기반 서버 SoC인 쿤펑(Kunpeng) 프로세서를 개발 중인 것으로 알려졌습니다. Tom's Hardware
주요 특징:
- HBM 통합: HBM은 기존 메모리보다 대역폭이 높고 전력 효율이 우수하여, 고성능 컴퓨팅에 적합합니다. 화웨이는 쿤펑 SoC에 HBM을 통합하여 데이터 처리 속도를 향상시키고자 합니다. Phoronix
- ARM 기반 Taishan 코어: 이전 쿤펑 920은 64개의 Taishan V110 코어를 탑재하였으며, 새로운 SoC에서는 이 코어의 업그레이드 버전이 사용될 가능성이 있습니다. Tom's Hardware
- 제조 공정: 미국의 제재로 인해 최첨단 공정 사용이 제한되어, 새로운 쿤펑 SoC는 중국의 SMIC 7nm 공정을 활용할 것으로 예상됩니다. Tom's Hardware
현재 이 새로운 쿤펑 SoC는 공식 발표되지 않았으며, 개발 중인 것으로 보입니다. 리눅스 커널에 관련 패치가 제출되면서 이러한 정보가 공개되었습니다. Phoronix
화웨이의 이러한 움직임은 서버 시장에서 인텔과 AMD의 제품과 경쟁하기 위한 전략으로 보입니다. HBM을 통합한 ARM 기반 서버 SoC는 고성능과 전력 효율을 동시에 추구하는 데이터 센터와 클라우드 컴퓨팅 분야에서 주목받을 수 있습니다.
New e-mails from Huawei engineers regarding Linux kernel development suggest that HiSilicon - Huawei's chip subsidiary - is prepping a new Kunpeng SoC with HBM (High Bandwidth Memory) technology - as highlighted by Phoronix. This will likely be the the first significant release from HiSilicon in a while but don't get your hopes up as it could also just be a rebranded older model with a slight pinch of HBM.
Phoronix에서 보도한 바에 따르면, 리눅스 커널 개발과 관련한 화웨이 엔지니어들의 새로운 이메일은 화웨이의 반도체 자회사인 하이실리콘(HiSilicon)이 HBM(고대역폭 메모리) 기술을 탑재한 새로운 쿤펑(Kunpeng) SoC를 준비 중임을 시사합니다. 이는 하이실리콘에서 오랜만에 발표하는 주요 제품이 될 가능성이 있지만, 기존 모델에 HBM을 약간 추가한 리브랜딩일 수도 있으니 과도한 기대는 금물입니다.
There are very few CPUs with HBM. Most notably Intel’s Xeon Max (Sapphire Rapids HBM) and AMD’s custom EPYC CPUs for Microsoft are the first ones to come to mind. Therefore, it’s a significant achievement for Huawei to put out a Kunpeng chip with HBM.
현재 HBM을 탑재한 CPU는 극히 드뭅니다. 가장 주목할 만한 예는 **인텔의 Xeon Max(Sapphire Rapids HBM)**과 마이크로소프트를 위한 AMD의 커스텀 EPYC CPU입니다. 따라서, 화웨이가 HBM을 탑재한 쿤펑 칩을 출시하는 것은 중요한 성과로 평가될 수 있습니다.
Kunpeng is a series of server SoCs from HiSilicon that were originally designed using Arm's Cortex cores. HiSilicon later transitioned to custom Arm-based Taishan cores with the Kunpeng 920 featuring 64 such Taishan V110 cores fabricated using TSMC's 7nm process.
쿤펑(Kunpeng)은 하이실리콘(HiSilicon)의 서버 SoC 시리즈로, 초기에는 Arm의 Cortex 코어를 사용해 설계되었습니다. 이후 하이실리콘은 커스텀 Arm 기반의 타이산(Taishan) 코어로 전환했으며, 쿤펑 920은 TSMC의 7nm 공정으로 제조된 64개의 타이산 V110 코어를 특징으로 합니다.
Plans for future versions were spoiled in light of US sanctions as China was and still is unable to procure bleeding-edge nodes from TSMC - with all Chinese chip makers reliant on SMIC.
그러나 미국의 제재로 인해 향후 버전 계획이 차질을 빚었습니다. 중국은 여전히 TSMC의 최첨단 공정을 확보할 수 없으며, 모든 중국 반도체 제조사는 SMIC에 의존하고 있는 상황입니다.
Just a few months back, a Kunpeng chip with Taishan V120 cores surfaced with performance similar to AMD's Zen 3 architecture so these processors do have something to show for themselves despite lackluster support on desktop.
몇 달 전에는 타이산 V120 코어를 탑재한 새로운 쿤펑 칩이 등장했으며, 이 칩의 성능은 AMD Zen 3 아키텍처와 유사한 수준으로 평가되었습니다. 비록 데스크톱 지원이 부족한 점이 단점으로 지적되긴 하지만, 이러한 프로세서들은 여전히 일정 수준의 성과를 보여주고 있습니다.
Linux Preps For Kunpeng ARM Server SoC With High Bandwidth Memory
Written by Michael Larabel in Hardware on 6 December 2024 at 10:03 AM EST. 2 Comments
New Linux patches from Huawei engineers are preparing new driver support for controlling High Bandwidth Memory (HBM) with the ARM-based Kunpeng high performance SoC.
화웨이 엔지니어들이 제출한 새로운 리눅스 패치에서는 ARM 기반 쿤펑(Kunpeng) 고성능 SoC에서 **고대역폭 메모리(HBM)**를 제어하기 위한 새로운 드라이버 지원이 준비되고 있습니다.
Huawei's Kunpeng SoC so far has been in the form of the Kunpeng 920 as an aging 7nm CPU with up to 64 cores based on Armv8.2. The Kunpeng 920 supports eight channels of DDR4 memory and has up to a 180 Watt TDP. The specs aren't interesting as we approach 2025 but it would appear there is a new Kunpeng SoC coming that will feature integrated High Bandwidth Memory (HBM).
현재까지 화웨이의 쿤펑 SoC는 쿤펑 920 형태로 제공되었습니다. 이는 Armv8.2 기반의 7nm CPU로, 최대 64개의 코어를 제공하며, DDR4 메모리 8채널을 지원하고 최대 180W TDP를 가집니다. 하지만 2025년에 가까워지는 현재, 이러한 사양은 시대에 뒤떨어진 것으로 간주됩니다. 새롭게 개발 중인 쿤펑 SoC는 **HBM(고대역폭 메모리)**을 통합할 것으로 보입니다.
(주:인텔의 Xeon Max(코드명: Sapphire Rapids HBM) 프로세서는 64GB의 HBM2e 메모리를 통합하고 있습니다. ITHome
한편, 마이크로소프트 애저를 위해 AMD가 맞춤 제작한 EPYC 프로세서는 HBM3 메모리를 탑재하고 있으며, 각 가상 머신(VM)은 400GB에서 450GB의 HBM3 메모리를 활용할 수 있습니다. Overclock3D
이러한 HBM 통합은 고성능 컴퓨팅(HPC) 및 데이터 집약적인 작업에서 메모리 대역폭을 크게 향상시켜 성능을 높이는 데 기여합니다.)
Unless I missed something, this Kunpeng SoC with HBM memory hasn't been formally announced yet and I haven't been able to find any other references short of pointing to prior kernel patches working on this HBM integration. The patches out today are adding power control support for the HBM memory on the Kunpeng SoC and the ability to online/offline this cache.
다만, 이 HBM을 탑재한 쿤펑 SoC는 아직 공식 발표되지 않았으며, 이에 대한 추가적인 정보는 발견되지 않았습니다. 지금까지는 커널 패치에서 HBM 통합 작업과 관련된 내용만 확인되었습니다. 이번에 공개된 패치에서는 쿤펑 SoC에서 HBM 메모리의 전력 제어 지원과 캐시의 활성화(onlining)/비활성화(offlining) 기능이 추가되었습니다.

The patch series from Huawei explains of this HBM support on the unspecified Kunpeng SoC:
화웨이가 제출한 패치 시리즈는 특정되지 않은 쿤펑(Kunpeng) SoC에서의 HBM(고대역폭 메모리) 지원에 대해 다음과 같이 설명하고 있습니다:
"Add power control support for High Bandwidth Memory (HBM) for Kunpeng SoC platform. HBM devices on Kunpeng SoC can provide higher bandwidth at the cost of higher power consumption. Providing power control methods can help reducing the power when the workload does not need use HBM.
"쿤펑 SoC 플랫폼에서 HBM(고대역폭 메모리)에 대한 전력 제어 지원을 추가합니다. 쿤펑 SoC의 HBM 장치는 더 높은 대역폭을 제공하지만 더 높은 전력 소비를 동반합니다. 전력 제어 방법을 제공함으로써 작업 부하가 HBM을 필요로 하지 않을 때 전력을 줄이는 데 도움이 될 수 있습니다."
Add a driver for High Bandwidth Memory (HBM) devices, which will provide user space interfaces to power on/off the HBM devices. In Kunpeng servers, we need to control the power of HBM devices which can be power consuming and will only be used in some specialized scenarios, such as HPC. HBM memory devices in a socket are in the same power domain, and should be power off/on together.
HBM 장치용 드라이버 추가:
- HBM 장치의 전원을 켜고 끌 수 있는 사용자 공간 인터페이스를 제공합니다.
- 쿤펑 서버에서는 고전력 소비가 예상되는 HBM 장치를 제어할 필요가 있으며, HBM은 주로 **고성능 컴퓨팅(HPC)**과 같은 특수 시나리오에서만 사용됩니다.
- 한 소켓에 있는 HBM 메모리 장치는 동일한 전력 도메인에 속하므로, 전원을 함께 켜거나 꺼야 합니다.
Add a driver for High Bandwidth Memory (HBM) cache, which provides user space interfaces to power on/off the HBM cache. Use HBM as a cache can take advantage of the high bandwidth of HBM in normal memory access, and OS does not need to aware of the existence of HBM cache. For workloads which does not require a high memory access bandwidth, power off the HBM cache device can help save energy."
HBM 캐시용 드라이버 추가:
- HBM 캐시의 전원을 켜고 끌 수 있는 사용자 공간 인터페이스를 제공합니다.
- HBM을 캐시로 사용할 경우, 일반 메모리 액세스에서 HBM의 고대역폭을 활용할 수 있으며, 운영 체제(OS)는 HBM 캐시의 존재를 인식하지 않아도 됩니다.
- 높은 메모리 액세스 대역폭이 필요하지 않은 작업 부하에서는 HBM 캐시 장치의 전원을 꺼 에너지를 절약할 수 있습니다.
It will be interesting to see what comes of Huawei Kunpeng SoCs with HBM memory and ultimately how well they perform against other AArch64 server processors as well as the Intel Xeon and AMD EPYC competition.
화웨이의 쿤펑 SoC가 HBM 메모리를 통합하여 출시될 경우, 이러한 플랫폼이 다른 AArch64 서버 프로세서는 물론 인텔 제온(Intel Xeon) 및 AMD EPYC와의 경쟁에서 어느 정도 성능을 발휘할지가 주목됩니다.
AMD creates custom EPYC CPU with HBM3 memory for Microsoft - OC3D
AMD, 마이크로소프트 애저(Microsoft Azure)를 위해 HBM3 메모리를 탑재한 맞춤형 EPYC CPU 제작
AMD crafts custom EPYC CPUs for Microsoft with Zen 4 cores and HBM3 memory on-chip – Insane bandwidth
AMD, 마이크로소프트를 위해 Zen 4 코어와 HBM3 메모리를 칩에 통합한 맞춤형 EPYC CPU 제작 – 엄청난 대역폭 제공
Microsoft has revealed their latest HBv series virtual machines for Azure, promising incredible performance levels thanks to their custom AMD EPYC CPUs. These customer EPYC CPUs feature an exclusive design with HBM3 memory, up to 352 Zen 4 CPU cores, 6.9 TB/s of memory bandwidth.
마이크로소프트는 Azure를 위한 최신 **HBv 시리즈 가상 머신(VM)**을 공개하며, 맞춤 제작된 AMD EPYC CPU를 통해 놀라운 성능 수준을 약속했습니다. 이 맞춤형 EPYC CPU는 HBM3 메모리, 최대 352개의 Zen 4 CPU 코어, 6.9TB/s의 메모리 대역폭을 특징으로 합니다.
Microsoft’s new HBv5 virtual machines can feature between 400 and 450GB of HBM3 memory. These VMs have four processors total, each with 88 Zen 4 CPU cores. That gives this CPU up to 9GB of HBM3 memory per CPU core, which is a lot of memory to play with.
마이크로소프트의 새로운 HBv5 가상 머신은 400GB에서 450GB의 HBM3 메모리를 탑재할 수 있습니다. 이 가상 머신은 총 4개의 프로세서를 포함하며, 각 프로세서에는 88개의 Zen 4 CPU 코어가 장착됩니다. 이는 코어당 최대 9GB의 HBM3 메모리를 제공하며, 이는 매우 높은 메모리 용량입니다.
Additionally, this memory provides users with faster access than standard DRAM, as this HBM memory is connected directly to the CPU through an interposer.
또한, 이 HBM 메모리는 표준 DRAM보다 더 빠른 접근 속도를 제공하며, **인터포저(interposer)**를 통해 CPU와 직접 연결되어 있습니다.
EPYC CPUs with HBM3 memory
The key feature of Microsoft’s new HBv5 VMs is their memory bandwidth. Memory performance can be a huge limiting factor for enterprise CPU users. That’s why AMD and Microsoft co-developed these CPUs to overcome these potential bottlenecks.
HBM3 메모리를 탑재한 EPYC CPU
마이크로소프트의 새로운 **HBv5 가상 머신(VM)**의 핵심 특징은 메모리 대역폭입니다. 메모리 성능은 엔터프라이즈 CPU 사용자들에게 큰 제약 요인이 될 수 있습니다. 이를 해결하기 위해 AMD와 마이크로소프트는 이러한 잠재적인 병목 현상을 극복하기 위해 공동으로 CPU를 개발했습니다.
Microsoft claims that their new Azure HBv5 systems are up to 8x faster than their competitors in terms of memory bandwidth. Additionally, they claim that these VMs are up to 35x faster than 4-5 year old HPC servers, which are entering the end of their hardware lifecycle.
마이크로소프트는 새로운 Azure HBv5 시스템이 메모리 대역폭 측면에서 경쟁사 대비 최대 8배 빠르다고 주장합니다. 또한, 이 가상 머신이 4-5년 된 HPC 서버(하드웨어 수명이 끝나가는 단계)에 비해 최대 35배 빠르다고 강조하고 있습니다.
These new VMs from Microsoft deliver astounding levels of memory bandwidth. Simply put, the bandwidth offered by these new VMs makes all of Microsoft’s prior HBv virtual machines look slow by comparison.
마이크로소프트의 이 새로운 가상 머신(VM)은 놀라운 수준의 메모리 대역폭을 제공합니다. 간단히 말해, 이 새로운 VM이 제공하는 대역폭은 마이크로소프트의 이전 HBv 가상 머신들에 비해 훨씬 더 빠르게 느껴질 정도입니다.
Microsoft’s new HBv5 server CPUs reportedly feature double the Infinity Cache bandwidth of standard AMD EPYC CPUs and 800Gb/s Nvidia Quantum-2 InfiniBand for network switching. These CPUs also have SMT disabled and are designed for single-tenant use to maximise security.
마이크로소프트의 새로운 HBv5 서버 CPU는 표준 AMD EPYC CPU에 비해 Infinity Cache 대역폭이 두 배로 증가했으며, 네트워크 스위칭을 위해 800Gb/s Nvidia Quantum-2 InfiniBand를 탑재한 것으로 알려졌습니다. 또한, 이 CPU는 **SMT(Simultaneous Multi-Threading)**가 비활성화되어 있으며, 단일 테넌트(single-tenant) 사용을 위해 설계되어 보안을 극대화합니다.
