2026.05.20
시장조사업체 TrendForce의 최신 AI 산업 조사에 따르면, 북미 상위 5개 클라우드 서비스 제공업체(CSP)들은
2026년에 AI 학습 및 추론 모델 배치를 확대하기 위해 랙 스케일 AI 서버 도입을 대폭 늘릴 전망입니다.
이들 5개 기업은 올해 전 세계 NVIDIA GB(블랙웰) 및 VR(베라 루빈) 시리즈 서버 수요의 60% 이상을 차지할 것으로 예상됩니다.
또한 TrendForce는 이러한 공격적인 인프라 확장이 이들 기업의 AI 학습 컴퓨팅 성능을 전년 대비 56% 이상 끌어올리고,
AI 추론 컴퓨팅 성능은 무려 약 122% 급증시킬 것으로 전망했습니다.
TrendForce는 2026년 글로벌 AI 서버 출하량이 전년 대비 28% 이상 증가할 것으로 내다봤습니다.
고성능 AI 학습 서버는 올해 전체 AI 서버 출하량의 약 55%를 차지하며 여전히 시장을 주도할 전망입니다.
다만 중장기적으로는 CSP들이 AI 애플리케이션을 빠르게 상용화하면서 AI 클라우드 서비스를 확대함에 따라,
AI 추론 서버가 학습 서버를 추월할 것으로 예상됩니다.
한편 NVIDIA는 AI 추론 솔루션과 활용 사례를 적극 확대하고 있습니다.
실제로 NVIDIA는 올해 주력 AI 서버인 GB 및 VR 시스템을 홍보하면서,
이들 시스템이 AI 학습뿐 아니라 AI 추론 워크로드도 지원한다는 점을 강조하고 있습니다.
TrendForce는 Google, Amazon, Microsoft, Meta, Oracle 등 북미 상위 5개 CSP의 2026년 합산 자본지출(CapEx)이
7,700억 달러를 넘어설 것으로 추정했으며, 이는 전년 대비 약 87% 증가한 규모입니다.
이들 CSP가 NVIDIA GB 및 VR 서버 구매를 통해 확보하게 될 컴퓨팅 성능을 분석한 결과도 매우 공격적인 증가세를 보여줍니다.
AI 학습 기준(FP16 및 BF16 기준)으로 보면, 이들의 합산 컴퓨팅 성능은 2025년 9 ExaFLOPS를 넘어섰고,
2026년에는 추가로 56% 이상 성장할 것으로 예상됩니다.
AI 추론 성능을 FP4/NVFP4 기준으로 평가할 경우, 상위 5개 CSP의 합산 추론 성능은 2025년에 이미 37 ExaFLOPS를 넘어선 것으로 추정됩니다.
그리고 2026년에는 이 수치가 약 122% 급증할 것으로 예상되는데, 이는 AI 학습 성능 증가 속도보다 훨씬 빠른 수준입니다.
이러한 흐름은 NVIDIA가 차세대 GB300 및 VR200 랙 스케일 솔루션을 통해 하드웨어와 소프트웨어 전반에서
AI 추론 성능 최적화에 집중하고 있음을 보여준다고 TrendForce는 설명했습니다.
GPU 기반 솔루션과 함께, CSP들의 자체 ASIC 기반 랙 제품도 빠르게 확대되고 있습니다.
특히 Google이 가장 적극적입니다.
TrendForce는 Google의 자체 TPU 칩 수요가 2026년에 전년 대비 거의 80% 증가할 것으로 예상했으며,
올해 하반기부터 TPU v7에서 v8 세대로 점진적인 전환이 이뤄질 것으로 전망했습니다.
Amazon 역시 자체 ASIC 확대 전략에서 Google 다음으로 적극적인 기업으로 평가됩니다. TrendForce는 Amazon의 Trainium 시리즈가 2026년 Amazon 자체 AI 서버 출하량의 40% 이상을 차지할 것으로 예상했습니다.
TrendForce는 또한 NVIDIA 및 AMD GPU와 CSP 자체 ASIC을 탑재한 최신 서버 랙들이 모두 액체 냉각(liquid cooling) 시스템을 채택하고 있다고 설명했습니다. 이를 통해 서버 높이(U-count)를 줄여 하나의 AI 서버 랙 안에 더 많은 가속기를 탑재할 수 있게 됩니다.
그러나 개별 AI GPU와 ASIC의 열설계전력(TDP)이 계속 상승하면서, AI 서버 전체 시스템의 전력 소비 역시 구조적으로 증가하고 있습니다.
TrendForce에 따르면, 북미 상위 5개 CSP가 운영하는 전체 서버 전력 소비는 2023년에 전년 대비 2.8GW 증가했습니다. 그런데 2026년에는 전년 대비 무려 18GW 증가할 것으로 전망되며, 증가율은 116%에 달할 것으로 예상됩니다.
TrendForce는 이러한 폭발적인 전력 수요 증가의 핵심 원인으로 AI 패권 경쟁 심화를 지목했습니다.
이에 따라 NVIDIA의 GB300 플랫폼, AMD의 Helios 플랫폼, 그리고 CSP들이 자체 개발한 다양한 ASIC 플랫폼이
동시에 대규모로 배치되고 있다는 설명입니다.

'삼성전자-하이닉스-마이크론-샌디스크' 카테고리의 다른 글
| 심성전기 silicon capacitor(실리콘 커패시터)(2026.05.21) (0) | 2026.05.21 |
|---|---|
| 中 CXMT 분기 7조원 순이익(2026.05.18) (0) | 2026.05.18 |
| 팔란티어 컨콜에서 나온 'rule of 40'이란?(2026.05.17) (0) | 2026.05.17 |
| ‘59만전자·400만닉스’ 전망 나왔다…노무라증권 “TSMC 몸값 따라가야”(2026.05.17) (0) | 2026.05.17 |
| SK하이닉스 ,목표가 300만원으로 상향(2026.05.15) (0) | 2026.05.15 |