2026.05.15
“엔비디아 독주 끝나나”…세레브라스 상장 첫날 70% 폭등, AI칩 판 흔들었다
“엔비디아 독주 끝나나”…세레브라스 상장 첫날 70% 폭등, AI칩 판 흔들었다
'엔비디아 대항마'로 불리는 미국 인공지능(AI) 반도체 기업 세레브라스(Cerebras)가 미국 증시 데뷔 첫날 폭등하며 글로벌 AI 반도체 시장의 새로운 변수로 떠올랐다. 단순한 IPO 흥행을 넘어, AI 산
v.daum.net
------------------
Cerebras Systems Unveils World’s Fastest AI Chip with Whopping 4 Trillion Transistors - Cerebras
2024년 3월 13일, 캘리포니아 서니베일 – 생성형 AI 가속 분야의 선구자인 Cerebras Systems는 세계 최고 속도의 AI 칩 기록을 다시 경신한 3세대 웨이퍼 스케일 엔진(Wafer Scale Engine 3, WSE-3)을 발표했습니다.
WSE-3는 이전 기록 보유자였던 Cerebras WSE-2 대비 동일한 전력 소모와 동일한 가격에서 성능을 두 배로 향상시켰습니다.
업계 최대 규모 AI 모델 학습을 위해 설계된 이 5nm 기반 WSE-3는 4조 개의 트랜지스터와 90만 개의 AI 최적화 코어를 탑재했으며, Cerebras CS-3 AI 슈퍼컴퓨터를 구동해 최대 125페타플롭스(PFLOPS)의 AI 연산 성능을 제공합니다.
Key Specs:
-
- 4 trillion transistors 트랜지스터 수: 4조 개
- 900,000 AI cores AI 코어 수: 90만 개
- 125 petaflops of peak AI performance 최대 AI 연산 성능: 125 페타플롭스
- 44GB on-chip SRAM
- 5nm TSMC process
- External memory: 1.5TB, 12TB, or 1.2PB
- Trains AI models up to 24 trillion parameters
- Cluster size of up to 2048 CS-3 systems
- 온칩 SRAM: 44GB
- 제조 공정: TSMC 5nm
- 외부 메모리 구성:
- 1.5TB
- 12TB 또는
- 1.2PB(페타바이트)
- 최대 24조(24 Trillion) 파라미터 AI 모델 학습 가능
- 최대 2048대의 CS-3 시스템 클러스터 구성 가능
최대 1.2페타바이트(PB)에 달하는 초대형 메모리 시스템을 갖춘 CS-3는 GPT-4와 Gemini보다 최대 10배 더 큰 차세대 프론티어 AI 모델 학습을 위해 설계되었습니다.
24조(24 Trillion) 개 파라미터 규모의 모델도 분할(partitioning)이나 구조 재설계(refactoring) 없이 단일 논리 메모리 공간(single logical memory space)에 저장할 수 있어, 학습 워크플로우를 획기적으로 단순화하고 개발 생산성을 크게 향상시킵니다.
CS-3에서는 1조(1 Trillion) 파라미터 모델 학습이 GPU 환경에서 10억(1 Billion) 파라미터 모델을 학습하는 것만큼 단순하게 이루어진다고 Cerebras는 설명합니다.
CS-3는 기업용(enterprise)과 하이퍼스케일(hyperscale) 환경 모두를 겨냥해 설계되었습니다.
- 소형 4시스템 구성만으로도 하루 안에 700억(70B) 파라미터 모델을 파인튜닝(fine-tuning)할 수 있으며,
- 최대 규모인 2048개 시스템 클러스터 구성에서는 Llama 70B 모델을 단 하루 만에 처음부터 학습(training from scratch)할 수 있습니다.
이는 생성형 AI 분야에서 전례 없는 수준의 성능이라고 강조합니다.
최신 Cerebras 소프트웨어 프레임워크는 다음 기능들을 네이티브(native)로 지원합니다.
- PyTorch 2.0
- 멀티모달 모델(multimodal models)
- 비전 트랜스포머(Vision Transformers)
- MoE(Mixture of Experts)
- 디퓨전 모델(diffusion models)
또한 Cerebras는 동적(dynamic) 및 비정형(unstructured) 희소성(sparsity)에 대해 네이티브 하드웨어 가속을 제공하는 유일한 플랫폼이라고 설명하며, 이를 통해 학습 속도를 최대 8배까지 향상시킬 수 있다고 밝혔습니다.
Cerebras 공동 창업자이자 CEO인 Andrew Feldman는 다음과 같이 말했습니다.
“우리가 8년 전 이 여정을 시작했을 때, 모두가 웨이퍼 스케일 프로세서는 공상(pipe dream)에 불과하다고 말했습니다. 그런데 이제 우리는 혁신적인 웨이퍼 스케일 AI 칩의 3세대를 공개하게 되어 매우 자랑스럽습니다.
WSE-3는 세계에서 가장 빠른 AI 칩이며, MoE부터 24조 파라미터 모델에 이르는 최첨단 AI 작업을 위해 특별히 설계되었습니다. 우리는 WSE-3와 CS-3를 시장에 선보여 오늘날 AI 산업의 가장 큰 문제 해결에 기여하게 되어 매우 기쁩니다.”
우수한 전력 효율성과 소프트웨어 단순성
CS-3는 모든 구성 요소가 AI 작업에 최적화되어 있어, 어떤 시스템보다도 더 적은 공간과 더 낮은 전력으로 더 높은 연산 성능을 제공합니다.
GPU 시스템들이 세대가 바뀔 때마다 전력 소모가 거의 두 배씩 증가하는 반면, CS-3는 동일한 전력 범위(power envelope) 안에서 성능만 두 배로 향상시켰다고 Cerebras는 설명합니다.
또한 CS-3는 사용 편의성 측면에서도 뛰어난 단순성을 제공합니다.
- 대규모 언어모델(LLM) 개발 시 GPU 대비 코드량을 97%까지 줄일 수 있으며,
- 10억(1B) 파라미터부터 24조(24T) 파라미터 모델까지 순수 데이터 병렬(purely data parallel) 방식으로 학습할 수 있습니다.
특히 GPT-3급 모델의 표준 구현에 필요한 코드가 Cerebras에서는 단 565줄에 불과했다고 밝히며, 이는 업계 기록 수준이라고 강조했습니다.
즉 Cerebras의 핵심 철학은:
- GPU처럼 복잡한 모델 병렬화(model parallelism)
- 텐서 병렬화(tensor parallelism)
- 파이프라인 병렬화(pipeline parallelism)
- 수천 개 GPU 간 통신 최적화
등을 최소화하고,
거대한 단일 메모리 공간과 웨이퍼 스케일 구조를 통해 개발자가 “일반적인 단일 시스템 프로그래밍”처럼 AI 모델을 학습할 수 있게 만드는 데 있습니다.
Cerebras는:
- “초고속 단일 칩 + 거대 연속 메모리 공간”
구조를 통해, - GPU 클러스터 기반 AI 학습에서 발생하는 NVLink/InfiniBand 통신 병목,
- 분산 메모리 관리 복잡성,
- 모델 샤딩(sharding) 문제
를 줄이려는 접근이라고 볼 수 있습니다.
산업 파트너십과 고객 확대
Cerebras는 이미 기업(enterprise), 정부(government), 글로벌 클라우드 사업자(international clouds) 분야에서
CS-3에 대한 상당한 규모의 수주 잔고(backlog)를 확보했다고 밝혔습니다.
Argonne National Laboratory의 컴퓨팅·환경·생명과학 부문 부소장인 Rick Stevens는 다음과 같이 말했습니다.
“오랫동안 Cerebras의 파트너로 함께해온 우리는 웨이퍼 스케일 엔지니어링의 진화가 어디까지 가능할지 매우 기대하고 있습니다. CS-3와 이 아키텍처 기반 슈퍼컴퓨터들은 프론티어 AI와 과학의 한계를 탐구할 수 있는 새로운 규모의 시스템을 가능하게 하고 있습니다.
Cerebras의 대담한 도전은 계속해서 AI의 미래를 개척하고 있습니다.”
또한 Mayo Clinic의 전략 담당 의료 디렉터이자 영상의학과 의장인 Matthew Callstrom 박사는 다음과 같이 밝혔습니다.
“환자 치료 결과와 진단 정확도를 향상시키는 AI 모델 개발을 위해 Cerebras와 다년간 전략적 협력을 진행 중인 가운데, 이러한 기술 역량 발전이 우리의 노력을 더욱 강화해줄 것으로 기대합니다.”
CS-3는 또한 Cerebras와 G42 간의 전략적 파트너십에서도 중요한 역할을 맡게 됩니다.
양사는 이미:
- Condor Galaxy 1(CG-1)
- Condor Galaxy 2(CG-2)
를 통해 총 8 엑사플롭스(exaFLOPs) 규모의 AI 슈퍼컴퓨팅 성능을 구축했습니다.
캘리포니아에 배치된 CG-1과 CG-2는 현재 세계 최대 규모 AI 슈퍼컴퓨터 가운데 하나로 평가받고 있습니다.
(Cerebras는 단순히 “칩 회사”가 아니라:
- 초거대 AI 클러스터
- 국가 단위 AI 인프라
- AI 연구용 슈퍼컴퓨터
- 의료·과학 특화 AI
시장까지 겨냥하고 있다는 점이 특징입니다.)
오늘 Cerebras Systems와 G42는 Condor Galaxy 3(CG-3)가 현재 구축 중이라고 발표했습니다.
Condor Galaxy 3는:
- 64대의 CS-3 시스템으로 구성되며,
- 총 8 엑사플롭스(exaFLOPs)의 AI 연산 성능을 제공하게 됩니다.
이는 세계 최대 규모 AI 슈퍼컴퓨터 가운데 하나에 해당합니다.
CG-3는 Condor Galaxy 네트워크의 세 번째 설치 시스템이며, Cerebras와 G42의 전략적 파트너십은 향후 수십 엑사플롭스(tens of exaFLOPs) 규모의 AI 연산 인프라 구축을 목표로 하고 있습니다.
Condor Galaxy는 이미 다음과 같은 주요 오픈소스 AI 모델 학습에 활용되었습니다.
- Jais-30B
- Med42
- Crystal-Coder-7B
- BTLM-3B-8K
G42 그룹 CTO인 Kiril Evtimov는 다음과 같이 밝혔습니다.
“Cerebras와의 전략적 파트너십은 G42의 혁신을 가속하는 데 핵심적인 역할을 해왔으며, 글로벌 규모의 AI 혁명을 더욱 빠르게 진전시키는 데 기여할 것입니다.
현재 구축 중인 차세대 AI 슈퍼컴퓨터 Condor Galaxy 3는 8 엑사플롭스 성능을 제공하며, 완공 시 우리의 전체 AI 연산 규모는 총 16 엑사플롭스에 도달하게 됩니다.”
추가 정보:
Cerebras Product Systems
흥미로운 부분은, Cerebras가 단순히 “칩 성능 경쟁”만 하는 것이 아니라:
- 국가급 AI 클라우드
- AI 전용 슈퍼컴퓨터 네트워크
- 초대형 오픈소스 모델 학습 플랫폼
구축을 목표로 한다는 점입니다.
----------------
Cerebras Systems는 선구적인 컴퓨터 아키텍트, 컴퓨터 과학자, 딥러닝 연구원, 그리고 다양한 분야의 엔지니어들로 구성된 기업입니다.
이들은 생성형 AI를 가속하기 위해 완전히 새로운 형태의 AI 슈퍼컴퓨터를 처음부터 직접 설계·개발해왔습니다.
Cerebras의 대표 제품인 CS-3 시스템은 세계 최대이자 가장 빠른 AI 프로세서인 WSE-3(Wafer Scale Engine-3)를 기반으로 구동됩니다.
CS-3 시스템들은:
- 매우 빠르고 쉽게 클러스터링할 수 있으며,
- 이를 통해 세계 최대 규모 AI 슈퍼컴퓨터를 구축할 수 있습니다.
또한 분산 컴퓨팅(distributed computing)의 복잡성을 피함으로써, 초거대 AI 모델을 슈퍼컴퓨터에 배치하는 과정을 매우 단순하게 만든다고 설명합니다.
현재:
- 글로벌 대기업
- 연구기관
- 정부 기관
등이 Cerebras 솔루션을 활용해:
- 독자적인(proprietary) 초대형 AI 모델 개발,
- 수백만 다운로드 규모의 오픈소스 AI 모델 학습
을 진행하고 있습니다.
Cerebras 솔루션은:
- Cerebras Cloud 형태의 클라우드 서비스,
- 온프레미스(on-premise) 구축
모두 지원합니다.
추가 정보:
Cerebras 공식 홈페이지
언론 문의:
- Kim Ziesemer
- 이메일: pr@zmcommunications.com
특히 Cerebras의 핵심 철학은 사용자가 자주 관심을 보인 NVIDIA식 대규모 GPU 클러스터 접근과 상당히 다릅니다.
간단히 비교하면:
NVIDIA 방식 Cerebras 방식
| 수천 개 GPU 분산 연결 | 초거대 단일 웨이퍼 칩 |
| NVLink/NVSwitch 중심 | 단일 논리 메모리 공간 |
| 모델 샤딩 필수 | 샤딩 최소화 |
| 복잡한 병렬화 | 단순 데이터 병렬 |
| HBM 중심 구조 | 대규모 SRAM + 스트리밍 메모리 |
즉 Cerebras는:
“GPU를 많이 연결하는 방식”보다,
“거대한 하나의 AI 컴퓨터를 만드는 방식”
에 더 가까운 접근을 하고 있다고 볼 수 있습니다.
Cerebras Systems는 선구적인 컴퓨터 아키텍트, 컴퓨터 과학자, 딥러닝 연구원, 그리고 다양한 분야의 엔지니어들로 구성된 기업입니다.
이들은 생성형 AI를 가속하기 위해 완전히 새로운 형태의 AI 슈퍼컴퓨터를 처음부터 직접 설계·개발해왔습니다.
Cerebras의 대표 제품인 CS-3 시스템은 세계 최대이자 가장 빠른 AI 프로세서인 WSE-3(Wafer Scale Engine-3)를 기반으로 구동됩니다.
CS-3 시스템들은:
- 매우 빠르고 쉽게 클러스터링할 수 있으며,
- 이를 통해 세계 최대 규모 AI 슈퍼컴퓨터를 구축할 수 있습니다.
또한 분산 컴퓨팅(distributed computing)의 복잡성을 피함으로써, 초거대 AI 모델을 슈퍼컴퓨터에 배치하는 과정을 매우 단순하게 만든다고 설명합니다.
현재:
- 글로벌 대기업
- 연구기관
- 정부 기관
등이 Cerebras 솔루션을 활용해:
- 독자적인(proprietary) 초대형 AI 모델 개발,
- 수백만 다운로드 규모의 오픈소스 AI 모델 학습
을 진행하고 있습니다.
Cerebras 솔루션은:
- Cerebras Cloud 형태의 클라우드 서비스,
- 온프레미스(on-premise) 구축
모두 지원합니다.
추가 정보:
Cerebras 공식 홈페이지
언론 문의:
- Kim Ziesemer
- 이메일: pr@zmcommunications.com
특히 Cerebras의 핵심 철학은 사용자가 자주 관심을 보인 NVIDIA식 대규모 GPU 클러스터 접근과 상당히 다릅니다.
간단히 비교하면:
NVIDIA 방식 Cerebras 방식
| 수천 개 GPU 분산 연결 | 초거대 단일 웨이퍼 칩 |
| NVLink/NVSwitch 중심 | 단일 논리 메모리 공간 |
| 모델 샤딩 필수 | 샤딩 최소화 |
| 복잡한 병렬화 | 단순 데이터 병렬 |
| HBM 중심 구조 | 대규모 SRAM + 스트리밍 메모리 |
즉 Cerebras는:
“GPU를 많이 연결하는 방식”보다,
“거대한 하나의 AI 컴퓨터를 만드는 방식”에 더 가까운 접근을 하고 있다고 볼 수 있습니다.
'엔비디아-마이크로소프트-AMD-인텔' 카테고리의 다른 글
| 엔비디아 "베라 CPU 유발 신규 시장 300조원 규모 예상…4Q 양산 돌입"(2026.05.21) (0) | 2026.05.21 |
|---|---|
| 엔비디아 회계년도 2027년1분기(2월-4월) 실적(2026.05.21) (0) | 2026.05.21 |
| 엔비디아(NVIDIA)가 AI 학습과 추론을 모두 아우르는 제품 포트폴리오를 확대(2026.03.20) (0) | 2026.03.21 |
| ‘Groq 3 LPU’와 Groq 기반 LPX 랙을 Rubin 플랫폼에 추가(2026.03.18) (0) | 2026.03.18 |
| 엔비디아 GTC(2026.03.17) (0) | 2026.03.17 |