#HM26

MS 애저, AI 슈퍼컴퓨팅 새 기준 제시

이번 GB300 클러스터 출시는 단순한 하드웨어 공급을 넘어, 컴퓨팅부터 냉각, 네트워킹까지 모든 요소를 통합 설계한 AI 슈퍼컴퓨팅의 새로운 표준을 제시하며 조 단위 파라미터 모델의 시대를 열 것이다.

OpenAI 워크로드용 NVIDIA GB300 NVL72 대규모 클러스터 첫 공급
수십만 개 GPU로 확장 계획

마이크로소프트(Microsoft) 애저(Azure)가 OpenAI 워크로드를 위해 4,600개 이상의 NVIDIA GB300 NVL72로 구성된 첫 대규모 프로덕션 클러스터를 제공한다고 밝혔다. 차세대 NVIDIA 인피니밴드(InfiniBand) 네트워크로 연결된 NVIDIA Blackwell Ultra GPU를 탑재한 이 클러스터는, 향후 마이크로소프트 AI 데이터센터 전반에 걸쳐 수십만 개의 GPU로 확장될 계획의 시작점이다.

이번 배포는 모델 훈련 시간을 수개월에서 수 주로 단축하고, 추론 워크로드에서 높은 처리량을 제공하는 것을 목표로 한다. 또한, 수백조 개의 파라미터를 가진 모델의 훈련을 최초로 지원하게 될 예정이다.

이안 벅(Ian Buck) 엔비디아 하이퍼스케일 및 고성능 컴퓨팅 부문 부사장은 “MS 애저의 NVIDIA GB300 NVL72 슈퍼클러스터 출시는 프론티어 AI 발전의 흥미로운 단계”라며, “OpenAI가 조 단위 파라미터 모델을 서비스하는 데 필요한 슈퍼컴퓨팅 엔진을 제공하며 가속 컴퓨팅의 새로운 표준을 설정했다”고 평가했다.

MS 애저, AI 슈퍼컴퓨팅 새 기준 제시
Microsoft Azure delivers the first large scale cluster with NVIDIA GB300 NVL72 for OpenAI workloads (image. Microsfot)

ND GB300 v6 VM으로 AI 성능 기준 재정의

MS 애저는 엔비디아 블랙웰(Blackwell) 아키텍처 기반의 ND GB200 v6 가상머신(VM)에 이어, 추론 모델, 에이전트 AI 시스템, 멀티모달 생성형 AI에 최적화된 ND GB300 v6 VM을 새롭게 선보였다. 랙 스케일 시스템으로 구축된 각 랙은 18개의 VM과 총 72개의 GPU를 포함하며 주요 사양은 다음과 같다.

  • 72개의 NVIDIA Blackwell Ultra GPU (36개의 NVIDIA Grace CPU 포함)
  • 차세대 NVIDIA Quantum-X800 InfiniBand를 통한 GPU당 800Gb/s의 랙 간 스케일아웃 대역폭
  • 랙 내 130TB/s의 NVIDIA NVLink 대역폭
  • 37TB의 고속 메모리
  • 최대 1,440 페타플롭스(PFLOPS)의 FP4 텐서 코어 성능

슈퍼컴퓨팅 스케일을 위한 통합 시스템 설계

이번 인프라는 컴퓨팅, 메모리, 네트워킹, 데이터센터, 냉각, 전력 등 스택의 모든 계층을 통합된 시스템으로 재구성한 결과물이다. 랙 수준에서는 NVLink와 NVSwitch가 메모리 및 대역폭 제약을 줄여 랙 내에서 초당 130TB의 데이터 전송을 가능하게 한다.

랙을 넘어선 확장을 위해 애저는 현재 가장 빠른 네트워킹 패브릭인 NVIDIA Quantum-X800 InfiniBand를 사용한 풀 팻트리(full fat-tree), 논블로킹(non-blocking) 아키텍처를 배포했다. 이를 통해 통신 오버헤드를 최소화하며 수만 개의 GPU로 훈련을 확장할 수 있다. 또한 NVIDIA SHARP와 같은 기능은 스위치 내에서 연산을 수행하여 집합 연산(collective operations)을 가속화하고 유효 대역폭을 두 배로 늘린다.

데이터센터 인프라 측면에서는 독립형 열 교환 장치와 시설 냉각을 사용하는 첨단 냉각 시스템을 통해 물 사용량을 최소화하면서 고밀도 클러스터의 열 안정성을 유지한다. 또한 ND GB300 v6 VM 클래스의 높은 에너지 밀도와 동적 부하 분산을 지원할 수 있는 새로운 전력 분배 모델을 개발 및 배포하고 있다.

MS 애저는 전 세계적으로 GB300 배포를 확대함에 따라, 고객들이 이전 세대보다 훨씬 짧은 시간 안에 새로운 모델을 훈련하고 배포할 수 있을 것으로 기대하고 있다.

뉴스레터 구독하기

아이씨엔매거진은 AIoT, IIoT 및 피지컬 AI, 디지털트윈을 통한 제조업 디지털전환 애널리틱스를 제공합니다.
테크리포트: 자율제조, 전력전자, 모빌리티, 로보틱스, 스마트농업

AW2026 expo
ACHEMA 2027
전시회 세미나 선물 준비는 기프트랩스
우청 기자
우청 기자http://icnweb.co.kr
아이씨엔 매거진 테크니컬 에디터입니다. 산업용사물인터넷과 디지털전환을 위한 애널리틱스를 모아서 뉴스와 기술기사로 제공합니다.
fastech EtherCAT
as-interface
GiftLabs

Related Articles

Stay Connected

440FansLike
407FollowersFollow
224FollowersFollow
120FollowersFollow
372FollowersFollow
152SubscribersSubscribe
GiftLabs
spot_img
InterPACK
spot_img
SPS 2026
automotion
Power Electronics Mag

Latest Articles

Related Articles

PENGUIN Solutions
미뉴-노르딕, nRF54L15로 자산 추적 정밀도 혁신

미뉴-노르딕, nRF54L15로 자산 추적 정밀도 혁신

0
미뉴는 노르딕의 차세대 SoC를 통해 배터리 수명 10년과 고정밀 위치 추적을 동시에 구현함으로써, 대규모 산업 현장의 인프라 구축 및 유지보수 비용을 획기적으로 낮춘 자산 관리 솔루션을 완성했다
WindEnergy
InterPACK

Related Articles

fastech EtherCAT
as-interface
마우저, 첨단 자동화를 위한 델타 48V 3상 전원공급장치 ‘포스-GT’ 공급

마우저, 첨단 자동화를 위한 델타 48V 3상 전원공급장치 ‘포스-GT’ 공급

0
마우저는 최대 96%의 고효율과 초슬림 설계를 갖춘 델타의 포스-GT 48V 전원공급장치를 공급하며, 보호 코팅과 광범위한 동작 온도를 지원해 전기차 충전 및 로보틱스 등 열악한 산업 환경의 전력 신뢰성을 높인다
ADI, 차세대 ‘A²B 2.0’ 양산… 케이블 경량화로 차량 연비 혁신 이끈다

ADI, 차세대 ‘A²B 2.0’ 양산… 케이블 경량화로 차량 연비 혁신 이끈다

0
ADI의 A²B 2.0은 배선 복잡도를 75% 줄이는 경량화 설계를 통해 차량 연비 경쟁력을 높이는 동시에, 고대역폭 이더넷 통합으로 SDV 시대의 프리미엄 오디오 인프라를 선점하고 있다
콩가텍, 엔트리급 에지 AI 시장 겨냥한 ‘conga-TC300’ 모듈 출시

콩가텍, 엔트리급 에지 AI 시장 겨냥한 ‘conga-TC300’ 모듈 출시

0
콩가텍의 conga-TC300은 엔트리급 저전력 모듈에 하이엔드급 NPU 기술을 통합함으로써, 중소규모 산업 현장에서도 비용 효율적으로 고성능 에지 AI 솔루션을 도입할 수 있는 새로운 시장 표준을 제시했다
벡터코리아, 전기차 충전 보안 잡는 ‘CANoe Test Package EV – Security’ 출시

벡터코리아, 전기차 충전 보안 잡는 ‘CANoe Test Package EV – Security’...

0
벡터의 신규 보안 테스트 솔루션은 전기차 충전 시장의 글로벌 표준인 ISO 15118 보안 검증을 자동화함으로써, 제조사의 사이버 보안 리스크 관리 비용을 절감하고 차별화된 충전 서비스 경쟁력을 확보하게 한다.
ST, 저저항 Smart STripFET F8 MOSFET으로 자동차 전력 혁신 선도

ST, 저저항 Smart STripFET F8 MOSFET으로 자동차 전력 혁신 선도

0
ST의 신규 MOSFET 시리즈는 업계 최저 수준의 저항과 소형화된 패키징 기술을 통해 전기차의 에너지 효율을 개선하고 제조 공정의 신뢰성을 높임으로써 차세대 모빌리티 시장의 기술적 우위를 제공한다.
마우저, 진동 데이터를 클라우드로 직결하는 암페놀 ‘VDS130’ 공급

마우저, 진동 데이터를 클라우드로 직결하는 암페놀 ‘VDS130’ 공급

0
마우저가 공급하는 암페놀 VDS130은 기존 아날로그 진동 센서 자산을 유지하면서도 현장 데이터를 MQTT 클라우드로 즉시 연결해 주어, 산업 현장의 디지털 전환 비용과 시간을 획기적으로 줄여준다
- Our Youtube Channel -Engineers Youtube Channel

Latest Articles