AMD 인스팅트 MI355X GPU 탑재
제타스케일 AI 클러스터
대규모 AI 훈련 및 추론 지원
오라클과 AMD가 오라클 클라우드 인프라스트럭처(OCI)에 AMD 인스팅트 MI355X GPU를 탑재한 AI 슈퍼컴퓨터를 제공한다고 밝혔다. 오라클은 하이퍼스케일 클라우드 기업 중 최초로 MI355X GPU 기반 제타스케일 AI 클러스터를 도입해, 최대 131,072개의 GPU를 활용한 대규모 AI 구축, 훈련, 추론을 지원한다.
AMD 인스팅트 MI355X GPU는 전 세대 대비 2배 이상의 가성비와 3배에 달하는 컴퓨팅 성능, 50% 향상된 고대역폭 메모리를 제공한다. 또한, 4비트 부동 소수점(FP4) 지원, 고밀도 수냉식 설계, 최대 288GB HBM3 메모리, 랙당 64개 GPU 구성 등으로 최신 대규모 AI 모델과 에이전틱 애플리케이션의 고성능 요구를 충족한다.
OCI의 강력한 네트워크 인프라와 AMD 폴라라 AI NIC, 오픈소스 ROCm 소프트웨어 스택은 고객에게 유연한 아키텍처와 효율적인 AI 워크로드 운영 환경을 제공한다. 오라클과 AMD는 이번 협력을 통해 AI 혁신을 가속화하고, 클라우드 기반 AI 인프라의 새로운 표준을 제시할 계획이다.
오라클은 동시에 NVIDIA와의 협력을 통해 세계 최초의 제타스케일 AI 슈퍼컴퓨터를 클라우드에서 공개했다. 이 슈퍼컴퓨터는 100,000개 이상의 NVIDIA GB200 Grace Blackwell GPU와 초고속 인피니밴드(InfiniBand) 네트워크로 가속화되어, AI 성능의 새로운 기준을 제시한다.
오라클 클라우드 인프라스트럭처(OCI) 슈퍼클러스터는 액체 냉각 기반의 에너지 효율적 설계로 전력 소모와 비용을 75%까지 절감하며, 실시간 트릴리언 파라미터 AI 모델의 훈련과 추론을 30배 빠른 성능과 25배 향상된 에너지 효율로 지원한다.
카란 바타(Karan Batta) 오라클 OCI(오라클 클라우드 인프라스트럭처) 선임부사장은 “이 플랫폼은 NVAIE, NeMo, BioNeMo, Omniverse 등 풀스택 소프트웨어와 결합되어, 복잡한 기후 예측, 신약 개발, 디지털 트윈, 자율주행, 공공서비스 등 글로벌 난제 해결에 필요한 초대규모 생성형 AI 모델 개발을 뒷받침한다.”고 강조했다.
그는 또한 “OCI의 ‘AI Anywhere’ 전략을 바탕으로, 전 세계 165개 지역에서 공공·프라이빗·분산 클라우드 환경에 AI를 손쉽게 배포할 수 있으며, 데이터와 규제 요구가 복잡한 조직에도 유연하게 대응이 가능하다”고 밝혔다.