오픈AI와 협력해 제타플롭스급 AI 성능 구현
새로운 네트워킹 아키텍처로 모든 워크로드의 성능·보안·효율성 극대화

[아이씨엔 우청 기자] 오라클이 현지시간 10월 16일 미국 라스베이거스에서 열린 ‘오라클 AI 월드’에서 모든 클라우드 워크로드의 성능과 효율성을 극대화하는 신규 네트워킹 기능 ‘오라클 액셀러론(Oracle Acceleron)’과 이를 기반으로 구축된 AI 슈퍼컴퓨터 ‘OCI 제타스케일10(Zettascale10)’을 발표했다.
이번 발표는 클라우드 인프라의 근간이 되는 네트워킹 기술을 근본적으로 혁신하고, 이를 통해 전례 없는 규모의 AI 컴퓨팅 성능을 제공하겠다는 오라클의 강력한 의지를 보여준다. 특히 오픈AI(OpenAI)와의 협력을 통해 구축 중인 슈퍼클러스터 ‘스타게이트(Stargate)’의 기반 기술이라는 점에서 업계의 큰 주목을 받고 있다.
모든 워크로드를 위한 혁신, ‘오라클 액셀러론’
오라클 액셀러론은 10년 이상의 클라우드 네트워킹 혁신을 집약한 OCI의 새로운 네트워크 소프트웨어 및 아키텍처 제품군이다. 고객이 모든 워크로드를 더 빠르고 비용 효율적으로 실행할 수 있도록 설계되었으며, 추가 비용 없이 OCI 고객에게 제공된다.
액셀러론은 ▲전용 네트워크 패브릭 ▲융합형 네트워크 인터페이스 카드(NIC) ▲호스트 수준의 제로 트러스트 패킷 라우팅(ZPR) ▲다중 플레인(multi-planar) 설계 등을 결합해 데이터 이동 경로를 단순화하고 오버헤드를 줄인다. 이를 통해 예측 가능한 고대역폭과 초저지연 연결을 제공하는 것이 핵심이다.
주요 신기능은 다음과 같다.
- 전용 패브릭 네트워크 아키텍처: 기존 3계층 네트워크를 대체해 트래픽을 명확히 분리하고, 예측 가능한 저지연, 고대역폭 연결을 대규모로 구현한다.
- 다중 플레인 네트워킹: 고객 NIC를 여러 독립된 네트워크 플레인에 연결해 한 플레인에 문제가 생겨도 즉시 트래픽을 전환, 네트워크 복원력을 극대화한다.
- 융합형 NIC: 스마트NIC를 고객과 공급자 플레인으로 분할해 격리를 유지하면서도 처리량을 최대 2배까지 향상시킨다. AMD 펜산도 DPU(AMD Pensando DPU)를 기반으로 내년 초 출시될 예정이다.
- 제로 트러스트 패킷 라우팅(ZPR): 첫 패킷부터 최소 권한 원칙을 적용해 호스트 수준에서 보안 정책을 강제, 워크로드 보안을 강화한다.
클레이 마고요크 오라클 CEO는 “오라클은 10년 이상 클라우드 네트워킹 혁신을 주도해왔다”면서, “이번 업데이트로 오라클 액셀러론은 어떠한 클라우드 워크로드에서도 성능, 확장성, 보안성을 모두 갖춘 인프라를 제공하게 되었다”고 밝혔다.

제타플롭스 시대 여는 AI 슈퍼컴퓨터, ‘OCI 제타스케일10’
OCI 제타스케일10은 오라클 액셀러론의 강력한 성능을 기반으로 탄생한 클라우드 환경 내 최대 규모의 AI 슈퍼컴퓨터다. 여러 데이터센터에 걸쳐 수십만 개의 엔비디아(NVIDIA) GPU를 연결해 멀티 기가와트급 클러스터를 형성하며, 최대 16 제타플롭스($zettaFLOPS$)에 달하는 전례 없는 최고 성능을 제공한다.
특히 OCI 제타스케일10은 오픈AI와 협력하여 미국 텍사스주 애빌린에 구축 중인 대표 슈퍼클러스터 ‘스타게이트’의 기반 패브릭으로 채택되었다.
피터 호셸레 오픈AI 인프라 및 산업 컴퓨팅 부문 부사장은 “OCI 제타스케일10 네트워크 및 클러스터 패브릭은 스타게이트 사이트에서 최초로 개발 및 배포되었다”고 설명하고, “고도로 확장 가능한 맞춤형 RoCE 설계는 기가와트 규모에서 패브릭 전체 성능을 극대화하면서도 대부분의 전력을 컴퓨팅에 집중시켜 준다”고 밝혔다.
OCI 제타스케일10은 차세대 ‘오라클 액셀러론 RoCE(Oracle Acceleron RoCE)’ 네트워킹 아키텍처를 기반으로 구축됐다. 이 아키텍처는 최신 GPU NIC에 내장된 스위칭 기능을 활용해 각 GPU가 여러 독립된 네트워크 플레인에 동시에 연결되도록 설계됐다. 이를 통해 하나의 네트워크 플레인에 문제가 발생해도 작업 중단이나 비용이 많이 드는 재시작 없이 AI 훈련을 안정적으로 지속할 수 있다.
마헤쉬 티아가라얀 OCI 총괄 부사장은 “고객은 성능 단위당 전력 소비를 줄이면서 높은 안정성을 달성해 가장 큰 규모의 AI 모델을 실제 운영 환경에 구축, 훈련 및 배포할 수 있다”고 강조했다.
오라클은 현재 OCI 제타스케일10 주문을 접수 중이며, 내년 하반기부터 최대 80만 개의 엔비디아 GPU를 탑재한 클러스터를 시작으로 본격적인 서비스를 제공할 계획이다.
이번 발표에는 아리스타 네트웍스, AMD, 엔비디아 등 업계 주요 파트너들의 지지도 이어졌다. 이안 벅 엔비디아 하이퍼스케일 부문 부사장은 “엔비디아 풀스택 AI 인프라를 탑재한 OCI 제타스케일10은 최첨단 AI 연구를 발전시키고 전 세계 조직들이 산업화된 AI로 나아갈 수 있도록 지원하는 컴퓨팅 패브릭을 제공한다”고 말했다.









