2024년 9월 6일

일본 AIST, 수천 개의 엔비디아 H200 GPU 채택으로 AI 슈퍼컴퓨터 구축

ABCI 3.0 프로젝트, 일본 경제산업성이 지원하는 10억 달러 규모의 광범위 이니셔티브 프로젝트

[아이씨엔 오승모 기자] AI 컴퓨팅 기술 분야의 선두주자인 엔비디아(nvidia)가 일본 산업기술총합연구소(AIST)의 ABCI 3.0 슈퍼컴퓨터에 수천 개의 엔비디아(NVIDIA) H200 텐서 코어(Tensor Core) GPU가 통합된다고 밝혔다.

ABCI 3.0은 AI 연구 개발을 발전시키기 위해 설계된 일본의 대규모 개방형 AI 컴퓨팅 인프라의 최신 버전이다. 이번 협력은 AI 역량을 발전시키고 기술 독립성을 강화하려는 일본의 노력을 강조한다.

ABCI 3.0 슈퍼컴퓨터는 카시와에 위치한 일본 AIST 운영 시설에 설치될 예정이다.
ABCI 3.0 슈퍼컴퓨터는 카시와에 위치한 일본 AIST 운영 시설에 설치될 예정이다. (이미지: AIST)

AIST의 이사인 요시오 다나카(Yoshio Tanaka)는 “2018년 8월에 우리는 세계 최초의 대규모 개방형 AI 컴퓨팅 인프라인 ABCI를 출범했다. 지난 몇 년간 ABCI를 관리해 온 경험을 바탕으로 이제 ABCI 3.0으로 업그레이드하게 됐다. 엔비디아와 협력을 통해 ABCI 3.0이 일본 생성형 AI 연구 개발 역량을 더욱 발전시킬 컴퓨팅 인프라로 발전하는 것이 목표다”라고 말했다.

이를 통해 일본의 AI 주권과 연구 개발 역량이 강화될 것으로 기대된다. 아울러 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise, HPE) 크레이(Cray) XD 시스템은 엔비디아 퀀텀-2 인피니밴드(Quantum-2 InfiniBand) 네트워킹을 채택해 우수한 성능과 확장성을 제공할 예정이다.

ABCI 3.0: 일본 AI 연구 개발의 새로운 시대

ABCI 3.0은 AIST와 그 사업 자회사인 AIST 솔루션스, 시스템 통합업체인 HPE가 구축하고 운영한다.

ABCI 3.0 프로젝트는 경제 안전 기금을 통해 컴퓨팅 자원을 강화하기 위한 일본 경제산업성(Ministry of Economy, Trade and Industry, METI)의 지원에 따른 것으로, METI의 10억 달러 규모의 광범위한 이니셔티브의 일환이다. 여기에는 ABCI 노력과 클라우드 AI 컴퓨팅에 대한 투자를 모두 포함한다.

엔비디아는 지난해 엔비디아 창립자 겸 CEO인 젠슨 황(Jensen Huang)이 기시다 후미오 일본 총리를 비롯한 정재계 인사들을 만나 AI의 미래를 논의한 이후 꾸준히 연구와 교육 분야에서 METI와 긴밀히 협력하고 있다.

젠슨 황은 특히 생성형 AI, 로보틱스, 양자 컴퓨팅 분야에서의 연구 협력, AI 스타트업 투자, AI에 대한 제품 지원, 훈련, 교육을 제공하기로 약속했다. 그는 가장 연산 집약적인 AI 작업을 처리하도록 설계된 차세대 데이터 센터인 ‘AI 팩토리’가 방대한 양의 데이터를 지능화하는 데 매우 중요하다고 강조했다.

초고밀도 데이터 센터와 에너지 효율적인 설계를 갖춘 ABCI는 AI와 빅데이터 애플리케이션 개발을 위한 강력한 인프라를 제공한다. 이 시스템은 올해 말까지 가동돼 최첨단 AI 연구와 개발 자원을 제공할 것이며, 도쿄 인근 카시와(Kashiwa)에 들어설 예정이다.

엔비디아 H200은 초당 4.8테라바이트(TB/s)의 속도로 140기가바이트(GB) 이상의 HBM3e 메모리를 제공하는 최초의 GPU이다. H200의 더 크고 빠른 메모리는 생성형 AI와 거대 언어 모델(large language model, LLM)을 가속화하는 동시에 더 나은 에너지 효율과 낮은 총소유비용으로 HPC 워크로드를 위한 과학 컴퓨팅을 발전시킨다.

엔비디아는 “엔비디아 H200 GPU는 LLM 토큰 생성과 같은 AI 워크로드에 대해 ABCI의 이전 세대 아키텍처보다 에너지 효율이 15배 더 높다.”고 강조했다.

네트워킹 장치가 데이터에 대한 연산을 수행해 CPU의 작업을 분산(offloading)시키는 인-네트워크 컴퓨팅(In-Network Computing)과 고급 엔비디아 퀀텀-2 인피니밴드의 통합은 집약적인 AI 워크로드와 방대한 데이터 세트를 처리하는 데 필수적인 고효율, 고속, 저지연 통신을 보장한다. ABCI는 세계 최고 수준의 컴퓨팅과 데이터 처리 능력을 자랑하며 산학관 공동 AI 연구 개발을 가속화하는 플랫폼 역할을 하고 있다.

아이씨엔매거진

IO-Link Wireless
오승모 기자
오승모 기자http://icnweb.kr
기술로 이야기를 만드는 "테크 스토리텔러". 아이씨엔 미래기술센터 수석연구위원이며, 아이씨엔매거진 편집장을 맡고 있습니다. 디지털 전환을 위한 데이터에 기반한 혁신 기술들을 국내 엔지니어들에게 쉽게 전파하는데 노력하는 중입니다.
  • K-BATTERY Show
  • AW2025
  • 파스텍 배너 900
  • hilscher
ASI

Join our Newsletter

Get the latest newsletters on industry innovations.

AW2025
오토모션
K-BATTERY SHOW 2024

Related articles

키사이트, 엔비디아 6G 리서치 클라우드 플랫폼에서 AI 연구 협업

키사이트가 엔비디아 6G 리서치 클라우드 플랫폼 솔루션 파트너로 선정됐다

엔비디아, NVIDIA 스펙트럼-X 이더넷 네트워킹 플랫폼 출시 일정 발표

엔비디아는 NVIDIA Spectrum™-X 이더넷 네트워킹 플랫폼 출시 일정을 발표했다

엔비디아, 차세대 산업혁명 이끌 데이터센터인 AI 팩토리 위한 블랙웰 플랫폼 발표 

엔비디아(NVIDIA)는 세계 최고의 컴퓨터 제조업체들과 협력해 차세대 생성형 AI 혁신을 주도할 혁신적인 데이터센터인 AI팩토리(AI Factory) 구축에 나선다고 밝혔다

기자의 추가 기사

IIoT

오토모션
K-BATTERY SHOW 2024
K-BATTERY SHOW 2024

추천 기사

mobility