클라우드, 온프레미스, 임베디드와 엣지 AI 시스템 포괄하는 광범위한 포트폴리오
컴퓨터 업계 선도 기업들, 엔비디아 그레이스 CPU, 네트워킹과 인프라 탑재한 블랙웰 기반 시스템 공개
AI 컴퓨팅 기술 분야의 선두주자인 엔비디아(NVIDIA; CEO 젠슨 황)는 세계 최고의 컴퓨터 제조업체들과 협력해 차세대 생성형 AI 혁신을 주도할 혁신적인 데이터센터인 AI팩토리(AI Factory) 구축을 위해 기업이 사용할 수 있는 그레이스(Grace) CPU, 엔비디아(NVIDIA) 네트워킹과 인프라를 갖춘 다양한 엔비디아 블랙웰(Blackwell) 플랫폼을 발표했다.
지난 6월 2일 밤 대만에서 열리고 있는 컴퓨텍스(COMPUTEX) 기조연설에서 엔비디아 창립자 겸 CEO 젠슨 황(Jensen Huang)은 애즈락 랙(ASRock Rack), 에이수스(ASUS), 기가바이트(GIGABYTE), 인그라시스(Ingrasys), 인벤텍(Inventec), 페가트론(Pegatron), QCT, 슈퍼마이크로(Supermicro), 위스트론(Wistron), 위윈(Wiwynn)이 엔비디아 GPU와 네트워킹을 사용해 클라우드, 온프레미스, 임베디드와 엣지 AI 시스템을 제공한다고 발표했다.
CEO 젠슨 황은 “차세대 산업 혁명이 시작됐다. 수조 달러 규모의 기존 데이터센터를 가속 컴퓨팅으로 전환하고 새로운 유형의 데이터센터인 AI 팩토리를 구축해 새로운 상품인 인공지능을 생산하기 위해 기업과 국가들이 엔비디아와 협력하고 있다. 서버, 네트워킹, 인프라 제조업체부터 소프트웨어 개발자에 이르기까지 업계 전체가 블랙웰을 통해 모든 분야에서 AI 기반 혁신을 가속화할 준비를 하고 있다”고 말했다.
모든 유형의 애플리케이션에 대응하기 위해 단일 GPU부터 멀티 GPU, x86 기반 프로세서부터 그레이스 기반 프로세서, 공냉식부터 수냉식 기술까지 다양한 제품을 제공할 예정이다.
또한, 다양한 크기와 구성의 시스템 개발 속도를 높이기 위해 엔비디아 MGX™ 모듈형 레퍼런스 디자인 플랫폼은 이제 엔비디아 블랙웰 제품을 지원한다. 여기에는 메인스트림 대규모 언어 모델 추론, 검색 증강 생성과 데이터 처리를 위한 탁월한 성능을 제공하도록 설계된 새로운 엔비디아 GB200 NVL2 플랫폼이 포함된다.
GB200 NVL2는 기업들이 매년 수백억 달러를 지출하는 데이터 분석과 같은 신흥 시장 기회에 적합하게 설계됐다. NV링크(NVLink)®-C2C 인터커넥트와 블랙웰 아키텍처의 전용 압축 해제 엔진이 제공하는 고대역폭 메모리 성능을 활용하면 데이터 처리 속도가 최대 18배 빨라지고, x86 CPU를 사용할 때보다 에너지 효율이 8배 향상된다.
산업 혁신을 가져올 데이터센터인 AI팩토리는 가속 컴퓨팅을 위한 모듈식 레퍼런스 아키텍처를 지향한다.
전 세계 데이터센터의 다양한 가속 컴퓨팅 요구 사항을 충족하기 위해 엔비디아 MGX는 컴퓨터 제조업체에 100가지 이상의 시스템 디자인 구성을 빠르고 비용 효율적으로 구축할 수 있는 레퍼런스 아키텍처를 제공한다.
제조업체는 서버 섀시를 위한 기본 시스템 아키텍처로 시작한 다음 다양한 워크로드를 처리하기 위해 GPU, DPU, CPU를 선택한다. 현재까지 25개 이상의 파트너사에서 90개 이상의 시스템이 출시됐거나 개발 중이며, 이는 작년 6개 파트너사의 14개 시스템에서 증가한 수치다. MGX를 사용하면 개발 비용을 최대 4분의 3까지 절감하고 개발 시간을 최대 3분의 2까지 줄여 6개월까지 단축할 수 있다.
AMD와 인텔(Intel)은 처음으로 자체 CPU 호스트 프로세서 모듈 설계를 제공할 계획으로 MGX 아키텍처를 지원하고 있다. 여기에는 차세대 AMD 튜린(Turin) 플랫폼과 이전에 그래나이트 래피즈(Granite Rapids)라는 코드명으로 더 익숙했던 인텔® 제온(Xeon)® 6 프로세서의 P-코어가 포함된다. 모든 서버 시스템 빌더는 이러한 레퍼런스 디자인을 사용해 개발 시간을 절약하는 동시에 설계와 성능의 일관성을 보장할 수 있다.
엔비디아 최신 플랫폼인 GB200 NVL2 역시 MGX와 블랙웰을 활용한다. 스케일아웃, 단일 노드 설계를 통해 다양한 시스템 구성과 네트워킹 옵션을 지원해 가속 컴퓨팅을 기존 데이터센터 인프라에 원활하게 통합할 수 있다.
GB200 NVL2는 엔비디아 블랙웰 텐서 코어(Tensor Core) GPU, GB200 그레이스 블랙웰 슈퍼칩(Superchip), GB200 NVL72를 포함하는 블랙웰 제품 라인업에 합류했다.
NVIDIA 블랙웰 플랫폼을 통해 AI팩토리 데이터센터를 위한 모든 혁신 기술을 포괄해 수직적이고 수평적인 통합 에코시스템이 구축된다.
엔비디아의 포괄적인 파트너 에코시스템에는 세계 최고의 반도체 제조업체이자 엔비디아 파운드리 파트너인 TSMC를 비롯해 AI 팩토리 구축을 위한 핵심 구성요소를 제공하는 글로벌 전자제품 제조업체가 포함된다. 여기에는 서버 랙, 전원 공급 장치, 냉각 솔루션 등 제조 혁신 기술을 보유한 암페놀(Amphenol), 아시아 바이털 컴포넌트(Asia Vital Components, AVC), 쿨러 마스터(Cooler Master), CPC(Colder Products Company), 댄포스(Danfoss), 델타 일렉트로닉스(Delta Electronics), 라이트온(LITEON) 등의 회사가 포함된다.
그 결과, 전 세계 기업의 요구를 충족하는 새로운 데이터센터 인프라를 신속하게 개발하고 배포할 수 있으며, 선도적인 시스템 제조업체인 델 테크놀로지스(Dell Technologies), 휴렛 팩커드 엔터프라이즈(Hewlett Packard Enterprise, HPE), 레노버(Lenovo)의 서버에서 블랙웰 기술, 엔비디아 퀀텀-2(Quantum-2) 또는 퀀텀-X800 인피니밴드(InfiniBand) 네트워킹, 엔비디아 스펙트럼™-X(Spectrum™-X) 이더넷 네트워킹, 엔비디아 블루필드®-3(BlueField®-3) DPU로 더욱 가속화할 수 있게 됐다.
또한 기업들은 엔비디아 NIM™ 추론 마이크로서비스가 포함된 엔비디아 AI 엔터프라이즈 소프트웨어 플랫폼을 활용해 프로덕션급 생성형 AI 애플리케이션을 제작하고 실행할 수 있다.
“대규모 인텔리전스를 생산하는 곳을 우리는 AI팩토리라 부른다. 우리가 알고 있던 컴퓨팅을 완전히 재창조한 대규모 인프라 기능으로, 이 팩토리로 데이터가 들어가고 토큰(Token)이 나온다. 생산되는 토큰은 모든 종류의 다양한 애플리케이션에서 사용될 수 있다.”
– 젠슨 황, NVIDIA CEO
쿨러 마스터 CEO 앤디 린(Andy Lin)은 “가속 컴퓨팅에 대한 수요가 계속 급증함에 따라 최첨단 가속기를 활용하는 기업을 위한 에너지 표준을 효과적으로 충족하는 솔루션에 대한 수요도 증가하고 있다. 열 관리 솔루션의 선구자인 쿨러 마스터는 고객에게 놀라운 성능을 제공할 수 있는 엔비디아 블랙웰 플랫폼의 잠재력을 최대한 발휘할 수 있도록 돕고 있다”고 말했다.
댄포스 CEO 킴 파우징(Kim Fausing)은 “댄포스의 혁신적인 고성능 퀵 디스커넥트와 유체 동력 설계에 중점을 둔 커플링은 데이터센터의 효율적이고 안정적이며 안전한 운영에 일조하고 있다. 엔비디아 AI 에코시스템의 중요한 일원으로서 환경에 미치는 영향을 최소화하면서 급증하는 AI 수요를 충족할 수 있는 데이터센터를 구현하기 위해 협업하고 있다”고 밝혔다.
슈퍼마이크로 대표 겸 CEO인 찰스 리앙(Charles Liang)은 “슈퍼마이크로의 빌딩 블록 아키텍처와 랙 규모의 수냉식 솔루션은 자사의 엔지니어링 역량과 월 5,000개의 랙을 생산하는 글로벌 생산 능력과 결합해 전 세계 AI 팩토리에 다양한 엔비디아 AI 플랫폼 기반 제품을 신속하게 제공할 수 있게 해준다. 엔비디아 블랙웰 아키텍처 기반의 모든 제품에 최적화된 랙 스케일 디자인의 수냉식 또는 공냉식 고성능 시스템을 통해 고객은 차세대 컴퓨팅에 대한 요구 사항을 충족할 수 있는 놀라운 플랫폼 선택권을 갖게 될 뿐만 아니라 AI의 미래를 향한 큰 도약을 이룰 수 있다”고 말했다.
TSMC CEO C.C. 웨이는 “TSMC는 엔비디아와 긴밀히 협력해 반도체 혁신의 한계를 뛰어넘어 AI 비전을 실현하기 위해 노력하고 있다. TSMC의 업계 최고 반도체 제조 기술은 블랙웰 아키텍처 기반 GPU를 비롯한 엔비디아의 획기적인 GPU를 만드는 데 기여했다”고 밝혔다.
또한, 젠슨 황 CEO는 기조연설에서 대만의 선도 기업들이 AI의 힘을 자사 비즈니스에 활용하기 위해 블랙웰을 빠르게 도입하고 있다고 발표했다.
대만의 대표적인 의료기관인 CGMH(Chang Gung Memorial Hospital)은 엔비디아 블랙웰 컴퓨팅 플랫폼을 사용해 생물의학 연구를 발전시키고, 영상과 언어 애플리케이션을 가속화해 임상 워크플로우를 개선하고, 궁극적으로 환자 치료를 향상시킬 계획이다.
세계 최대 전자제품 제조업체 중 하나인 폭스콘(Foxconn)은 엔비디아 그레이스 블랙웰을 사용해 AI 기반 전기 자동차와 로봇 플랫폼을 위한 스마트 솔루션 플랫폼을 개발하고, 고객에게 보다 개인화된 경험을 제공하기 위한 언어 기반 생성형AI 서비스를 확대할 계획이다.
엔비디아 블랙웰과 MGX 플랫폼에 대한 보다 자세한 내용은 젠슨 황의 컴퓨텍스 기조연설(링크)에서 확인할 수 있다.