2025년 10월 14일, 화요일

엔비디아 블랙웰, ’15배 ROI’로 AI 경제학 새로 썼다

새로운 인퍼런스MAX 벤치마크서 압도적 성능 과시
풀스택 최적화로 추론 비용은 15배 절감

새로운 인퍼런스MAX v1 벤치마크에서 최고 성능·효율성 입증하며 압도적 성과 거둬
엔비디아, 새로운 인퍼런스MAX v1 벤치마크에서 최고 성능·효율성 입증하며 압도적 성과 거둬 (image. 엔비디아)

AI 컴퓨팅 기술의 선두주자 엔비디아가 자사의 차세대 AI 플랫폼 ‘블랙웰(Blackwell)’이 AI 추론의 경제성을 완전히 새로운 차원으로 끌어올렸음을 입증했다. 엔비디아는 10월 13일, 새롭게 발표된 독립 벤치마크 ‘인퍼런스MAX(InferenceMAX) v1’에서 블랙웰 플랫폼이 모든 경쟁자를 압도하는 최고 성능을 기록했다고 밝혔다.

이번 결과는 단순한 성능 지표를 넘어, AI가 실제 가치를 창출하는 ‘추론’ 단계에서 처리량, 효율성, 비용 경쟁력까지 모두 잡았다는 것을 의미한다. 이는 엔비디아의 풀스택(Full-stack) 하드웨어·소프트웨어 공동 설계가 AI 데이터센터의 생산성과 투자수익률(ROI)을 어떻게 극대화하는지를 명확히 보여준다.

’15배 ROI’… 추론의 경제학을 바꾸다

AI가 단발성 답변에서 벗어나 여러 단계에 걸친 복잡한 추론 작업을 수행하게 되면서, AI 추론에 필요한 컴퓨팅 자원과 비용은 기하급수적으로 증가하고 있다. 이러한 상황에서 처음으로 실제 시나리오의 총 컴퓨팅 비용을 측정한 인퍼런스MAX v1 벤치마크의 등장은 시사하는 바가 크다.

결과는 충격적이었다. 엔비디아는 500만 달러(약 68억 원) 규모의 GB200 NVL72 시스템 투자를 통해 7,500만 달러(약 1,027억 원)에 달하는 토큰 수익을 창출할 수 있으며, 이는 무려 15배의 ROI에 해당한다고 밝혔다. 또한, 이전 세대 아키텍처 대비 백만 토큰당 비용을 15배까지 낮췄으며, 전력이 제한된 AI 팩토리 환경에서는 메가와트당 처리량을 10배 높여 더 높은 수익 창출이 가능함을 증명했다.

이안 벅(Ian Buck) 엔비디아 하이퍼스케일 및 고성능 컴퓨팅 부문 부사장은 “추론은 AI가 매일 가치를 창출하는 영역”이라며 “이번 결과는 엔비디아의 풀스택 접근 방식이 고객에게 필요한 성능과 효율성을 제공함을 보여준다”고 말했다.

하드웨어와 소프트웨어의 합작품, 압도적 성능의 비결

블랙웰의 이러한 리더십은 하드웨어와 소프트웨어의 극단적인 공동 설계에서 비롯된다. 엔비디아는 소프트웨어 최적화만으로도 지속적인 성능 향상을 이뤄내고 있다.

최신 소프트웨어 라이브러리인 텐서RT LLM(TensorRT LLM) v1.0은 고급 병렬화 기술과 추측 디코딩(speculative decoding) 같은 기법을 통해 gpt-oss-120b 모델의 처리량을 3배나 향상시켰다. 메타의 라마 3.3 70B와 같은 고밀도 AI 모델에서는 이전 세대인 H200 GPU 대비 GPU당 처리량이 4배 더 높은 것으로 나타났다.

이러한 성능의 기반에는 정확도 손실 없이 효율을 높이는 NVFP4 저정밀도 포맷, 72개의 GPU를 하나처럼 묶는 5세대 NV링크 기술 등 혁신적인 하드웨어 아키텍처가 자리 잡고 있다. 또한, 엔비디아는 오픈AI, 메타 등 선도적인 모델 개발사는 물론, vLLM과 같은 오픈소스 커뮤니티와 긴밀하게 협력하며 개방형 생태계를 통해 공유된 혁신을 가속화하고 있다.

인퍼런스MAX는 비용, 에너지 효율성, 처리량, 반응성 등 다양한 지표 간의 최적의 균형점을 보여주는 파레토 프론티어(Pareto frontier) 접근법을 사용한다. 이는 블랙웰이 특정 시나리오에만 최적화된 것이 아니라, 실제 기업 환경에서 가장 중요한 생산성과 ROI를 극대화하도록 설계되었음을 보여준다.



.
이 기사는 아이씨엔매거진에서 발행되었습니다. 더 많은 기사를 아이씨엔매거진(링크)에서 확인하실 수 있습니다.        

ASI
오승모 기자
오승모 기자http://icnweb.kr
기술로 이야기를 만드는 "테크 스토리텔러". 아이씨엔 미래기술센터 수석연구위원이며, 아이씨엔매거진 편집장을 맡고 있습니다. 디지털 전환을 위한 데이터에 기반한 혁신 기술들을 국내 엔지니어들에게 쉽게 전파하는데 노력하는 중입니다.
ACHEMA 2027
hilscher
ASI

Join our Newsletter

Get the latest newsletters on industry innovations.

fastechEcat

Related articles

AI 시대, 흩어진 데이터가 힘

퓨어스토리지가 온프레미스와 클라우드 데이터를 통합 관리하는 플랫폼 혁신을 통해, 기업이 AI 시대의 데이터 주도권을 확보하도록 지원한다

엔비디아, 로봇의 뇌를 공개하다

엔비디아가 로봇의 ‘뇌(AI 모델)’와 ‘가상 육체(물리 엔진)’ 핵심 기술을 오픈소스로 공개하며 로봇 개발 가속화에 나섰다.

[분석] 오픈AI와 엔비디아의 동맹, AI 시장의 패러다임을 바꾼다

엔비디아는 오픈AI의 새로운 오픈 웨이트 AI 추론 모델인 'gpt-oss-120b'와 'gpt-oss-20b' 공동개발을 발표해, 새로운 파장을 일으키고 있다

기자의 추가 기사

IIoT

오토모션
오토모션
오토모션

추천 기사

mobility