엔비디아(CEO 젠슨 황)는 자사 데이터 처리 장치(DPU) 블루필드-2(Bluefield-2)가 테스트를 통해 세계 신기록을 달성했다고 밝혔다. 블루필드 DPU는 서버와 스토리지 간 4,100만 IOPS(초당 입출력 작업)를 초과해 기존 기록보다 4배 이상 증가된 성능을 증명했으며, 이를 통해 신속한 스토리지 액세스가 요구되는 데이터 센터에 가장 빠른 DPU 성능을 제공하게 됐다.
엔비디아의 최근 테스트 결과에 따르면 2개의 블루필드-2 DPU는 4,150만 IOPS를 달성해 현존하는 모든 DPU보다 4배 이상 높은 성능을 보였다.
블루필드-2 DPU는 이번 테스트에서 표준 네트워킹 프로토콜과 오픈 소스 소프트웨어를 사용해 뛰어난 성능을 기록했다. 기본 인터넷 프로토콜 중 하나인 TCP 네트워킹을 통해 스토리지 미디어에 액세스하는 일반적인 방법인 NVMe-oF(NVMe over Fabric)에 대해 4KB의 경우 500만 이상의 IOPS, 512B의 경우 700만부터 2,000만에 달하는 IOPS를 기록했다.
블루필드는 AI, 빅데이터 및 고성능 컴퓨팅(HPC) 애플리케이션을 가속화하기 위해 오늘날 널리 사용되는 RoCE 네트워크 전송 옵션을 사용하며, 이를 통해 훨씬 더 높은 스토리지 성능을 제공한다.
테스트에서 블루필드는 다양한 유형의 스토리지 소프트웨어 라이브러리와 워크로드를 사용하여 실제 스토리지 구성을 시뮬레이션하고 이니시에이터와 타겟으로서의 성능을 모두 극대화했다. 또한 블루필드는 수많은 HPC 및 AI 애플리케이션에서 선호되는 네트워킹 아키텍처인 인피니밴드(InfiniBand)를 통해 빠른 스토리지 연결을 지원한다.
엔비디아가 공개한 블루필드 DPU의 성능에 대한 테스트 결과는 다음과 같다.
- 더 작은 512B I/O 크기로 테스트한 결과 IOPS는 높지만 회선 속도보다 낮은 처리량이 나타났으며, 4KB I/O 크기는 처리량이 높지만 IOPS가 비교적 낮았다.
- 100% 읽기 및 100% 쓰기 워크로드는 유사한 IOPS 및 처리량을 제공하는 반면 50/50 혼합 읽기/쓰기 워크로드는 네트워크 연결의 양방향을 동시에 사용해 더 높은 성능을 생성했다.
- SPDK를 사용하면 커널 공간 소프트웨어보다 성능이 향상되지만 SPDK가 지속적인 폴링(polling)으로 사용자 공간에서 실행되기 때문에 예상되는 동작인 서버 CPU 사용률이 높아진다.
- 최신 리눅스 5.15 커널은 리눅스 커뮤니티에서 정기적으로 추가되는 저장소 개선 사항 덕분에 4.18 커널보다 뛰어난 성능을 달성했다.