디지털화와 IoT 사물인터넷의 확장과 함께 인공지능(AI) 처리 시스템의 활성화는 데이터센터에 막대한 압박을 가하고 있다. 특히 실시간 주식 매매 평가를 담당하는 증권사 데이터센터의 경우는 지연시간 없이 실시간으로 대규모 데이터를 정확히 처리해야 하기에 더욱 큰 압박에 시달린다. 그렇다고 무작정 막대한 투자금을 통해 새로운 시스템을 도입하거나, 업그레이드를 수행할 수도 없는 상황이다.
이에 기존 인프라와 네트워크 전반에 걸친 최첨단 컴퓨팅의 대규모 스케일 아웃(Scale-out)을 지원하는 고성능 컴퓨팅 가속기의 출현은 다양한 산업 분야에서 획기적인 혁신으로 다가서기에 충분했다. 시스템 업그레이드를 통한 방법이 아닌, 시스템을 병렬로 확장하는 스케일 아웃을 지원하면서도 체계적인 분산처리와 전력소모의 최적화를 구현하고 있기 때문이다.
적응형 컴퓨팅 부문의 선두주자인 자일링스(Xilinx®)는 SC21 슈퍼컴퓨팅 컨퍼런스에서 대규모로 FPGA를 구축할 수 있는 새로운 표준 기반 API 지원 클러스터링 솔루션과 알베오 U55C(Alveo™ U55C) 데이터센터 가속기 카드를 출시한다고 밝혔다. 알베오 U55C 가속기는 고성능 컴퓨팅(HPC: High Performance Computing) 및 데이터베이스 작업부하를 위해 탁월한 와트 당 성능을 제공하며, 자일링스 HPC 클러스터링 솔루션을 통해 손쉽게 확장이 가능하다.
11월 16일 온라인으로 진행된 기자간담회에서 네이선 창(Nathan Chang) 자일링스 데이터센터그룹 HPC 제품 매니저는 “CPU를 통한 데이터 처리에서의 한계와 전력소모의 증가로 인해 일반적인 HPC 아키텍처는 적정한 와트 당 성능을 제공하는데 어려움을 겪게 될 것”이라고 밝히고, “기존 고객 인프라와 네트워크 전반에 걸친 대규모 스케일 아웃이 가능한 획기적인 HPC 클러스터링 솔루션”이 필요하다고 말했다. 또한 바이티스(Visis) 통합 소프트웨어 플랫폼을 통해 C, C++, 파이썬, P4와 같은 개발언어를 비롯해 텐서플로우(Tensorflow), 카페(Caffe), 파이토치(PyTorch)와 같은 인공지능/머신러닝(AI/ML) 도구에 이르기까지 오늘날 HPC 개발자들이 널리 사용하는 프레임워크 대부분을 지원한다고 설명했다.
HPC(High Performance Computing) 및 빅데이터 작업부하를 위해 특별히 구현된 새로운 알베오 U55C 카드는 자일링스 알베오 가속기 포트폴리오 중 가장 높은 컴퓨팅 밀도와 HBM 용량을 제공하는 가장 강력한 알베오 가속기 카드이다. 또한 대규모 컴퓨팅 작업부하를 처리하는 광범위한 고객들은 새로운 자일링스 RoCE v2 기반 클러스터링 솔루션을 이용해 기존의 데이터센터 인프라 및 네트워크에서 강력한 FPGA 기반 HPC 클러스터링을 구현할 수 있다.
자일링스 데이터센터 그룹 수석 부사장 겸 총괄 매니저인 살릴 라제(Salil Raje)는 “HPC 작업부하를 위해 이전보다 훨씬 더 간편하고, 효율적이며, 강력한 알베오 컴퓨팅 성능을 확장했다.”고 전했다. 알베오 카드와 같이 아키텍처 측면에서 FPGA를 사용하는 가속기는 많은 컴퓨팅 집약적 작업부하에서 최저 비용으로 최고 성능을 제공한다는 것. 또한 고객의 기존 인프라와 네트워크를 사용하여 알베오 HPC 클러스터를 생성할 수 있는 표준 기반 방법론을 도입함으로써 이러한 주요 이점들을 모든 데이터센터의 대규모 확장에 활용할 수 있다.
이번에 새롭게 출시하는 알베오 U55C 카드는 오늘날 HPC 작업부하에 필요한 많은 주요 기능을 갖추고 있다. 더 많은 데이터 파이프라인의 병렬화, 탁월한 메모리 관리, 파이프라인 전반에 걸쳐 최적화된 데이터 이동은 물론, 알베오 포트폴리오 중 가장 뛰어난 와트 당 성능을 제공한다.
알베오 U55C 카드는 낮은 150W의 최대 전력으로 단일 슬롯 FHHL(Full Height, Half Length) 폼팩터로 구현되었다. 이전 제품인 듀얼 슬롯 알베오 U280 카드 대비 두 배에 이르는 16GB HBM2와 탁월한 컴퓨팅 밀도를 제공한다. U55C는 고밀도 알베오 가속기 기반 클러스터를 생성할 수 있도록 더 작은 폼팩터로 더욱 뛰어난 컴퓨팅 성능을 지원한다. 이는 빅데이터 분석 및 AI 애플리케이션과 같이 확장이 필요한 빅 컴퓨팅과 고밀도 스트리밍 데이터 및 높은 IO가 수반되는 수학 문제를 해결할 수 있다.
네이선 창(Nathan Chang) 자일링스 HPC 매니저는 “소프트웨어 개발자 및 데이터 과학자는 바이티스 플랫폼을 활용하여 애플리케이션 및 클러스터의 하이-레벨 프로그래밍 기능으로 알베오와 적응형 컴퓨팅의 이점을 활용할 수 있다. 자일링스는 하드웨어 전문지식이 없는 소프트웨어 개발자와 데이터 과학자들이 적응형 컴퓨팅에 보다 쉽게 접근할 수 있도록 바이티스 개발 플랫폼과 툴 플로우에 상당한 투자를 진행했다.”면서, “기존 데이터센터 내의 주요 HPC 작업부하를 쉽게 가속화할 수 있도록 지원한다.”고 강조했다.