소프트웨어 프로그래머빌리티 및 확장가능한 AI 추론으로 빠른 혁신 제공
자일링스의 CEO 빅터 펭(Victor Peng)은 개발자가 애플리케이션에 빠른 혁신을 가져올 수 있도록 지원하는 업계 최초의 적응형 컴퓨팅 가속화 플랫폼(ACAP, Adaptive Compute Acceleration Platform) Versal™을 ‘자일링스 개발자 포럼(XDF)’에서 공식 발표했다.
Versal 가속기는 스칼라 프로세싱 엔진, 적응형 하드웨어 엔진 및 지능형 엔진을 최첨단 메모리 및 인터페이스 기술과 결합해, 모든 애플리케이션에 강력한 이종 가속 기능을 제공한다. 하지만 가장 중요한 것은, Versal ACAP의 하드웨어 및 소프트웨어가 소프트웨어 개발자, 데이터 과학자 및 하드웨어 개발자 등에 의해 프로그래밍 및 최적화될 수 있으며, 다양한 툴, 소프트웨어, 라이브러리, IP, 미들웨어 및 프레임워크로 활성화되어, 이를 통해 업계 표준 설계가 가능해 다는 것이다.
TSMC의 7나노미터 핀펫(FinFET) 공정 기술을 기반으로 구축된 Versal 포트폴리오는 소프트웨어 프로그래머빌리티와 도메인별 하드웨어 가속을 결합한 최초의 플랫폼으로, 오늘날의 급격한 혁신 속도를 따라가기 위해 필요한 적응성을 제공한다. 포트폴리오에는 클라우드에서 네트워킹, 무선 통신, 에지 컴퓨팅 및 엔드포인트에 이르는 다양한 시장의 각종 애플리케이션에 확장성 및 AI 추론 기능을 제공하도록 독창적으로 설계된 6가지의 디바이스 시리즈가 포함된다.
자일링스의 CEO인 빅터 펭은 “AI 및 빅데이터의 폭발과 무어의 법칙의 쇠퇴로 업계는 중요한 변곡점에 도달했다. 실리콘의 설계 주기는 더 이상 혁신의 속도를 따라갈 수 없다”고 말했고, “4년에 걸친 개발 기간 끝에 발표된 Versal은 업계 최초의 ACAP이다. 자일링스는 모든 유형의 개발자들이 최적화된 하드웨어와 소프트웨어를 사용해 애플리케이션 전체를 가속화하고, 빠르게 진화하는 기술에 발 맞춰 이들 모두를 즉시 적응시키도록 독보적인 설계를 구현했다. 업계가 필요로 하는 바로 그 순간에 안성맞춤인 플랫폼이다”라고 덧붙였다.
포트폴리오에는 Versal Prime 시리즈, Premium 시리즈 및 HBM 시리즈가 포함되어 있으며, 요구 조건이 가장 까다로운 애플리케이션을 위해 업계 최고의 성능, 커넥티비티, 대역폭 및 통합성을 제공하도록 설계되었다. 포트폴리오에는 AI Core 시리즈, AI Edge 시리즈 및 AI RF 시리즈도 포함되며, 모두 탁월한 AI 엔진 사양을 구비하고 있다. AI 엔진은 다양한 애플리케이션에서 저지연 AI 추론 기능에 대한 새로운 필요성을 해결하고자 고안된 새로운 하드웨어 블록이며, 무선 및 레이더와 같은 애플리케이션을 위해 향상된 DSP 구현을 지원한다. 이는 Versal 적응형 하드웨어 엔진(Versal Adaptable Hardware Engines) 제품군과 밀접하게 연동되어 애플리케이션 전체의 가속화를 가능하게 한다. 즉, 하드웨어와 소프트웨어 모두를 조율해 성능과 효율성을 모두 극대화할 수 있다.
이 포트폴리오는 Versal Prime 시리즈로 데뷔해 다양한 시장에 폭넓게 적용 가능하며, Versal AI Core 시리즈는 업계 선두의 GPU 대비 약 8 배의 AI 추론 성능을 제공한다.
VERSAL AI CORE 시리즈
Versal AI Core 시리즈는 포트폴리오에서 최고의 컴퓨팅 및 최저 지연시간을 제공하므로 탁월한 AI 추론 처리량 및 성능을 구현할 수 있다. 이 시리즈는 클라우드, 네트워킹 및 자율 기술에 최적화되어 업계에서 최고 범주의 AI 및 작업량 가속화 기능을 제공한다. Versal AI Core 시리즈는 128~400개의 AI 엔진을 내장한 5개의 디바이스로 구성된다. 이 시리즈에는 듀얼 코어 Arm Cortex™-A72 애플리케이션 프로세서, 듀얼 코어 Arm Cortex-R5 실시간 프로세서, ECC가 탑재된 256KB의 온칩 메모리, 고정밀 부동소수점에 최적화된 1,900개 이상의 저지연 DSP 엔진이 포함되어 있다. 또한 초당 130Mb 이상의 UltraRAM이 결합된 190만개 이상의 시스템 로직 셀, 초당 최대 34Mb의 블록 RAM, 및 초당 27.5Mb의 분산 RAM 및 신형 Accelerator RAM 블록들로 구성되어, 모든 엔진에서 직접 액세스할 수 있으며, Versal AI 시리즈의 고유 기능으로 커스텀 메모리 계층을 지원한다. 이 시리즈는 또한 PCIe Gen4 8 레인, 16 레인 및 CCIX 호스트 인터페이스, 전력 최적화 32G SerDes, 최대 4개의 통합 DDR4 메모리 컨트롤러, 최대 4개의 멀티 레이트 이더넷 MAC, MIPI D-PHY용 650 고성능 I/O, NAND 및 스토리지 클래스 메모리 인터페이스, LVDS, 추가로 외부 부품 연결을 위한 78개의 멀티 플렉스 I/O 및 3.3V 인터페이싱을 위한 40개 이상의 HD I/O 등이 포함되어 있다. 이 모든 것은 최대 28개의 마스터/슬레이브 포트를 갖춘 최첨단 네트워크온칩(NoC)으로 연결되어 전력 효율성 및 기본 소프트웨어 프로그래밍 기능과 결합된 초당 멀티 테라 비트 대역폭을 저지연 기능과 함께 제공한다. 전체 제품군의 가이드는 현재 이용 가능하다.
VERSAL PRIME 시리즈
Versal Prime 시리즈는 다양한 시장에 걸쳐 폭넓게 적용할 수 있도록 설계되었으며 다양한 작업의 인라인 가속화 및 커넥티비티를 위해 최적화되어 있다. 미드-레인지급의 시리즈는 9개의 디바이스로 구성되며, 각 디바이스는 듀얼 코어 Arm® Cortex-A72 애플리케이션 프로세서, 듀얼 코어 Arm Cortex-R5 실시간 프로세서, ECC 장착 256KB 온칩 메모리, 고정밀 부동소수점에 대해 최적화된 4,000개 이상의 저지연 DSP 엔진으로 구성된다. 또한 200Mb 이상의 UltraRAM과 결합된 2백만개 이상의 시스템 로직 셀, 90Mb 이상의 블록 RAM 및 커스텀 메모리 계층 지원을 위한 30Mb 분산형 RAM 등을 포함한다. 또한 이 시리즈에는 PCIe® Gen4 8레인 및 16레인, CCIX 호스트 인터페이스, 전력 최적화된 초당 32기가비트 SerDes 및 메인스트림 초당 58기가비트 PAM4 SerDes, 최대 6개의 통합 DDR4 메모리 컨트롤러, 최대 4개의 멀티레이트 이더넷 MAC, MIPI D-PHY용 700개의 고성능 I/O, NAND 및 스토리지 클래스 메모리 인터페이스를 위한 고성능 I/O, 및 LVDS, 뿐만 아니라 외부 부품 연결을 위한 78개의 멀티플렉스 I/O 및 3.3V 인터페이스 연결을 위한 40개 이상의 HD I/O가 포함된다. 이 모든 것은 28개의 마스터/슬레이브 포트를 탑재한 최첨단 네트워크온칩(NoC)으로 연결되어 전력 효율성 및 기본 소프트웨어 프로그래밍 기능과 결합된 초당 멀티 테라비트 수준의 대역폭을 저지연 기능과 함께 제공한다.
Versal 포트폴리오는 드라이버, 미들웨어, 라이브러리 및 소프트웨어 프레임워크 지원을 포함해, 광범위한 소프트웨어 스택을 갖춘 개발 환경에서 사용 가능하다. 소프트웨어 프로그래밍 툴에 대한 보다 자세한 내용은 내년에 제공될 예정이다. Versal Prime 시리즈 및 Versal AI Core 시리즈는 2019년 하반기에 출시될 예정이다.
박은주 기자 news2@icnweb.co.kr