Catapult AI NN, 소프트웨어 엔지니어가 AI 신경망(Neural Nets)을 합성할 수 있는 포괄적인 솔루션 제공
[아이씨엔 오윤경 기자] 지멘스 디지털 인더스트리 소프트웨어, 지멘스 EDA 사업부는 애플리케이션별 집적 회로(ASIC) 및 시스템 온 칩(SoC)에서 신경망 가속기의 상위수준합성(HLS) 솔루션인 캐터펄트 AI NN(Catapult™ AI NN)을 발표했다고 밝혔다.
지멘스 EDA의 Catapult AI NN은 AI 프레임워크에서 신경망 기술(neural network description)에서 시작하여 C++로 변환하고, 이를 반도체칩 설계의 프로그램 언어인 베릴로그(Verilog) 또는 VHDL의 RTL(register transfer level) 가속기로 합성하여 실리콘에서 전력, 성능 및 면적(PPA)에 최적화된 하드웨어 설계를 변환 및 최적화시켜 구현할 수 있도록 지원하는 솔루션이다.
Catapult AI NN은 머신러닝 하드웨어 가속을 위한 오픈 소스 패키지인 hls4ml과 상위수준합성(HLS)을 위한 Siemens의 Catapult™ HLS 소프트웨어를 결합시켰다. Catapult AI NN은 미국 에너지부 산하 연구소(U.S. Department of Energy Laboratory)인 페르미연구소(Fermilab) 및 기타 hls4ml의 주요 기여자들과 긴밀히 협력하여 개발되었으며, 맞춤형 실리콘의 전력, 성능 및 면적에 대한 머신 러닝 가속기 설계의 고유한 요구 사항을 해결한다.
지멘스 디지털 인더스트리 소프트웨어의 상위수준설계, 검증 및 전력(High-Level Design, Verification and Power) 부문 부사장 겸 총괄 매니저인 모 모바헤드(Mo Movahed)는 “과학자와 AI 전문가가 신경망 모델 설계와 같은 산업 표준 AI 프레임워크를 활용하고 이러한 모델을 전력, 성능 및 면적(PPA)에 최적화된 하드웨어 설계를 위해 원활하게 합성할 수 있도록 지원함으로써 AI 및 머신러닝 소프트웨어 엔지니어에게 완전히 새로운 가능성의 영역을 개척하고 있다.”며, “새로운 Catapult AI NN 솔루션을 통해 개발자는 소프트웨어 개발 과정에서 최적의 PPA를 위한 신경망 모델을 자동화하고 동시에 구현할 수 있어 AI 개발의 효율성과 혁신의 새로운 시대를 열 수 있다.”고 말했다.
AI의 실행시간 및 머신 러닝 작업이 기존 데이터센터는 물론, 소비자 가전부터 의료 기기까지 모든 분야로 이전됨에 따라 전력 소비를 최소화하고 비용을 절감하며 최종 제품의 차별화를 극대화하기 위한 ‘적절한 크기의’ AI 하드웨어에 대한 요구가 빠르게 증가하고 있다. 그러나 대부분의 머신 러닝 전문가들은 합성 가능한 C++, Verilog 또는 VHDL보다는 텐서플로우(TensorFlow), 파이토치(PyTorch), 케라스(Keras)와 같은 반도체칩 설계 프로그램 언어 도구로 작업하는 것이 더 익숙하다. AI 전문가가 적절한 크기의 ASIC 또는 SoC 구현으로 머신 러닝 애플리케이션을 가속화할 수 있는 간편한 방법이 지금까지는 없었다.
머신 러닝 하드웨어 가속을 위한 오픈 소스 패키지인 hls4ml를 사용하면, 텐서플로우와 파이토치, 케라스 등과 같은 AI 프레임워크에 기술된 신경망에서 C++를 생성하여 이러한 간극을 매울 수 있다. 그런 다음 C++를 FPGA, ASIC 또는 SoC 구현을 위해 배포할 수 있다.
Catapult AI NN은 hls4ml의 기능을 ASIC 및 SoC 설계로 확장한다. 여기에는 ASIC 설계에 맞게 조정된 특별한 C++ 머신 러닝 함수의 전용 라이브러리가 포함되어 있다. 설계자는 이러한 함수를 사용하여 C++ 코드로 구현함에 있어 지연 시간 및 리소스 절충을 통해 PPA를 최적화할 수 있다. 또한 설계자는 이제 다양한 신경망 설계의 영향을 평가하고 하드웨어에 가장 적합한 신경망 구조를 결정할 수 있다.
한편, Catapult AI NN에 대한 자세한 내용은 https://eda.sw.siemens.com/en-US/ic/catapult-high-level-synthesis/ 에서 확인할 수 있다.