마이크로소프트가 검색 환경 혁신을 위해 데이터센터에 Altera Arria® 10 FPGA(field programmable gate array)를 채택함으로써 신경망 알고리즘의 혁신을 달성하고 있는 것으로 나타났다.
알테라(Altera)에 따르면, 마이크로소프트는 Altera Arria® 10 FPGA(field programmable gate array)를 채택함으로써 CNN(convolutional neural network) 알고리즘을 기반으로 한 데이터 센터 가속화로 비약적으로 향상된 와트당 성능을 달성하고 있다. CNN 알고리즘은 이미지 분류, 이미지 인식, 자연 언어 프로세싱에 널리 사용되고 있는 알고리즘이다.

알테라는 “Microsoft의 연구진은 클라우드 기술을 향상시키기 위한 연구를 하고 있는데, Arria 10 개발자 키트와 Arria 10 FPGA 엔지니어링 샘플을 이용함으로써 와트당 40GFLOPS에 이르는 성능을 달성하게 되었다. 이것은 데이터 센터 성능으로서 업계에서 가장 뛰어난 수준이다.”고 밝히고, 또한 “GPGPU를 이용했을 때와 비교해서 이와 같은 FPGA 성능은 CNN 플랫폼으로 전력대 성능비가 3배 이상 더 우수한 것이다. 오픈 소프트웨어 개발 언어인 OpenCL이나 또는 VHDL을 이용해서 Arria 10 FPGA와 이의 IEEE754 하드 부동소수점 DSP(digital signal processing) 블록을 코딩함으로써 이와 같은 성능을 달성하게 되었다.”고 전했다.
마이크로소프트 리서치(Microsoft Research)의 클라이언트 및 클라우드 앱 이사인 Doug Burger는 “우리 연구진은 Arria 10 엔지니어링 샘플을 이용함으로써 CNN 성능과 전력 효율에 있어서 비약적인 향상을 이룰 수 있었다. 이 실리콘에 통합하고 있는 DSP 블록의 정밀 하드 부동소수점 연산이 이와 같은 도약적인 성능 결과를 달성할 수 있었던 한 요인이다”고 말했다. Microsoft의 블로그(http://bit.ly/1MMMzvG)로 들어가면, Burger 이사가 인프라 차원에서 데이터 센터가 직면하고 있는 과제들에 대해서 살펴보고 어떻게 기존의 CPU를 재프로그램가능 FPGA로 교체함으로써 Microsoft가 이와 같은 과제들을 해결할 수 있게 되었는지에 대한 설명을 볼 수 있다.
알테라의 연산 및 스토리지 사업부 이사인 Michael Strickland는 “FPGA는 유연한 데이터 패스를 활용함으로써 컨벌브(convolve)와 풀링(pooling)을 매우 효율적으로 할 수 있으므로 아키텍처 차원에서 신경망 알고리즘에 이용하기에 유리하다. 그럼으로써 많은 OpenCL 커널들이 외부 메모리로 나갈 필요 없이 상호 간에 직접적으로 데이터를 전달할 수 있다. Arria 10은 또 곱셈과 덧셈 둘 다에 대해서 하드 부동소수점을 지원한다는 점이 또 다른 아키텍처적 이점이다. 그럼으로써 이 하드 부동소수점은 기존 FPGA 제품보다 더 많은 여유 로직을 활용할 수 있게 하고 더 빠른 클록 속도를 가능하게 한다”고 말했다.
마이크로소프트는 올 하반기에 완공 예정인 Bing 데이터 센터 서버에 이용하고자 혁신적인 Catapult 보드로 검색을 가속화하기 위해서 알테라의 Stratix V FPGA를 채택한 것으로 알려졌다.
한편, 중국 최대 온라인 검색 엔진 회사인 바이두(Baidu)도 이미 알테라 FPGA를 통해 CNN 알고리즘을 활용중이다. 지난해 9월 알테라는 중국 바이두가 딥 러닝(deep learning) 애플리케이션에 FPGA와 CNN(convolutional neural network) 알고리즘을 이용하는 것에 관해서 협력하고 있다고 밝혔다. 딥 러닝은 더욱 더 정확하고 신속한 온라인 검색이 가능하도록 중요한 역할을 할 것으로 기대되는 기술이다.
아이씨엔 오승모 기자 oseam@icnweb.co.kr
마이크로소프트, 알테라 FPGA로 데이터센터 알고리즘을 혁신하다
뉴스레터 구독하기
아이씨엔매거진은 AIoT, IIoT 및 Digital Twin을 통한 제조업 디지털전환 애널리틱스를 제공합니다.
테크리포트: 스마트제조, 전력전자, 모빌리티, 로보틱스, 스마트농업
[기자칼럼] 클라우드를 넘어 현장으로… 엣지·피지컬·온디바이스 AI, ‘산업 지능화’의 3대 축으로 부상
AI가 클라우드에서 내려오고 있다. 엣지·피지컬·온디바이스 형태로 엣지 하드웨어에 내재화되면서, 실시간성·보안성·물리적 상호작용을 극대화하는 '분산형 인텔리전스' 시대를 선도하고 있다
실라나 세미컨덕터, DSP 통합한 새로운 ADC 제품군 발표… 시스템 효율 극대화
실라나 세미컨덕터가 독자적인 레졸루션엔진 기술을 바탕으로 ADC 제품군에 신호 보정과 데이터 처리가 가능한 DSP를 통합함으로써, 시스템 설계의 복잡성을 낮추고 하드웨어 자원을 효율적으로 사용할 수 있는 기반을 마련했다
엔비디아, 블루필드-4로 AI 스토리지 한계 넘다… ‘에이전틱 AI’ 시대의 서막
AI 컴퓨팅 기술 분야의 선두주자인 엔비디아가 미국 라스베이거스에서 열린 세계 최대 IT·가전 전시회 CES 2026에서 엔비디아 블루필드-4 데이터 프로세서가 엔비디아 추론 컨텍스트 메모리 스토리지 플랫폼을 구현한다
레이저, CES 2026서 ‘Forge AI Dev Workstation’ 공개… AI 개발의 패러다임을...
레이저가 CES 2026에서 클라우드 서버를 거치지 않고 로컬 장비에서 직접 고성능 인공지능 학습과 추론을 수행할 수 있는 워크스테이션과 오픈소스 소프트웨어, 그리고 휴대용 AI 가속기를 발표했다
마우저, 르네사스 RA8T2 모터 제어 MCU 공급… 산업용 고정밀 드라이브 공략
마우저가 산업용 모터 제어용 르네사스의 RA8T2 MCU 신제품을 공급한다. RA8T2 MCU는 듀얼 코어 지원, 대용량 메모리 통합, 다양한 통신 및 보안 기능을 갖춘 고정밀 MCU이다
콩가텍, 인텔 코어 울트라로 ‘외장 가속기 없는 임베디드 AI’ 승부수
콩가텍이 별도 가속기 카드 없이 임베디드 AI 구현 가속하는 인텔 코어 울트라 시리즈 3 프로세서 기반 패스트트랙 COM을 출시했다. 이로써 인텔 코어 울트라 시리즈 3 프로세서 기반의 컴퓨터 온 모듈(COM) 제품군 중 업계 내 가장 폭넓은 포트폴리오를 갖추었다
노르딕, NPU 탑재 nRF54L 시리즈로 초저전력 엣지 AI 시대 연다
노르딕 세미컨덕터가 초소형 IoT 기기에 AI 인텔리전스를 구현할 수 있는 업계 최고 수준의 초저전력 엣지 AI 솔루션을 공개했다. NPU를 통합한 새로운 초저전력, 대용량 메모리 기반 무선 SoC 이다


















![[기자칼럼] 클라우드를 넘어 현장으로… 엣지·피지컬·온디바이스 AI, ‘산업 지능화’의 3대 축으로 부상 [기자칼럼] 클라우드를 넘어 현장으로… 엣지·피지컬·온디바이스 AI, ‘산업 지능화’의 3대 축으로 부상](https://icnweb.kr/wp-content/uploads/2026/01/perplexity-image-Edge-AI-web.png)






![[그래프] 국회의원 선거 결과 정당별 의석수 (19대-22대) 대한민국 국회의원 선거 결과(정당별 의석 수)](https://icnweb.kr/wp-content/uploads/2025/04/main-image-vote-flo-web-2-324x160.jpg)






