#하노버메세

메타의 Llama 3.2 LLM 통해 모든 곳에서 AI 추론 가속화 및 확장 시도하는 Arm

Arm의 머신러닝 기술 부사장 겸 펠로우 이안 브랫(Ian Bratt)은 최근 Arm 블로그 글(링크)을 통해 Arm CPU에서 Meta의 새로운 Llama 3.2 버전 실행 시 클라우드에서 엣지까지의 성능 대폭 향상되었고, 메타와의 협력을 통해 성과를 이어가고 있다고 밝혔다

Arm CPU에서 Meta의 새로운 Llama 3.2 버전 실행 시 클라우드에서 엣지까지의 성능 대폭 향상

Arm이 메타(Meta)가 새롭게 발표한 버전의 라마(Llama) 3.2 LLM 통해 모든 곳에서 AI 추론을 가속화하고 확장하고 있는 것으로 나타났다.

Arm의 머신러닝 기술 부사장 겸 펠로우 이안 브랫(Ian Bratt)은 최근 Arm 블로그 글(링크)을 통해 Arm CPU에서 Meta의 새로운 Llama 3.2 버전 실행 시 클라우드에서 엣지까지의 성능 대폭 향상되었으며, Meta와 Arm간의 협업으로 개인화된 온디바이스 추천이나 일상 작업 자동화 등의 사용 사례에서 더 빠른 혁신이 가능했다고 밝혔다.

그는 “AI가 지속적으로 빠르게 진화함에 따라 새로운 버전의 대규모 언어 모델(LLM)이 정기적으로 등장하고 있다. AI의 잠재력과 기회를 최대한 활용하기 위해서는 클라우드부터 엣지에 이르기까지의 모든 곳에서 실행되는 LLM이 필요하지만, 이로 인해 상당한 컴퓨팅 및 에너지 수요가 발생하고 있다.”고 설명했다.

그리고, 오픈 소스 LLM에 대해 다음과 같이 분석했다.

“에코시스템은 이 문제를 해결하기 위해 힘을 모으고 있으며, 광범위한 AI 추론 워크로드를 대규모로 지원하고 사용자에게 새롭고 가속화된 AI 경험을 더 빠르게 제공하기 위해 보다 새롭고 효율적인 오픈 소스 LLM을 출시하고 있다.”

Arm은 Meta와의 협력을 통해 Arm CPU에서 최신 Llama 3.2 LLM을 지원하여 이러한 과제를 해결하기 위한 오픈 소스 혁신과 Arm 컴퓨팅 플랫폼의 강력한 조합을 보여주고 있다며 메타(Meta)와의 협력에 대한 성과를 강조했다.

이어서 그는 “Arm의 지속적인 투자와 이와 같은 새로운 LLM과의 협력은 에코시스템이 Arm CPU에서 AI를 실행하는 이점을 자동으로 확인할 수 있음을 의미하며, 이를 통해 개발자들이 AI 추론 워크로드를 타깃할 때 선택할 수 있는 플랫폼이 되었다”고 밝혔다.

그에 따르면, Llama 3.2 1B 및 3B와 같이 기본적인 텍스트 기반 생성형 AI 워크로드를 지원하는 소규모의 LLM의 가용성은 대규모 AI 추론을 구현하는데 매우 중요하다.

메타의 Llama 3.2 LLM 통해 모든 곳에서 AI 추론 가속화 및 확장 시도하는 Arm
Llama Stack: a streamlined developer experience (image. meta)

Arm CPU에 최적화된 커널을 통해 Arm 기반의 모바일 디바이스에서 최신 Llama 3.2 3B LLM을 실행하면 처리 속도가 5배, 토큰 생성 속도가 3배 향상되어 생성 단계에서 초당 19.92개의 토큰을 처리할 수 있다. 이는 디바이스에서 AI 워크로드를 처리할 때 지연 시간이 줄어들고 전반적인 사용자 경험이 훨씬 빨라진다는 것을 의미한다.

또한, 엣지에서 더 많은 AI를 처리할수록 클라우드를 오가는 데이터의 전력이 절약되어 에너지 및 비용 절감으로 이어진다.

특히 그는 오픈 소스를 통한 혁신과 협업의 성과를 강조했다.

Llama 3.2와 같은 최신 LLM을 공개적으로 사용할 수 있도록 하는 것은 매우 중요하다고 강조했다.

그는 “오픈 소스 혁신은 놀라울 정도로 빠르게 진행되고 있다.”며, 이전 버전에서 오픈 소스 커뮤니티는 24시간 이내에 최신 LLM을 Arm에서 실행할 수 있었다고 설명했다.

Arm은 Arm Kleidi를 통해 소프트웨어 커뮤니티를 더욱 강화하고 있으며, 전체 AI 기술 스택이 이 최적화된 CPU 성능을 활용할 수 있도록 지원한다. Kleidi는 애플리케이션 개발자가 별도의 통합 없이 모든 AI 프레임워크에서 Arm Cortex 및 Neoverse CPU의 AI 기능 및 성능을 활용할 수 있도록 지원한다.

또한 “최근 Kleidi와 PyTorch의 통합과 현재 진행 중인 ExecuTorch와의 통합으로, Arm은 클라우드에서 엣지에 이르기까지 개발자가 Arm CPU에서 원활한 AI 성능 이점을 누릴 수 있도록 지원하고 있다”고 설명했다. Kleidi와 PyTorch의 통합으로 Llama 3 LLM을 실행할 때 Arm 기반 AWS Graviton 프로세서에서 첫 토큰 생성 시간이 2.5배 향상되었다고도 밝혔다.

Arm은 새로운 LLM과 오픈 소스 커뮤니티 및 Arm의 컴퓨팅 플랫폼을 통해 2025년까지 1,000억 개 이상의 Arm 기반 디바이스가 AI를 지원할 수 있도록 AI의 미래를 구축하고 있는 것이다.

뉴스레터 구독하기

아이씨엔매거진은 AIoT, IIoT 및 피지컬 AI, 디지털트윈을 통한 제조업 디지털전환 애널리틱스를 제공합니다.
테크리포트: 자율제조, 전력전자, 모빌리티, 로보틱스, 스마트농업

SourceARM
AW2026 expo
ACHEMA 2027
전시회 세미나 선물 준비는 기프트랩스
오승모 기자
오승모 기자http://icnweb.kr
기술로 이야기를 만드는 "테크 스토리텔러". 아이씨엔 미래기술센터 수석연구위원이며, 아이씨엔매거진 편집장을 맡고 있습니다. 디지털 전환을 위한 데이터에 기반한 혁신 기술들을 국내 엔지니어들에게 쉽게 전파하는데 노력하는 중입니다.
fastech EtherCAT
as-interface
GiftLabs

Related Articles

Stay Connected

440FansLike
407FollowersFollow
224FollowersFollow
120FollowersFollow
372FollowersFollow
152SubscribersSubscribe
GiftLabs
spot_img
InterPACK
spot_img
SPS 2026
automotion
Power Electronics Mag

Latest Articles

Related Articles

PENGUIN Solutions
글로벌 표준 설계자 서울 집결… 피지컬 AI 로드맵 공개

글로벌 표준 설계자 서울 집결… 피지컬 AI 로드맵 공개

0
글로벌 표준 설계자들이 오는 5월 서울에 모여 피지컬 AI 시대를 위한 산업용 네트워크 전략을 논의한다. PROFINET 포럼을 통해 자율 공장 구현을 위한 고정밀 제어 및 보안 기술의 미래를 직접 확인할 수 있다.
WindEnergy
InterPACK

Related Articles

fastech EtherCAT
as-interface
ADI, 차세대 ‘A²B 2.0’ 양산… 케이블 경량화로 차량 연비 혁신 이끈다

ADI, 차세대 ‘A²B 2.0’ 양산… 케이블 경량화로 차량 연비 혁신 이끈다

0
ADI의 A²B 2.0은 배선 복잡도를 75% 줄이는 경량화 설계를 통해 차량 연비 경쟁력을 높이는 동시에, 고대역폭 이더넷 통합으로 SDV 시대의 프리미엄 오디오 인프라를 선점하고 있다
콩가텍, 엔트리급 에지 AI 시장 겨냥한 ‘conga-TC300’ 모듈 출시

콩가텍, 엔트리급 에지 AI 시장 겨냥한 ‘conga-TC300’ 모듈 출시

0
콩가텍의 conga-TC300은 엔트리급 저전력 모듈에 하이엔드급 NPU 기술을 통합함으로써, 중소규모 산업 현장에서도 비용 효율적으로 고성능 에지 AI 솔루션을 도입할 수 있는 새로운 시장 표준을 제시했다
벡터코리아, 전기차 충전 보안 잡는 ‘CANoe Test Package EV – Security’ 출시

벡터코리아, 전기차 충전 보안 잡는 ‘CANoe Test Package EV – Security’...

0
벡터의 신규 보안 테스트 솔루션은 전기차 충전 시장의 글로벌 표준인 ISO 15118 보안 검증을 자동화함으로써, 제조사의 사이버 보안 리스크 관리 비용을 절감하고 차별화된 충전 서비스 경쟁력을 확보하게 한다.
ST, 저저항 Smart STripFET F8 MOSFET으로 자동차 전력 혁신 선도

ST, 저저항 Smart STripFET F8 MOSFET으로 자동차 전력 혁신 선도

0
ST의 신규 MOSFET 시리즈는 업계 최저 수준의 저항과 소형화된 패키징 기술을 통해 전기차의 에너지 효율을 개선하고 제조 공정의 신뢰성을 높임으로써 차세대 모빌리티 시장의 기술적 우위를 제공한다.
마우저, 진동 데이터를 클라우드로 직결하는 암페놀 ‘VDS130’ 공급

마우저, 진동 데이터를 클라우드로 직결하는 암페놀 ‘VDS130’ 공급

0
마우저가 공급하는 암페놀 VDS130은 기존 아날로그 진동 센서 자산을 유지하면서도 현장 데이터를 MQTT 클라우드로 즉시 연결해 주어, 산업 현장의 디지털 전환 비용과 시간을 획기적으로 줄여준다
피닉스컨택트, 유지보수·보안성 강화한 실외용 스마트 이더넷 박스 출시

피닉스컨택트, 유지보수·보안성 강화한 실외용 스마트 이더넷 박스 출시

0
피닉스컨택트가 실외에서 사용하는 똑똑한 통신 상자인 스마트 이더넷 박스를 업그레이드했다. 가장 큰 장점은 고장이 났을 때 복잡한 광케이블을 다시 연결할 필요 없이 상자 본체만 갈아 끼울 수 있어 복구 시간이 매우 짧다는 것
- Our Youtube Channel -Engineers Youtube Channel

Latest Articles