More

    클라이언트용 Arm CSS, LLM 속도 향상과 시스템 전력 효율성 제공

    3nm 공정 노드 검증 및 생산 준비가 완료된 새로운 Arm CPU 및 GPU 최적화 구현 방안 탑재

    Arm CSS for Client
    Arm의 새로운 Cortex-A725 CPU를 통한 최첨단 효율성과 결합되어 AI 및 모바일 게임 사용 사례를 대상으로 35%의 성능 향상을 제공한다

    [아이씨엔 오승모 기자] Arm은 실리콘 파트너들이 쉽게 빠르게 시장 출시 기간을 단축하고 모바일에서의 선도적인 AI 기반 경험을 제공하도록 지원하는 클라이언트용 Arm 컴퓨팅 서브시스템(CSS)을 발표했다.

    Arm은 5월 30일 ‘Arm 모바일 솔루션 발표 온라인 기자 간담회’를 통해 최신 스마트폰부터 모바일 PC, 웨어러블에 이르기까지 다양한 모바일 기기 전반에서 AI 지원 소비자 경험의 기반이 될 최신 모바일 컴퓨팅 전용 IP인 Arm CSS(Compute SubSystems)를 비롯해 원활한 개발자 경험을 위해 사용되는 AI 프레임워크와 통합된 새로운 클라이디(Kleidi) 소프트웨어를 소개했다.

    삼성전자의 새로운 AI 스마트폰인 S24에는 텍스트 뿐만 아니라 사진, 영상, 음성 등 다양한 현식의 콘텐츠를 처리할 수 있는 멀티모달 기능을 제공한다. 다국어 실시간 통역 통화 및 메시지 번역 기능을 온디바이스로 제공한다. 이는 구글이 자체 개발한 LLM인 제미나이의 경량화 모델로 모바일 기기에 최적화된 제미나이 나노(Gemini Nano)에서 구동되는 컨슈머 AI 모델인 갤럭시AI에 의해 수행된다. 삼성전자 뿐만 아니라 오포(Oppo), 비보(Vivo), 샤오미(Xiaomi)와 같은 주요 스마트 기기 OEM 들도 자체 AI 어시스턴스와 LLM(거대언어모델)을 도입해 모바일 혁신을 통해 새로운 사용자 경험을 제공하고자 한다.

    올해 하반기부터 본격적인 출시에 나설 것으로 예상되는 이러한 AI 스마트폰들은 무엇보다 우수한 컴퓨팅 성능과 전력 효율, 보안 기능을 요구하게 된다.

    Arm 코리아 황선욱 사장은 “전력 효율성을 핵심으로 하는 Arm 플랫폼은 AI 시대가 가속화됨에 따라 차세대 컴퓨팅 수요를 위한 기반을 제공하고 있고, 클라이언트용 Arm 컴퓨팅 서브시스템(CSS)은 프리미엄 모바일 경험의 한계를 계속 확장시킬 수 있는 플랫폼 기능의 획기적인 변화를 제공한다.”고 말했다. 또한, 지금이 모바일 산업에 있어서 매우 중요한 시점이라고 밝히고, “AI에 의해 스마트폰이라고 지칭할 때 그 스마트(Smart)가 어떻게 재정의되어야 하는지 보여주고 있다. 이 모든 것이 Arm을 통해 일어나고 있다.”고 강조했다.

    황선욱 사장의 설명에 따르면, AI의 활성화와 함께 고성능 컴퓨팅에 대한 수요가 계속 증가함에 따라 Arm 파운드리 파트너가 주도하는 최첨단 기술은 훨씬 더 성능이 뛰어나고 효율적인 장치에 대한 새로운 가능성을 열고 있다. 컴퓨팅 요구사항은 필요한 응용처에 맞게 제공되어야 하며, 시장 진입 시기 뿐만 아니라 엔지니어 효율성은 AI 시장에서 업계의 혁신을 주도하는 파트너들에게 매우 중요해졌다. AI 시대가 가속화함에 따라 복잡성이 증가하고 컴퓨팅 요구 사항이 기하급수적으로 증가하고 있기 때문이다.

    이에 “SOC 설계자 그리고 OEM 및 소프트웨어 개발자들은 모든 소비자 시장에서 미래 지향적 장치를 사용할 수 있는 유연성과 선택권이 필요하다. 이러한 변화와 요구 사항에 맞춰 Arm은 파트너 및 고객의 의견에 귀를 기울이고 최신 프로세스 노드를 활용하여 온디바이스 AI를 구현하기 위한 솔루션을 발전시키기 위해 노력하고 있다.”고 설명했다.

    클라이언트용 Arm CSS는 플래그십 모바일 시스텝온칩(SoC)를 위한 기본 컴퓨팅 요소를 제공하며, 최신 Armv9 CPU, Immortalis™ GPU, 3nm(나노미터)에서 생산 가능한 CPU 및 GPU용 물리적 구현과 최신 Corelink™ 시스템 메모리 관리 유닛(SMMU)을 특징으로 한다. 또한, 소프트웨어 개발자가 Arm CPU에서 가능한 최고의 성능을 원활하게 이용할 수 있도록 지원하는 Arm 클라우디(Kleidi)를 함께 발표했으며, Arm Kleidi에는 AI 워크로드를 위한 KleidiAI와 컴퓨터 비전 애플리케이션을 위한 KleidiCV가 포함된다.

    Arm 코리아 정춘상 FAE 이사는 “Arm은 armv9을 바탕으로 한 새로운 코어텍스 X CPU와 수준높은 이모탈리스 GPU를 기반으로 클라이언트 CSS를 제공한다. 이를 통해 성능 향상과 빠른 시장 진입을 달성할 수 있을 것으로 기대한다. Arm 기반 위에 구축된 소프트웨어 플랫폼은 많은 분야에서 다른 소프트웨어와 동자하면서 점점 복잡해져 가고 있다. 더불어 시장의 요구사항에 대응하기 위해 지속적으로 변화하고 있다.”고 설명했다.

    Arm Immortalis GPU 성능 요약
    Arm의 새로운 Immortalis GPU는 이전 세대 대비 37% 성능 향상을 제공한다

    Arm은 특히 안드로이드 플랫폼에 심혈을 기울이고 있다. 스마트폰이 현재 개발자의 혁신을 주도하고 있고, 새로운 소비자의 다양한 요구를 충족시켜 가면서 동시에 더 효율적인 성능을 필요로 하고 있기 때문이다. 이에 “클라이언트용 Arm CSS는 프리미엄 모바일 경험의 한계를 계속 확장시킬 수 있는 플랫폼 기능에 획기적인 변화를 제공한다.”고 밝혔다.

    더 많은 컴퓨팅 능력을 필요로 하고 새로운 앱을 계속해서 만들어내고 있기 때문에 새로운 앱들은 물론이고 앱을 위한 소프트웨어 플랫폼 모두에 클라이언트 CSS가 도움이 될 것이라는 것이다. 클라이언트용 Arm CSS는 30% 이상 향상된 컴퓨팅 및 그래픽 성능을 통해 광범위한 AI, 머신러닝 및 컴퓨터 비전(CV) 워크로드를 위한 59%의 더 빠른 AI 추론으로 까다로운 실제 Android 워크로드를 처리하는 가장 빠른 Arm 컴퓨팅 플랫폼이다.

    클라이언트용 CSS의 핵심은 성능과 전력 효율을 극대화하기 위한 Arm의 역대 최고 성능, 효율, 다용도 CPU 클러스터다. 새롭게 출시된 Arm Cortex-X925는 Cortex-X 역사상 전년 대비 가장 높은 성능 향상을 제공한다. 3.8GHz 클럭 속도와 최대 캐시 크기를 기준 하여 최첨단 3nm 공정 노드를 활용할 경우 2023년 스마트폰 플래그십 4nm SoC와 비교했을 때 단일 스레드 성능이 36% 향상되는 엄청난 결과를 얻을 수 있다. AI의 경우, Cortex-X925는 41%의 놀라운 성능 향상을 제공하여 LLM(대규모 언어 모델)과 같은 온디바이스 생성 AI의 응답성을 획기적으로 개선한다.

    현재까지 최고의 성능과 효율성을 갖춘 GPU인 새로운 Arm 이모탈리스-G925 GPU는 광범위한 주요 모바일 게임 애플리케이션에서 37% 더 높은 성능을 제공하며, 여러 AI 및 머신러닝 네트워크에서 측정할 경우 34% 더 높은 성능을 제공한다. Immortalis-G925는 플래그십 스마트폰 시장을 위해 출시된 반면, 확장성이 뛰어난 새로운 GPU 제품군인 Arm Mali™-G725 및 Mali-G625 GPU는 프리미엄 모바일 핸드셋부터 스마트워치 및 XR 웨어러블에 이르기까지 광범위한 소비자 기기 시장을 대상으로 한다.

    Arm은 또한 모바일 개발자들이 클라이언트 CSS에서 최고의 성능을 얻을 수 있도록 모든 소프트웨어 플랫폼에 내장할 수 있는 새로운 클라이디(Kleidi) 라이브러리를 내놓았다. 개발자들이 소비자가 요구하는 혁신을 최고의 성능으로 빠르게 구현할 수 있도록 하기 위함이다.

    정춘상 이사는 “클라이디(Kleidi) 라이브러리는 Arm에서 제공하는 CSS의 성능을 최대한 끌어내기 위해서 어떤 소프트웨어 플랫폼에도 인식될 수 있도록 설계되었다. 클라이디 라이브러리에는 인공지능을 위한 클라이디AI(KleidiAI)와 컴퓨터 비전을 위한 클라이디CV(KleidiCV)가 있다.”고 밝히고, “클라이디 라이브러리는 AI나 컴퓨터 비전이 수행되는 모든 곳에 통합될 수 있도록 설계된 아주 작고 잘 최적화된 커널이다. 이 라이브러리는 어떠한 Arm CPU에서든 최상의 성능을 얻을 수 있게 설계되었다.”고 설명했다.

    현재 기기의 종류가 점점 많아지고 신경망이나 추론 엔진이 다양화되면서 개발자들이 성능을 최적화하는데 어려움을 겪고 있다. 클라이디는 이러한 어려움을 해결할 수 있도록 클라이언트 CSS에 있는 SVE와 같은 최신 armv9 기능에 대해 최상의 성능을 발휘할 수 있도록 설계되었다. 또한 SME와 같은 차세대 CPU 간에 혁신 능력도 미리 대비할 수 있다. 예를들어 클라이디를 X925에서 실행했을 때 최신 라마(Llama) 3 같은 대규모 언어 모델을 실행하는데 기존 대비 2.9배 빠르게 실행할 수 있었다.

    클라이디AI(KleidiAI)는 AI 프레임워크 개발자를 위한 컴퓨팅 커널 세트로, NEON™, SVE2 및 SME2와 같은 주요 Arm 아키텍처 기능을 지원하여 다양한 디바이스에서 Arm CPU에서 설정 가능한 최고의 성능을 원활하게 이용할 수 있도록 한다. KleidiAI는 파이토치(PyTorch), 텐서플로우(Tensorflow), 미디어파이프(MediaPipe) 및 메타 라마 3(Meta Llama 3)와 같은 인기 있는 AI 프레임워크와 통합되며, 이후 Arm이 새롭게 출시할 추가 기술과도 적합하도록 이전 버전과 호환이 가능하다.

    현재 컴퓨터 비전은 기본적으로 AI와 결합되어 있기는 하지만, 카메라 파이프라인이 단순히 신경망 뿐만 아니라 기존 알고리즘을 많이 사용하고 있다. 이러한 알고리즘은 카메라를 구동시키고, 소셜미디어 앱 같은 다양한 앱들을 원활하게 실행시키기 위해서 많은 성능을 요구하게 된다. 클라이디CV(KleidiCV)는 클라이디AI가 다루지 못하는 이러한 부분을 최적화하도록 설계되었다. 특히 클라이디CV는 OpenCV와 통합했을 때, 상당한 성능 향상을 확인할 수 있다.

    OpenCV는 컴퓨터 비전(CV) 워크로드를 개발하고 배포하기 위한 오픈 소스 라이브러리이다. 이제 Arm과의 협력을 통해 안드로이드(Android)에서 사용할 수 있게 됨에 따라 Android 시스템용 CV 애플리케이션을 더 쉽게 개발하고 유지 관리할 수 있게 됐다. 이에 개발자가 AI 및 이미지 처리 알고리즘을 지원하기 위한 고품질 CV 알고리즘을 구축할 수 있는 진입 장벽이 사라지게 됐다.

    정춘상 이사는 “Arm은 올해 OpenCV와 협력해 안드로이드 개발자가 프로젝트의 OpenCV를 좀 더 쉽게 통합하고 클라이디CV의 개선사항을 활용할 수 있도록 지원하고 있다.”고 밝히고, “앞으로 몇 달 혹은 몇 년 동안 더 많은 라이브러리, 더 많은 통합과 성공사례를 볼 수 있을 것으로 예상한다.”고 말했다.

    IO-Link Wireless
    SourceArm
    오승모 기자
    오승모 기자http://icnweb.kr
    기술로 이야기를 만드는 "테크 스토리텔러". 아이씨엔 미래기술센터 수석연구위원이며, 아이씨엔매거진 편집장을 맡고 있습니다. 디지털 전환을 위한 데이터에 기반한 혁신 기술들을 국내 엔지니어들에게 쉽게 전파하는데 노력하는 중입니다.
    K-BATTERY Show
    • hilscher
    ASI

    Join our Newsletter

    Get the latest newsletters on industry innovations.

    FASTECH
    K-BATTERY SHOW 2024

    Related articles

    마우저, IoT 위한 유블럭스 XPLR-IOT-1 익스플로러 키트 공급

    마우저 일렉트로닉스는 유블럭스(u-blox)의 XPLR-IOT-1 익스플로러 키트(Explorer Kit)를 공급한다

    생성 AI의 모든 것.. 2024 국제인공지능산업대전 5월 1일 코엑스 개최

    올해 AI EXPO KOREA 2024에서는 생성 AI 플랫폼과 AI 칩에서부터 데이터센터, 클라우드까지 AI 인프라를 한눈에 확인할 수 있다

    인텔, 세계 최대 뉴로모픽 시스템 ‘할라 포인트(Hala Point)’ 발표

    할라 포인트는 과학 및 엔지니어링 문제 해결, 물류, 스마트 시티 인프라 관리, LLM 및 AI 에이전트와 같은 AI 애플리케이션 위한 실시간 연속 학습을 제공한다

    기자의 추가 기사

    IIoT

    FASTECH
    FASTECH
    FASTECH

    추천 기사

    mobility