토요일, 4월 26, 2025

AI 데이터센터의 도전과 혁신, “키사이트 ‘KAI 아키텍처’가 해법”

GPU 클러스터 효율성·고속 인터커넥트 한계 돌파…
실제 워크로드 검증으로 AI 인프라 신뢰성 확보

김도호 키사이트코리아 차장
키사이트 코리아 김도호 차장은 AI 학습이 실패하는 이유중에서 생각보다 많은 부분이 네트워크 최적화에서 발생한다고 소개했다. (image. 아이씨엔 미래기술센터)

[아이씨엔 오승모 기자] 급증하는 AI 연산 수요 속에서 데이터센터 운영사들은 GPU 클러스터 간 통신 지연1.6T급 초고속 인터커넥트 신뢰성 부족에너지 효율성 저하라는 삼중고에 직면해 있으며, 키사이트의 KAI 아키텍처는 이러한 문제들을 시스템 차원에서 진단·해결하는 통합 플랫폼으로 주목받고 있다.

메타와 구글을 비롯한 선두 기업들은 이미 AI 학습 효율을 높이기 위해 모델 병렬화(Model Parallelism) 전략을 도입했지만, 네트워크 토폴로지와의 불일치로 인해 GPU 활용도가 40% 미만으로 떨어지는 경우가 빈번했는데, 키사이트의 KAI 데이터센터 빌더는 실제 LLM(대형 언어 모델) 학습 패턴을 시뮬레이션해 최적의 네트워크 구성을 제안함으로써 이 문제를 해결한다.

키사이트 코리아 김도호 차장은 “최근 AI 트렌드인 AI 애플리케이션의 트레이닝 학습에서 실제 GPU가 데이터를 처리함에 있어 어려움이 GPU간의 통신, 서버간의 통신에서 발생하는 네트워크 이슈가 문제로 확인되고 있다. 이러한 네트워크 이슈가 GPU의 효율성을 떨어뜨리고 대기시간을 늘리는데 큰 영향을 준다.”고 밝혔다. “점점 복잡해져 가는 AI 데이터센터 상에서의 설비와 디바이스간의 네트워크가 GPU의 성능과 효율을 결정하기 때문에, 이러한 것들을 효율화하고 최적화는 것이 필요하다. KAI 데이터센터 빌더는 전체 AI 데이터센터를 효율적으로 운영할 수 있도록 애뮬레이션 할 수 있는 플랫폼이다.”고 말했다.

 KAI 데이터센터 빌더
KAI 데이터센터 빌더 (image. 키사이트)

반도체 업계가 1.6T 광 인터커넥트 상용화를 앞두고 있는 가운데, 신호 간섭과 열 관리 문제가 새로운 장벽으로 부상했으며, 키사이트는 DCA-M 샘플링 오실로스코프를 통해 240Gbps/레인의 광 신호 정밀 분석을 지원해 엔지니어들이 생산 현장에서도 초고속 트랜시버의 결함을 신속하게 탐지할 수 있도록 했다.

“단일 부품 검증으로는 AI 클러스터 성능을 보장할 수 없다”는 키사이트의 설명처럼, 마이크로소프트 Azure는 최근 자사 데이터센터에 엔드투엔드 트래픽 에뮬레이션 기술을 도입해 네트워크 병목 현상을 사전에 차단했으며, KAI 아키텍처는 이러한 산업계 움직임에 부합하는 유일한 검증 솔루션으로 평가받고 있다.

키사이트 측은 “AI 인프라의 복잡성이 커질수록 실제 워크로드 재현과 시스템 수준 테스트가 필수적”이라며, “KAI 아키텍처가 AI 데이터센터의 설계부터 운영까지 전 주기적 최적화를 가능하게 할 것”이라고 강조했다.



.
이 기사는 아이씨엔매거진에서 발행되었습니다. 더 많은 기사를 아이씨엔매거진(링크)에서 확인하실 수 있습니다.        

IO-Link Wireless
오승모 기자
오승모 기자http://icnweb.kr
기술로 이야기를 만드는 "테크 스토리텔러". 아이씨엔 미래기술센터 수석연구위원이며, 아이씨엔매거진 편집장을 맡고 있습니다. 디지털 전환을 위한 데이터에 기반한 혁신 기술들을 국내 엔지니어들에게 쉽게 전파하는데 노력하는 중입니다.
ACHEMA 2027
  • 파스텍 배너 900
  • hilscher
ASI

Join our Newsletter

Get the latest newsletters on industry innovations.

파스텍 배너 300

Related articles

슈나이더 일렉트릭, 전력 안정성과 효율성 강화하는 차세대 솔루션 발표

슈나이더 일렉트릭이 고신뢰성·고효율 전력 인프라에 대한 수요에 발맞춰, 차세대 전력 솔루션으로 산업 현장의 지속 가능성과 디지털 전환을 가속화한다

[기고] μModule 레귤레이터의 출력 커패시턴스를 최대 50% 줄이는 정밀 AVP 제어 기술

이 기고글은 μModule® 레귤레이터에 적용된 정확한 직렬 방식의 능동 전압 포지셔닝(active voltage positioning, AVP) 구현 방법을 소개한다.

소프트웨어로 이루어지는 제조 혁신 – 보쉬의 디지털 제조 전략

독일 울름에 위치한 보쉬 렉스로스의 모델 팩토리는 개방형 표준으로 모범적인 제조 프로세스를 구축했다.

기자의 추가 기사

IIoT

오토모션
오토모션
오토모션

추천 기사

mobility