수요일, 6월 18, 2025

[기고] AI 데이터센터 전력 공급 방안.. 48V 통합 핫 스왑(eFuse)

AI Datacenter

.

글_ 크시티즈 카트리(Kshitiz Khatri), 텍사스인스트루먼트(Texas Instruments)

고성능 컴퓨팅과 인공지능이 계속 성장함에 따라 데이터센터에는 최신 중앙 처리 장치, GPU(그래픽 처리 장치) 및 하드웨어 가속기를 지원하기 위해 전력 밀도가 높고 효율적인 솔루션이 필요하다. 처리 수요를 감당하기 위해 전력 밀도를 높이고 48V 전력 아키텍처로 전환해야 할 필요성으로 인해 새로운 과제가 발생한다. 특히 안정성, 효율성 및 확장성을 유지하면서 6kW 이상의 전력 레벨을 관리해야 한다.

전력 요구 사항이 증가하면 솔루션 크기가 커지고, 설계가 복잡해지며, 장애 감지 및 보호의 비효율성이 높아지는 경우가 많다. 또한 안전한 작동과 최소한의 전력 손실을 보장하면서 높은 전류를 관리하는 것도 중요한 문제이다. FET(개별 전계 효과 트랜지스터)와 결합된 기존의 핫 스왑 컨트롤러는 고전력 애플리케이션에서 상당한 한계에 직면하게 된다.

이러한 과제를 해결하기 위해 전원 경로 보호를 지원하는 TI의 48V 핫 스왑 eFuse 장치는 데이터 센터 애플리케이션을 위한 안정적이고 컴팩트한 솔루션으로 설계된다. 전류 모니터링을 위해 외부 감지 저항기와 전류 감지 증폭기가 필요한 접근 방식과 달리, TPS1689 및 TPS1685는 두 기능이 통합되어 설계가 간단하고 솔루션 크기가 50%까지 줄어들었기 때문에 높은 전력 수준을 지원할 수 있는 원활한 확장성을 구현할 수 있다.

TPS1689의 차별화된 기능으로는 블랭킹 타이머가 있으며, 시스템이 피크 부하 전류와 실제 오류 상태를 구분할 수 있도록 하여 잘못된 트립을 방지한다. 이 기능은 시스템 안정성을 향상하고 불필요한 셧다운을 방지한다. 전류 처리량을 높이기 위한 스태킹 기능도 지원하므로 고전력 애플리케이션에서 여러 장치를 함께 사용할 수 있다.

오류 로깅을 위한 통합 블랙박스, 보장된 FET 안전 작동 영역, 능동 전류 공유 및 상태 모니터링으로 시스템 복원력을 더욱 강화한다. 업계 표준의 공통 풋프린트로 제공되는 TPS1689는 안정적인 작동을 보장하는 전원 관리 솔루션을 제공한다.

서버 보호 및 성능 향상

블랭킹 타이머는 시스템 보호와 성능 최적화 사이의 균형을 유지하여 엔터프라이즈 서버 시스템에서 이점을 제공한다. 그림 1에서 볼 수 있듯이 이 기능을 사용하면 회로 차단기를 트리거하지 않고도 단기간의 과도 과부하의 패스스루가 가능하므로 AI, GPU 및 프로세서 집약적인 애플리케이션에서 흔히 발생하는 일시적인 고진폭 부하 펄스가 시스템을 중단시키지 않는다. 그러나 eFuse는 과전류가 지속되는 경우 즉시 회로를 차단한다.

그 밖의 장점은 다음과 같다:

  • 비용 최적화. 블랭킹 타이머는 특대형 PSU(전원 공급 장치)의 필요성을 최소화하고 병렬 구성에 필요한 eFuse의 수를 줄인다. 따라서 안정적인 작동을 유지하면서 자재 명세서 비용을 크게 절감할 수 있다.
  • 전력 밀도 개선. 고전류 운반 부품의 수와 크기를 줄임으로써 시스템을 더 컴팩트하게 설계하여 귀중한 PCB(인쇄 회로 보드) 공간을 확보하고 열 관리를 개선할 수 있다.
  • 유연성 및 사용자 지정. 설계자는 프로그래밍 가능한 오류 간격으로 특정 과도 프로파일에 맞게 시스템 응답을 미세 조정하여 고유한 워크로드에 맞게 성능을 최적화할 수 있다.
그림 1. 사용자 정의 블랭킹 후 과전류 응답
그림 1. 사용자 정의 블랭킹 후 과전류 응답(회로 차단기)

최대 과도 부하(일반적으로 1.7배)를 고려하지 않고 과전류 보호 임계값을 열 설계 전류의 1.1배로 설정할 수 있다. 이 접근 방식을 이용하면 PSU가 피크 과도 전류를 지원해야 하는 기존 설계에 비해 PSU의 크기와 비용이 줄어든다. 이러한 이점으로 인해 블랭킹 타이머는 고성능 서버 시스템의 핵심 기능으로 자리잡게 된다.

고급 스태킹 및 전류 공유 솔루션

AI 기반 프로세서와 서버의 전력 수요가 증가함에 따라 효율적인 전력 분배 시스템이 필요하며, 스마트 eFuse가 중요한 역할을 한다. 그림 2에서 볼 수 있듯이 기존의 병렬 작동 방식은 드레인-소스 온 저항(RDS(on)), PCB 트레이스 저항 및 비교기 임계값의 불일치로 인해 상당한 문제를 야기한다. 이러한 불일치로 인해 eFuse 간에 전류 공유가 고르지 않게 되고(일부 eFuse가 다른 eFuse보다 더 많은 전류를 운반함), 전체 시스템 전류가 트립 임계값 미만인 경우에도 개별 eFuse가 조기 트립되는 경우가 종종 발생한다. 잘못된 트립은 불필요한 시스템 다운타임, 안정성 저하, 운영 비효율성 증가로 이어질 수 있다.

이러한 과제를 해결하기 위해 TI는 상호 연결된 IMON 핀을 활용하는 전체 시스템 전류 제한 접근 방식을 eFuse에 도입했다. 이 접근 방식에서는 eFuse 하나를 전체 시스템 전류를 모니터링하는 기본 컨트롤러로 지정한다. 개별 eFuse 전류가 아닌 총 전류에 의존하면 경로 저항 불일치로 인한 부정확성을 방지하고 필요한 경우에만 시스템이 작동하도록 하여 작동 안정성을 향상할 수 있다.

더 높은 전류 부하를 지원할 수 있는 eFuse 병렬 스태킹
그림 2. 더 높은 전류 부하를 지원할 수 있는 eFuse 병렬 스태킹

능동 전류 공유 기술은 FET의 RDS(on)를 동적으로 조정하고 eFuse 간에 균형 잡힌 전류 공유를 달성하여 효율적인 전력 분배를 돕는다. 하나의 eFuse가 불균형하게 높은 전류를 전달하는 경우 RDS(on)를 높이면 모든 장치에 전류가 약간 더 균등하게 재분배된다. 이렇게 동적으로 조절하면 개별 eFuse의 열 응력을 최소화하여 장기간에 걸쳐 시스템 안정성이 향상된다.

과전류 보호 임계값 근처에서 능동 전류 공유가 발생하도록 하면 더 낮은 전류에서 불필요한 전력 손실을 피하기 위해 필요할 때만 임계값이 작동한다. 시스템은 최적의 임계값에서 능동 전류 공유를 활성화하여 고전류 작동 중에 균일한 열 응력 분배를 달성하여 장기적인 안정성을 개선한다.

효율적이고 안정적인 전원 관리

핫 스왑 eFuse 장치는 전력 밀도 증가, 설계 간소화, 보호 기능 향상, 비용 최적화를 이용하여 고성능 컴퓨팅 애플리케이션의 전원을 더욱 효율적이고 안정적으로 관리한다. 블랭킹 타이머 및 스태킹과 같은 기능이 통합되어 최신 AI 데이터 센터의 증가하는 전력 수요를 지원하기 위한 장치의 적합성이 더욱 강화된다.

제공. TI 코리아 (ti.com/kr)



.
이 기사는 아이씨엔매거진에서 발행되었습니다. 더 많은 기사를 아이씨엔매거진(링크)에서 확인하실 수 있습니다.        
ASI
아이씨엔
아이씨엔http://icnweb.co.kr
아이씨엔매거진 웹 관리자입니다.
ACHEMA 2027
  • 파스텍 배너 900
  • hilscher
ASI

Join our Newsletter

Get the latest newsletters on industry innovations.

오토모션
파스텍 배너 300

Related articles

[기고] 머신러닝 성공을 위한 계획

머신러닝 프로젝트는 명확한 목표, 고품질 데이터, 견고한 실험, 자원 활용, 지속적 모니터링으로 PoC에서 실제 적용까지 성공적으로 전환해야 한다.

슈나이더 일렉트릭이 제시하는 지속가능한 미래 비전

슈나이더 일렉트릭 코리아는 50년의 노하우를 담은 제조 혁신을 위한 지속 가능한 미래 비전에 대한 인사이트를 제시했다.

[칼럼]Arm의 새로운 진화와 새로운 정체성 체계: IP에서 AI 시대의 플랫폼으로

르네 하스 Arm CEO는 "Arm은 인프라, 클라이언트, 오토모티브, 그리고 IoT를 위한 엣지 AI 플랫폼 등 모든 핵심 시장에 걸쳐 Arm 컴퓨팅 서브시스템(CSS)을 도입했다."고 밝히고, 이것이 SoC를 설계하는 "유일한 방법"이라고 했다.

기자의 추가 기사

IIoT

파스텍 배너 300
오토모션
오토모션

추천 기사

mobility