월요일, 4월 14, 2025

[기고] AI 데이터센터 전력 공급 방안.. 48V 통합 핫 스왑(eFuse)

AI Datacenter

.

글_ 크시티즈 카트리(Kshitiz Khatri), 텍사스인스트루먼트(Texas Instruments)

고성능 컴퓨팅과 인공지능이 계속 성장함에 따라 데이터센터에는 최신 중앙 처리 장치, GPU(그래픽 처리 장치) 및 하드웨어 가속기를 지원하기 위해 전력 밀도가 높고 효율적인 솔루션이 필요하다. 처리 수요를 감당하기 위해 전력 밀도를 높이고 48V 전력 아키텍처로 전환해야 할 필요성으로 인해 새로운 과제가 발생한다. 특히 안정성, 효율성 및 확장성을 유지하면서 6kW 이상의 전력 레벨을 관리해야 한다.

전력 요구 사항이 증가하면 솔루션 크기가 커지고, 설계가 복잡해지며, 장애 감지 및 보호의 비효율성이 높아지는 경우가 많다. 또한 안전한 작동과 최소한의 전력 손실을 보장하면서 높은 전류를 관리하는 것도 중요한 문제이다. FET(개별 전계 효과 트랜지스터)와 결합된 기존의 핫 스왑 컨트롤러는 고전력 애플리케이션에서 상당한 한계에 직면하게 된다.

이러한 과제를 해결하기 위해 전원 경로 보호를 지원하는 TI의 48V 핫 스왑 eFuse 장치는 데이터 센터 애플리케이션을 위한 안정적이고 컴팩트한 솔루션으로 설계된다. 전류 모니터링을 위해 외부 감지 저항기와 전류 감지 증폭기가 필요한 접근 방식과 달리, TPS1689 및 TPS1685는 두 기능이 통합되어 설계가 간단하고 솔루션 크기가 50%까지 줄어들었기 때문에 높은 전력 수준을 지원할 수 있는 원활한 확장성을 구현할 수 있다.

TPS1689의 차별화된 기능으로는 블랭킹 타이머가 있으며, 시스템이 피크 부하 전류와 실제 오류 상태를 구분할 수 있도록 하여 잘못된 트립을 방지한다. 이 기능은 시스템 안정성을 향상하고 불필요한 셧다운을 방지한다. 전류 처리량을 높이기 위한 스태킹 기능도 지원하므로 고전력 애플리케이션에서 여러 장치를 함께 사용할 수 있다.

오류 로깅을 위한 통합 블랙박스, 보장된 FET 안전 작동 영역, 능동 전류 공유 및 상태 모니터링으로 시스템 복원력을 더욱 강화한다. 업계 표준의 공통 풋프린트로 제공되는 TPS1689는 안정적인 작동을 보장하는 전원 관리 솔루션을 제공한다.

서버 보호 및 성능 향상

블랭킹 타이머는 시스템 보호와 성능 최적화 사이의 균형을 유지하여 엔터프라이즈 서버 시스템에서 이점을 제공한다. 그림 1에서 볼 수 있듯이 이 기능을 사용하면 회로 차단기를 트리거하지 않고도 단기간의 과도 과부하의 패스스루가 가능하므로 AI, GPU 및 프로세서 집약적인 애플리케이션에서 흔히 발생하는 일시적인 고진폭 부하 펄스가 시스템을 중단시키지 않는다. 그러나 eFuse는 과전류가 지속되는 경우 즉시 회로를 차단한다.

그 밖의 장점은 다음과 같다:

  • 비용 최적화. 블랭킹 타이머는 특대형 PSU(전원 공급 장치)의 필요성을 최소화하고 병렬 구성에 필요한 eFuse의 수를 줄인다. 따라서 안정적인 작동을 유지하면서 자재 명세서 비용을 크게 절감할 수 있다.
  • 전력 밀도 개선. 고전류 운반 부품의 수와 크기를 줄임으로써 시스템을 더 컴팩트하게 설계하여 귀중한 PCB(인쇄 회로 보드) 공간을 확보하고 열 관리를 개선할 수 있다.
  • 유연성 및 사용자 지정. 설계자는 프로그래밍 가능한 오류 간격으로 특정 과도 프로파일에 맞게 시스템 응답을 미세 조정하여 고유한 워크로드에 맞게 성능을 최적화할 수 있다.
그림 1. 사용자 정의 블랭킹 후 과전류 응답
그림 1. 사용자 정의 블랭킹 후 과전류 응답(회로 차단기)

최대 과도 부하(일반적으로 1.7배)를 고려하지 않고 과전류 보호 임계값을 열 설계 전류의 1.1배로 설정할 수 있다. 이 접근 방식을 이용하면 PSU가 피크 과도 전류를 지원해야 하는 기존 설계에 비해 PSU의 크기와 비용이 줄어든다. 이러한 이점으로 인해 블랭킹 타이머는 고성능 서버 시스템의 핵심 기능으로 자리잡게 된다.

고급 스태킹 및 전류 공유 솔루션

AI 기반 프로세서와 서버의 전력 수요가 증가함에 따라 효율적인 전력 분배 시스템이 필요하며, 스마트 eFuse가 중요한 역할을 한다. 그림 2에서 볼 수 있듯이 기존의 병렬 작동 방식은 드레인-소스 온 저항(RDS(on)), PCB 트레이스 저항 및 비교기 임계값의 불일치로 인해 상당한 문제를 야기한다. 이러한 불일치로 인해 eFuse 간에 전류 공유가 고르지 않게 되고(일부 eFuse가 다른 eFuse보다 더 많은 전류를 운반함), 전체 시스템 전류가 트립 임계값 미만인 경우에도 개별 eFuse가 조기 트립되는 경우가 종종 발생한다. 잘못된 트립은 불필요한 시스템 다운타임, 안정성 저하, 운영 비효율성 증가로 이어질 수 있다.

이러한 과제를 해결하기 위해 TI는 상호 연결된 IMON 핀을 활용하는 전체 시스템 전류 제한 접근 방식을 eFuse에 도입했다. 이 접근 방식에서는 eFuse 하나를 전체 시스템 전류를 모니터링하는 기본 컨트롤러로 지정한다. 개별 eFuse 전류가 아닌 총 전류에 의존하면 경로 저항 불일치로 인한 부정확성을 방지하고 필요한 경우에만 시스템이 작동하도록 하여 작동 안정성을 향상할 수 있다.

더 높은 전류 부하를 지원할 수 있는 eFuse 병렬 스태킹
그림 2. 더 높은 전류 부하를 지원할 수 있는 eFuse 병렬 스태킹

능동 전류 공유 기술은 FET의 RDS(on)를 동적으로 조정하고 eFuse 간에 균형 잡힌 전류 공유를 달성하여 효율적인 전력 분배를 돕는다. 하나의 eFuse가 불균형하게 높은 전류를 전달하는 경우 RDS(on)를 높이면 모든 장치에 전류가 약간 더 균등하게 재분배된다. 이렇게 동적으로 조절하면 개별 eFuse의 열 응력을 최소화하여 장기간에 걸쳐 시스템 안정성이 향상된다.

과전류 보호 임계값 근처에서 능동 전류 공유가 발생하도록 하면 더 낮은 전류에서 불필요한 전력 손실을 피하기 위해 필요할 때만 임계값이 작동한다. 시스템은 최적의 임계값에서 능동 전류 공유를 활성화하여 고전류 작동 중에 균일한 열 응력 분배를 달성하여 장기적인 안정성을 개선한다.

효율적이고 안정적인 전원 관리

핫 스왑 eFuse 장치는 전력 밀도 증가, 설계 간소화, 보호 기능 향상, 비용 최적화를 이용하여 고성능 컴퓨팅 애플리케이션의 전원을 더욱 효율적이고 안정적으로 관리한다. 블랭킹 타이머 및 스태킹과 같은 기능이 통합되어 최신 AI 데이터 센터의 증가하는 전력 수요를 지원하기 위한 장치의 적합성이 더욱 강화된다.

제공. TI 코리아 (ti.com/kr)



.
이 기사는 아이씨엔매거진에서 발행되었습니다. 더 많은 기사를 아이씨엔매거진(링크)에서 확인하실 수 있습니다.        
IO-Link Wireless
아이씨엔
아이씨엔http://icnweb.co.kr
아이씨엔매거진 웹 관리자입니다.
ACHEMA 2027
  • 파스텍 배너 900
  • hilscher
ASI

Join our Newsletter

Get the latest newsletters on industry innovations.

오토모션
Hannover messe

Related articles

“AI가 제조업 생산성 혁신 주도한다”.. 팀뷰어 AI 기회 보고서

제조업의 78% 의사결정자가 주 1회 이상 AI를 활용하며 생산성 향상을 도모하고 있으나, 기술 숙련도는 여전히 낮은 수준이며, 반복 업무 자동화 등을 통해 월 10시간의 효율화 효과를 얻고 있다.

[HM25] 글로벌 무역 위기를 산업 혁신으로.. Hannover Messe 2025 개막

올해 하노버메쎄에서는 미국 트럼프의 무역 질서 파괴에 맞서, 글로벌 협력을 통한 산업 혁신에 힘을 모으는 모양새다.

슈나이더 일렉트릭-ETAP, AI 기반 디지털 트윈 기술로 데이터 센터 전력 관리 혁신

슈나이더 일렉트릭과 전력 시스템 설계 및 운영 기술을 선도하는 이탭(ETAP)이 AI를 활용한 공정의 전력 요구 사항을 정확하게 시뮬레이션할 수 있는 디지털 트윈을 공개했다

기자의 추가 기사

IIoT

파스텍 배너 300
파스텍 배너 300

추천 기사

mobility