FP8 양자화 및 VRAM 최적화 통해 성능 40% 향상, 90GB 요구 모델을 일반 소비자 환경으로

AI 컴퓨팅 기술 선두주자인 엔비디아(NVIDIA)가 블랙 포레스트 랩스(Black Forest Labs), 컴피UI(ComfyUI)와 협력하여 FLUX.2 이미지 생성 AI 모델을 엔비디아 RTX GPU에 최적화했다고 밝혔다. 비주얼 생성형 AI 모델을 개발하는 블랙 포레스트 랩스가 출시한 첨단 이미지 생성 모델 FLUX.2 제품군은 사진처럼 사실적인 디테일과 깔끔한 글꼴을 유지하며 대규모 작업에서도 일관된 품질을 제공하는 멀티 레퍼런스(multi-reference) 기능을 포함한 새로운 툴과 기능을 제공한다.
FLUX.2의 최첨단 비주얼 인텔리전스
FLUX.2로 생성된 이미지는 최대 4메가픽셀 해상도와 실제와 같은 조명, 물리 효과를 구현하며, 시각적 완성도를 떨어뜨리는 ‘AI 특유의 느낌’을 제거하여 대규모 작업에서도 사진 수준의 품질을 제공한다.
이 모델에는 피사체나 캐릭터의 포즈를 명확하게 지정할 수 있는 다이렉트 포즈 컨트롤(direct pose control) 기능이 추가되었으며, 인포그래픽, UI 화면, 다국어 콘텐츠에서도 깔끔하고 가독성 높은 텍스트를 제공하는 것이 특징이다. 또한 새로운 멀티 레퍼런스 기능을 통해 스타일과 주제가 일관된 최대 6개의 참조 이미지를 선택할 수 있어, 모델의 광범위한 미세 조정이 필요하지 않다.
RTX 최적화: VRAM 절감 및 성능 향상
FLUX.2 모델은 320억 개의 파라미터를 가진 대규모 모델로, 완전히 로드하기 위해서는 90GB의 VRAM이 필요하며, 활성 모델만 로드하는 lowVRAM 모드를 사용하더라도 64GB의 VRAM이 요구되어 일반 소비자용 그래픽 카드로는 효과적인 실행이 불가능한 수준이다.
모델의 접근성을 넓히기 위해 엔비디아와 블랙 포레스트 랩스는 협력하여 FLUX.2 모델을 FP8 양자화했으며, 이는 비교 가능한 품질을 유지하면서도 VRAM 요구사항을 40% 절감시킨다.
엔비디아는 모델 출시와 동시에 FP8 양자화와 RTX GPU 성능 최적화를 지원하여, 모델 구동에 필요한 VRAM을 40% 절감하는 동시에 성능을 40% 향상시키는 성과를 거두었다.
추가적으로, 엔비디아는 컴피UI와 협력하여 웨이트 스트리밍(weight streaming) 기술을 통해 앱의 RAM 오프로드 기능을 개선했다. 사용자는 이 기능을 통해 모델의 일부를 시스템 메모리로 오프로드하여 GPU 사용 메모리를 확장할 수 있으며, 해당 모델은 별도의 소프트웨어 패키지 없이 컴피UI에서 바로 사용 가능하다.























![[그래프] 국회의원 선거 결과 정당별 의석수 (19대-22대) 대한민국 국회의원 선거 결과(정당별 의석 수)](https://i0.wp.com/icnweb.kr/wp-content/uploads/2025/04/main-image-vote-flo-web-2.jpg?resize=324%2C160&ssl=1)







