2026년 4월 3일, 금요일
식민지역사박물관
B&R

엔비디아와 오픈AI, 로컬 PC에서 구동하는 오픈소스 AI 모델 최적화 협력

엔비디아는 오픈AI와의 협력을 통해 새로운 오픈소스 모델인 'gpt-oss'를 엔비디아 RTX GPU에 최적화하여, 사용자들이 클라우드를 거치지 않고 자신의 PC나 워크스테이션에서 직접 빠르고 효율적인 AI 추론을 실행할 수 있도록 지원한다고 밝혔다.

새로운 gpt-oss 모델,
엔비디아 RTX GPU 기반 AI PC 및 워크스테이션에서 가속화

엔비디아와 오픈AI, 로컬 PC에서 구동하는 오픈소스 AI 모델 최적화 협력
엔비디아, 지포스 RTX·RTX PRO GPU로 로컬에서 오픈AI 신규 오픈 모델 가속화 (image. NVIDIA)

[아이씨엔 오승모 기자] 엔비디아가 오픈AI(OpenAI)와 협력하여 새로운 오픈소스 AI 모델을 로컬 하드웨어에서 가속화한다고 발표했다. 이번 협력은 오픈AI의 신규 오픈소스 모델인 ‘gpt-oss’를 엔비디아 GPU에 최적화하여, 클라우드부터 개인용 PC에 이르기까지 빠르고 스마트한 추론 환경을 구축하는 것을 목표로 한다. 새로운 추론 모델은 웹 검색, 코딩 지원, 심층 연구 등 다양한 에이전틱 AI 애플리케이션을 지원하도록 설계되었다.

오픈AI는 gpt-oss-20b와 gpt-oss-120b 두 가지 모델을 오픈 웨이트(open-weight) 방식으로 출시했다. 이로써 개발자들과 AI 애호가들은 올라마(Ollama), 라마.cpp(llama.cpp) 등 널리 사용되는 도구를 통해 엔비디아 RTX AI PC 및 워크스테이션에서 직접 최적화된 모델을 사용할 수 있게 되었다.

엔비디아 창립자 겸 CEO인 젠슨 황(Jensen Huang)은 “오픈AI는 엔비디아 AI를 기반으로 무엇을 구축할 수 있는지 세상에 보여줬으며, 이제 오픈소스 소프트웨어 분야에서의 혁신을 이끌고 있다”며, “gpt-oss 모델은 전 세계 개발자들이 최첨단 오픈소스 기반 위에 구축할 수 있도록 지원하고, 세계 최대 규모의 AI 컴퓨팅 인프라를 기반으로 미국의 AI 기술 리더십을 강화할 것”이라고 말했다.

대용량 문서 처리와 효율성을 갖춘 gpt-oss 모델

이번에 공개된 gpt-oss 모델은 기술적으로 여러 특징을 갖추고 있다. ‘전문가 혼합(MoE)’ 아키텍처를 활용해 추론 강도를 유연하게 조절할 수 있으며, 복잡한 문제 해결을 위한 ‘사고 사슬(chain-of-thought)’ 기능을 갖추고 있다. 이 모델들은 엔비디아 H100 GPU에서 훈련되었다.

특히 주목할 점은 로컬 추론 환경에서 긴 수준인 최대 131,072 토큰의 컨텍스트 길이를 지원한다는 것이다. 이는 사용자가 대용량 문서를 기반으로 질문하거나 여러 단계에 걸친 복잡한 작업을 지시하는 등 컨텍스트 기반의 추론 능력을 요구하는 웹 검색, 코딩 지원, 문서 이해 등의 작업에 유용하다.

또한, 이 모델들은 엔비디아 RTX에서 지원되는 첫 MXFP4 모델이다. MXFP4는 높은 모델 품질은 유지하면서 다른 정밀도 유형에 비해 적은 시스템 리소스를 사용하여 빠르고 효율적인 성능을 제공하는 데이터 형식이다.

다양한 도구로 손쉬워진 로컬 AI 모델 실행

개발자와 사용자는 다양한 도구를 활용해 자신의 RTX AI PC에서 gpt-oss 모델을 경험할 수 있다.

가장 쉬운 방법 중 하나는 새로운 ‘올라마(Ollama)’ 앱을 사용하는 것이다. 24GB 이상의 VRAM을 갖춘 GPU가 탑재된 RTX AI PC에서 사용 가능하며, 별도의 설정 없이 드롭다운 메뉴에서 모델을 선택하는 것만으로 간편하게 대화를 시작할 수 있다. 올라마의 신규 앱은 PDF나 텍스트 파일을 채팅에 바로 지원하는 기능, 이미지 프롬프트를 사용하는 멀티모달 지원 등의 기능을 포함한다.

이 외에도 최소 16GB VRAM이 장착된 GPU 사용자들은 라마.cpp(llama.cpp) 프레임워크를 통해 모델을 사용해 볼 수 있다. 윈도우 개발자들은 현재 공개 프리뷰로 제공되는 ‘마이크로소프트 AI 파운드리 로컬’을 통해서도 새 모델에 접근할 수 있다. 파운드리 로컬을 설치한 후 터미널에 “Foundry model run gpt-oss-20b”를 입력하는 간단한 명령어로 모델 실행이 가능하다.

이번 오픈소스 모델 출시는 AI 가속 윈도우 애플리케이션에 추론 기능을 직접 통합하려는 개발자 및 AI 애호가들의 혁신을 가속화할 것으로 전망된다.

뉴스레터 구독하기

아이씨엔매거진은 AIoT, IIoT 및 피지컬 AI, 디지털트윈을 통한 제조업 디지털전환 애널리틱스를 제공합니다.
테크리포트: 자율제조, 전력전자, 모빌리티, 로보틱스, 스마트농업

AW2026 expo
ACHEMA 2027
오승모 기자
오승모 기자http://icnweb.kr
기술로 이야기를 만드는 "테크 스토리텔러". 아이씨엔 미래기술센터 수석연구위원이며, 아이씨엔매거진 편집장을 맡고 있습니다. 디지털 전환을 위한 데이터에 기반한 혁신 기술들을 국내 엔지니어들에게 쉽게 전파하는데 노력하는 중입니다.
fastech EtherCAT
as-interface

Related Articles

Stay Connected

440FansLike
407FollowersFollow
224FollowersFollow
120FollowersFollow
372FollowersFollow
152SubscribersSubscribe
spot_img
InterPACK
spot_img
SPS 2026
automotion
Power Electronics Mag

Latest Articles

Related Articles

PENGUIN Solutions
터크, IP67 등급 IO-Link 전자 퓨즈 TBIF 출시… 캐비닛 없는 현장 자동화 구현

터크, IP67 등급 IO-Link 전자 퓨즈 TBIF 출시… 캐비닛 없는 현장...

0
터크가 별도의 보호함 없이 공장 현장에 바로 설치할 수 있는 똑똑한 전자 퓨즈 TBIF를 출시했다. 이 제품은 물과 먼지에 강한 설계를 갖추고 있으며, 컴퓨터나 스마트 기기로 원격에서 상태를 확인하거나 고장 난 회로를 다시 켤 수 있다. 이를 통해 기계 고장 시간을 줄이고 관리 비용을 아낄 수 있다
WindEnergy
InterPACK

Related Articles

fastech EtherCAT
as-interface
ARC 인포메티크, IEC 62443-4-1 인증 획득… PcVue 플랫폼 보안성 강화

ARC 인포메티크, IEC 62443-4-1 인증 획득… PcVue 플랫폼 보안성 강화

0
공장 자동화 소프트웨어인 PcVue를 만드는 ARC Informatique가 국제적인 산업 보안 인증을 받았다. 이번 인증은 소프트웨어를 처음 만들 때부터 해킹에 강하게 설계했다는 것을 보증한다. 이를 통해 공장을 운영하는 기업들은 보안 걱정을 덜고 더 안전하게 생산 시설을 관리할 수 있다
터크, IP67 등급 IO-Link 전자 퓨즈 TBIF 출시… 캐비닛 없는 현장 자동화 구현

터크, IP67 등급 IO-Link 전자 퓨즈 TBIF 출시… 캐비닛 없는 현장...

0
터크가 별도의 보호함 없이 공장 현장에 바로 설치할 수 있는 똑똑한 전자 퓨즈 TBIF를 출시했다. 이 제품은 물과 먼지에 강한 설계를 갖추고 있으며, 컴퓨터나 스마트 기기로 원격에서 상태를 확인하거나 고장 난 회로를 다시 켤 수 있다. 이를 통해 기계 고장 시간을 줄이고 관리 비용을 아낄 수 있다
한국레노버, 씽크패드 아우라 에디션 3종 출시… 온디바이스 AI로 업무 혁신 주도

한국레노버, 씽크패드 아우라 에디션 3종 출시… 온디바이스 AI로 업무 혁신 주도

0
한국레노버가 인공지능 기능을 강화한 씽크패드 아우라 에디션 노트북 3종을 출시했다. 인공지능이 업무 환경을 분석해 보안을 강화하거나 집중을 돕는 스마트 모드를 탑재했다
호리바, 광섬유식 비접촉 약액 농도 모니터 CS-900F 출시… 반도체 공정 효율 극대화

호리바, 광섬유식 비접촉 약액 농도 모니터 CS-900F 출시… 반도체 공정 효율...

0
호리바 어드밴스드 테크노가 반도체 공정용 약액 농도 측정기 CS-900F를 출시했다. 광섬유 기술을 활용해 핵심 부품을 분리 배치함으로써 배관에 붙는 측정기 크기를 기존보다 60%나 줄였다. 덕분에 복잡한 반도체 장비 내부 공간을 더 넓게 쓸 수 있고, 측정 가능한 약액 종류도 대폭 늘어났다

한국요꼬가와전기, 차세대 광학 측정기 2종 2026 광통신 혁신상 수상

0
한국요꼬가와전기가 광학 측정 장비 2종으로 2026 광통신 혁신상을 수상하며 기술력을 증명했다. 이번 장비들은 AI 데이터센터에 필요한 부품을 더 빠르고 정확하게 만들고 검사하는 데 활용되어 국내 통신 부품 제조사들의 경쟁력을 높이는 데 기여한다
벡터, AI 기반 테스트 자동화 ‘벡터캐스트 2026’ 발표… 요구사항-테스트 정렬 가속화

벡터, AI 기반 테스트 자동화 ‘벡터캐스트 2026’ 발표… 요구사항-테스트 정렬 가속화

0
자동차나 비행기 소프트웨어를 만드는 벡터가 인공지능이 스스로 테스트 문제를 만들고 검사하는 기술을 내놓았다. 사람이 일일이 하던 복잡한 확인 작업을 AI가 돕되, 최종 결정은 사람이 내려 안전성을 두 배로 높였다
- Our Youtube Channel -Engineers Youtube Channel

Latest Articles