로그인
토토사이트
먹튀사이트/제보
업체홍보/구인
신규사이트
지식/노하우
놀이터홍보
판매의뢰
스포츠분석
뉴스
후기내역공유
커뮤니티
포토
포인트
보증업체
카지노 먹튀
토토 먹튀
먹튀제보
구인
구직
총판
제작업체홍보
카지노
토토
홀덤
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
축구
야구
농구
배구
하키
미식축구
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[]
정부, 이란 사태 실물경제 영향 긴급 점검…긴급대책반 가동
N
[IT뉴스]
"완벽한 2등보다 빠른 1등"…장현국 대표의 넥써쓰 전략
N
[연예뉴스]
김태리가 이끄는 연극 ‘오즈의 마법사’, 첫 대본리딩 (방과후 태리쌤)
N
[연예뉴스]
'독박투어4' 김준호, 장가계서 눈물의 프러포즈 송 재연
N
[연예뉴스]
아이브 신드롬 ing, '뱅뱅'으로 음방 3관왕
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
목록
글쓰기
[IT뉴스]"지포스 RTX와 쿠다로 무장"…엔비디아 'LM 스튜디오' 성능 폭발
온카뱅크관리자
조회:
96
2025-05-12 15:37:32
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">플래시 어텐션·쿠다 그래프 최적화…로컬 LLM 사용성·처리량 대폭 강화</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="1jkhyTUlof"> <p contents-hash="b6f71df8e3266616ca2fafc763496e36e61399d9bfaf3886c6afb9ac088a7870" dmcf-pid="tB9MiJrRNV" dmcf-ptype="general">(지디넷코리아=조이환 기자)엔비디아가 지포스 그래픽처리장치(GPU)와 쿠다를 기반으로 자체 로컬 거대언어모델(LLM) 실행 도구의 성능을 대폭 강화했다. 로딩·응답 속도 향상과 더불어 개발자 제어 기능을 확장해 로컬 AI 활용 생태계를 본격적으로 견인하는 전략이다.</p> <p contents-hash="8df70ef0e4195cd5f6ad887aa650db16746482646d893c88ecc24d4ee99f1c94" dmcf-pid="Fb2Rnimeg2" dmcf-ptype="general">엔비디아는 최근 'LM 스튜디오' 0.3.15 버전을 발표했다고 12일 밝혔다. 이번 버전은 지포스 '레이 트레이싱 익스피리언스(RTX)' GPU 환경에서 성능을 최대 27%까지 끌어올릴 수 있게 '쿠다' 그래프와 플래시 어텐션 최적화를 적용했다. 지포스 'RTX 20' 시리즈부터 최신 블랙웰 GPU까지 폭넓은 하드웨어 호환성도 확보했다.</p> <p contents-hash="e740a1f810bde4eb7206dbca5a6da141662624550adbdb868df43975b7255643" dmcf-pid="3KVeLnsdg9" dmcf-ptype="general">'LM 스튜디오'는 고성능 추론과 데이터 보안을 동시에 확보할 수 있는 로컬 LLM 실행 도구다. '라마.cpp(llama.cpp)' 기반 런타임을 바탕으로 오프라인에서도 모델 실행이 가능하고 오픈AI 응용 프로그램 인터페이스(API) 호환 엔드포인트로도 작동해 맞춤형 워크플로우에 쉽게 통합된다.</p> <figure class="figure_frm origin_fig" contents-hash="b83d9e14cef3994e9128f73bfea6245f87cf6c8717ef1e78a086002b950ccbb7" dmcf-pid="09fdoLOJAK" dmcf-ptype="figure"> <p class="link_figure"><img alt="엔비디아가 지포스 그래픽처리장치(GPU)와 쿠다를 기반으로 자체 로컬 거대언어모델(LLM) 실행 도구의 성능을 대폭 강화했다. (사진=엔비디아)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202505/12/ZDNetKorea/20250512153328620jdzt.jpg" data-org-width="638" dmcf-mid="5KtBV2nbA4" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202505/12/ZDNetKorea/20250512153328620jdzt.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 엔비디아가 지포스 그래픽처리장치(GPU)와 쿠다를 기반으로 자체 로컬 거대언어모델(LLM) 실행 도구의 성능을 대폭 강화했다. (사진=엔비디아) </figcaption> </figure> <p contents-hash="fdd64005cbb0e4baa80316571ae5cb2d2f8d00e5ec9e6d8230b3cafe2ed7f95b" dmcf-pid="p24JgoIiob" dmcf-ptype="general">새 버전은 '툴_초이스(tool_choice)' 패러미터를 도입해 도구 호출 방식에 대한 세밀한 제어를 제공한다. 외부 도구 연동 여부를 개발자가 지정하거나 모델이 동적으로 결정하게 할 수 있어 검색 증강 생성(RAG), 에이전트 파이프라인 등에 최적화된 구조를 제공한다.</p> <p contents-hash="077cebcae37938087398c4dfcbf8595e939c6b55b5c164dd99ce438801f93d2f" dmcf-pid="UV8iagCngB" dmcf-ptype="general">시스템 프롬프트 편집기도 새롭게 설계돼 복잡하거나 장문 프롬프트에 대한 대응력이 향상됐다. 프리셋 기반의 다양한 모델과 양자화 방식도 지원되며 '젬마', '라마3', '미스트랄', '오르카' 등 주요 오픈소스 모델이 모두 포함됐다.</p> <p contents-hash="40001c0d5973d0399e04f0fa8deb902edf26e58c9920ba9a80db4aaf5090835b" dmcf-pid="uf6nNahLAq" dmcf-ptype="general">이같은 구조는 '옵시디언'과 같은 노트 기반 앱에 플러그인 형태로 연결돼 텍스트 생성, 연구 요약, 노트 검색을 클라우드 없이 수행할 수 있게 한다. 이 모든 과정은 'LM 스튜디오' 내의 로컬 서버를 통해 이뤄져 빠르고 프라이버시 중심의 상호작용이 가능하다.</p> <p contents-hash="a37c74325d720d1db512c6b777367c848c4e4f7735781bff2c7bc5d714817ed3" dmcf-pid="7H5z9KJqNz" dmcf-ptype="general">성능 개선의 핵심은 '라마.cpp' 백엔드에 적용된 쿠다 그래프와 플래시 어텐션이다. 쿠다 그래프는 컴퓨팅처리장치(CPU) 호출 횟수를 줄여 모델 처리량을 최대 35%까지 높였다. 플래시 어텐션은 메모리 부담 없이 긴 컨텍스트 대응 능력을 강화하며 최대 15% 속도 향상을 이끌었다.</p> <p contents-hash="b0645fcd7e2d1618ea8dbf7fa62e0dffdf2fcc5184e7cddf619f222c15942a87" dmcf-pid="zX1q29iBA7" dmcf-ptype="general">RTX GPU 사용자라면 별도 설정 없이도 '쿠다 12.8' 기반의 성능 향상을 경험할 수 있다. 드라이버 호환 시 자동 업그레이드가 적용되며 얇은 노트북부터 고성능 워크스테이션까지 전 범위 RTX 인공지능(AI) PC에서 효율적인 추론이 가능하다.</p> <p contents-hash="44c63bc9fa0e9ca5f642476d5357cfdf4e80b0deccd79fe21e42c7babee0f721" dmcf-pid="qZtBV2nbAu" dmcf-ptype="general">'LM 스튜디오'는 윈도우, 맥OS, 리눅스에서 모두 실행 가능하며 무료로 다운로드해 사용할 수 있다. 데스크톱 채팅, 오픈AI API 개발자 모드 등 다양한 인터페이스도 제공된다.</p> <p contents-hash="eaee85d4c7ecb73954598af36721fc8025d47fa90fb60b8428cb536b541156ff" dmcf-pid="B5FbfVLKjU" dmcf-ptype="general">엔비디아 측은 "'LM 스튜디오' 최신 업데이트는 RTX AI PC에서 최고의 성능과 유연성을 제공한다"며 "로컬 LLM 도입 장벽을 낮추고 사용자의 AI 실험과 배포를 적극 지원할 것"이라고 밝혔다.</p> <p contents-hash="754d141410c5b7f398c2174148df8649a18aa93baaec37b7b3ffa897fd87e99f" dmcf-pid="b13K4fo9Np" dmcf-ptype="general">조이환 기자(ianyhcho@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기