로그인
토토사이트
먹튀사이트/제보
업체홍보/구인
신규사이트
지식/노하우
놀이터홍보
판매의뢰
스포츠분석
뉴스
후기내역공유
커뮤니티
포토
포인트
보증업체
카지노 먹튀
토토 먹튀
먹튀제보
구인
구직
총판
제작업체홍보
카지노
토토
홀덤
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
축구
야구
농구
배구
하키
미식축구
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[]
'7.5 강진' 베네수 비상사태 선포…수도 인근 국제공항 폐쇄(종합)
N
[]
내년 최저임금 최초요구안 노사 격차 '1680원'…1차 수정안 주목
N
[IT뉴스]
앤트로픽 “알리바바, 역대 최대 AI모델 베끼기 시도”…美 의회 서한
N
[IT뉴스]
개인정보위 "상조업계 개인정보 보호 체계 미흡"
N
[IT뉴스]
유베이스, 뉴빌리티와 로봇 운영 협력
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
목록
글쓰기
[IT뉴스]AI PC 경쟁, 칩 성능 넘어 ‘시스템 최적화’로…노타, GPU·NPU 분리형 추론 구현
온카뱅크관리자
조회:
36
2026-06-04 09:37:31
<div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="85zS8lGhly"> <div contents-hash="ff4b451b2339266c227fdd7725e5dd9c654ce0d33351a38a058b36bacd54954b" dmcf-pid="61qv6SHlTT" dmcf-ptype="general"> <h5>인텔 루나 레이크 기반 AI PC에서 LLM 연산 단계별 분산 배치</h5> <h5>단일 GPU 대비 에너지 소비 32% 절감·생성 처리량 12% 개선</h5> <h5>단일 NPU 대비 첫 응답 지연 89% 단축…온디바이스 AI 효율성 입증</h5> <div> </div> </div> <figure class="figure_frm origin_fig" contents-hash="504f32d7fc267429c10a8bb14952a383a9a3595ea34b7bb67a695bbdd9abdd6e" dmcf-pid="PtBTPvXSyv" dmcf-ptype="figure"> <p class="link_figure"><img alt="동일한 LLM을 AI PC에서 실행한 비교 화면. 노타의 분리형 추론 방식은 입력 처리와 답변 생성을 GPU·NPU에 나눠 배치해 단일 연산 장치 기반 실행보다 빠르게 응답을 완료했다. (이미지=노타)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/04/552816-OGTrtXj/20260604093357023cnvi.png" data-org-width="1024" dmcf-mid="4pDPS6d8CW" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/04/552816-OGTrtXj/20260604093357023cnvi.png" width="658"></p> <figcaption class="txt_caption default_figure"> 동일한 LLM을 AI PC에서 실행한 비교 화면. 노타의 분리형 추론 방식은 입력 처리와 답변 생성을 GPU·NPU에 나눠 배치해 단일 연산 장치 기반 실행보다 빠르게 응답을 완료했다. (이미지=노타) </figcaption> </figure> <div contents-hash="bc5257331c0ea1386c5d07525a5cf1ed36bf94371bdd3122fe6ff4b5df167384" dmcf-pid="QFbyQTZvhS" dmcf-ptype="general"> <div> </div> </div> <p contents-hash="9d35bd1b867f918f2c6838cff2a3cf282e96a5146c876ea0563cd0e987204a4d" dmcf-pid="x3KWxy5TSl" dmcf-ptype="general">AI PC의 성능 경쟁이 개별 칩의 연산 능력을 넘어, GPU와 NPU 등 여러 연산 장치를 얼마나 효율적으로 조합하느냐의 문제로 확장되고 있다. 대규모언어모델(LLM)을 PC 내부에서 실행하는 온디바이스 AI 환경에서는 제한된 전력과 연산 자원을 활용해야 하는 만큼, 하드웨어 구성 전체를 고려한 최적화 역량이 사용자 경험을 좌우하는 핵심 요소로 떠오르고 있다. </p> <p contents-hash="de19c3effab972a56e9d42d5a60d72c82fb88e3a900cbea49082972bd13f50d0" dmcf-pid="yamMyxnQWh" dmcf-ptype="general">AI 경량화 및 최적화 기술 기업 노타는 AI PC 환경에서 GPU와 NPU를 함께 활용하는 이기종 컴퓨팅 기반 LLM 추론 최적화 기술을 구현했다고 4일 밝혔다. 이기종 컴퓨팅은 CPU, GPU, NPU처럼 서로 다른 특성을 가진 프로세서가 각자 강점을 가진 연산을 나눠 처리하도록 구성하는 방식이다. </p> <p contents-hash="bbb9350ddfc7701018c2fb2e4ddddc3a8d907cb63a7e23b2f5727c33971b1d87" dmcf-pid="WNsRWMLxCC" dmcf-ptype="general">노타는 인텔 루나 레이크 기반 AI PC에서 LLM 실행 과정을 입력 처리 단계와 답변 생성 단계로 나눠 분석했다. 이후 입력 처리 연산은 GPU에서, 답변 생성 연산은 NPU에서 수행하도록 배치하는 ‘분리형 추론’ 방식을 적용했다. 단순히 여러 연산 장치를 동시에 사용하는 것이 아니라, AI 모델의 작업 흐름과 하드웨어 특성을 맞물리게 설계한 것이 특징이다. </p> <p contents-hash="a40f1135f6c8533465eafe7a5622ced6df35c7a94e86dcba0bcbcc1f1c979a8d" dmcf-pid="YjOeYRoMlI" dmcf-ptype="general">성능 평가에서도 효율 개선이 확인됐다. 노타에 따르면 분리형 추론 적용 결과 단일 GPU 실행 방식과 비교해 토큰당 에너지 소비는 약 32% 줄었고, 생성 처리량은 약 12% 높아졌다. 단일 NPU 방식과 비교해서는 첫 응답 지연시간이 약 89% 단축됐다. 평가는 인텔 루나 레이크 기반 AI PC와 MoE LLM, 컨텍스트 윈도 크기 512 조건에서 진행됐다. </p> <p contents-hash="86af3200c4f700c96733a4e68ca2e0589682f748fb46f80a9240d2238a344a8e" dmcf-pid="GgrxTQiPTO" dmcf-ptype="general">이번 결과는 같은 AI PC라도 연산 장치를 어떻게 배분하느냐에 따라 실제 응답 속도와 전력 효율이 달라질 수 있음을 보여준다. 특히 AI 에이전트용 PC처럼 로컬 환경에서 LLM을 반복적으로 실행해야 하는 경우, 모델 경량화뿐 아니라 런타임과 하드웨어 활용 방식까지 함께 최적화하는 접근이 중요해질 수 있다. </p> <p contents-hash="3b33ef338f9105711c81e29d00dbe3825608cb3dfe67e135c941eb1aacddd085" dmcf-pid="HamMyxnQWs" dmcf-ptype="general">노타는 이번 성과가 AI PC 확산 흐름 속에서 자사의 온디바이스 AI 최적화 역량을 보여주는 사례라고 설명했다. 회사는 모델 경량화, 런타임 최적화, 하드웨어 최적화 기술을 결합해 AI PC 환경에서 LLM 실행 효율을 높여 나간다는 계획이다. </p> <p contents-hash="5fc11c06d48a8e212596384ce359e9303fc97809a8fd15396190b2938499ac8b" dmcf-pid="XNsRWMLxvm" dmcf-ptype="general">채명수 노타 대표는 “AI PC 시대에는 AI 모델을 기기 안에 올리는 것만으로는 충분하지 않다”며 “GPU, NPU 등 다양한 연산 장치를 모델 특성에 맞게 조합하는 최적화 역량이 실제 AI 경험을 좌우한다”고 말했다. </p> <p contents-hash="3f80eb725b736e61f60c5f1327d9e2d4f105819a0a1e62448903c7c388cef0fa" dmcf-pid="ZjOeYRoMSr" dmcf-ptype="general">저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지</p> </section> </div>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기