로그인
토토사이트
먹튀사이트/제보
업체홍보/구인
신규사이트
지식/노하우
놀이터홍보
판매의뢰
스포츠분석
뉴스
후기내역공유
커뮤니티
포토
포인트
보증업체
카지노 먹튀
토토 먹튀
먹튀제보
구인
구직
총판
제작업체홍보
카지노
토토
홀덤
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
축구
야구
농구
배구
하키
미식축구
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[]
"통과는 됐지만‥" 잇단 벼락치기 수정에 '부글'
N
[]
"메타, 엔비디아·AMD 이어 구글과도 AI칩 계약…자체칩은 난항"(종합)
N
[IT뉴스]
케이엘큐브, 공공솔루션마켓 참가… AI수어 기반 디지털포용행정 공공서비스 모델 제시
N
[연예뉴스]
오아베, 사랑 앞에 무력한 감정 담은 '자유낙하' 발표
N
[연예뉴스]
블랙핑크, 오늘 컴백…“네 멤버 음악적 역량, 시너지 집약”
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
목록
글쓰기
[IT뉴스][현장] LLM보다 20배 자원 쓰는 에이전틱 AI…레드햇 "해법은 추론 최적화"
온카뱅크관리자
조회:
4
2026-02-27 08:47:30
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">LG CNS AI 테크 서밋 2026…이호진 레드햇 솔루션 아키텍트 "비용·성능·안정성 동시에 잡아야"</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="WYt2S1MVjQ"> <p contents-hash="779f3cf4d46f300b2db38fddaa7232c66c4b80066dd058f13b63663d72bc960f" dmcf-pid="YGFVvtRfkP" dmcf-ptype="general">(지디넷코리아=남혁우 기자)"에이전틱 AI는 하나의 질문에도 모델을 여러 번 호출하며 일반 챗봇 대비 GPU 자원을 5배에서 최대 20배까지 더 소모하는 구조입니다. 기업이 이를 도입해 수익을 창출하려면 비용 통제와 성능 확보, 서비스 안정성을 동시에 달성할 수 있는 추론 최적화가 필수입니다."</p> <p contents-hash="d2e042a33368fbce848d2bb1528e0bfda8dab40ba71aac41b86b2a076b2c67bf" dmcf-pid="GH3fTFe4A6" dmcf-ptype="general">이호진 레드햇 솔루션 아키텍트는 26일 서울 마곡 LG사이언스파크에서 열린 'LG CNS AI 테크 서밋 2026'에서 이같이 강조했다. </p> <p contents-hash="baa597447bfe44ef3e736d12f7d3d1f9633a9f98165904472bef5ff073b2cc06" dmcf-pid="HX04y3d8k8" dmcf-ptype="general">그는 '에이전틱 AI로의 진화와 추론 최적화 전략'을 주제로 발표하며, 생성형 AI를 넘어 에이전틱 AI 시대로 전환되는 흐름과 이에 따른 인프라 전략 변화를 짚었다.</p> <figure class="figure_frm origin_fig" contents-hash="324ec7dd283b85aeb1beb019b98b64c3c51cec3b49b3080a210314685b823faf" dmcf-pid="XZp8W0J6k4" dmcf-ptype="figure"> <p class="link_figure"><img alt="이호진 레드햇 솔루션아키텍트(사진=남혁우 기자)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202602/27/ZDNetKorea/20260227084041555xwuw.jpg" data-org-width="640" dmcf-mid="VjRkKMCENL" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202602/27/ZDNetKorea/20260227084041555xwuw.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 이호진 레드햇 솔루션아키텍트(사진=남혁우 기자) </figcaption> </figure> <p contents-hash="740e65d96eaa197dceaf59981def878447fbfff15c938c818e574fb73b3f7b07" dmcf-pid="Z5U6YpiPaf" dmcf-ptype="general">이 아키텍트는 가트너와 IDC 리서치를 인용하며 올해 기업 애플리케이션 40%가 업무 특화 AI 에이전트를 탑재하거나 AI 에이전트와 함께 일하게 될 것이라고 설명했다. </p> <p contents-hash="f591f08af0967f334018ecd0258734aed7c42210f8f913a743a9c2219aec8d18" dmcf-pid="51uPGUnQkV" dmcf-ptype="general">단순 질의응답을 수행하는 생성형 AI에서 벗어나, 멀티스텝 업무 자동화와 워크플로우 판단·실행까지 수행하는 구조로 진화하고 있다는 분석이다.</p> <p contents-hash="68e640b559ce78f8c75563a9ced946482372dc38b78bad9618699042493e354d" dmcf-pid="1daCQgGho2" dmcf-ptype="general">문제는 자원 소모다. 에이전틱 AI는 하나의 요청에도 모델 호출과 도구 실행, 검색과 재시도를 반복한다. 그 결과 일반 챗봇 대비 GPU 자원이 5배에서 최대 20배까지 더 필요할 수 있다. </p> <p contents-hash="2035b975806fe6b9d7b03052a40f4ed1f26d3036de134708b5115ac61d851989" dmcf-pid="tJNhxaHlj9" dmcf-ptype="general">그는 "이 구조에서는 추론 비용이 급격히 증가할 수밖에 없다"며 "추론 최적화 없이 에이전틱 AI를 확장하는 것은 현실적으로 어렵다"고 말했다.</p> <p contents-hash="825e18284c7aa11d136160b3bd169b0c3b1647acc2eb0f523a952c6852f90673" dmcf-pid="FijlMNXSjK" dmcf-ptype="general">이어 추론의 개념과 운영 환경에서의 과제를 설명했다. 대규모언어모델(LLM) 추론은 입력을 토큰으로 변환하고 토큰 간 관계를 계산해 답변을 생성하는 과정이다. 현재 AI 시장의 예산과 컴퓨팅 중심이 학습에서 추론 영역으로 이동하고 있으며 상시 운영 환경에서는 성능과 비용 최적화의 효과가 더욱 크게 나타난다고 강조했다.</p> <p contents-hash="c04e8b7e8d58b3022d0dea091123aaf302d8e85d02ff5f0488863264581b5aa0" dmcf-pid="3nASRjZvAb" dmcf-ptype="general">특히 엔터프라이즈 환경에서는 GPU 자원 효율화뿐 아니라 보안 검증, 모델 안정성 확보, 지연 편차 관리까지 함께 고려해야 한다고 짚었다.</p> <p contents-hash="51fda5346160b6bdb3b157411f2c59d21fc7c8b5ba7ce2a7da91da00957773de" dmcf-pid="0LcveA5TNB" dmcf-ptype="general">레드햇은 이를 해결하기 위한 전략으로 가상대규모언어모델(vLLM)<span>, LLM 컴프레서, 검증된 모델 컬렉션, 대규모 분산 추론 기술(LLM-D)을 제시했다. vLLM은 고성능 모델 서빙 엔진으로, 신규 모델과 다양한 AI 가속기를 지속적으로 지원하며 업계 표준처럼 활용되고 있다고 설명했다. </span></p> <p contents-hash="67dcea1f42d1d96ed1d870cdc0ae0e3c2584ae508e2d31582d17693c39821328" dmcf-pid="pokTdc1ykq" dmcf-ptype="general"><span>LLM 컴프레서는 양자화를 통해 모델 크기와 GPU 메모리 사용량을 줄이면서도 정확도를 유지하는 기술이다. 실제 70B 모델을 GPU 8장에서 2장으로 줄이면서 99% 이상의 정확도를 확보한 사례도 소개했다.</span></p> <p contents-hash="045181356d33e3121d73ef699f354a65eb2e0b6883739ffee1d0a1df085d2c83" dmcf-pid="UgEyJktWkz" dmcf-ptype="general">또한 오픈시프트 기반으로 검증·최적화된 모델을 제공해 엔터프라이즈 AI의 품질과 안정성을 빠르게 확보할 수 있다고 밝혔다.</p> <p contents-hash="678a3e3c2a95e99f992a6d106f6dbe6ff7d42af13e8ee3f6faad4d142a9ef501" dmcf-pid="uaDWiEFYN7" dmcf-ptype="general">LLMD는 대규모 분산 추론을 지원하는 기술로 여러 서버에 모델을 분산 배치하고 라우팅과 로드밸런싱, KV 캐시 효율화를 통해 고성능과 비용 효율을 동시에 달성할 수 있도록 돕는다고 설명했다.</p> <p contents-hash="c619834c53ad21863c6f96fd0da9a79e4efafdf226ab40e0b49eecbf350b4e9c" dmcf-pid="7NwYnD3Gcu" dmcf-ptype="general">BC카드 사례도 공유했다. 초기에는 오라마 기반으로 최대 20건 요청을 처리했으나, vLLM 전환과 API 캐싱, 튜닝을 거치며 최대 25만건 요청을 처리하는 구조로 확장했다. 특히 LLM 컴프레서를 통한 양자화로 모델 크기를 절반으로 줄이고 성능은 3배 높이면서도 정확도 차이는 0.01% 수준에 그쳤다고 밝혔다.</p> <p contents-hash="ba36ef55d7d8004b7f2b200b0b01d8bb3548d343677e0906da5eee5d6d9f1f7c" dmcf-pid="zjrGLw0HjU" dmcf-ptype="general">이 과정에서 기업이 모든 기술 레이어를 자체적으로 감당하기보다 안정적인 플랫폼을 기반으로 전문 역량을 결합하는 전략이 필요하다고 강조했다.</p> <p contents-hash="aa25f5c043bfb79108fd92ef0390781b824e21911b74658ec5b80a20dcf7244b" dmcf-pid="qAmHorpXop" dmcf-ptype="general">이호진 아키텍트는 "에이전틱 AI 시대에는 추론이 곧 경쟁력"이라며 "레드햇 AI 플랫폼과 전문 역량, 컨설팅을 통해 고객의 추론 최적화와 AI 혁신을 지원하겠다"고 말했다. </p> <p contents-hash="452916874165974956984d885c36d76d1a32a593fe721cd6f3e66dbe7c9391ed" dmcf-pid="BcsXgmUZk0" dmcf-ptype="general">남혁우 기자(firstblood@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기