로그인
토토사이트
먹튀사이트/제보
업체홍보/구인
신규사이트
지식/노하우
놀이터홍보
판매의뢰
스포츠분석
뉴스
후기내역공유
커뮤니티
포토
포인트
보증업체
카지노 먹튀
토토 먹튀
먹튀제보
구인
구직
총판
제작업체홍보
카지노
토토
홀덤
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
축구
야구
농구
배구
하키
미식축구
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[]
양대노총 공공노동자 도심 집회…"정부, 노정교섭 나서야"
N
[]
러 "돈바스 내 주요 거점 확보"…우크라 "러 석유시설·군사시설 타격"(종합)
N
[스포츠뉴스]
마침내 해냈다! 신유빈-임종훈, 세계 최강 중국 꺾고 첫 그랜드 스매시 정상
N
[]
푸틴 "도네츠크 요충지 점령"…젤렌스키 "그럼 거기서 만나자"(종합)
N
[]
하준경 "3대 메가 프로젝트, 평택 밑 '남방 한계선' 깨는 의미 있다"
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
목록
글쓰기
[IT뉴스]더 크게보다 더 가볍게…AI 인프라 경량화 시대 부상
온카뱅크관리자
조회:
53
2026-05-16 10:47:29
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">로봇·모바일·스마트팩토리 AI 확산…추론 최적화 중심 재편 가속</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="qVhIZKfzgJ"> <p contents-hash="c298874fadcd3c44d8688a7cbfce30ac8255f73ad7cda4f14d70d917f4a548f3" dmcf-pid="BflC594qgd" dmcf-ptype="general">(지디넷코리아=한정호 기자)<span>생성형 인공지능(AI) 경쟁 구도가 빠르게 바뀌고 있다. 단순히 더 큰 그래픽처리장치(GPU)와 더 많은 연산 성능을 확보하는 경쟁을 넘어 데이터 이동과 메모리 병목을 얼마나 줄이고 실제 서비스 환경에서 효율적으로 AI를 실행할 수 있는지가 새로운 핵심 경쟁력으로 떠오르는 모습이다.</span></p> <p contents-hash="c7bdb2f394cc320579ffcc9962d5671c7edbc1468fb0dee338a879de2d3bef7a" dmcf-pid="b4Sh128Bje" dmcf-ptype="general">로봇·모바일·스마트팩토리 등 실제 산업 현장으로 AI 확산이 본격화되면서 업계 무게중심도 초거대 모델 학습보다 추론 최적화와 전력 효율 중심으로 이동하고 있다는 분석이 나온다.</p> <figure class="figure_frm origin_fig" contents-hash="2c17f172c6a636b02e72dfa63b068b2ef2db7b2c8218417ee26e585639a03ecb" dmcf-pid="K8vltV6bcR" dmcf-ptype="figure"> <p class="link_figure"><img alt="(사진=클립아트코리아)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202605/16/ZDNetKorea/20260516103907758ziey.jpg" data-org-width="640" dmcf-mid="ZcF1Gq9Ug9" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202605/16/ZDNetKorea/20260516103907758ziey.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> (사진=클립아트코리아) </figcaption> </figure> <p contents-hash="799d2bcaaef05779dde78fe825e2e49a8403c134d5dd8e4062ed210e3050d727" dmcf-pid="9QWT08x2NM" dmcf-ptype="general"><strong>AI 추론 중심 재편…경량화·최적화 기술 부상</strong></p> <p contents-hash="b5c9af0ed16201d41ee4866902f21c7b70af77d1554507c126b947cd0147101f" dmcf-pid="2xYyp6MVkx" dmcf-ptype="general"><span>16일 업계에 따르면 최근 미국 AI 반도체 기업 세레브라스 시스템즈가 나스닥 상장 첫날 공모가 대비 68% 급등하며 올해 최대 규모 기업공개(IPO) 중 하나로 떠올랐다. 시장에선 이를 AI 산업 패러다임 변화의 상징적 사례로 해석하고 있다.</span></p> <p contents-hash="cfbf583bfa725059876f1e0e411c51a2056e07f3f5970562f9fa402a53812714" dmcf-pid="VMGWUPRfgQ" dmcf-ptype="general">세레브라스는 웨이퍼 스케일 기반 초대형 칩 구조와 고속 SRAM 메모리 기술을 통해 AI 추론 효율을 높이며 주목받고 있다. 업계에선 이를 두고 AI 산업의 무게중심이 '학습'에서 실제 서비스 단계인 '추론' 중심으로 이동하고 있다는 신호로 해석하고 있다. 실제 맥킨지는 2030년 AI 컴퓨팅 수요의 절반 이상이 학습이 아닌 추론에서 발생할 것으로 전망했다.</p> <p contents-hash="6698cf769c0e08760000626061f4e20cafedbab8dd657c7a35a6c71bf1ab425c" dmcf-pid="fRHYuQe4NP" dmcf-ptype="general">특히 생성형 AI가 데이터센터를 넘어 모바일과 로봇, 자율주행, 스마트팩토리, CCTV 등 실제 산업 현장으로 확산되면서 AI 경쟁의 기준 역시 빠르게 달라지고 있다는 관측이다.</p> <figure class="figure_frm origin_fig" contents-hash="931f457ad3b20ca224601de7351a68d365c18e7ac9e78ddbfdb5eb741ebf3260" dmcf-pid="4eXG7xd8g6" dmcf-ptype="figure"> <p class="link_figure"><img alt="구글클라우드가 공개한 8세대 텐서처리장치(TPU)중 학습용 칩 8t(왼쪽)와 추론용 칩8i (사진=구글클라우드)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202605/16/ZDNetKorea/20260516103907993hood.png" data-org-width="640" dmcf-mid="5XEcgCvmgK" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202605/16/ZDNetKorea/20260516103907993hood.png" width="658"></p> <figcaption class="txt_caption default_figure"> 구글클라우드가 공개한 8세대 텐서처리장치(TPU)중 학습용 칩 8t(왼쪽)와 추론용 칩8i (사진=구글클라우드) </figcaption> </figure> <p contents-hash="2451259f715ce30229bfeb215a60e46c4ff701103122c96a10054213befd0683" dmcf-pid="8dZHzMJ6o8" dmcf-ptype="general"><span>과거에는 더 큰 모델과 더 높은 연산 성능 확보가 핵심이었다면, 이제는 제한된 전력과 메모리 환경에서도 얼마나 효율적으로 AI를 실행할 수 있는지가 중요해지고 있다는 설명이다. 최근 AI 서비스 운영 과정에선 연산 성능 자체보다 메모리 사용량과 데이터 이동 비용, 전력 효율 등이 전체 운영비용(TCO)을 좌우하는 요소로 부상 중이다.</span></p> <p contents-hash="2e42130735ce89216b2d580349fab28c55363ccfe912a6f261954430fd29c2f9" dmcf-pid="6J5XqRiPc4" dmcf-ptype="general">특히 AI 에이전트와 실시간 응답 서비스가 확대되면서 지연시간과 전력 효율 중요성이 빠르게 커지고 있다는 분석이다. 대규모 데이터를 반복적으로 처리하는 학습 단계보다 실제 사용자 요청에 즉각 대응해야 하는 추론 환경에선 메모리 병목과 데이터 이동 최소화가 핵심 경쟁력으로 떠오르고 있다.</p> <p contents-hash="64ccea4886c7c3544fb08281b4bfd5420ac03c76754a3169e3d5084f121ba798" dmcf-pid="Pi1ZBenQjf" dmcf-ptype="general">세레브라스의 방향성 역시 단순한 초고성능 AI 칩 경쟁이 아니라, AI를 실제 환경에서 얼마나 효율적으로 구동할 수 있는가에 더 가까워지고 있다는 분석이 나온다.</p> <p contents-hash="f06f07f88c0d8a9aa4fbe585288c3e6aa1b20ba294dc80ca96df8de679677165" dmcf-pid="Qnt5bdLxNV" dmcf-ptype="general"><strong>"얼마나 크게보다 얼마나 효율적으로"</strong></p> <p contents-hash="f0ddc26d24f475883f73e1367f36d2f8914b4334b6b5cab8169b800ec28feeab" dmcf-pid="xLF1KJoMo2" dmcf-ptype="general"><span>이같은 흐름 속에서 AI 반도체뿐 아니라 모델 경량화와 추론 최적화 기술 중요성도 함께 커지고 있다. AI가 실제 디바이스 환경으로 확산될수록 제한된 메모리와 전력 안에서 안정적으로 AI를 실행해야 하는 만큼, 하드웨어(HW)와 소프트웨어(SW)를 함께 최적화하는 방향으로 시장이 재편되고 있는 추세다.</span></p> <p contents-hash="ed870f7d05fd0ef361049b08ec99bfaadb9098f9e213497ce732ff05a27f21dd" dmcf-pid="y1gLmXtWg9" dmcf-ptype="general">국내에서도 이러한 흐름에 맞춰 추론 중심 AI 반도체와 최적화 기술 기업들이 사업 확대에 나서고 있다. 퓨리오사AI와 모빌린트, 리벨리온 등은 신경망처리장치(NPU) 기반 AI 반도체를 앞세워 전력 효율 중심의 추론 시장 공략을 강화하고 있다.</p> <figure class="figure_frm origin_fig" contents-hash="5e3f1967c45a08df5e595ab30eb9d2db491213baa8131409b0292b557d95f24b" dmcf-pid="WtaosZFYkK" dmcf-ptype="figure"> <p class="link_figure"><img alt="채명수 노타 CEO(왼쪽), 김태호 CTO (사진=지디넷코리아DB)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202605/16/ZDNetKorea/20260516103909393zryb.jpg" data-org-width="639" dmcf-mid="1eK9zMJ6Nb" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202605/16/ZDNetKorea/20260516103909393zryb.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 채명수 노타 CEO(왼쪽), 김태호 CTO (사진=지디넷코리아DB) </figcaption> </figure> <p contents-hash="59a21f4ef6adb2bfa69811bf3cadd50f1e8793e10478623687616976614e8bad" dmcf-pid="YA7U8acnAb" dmcf-ptype="general">이 과정에서 AI 모델 최적화 기업 역할도 함께 확대되고 있다. 먼저 노타는 AI 모델 최적화 플랫폼 '넷츠프레소(NetsPresso)'를 기반으로 모델 경량화·양자화·구조 최적화 기술을 제공하며 다양한 AI 반도체 환경에서 실행 효율을 높이고 있다. 최근에는 퓨리오사AI의 추론 특화 NPU '레니게이드(RNGD)' 환경 최적화 협력을 진행 중이며 모빌린트와도 온디바이스 AI 최적화 협력을 확대하고 있다.</p> <p contents-hash="73ddbef7f6328b9768383ba8fc7fb69dba816dddd3f853069dbf4fced533dbe8" dmcf-pid="Gczu6NkLaB" dmcf-ptype="general"><span>AI 경량화 분야에선 스퀴즈비츠 역시 주요 기업으로 거론된다. 스퀴즈비츠는 AI 모델 압축·양자화·추론 최적화 기술을 기반으로 GPU와 NPU 환경 모두에서 거대언어모델(LLM) 서빙 효율을 높이는 솔루션을 개발 중이다. 이 회사도 리벨리온과 협력해 NPU 기반 LLM 추론 생태계 확대에 박차를 가하고 있다.</span></p> <p contents-hash="9fa513880bf060ec514ca16e13a1e3caca2ac3edaacf18943bb670e09b33cbbf" dmcf-pid="Hkq7PjEojq" dmcf-ptype="general">AI 인프라 운영 분야에선 아크릴 역시 존재감을 키우고 있다. GPU·NPU 등 다양한 AI 가속기 운영 최적화 SW 사업을 확대 중이다.</p> <p contents-hash="81faafeaa446fb5af9157f4ed7beff76390430cbc76ec0793b40480135a90325" dmcf-pid="XEBzQADggz" dmcf-ptype="general">업계에선 AI 에이전트와 실시간 추론 서비스 확산이 본격화될수록 단순 칩 성능 경쟁을 넘어 실제 서비스 환경에서 AI를 얼마나 안정적이고 효율적으로 운영할 수 있는지가 더욱 중요해질 것으로 보고 있다.</p> <p contents-hash="a95cd91d9190e918b825e33b31982ad115b72541e4bef4f30b97166e8f150758" dmcf-pid="ZDbqxcwaN7" dmcf-ptype="general">업계 관계자는 "향후 AI 시장 경쟁은 단순히 더 큰 모델을 만드는 방향이 아니라, 실제 환경에서 얼마나 가볍고 효율적으로 AI를 실행할 수 있는가 중심으로 재편될 것"이라고 밝혔다.</p> <p contents-hash="e0395ff0de7216810700e6129f88a7e8b7ca80595d652c7e5704afb17c842b9b" dmcf-pid="5wKBMkrNAu" dmcf-ptype="general">한정호 기자(jhh@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기