로그인
토토사이트
신규사이트
업체홍보/구인
먹튀사이트/제보
지식/노하우
놀이터홍보
판매의뢰
스포츠분석
뉴스
후기내역공유
커뮤니티
포토
포인트
보증업체
카지노
토토
홀덤
구인
구직
총판
제작업체홍보
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
축구
야구
농구
배구
하키
미식축구
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[]
[단독] 계엄 전 대공포 '고각 조준'‥'원점 타격' 작전계획 있었다
N
[]
박재억·송강 연이어 사의…항소포기 검찰 '줄사표'로 가나(종합)
N
[연예뉴스]
민희진, 남의 딸 피눈물 흘리게 해놓고…"뉴진스 끌어들이지 마" [TEN스타필드]
N
[연예뉴스]
S.E.S 슈, 마약 혐의 후 CEO로 대변신 "화장품에 힘써..직접 공부"
N
[스포츠뉴스]
배우 이정진이 日 유도장 찾은 사연…"이틀 간 金 3개, 열심히 응원한 보람이 결과로"
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
목록
글쓰기
[IT뉴스]엔비디아, AWS·구글·MS·OCI와 손잡고 '다이나모'로 AI 추론 가속화
온카뱅크관리자
조회:
1
2025-11-17 17:57:31
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">블랙웰·쿠버네티스·분산형 서빙 결합…멀티 노드 LLM·MoE 추론 효율 극대화</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="7gn9b4ztj3"> <p contents-hash="de6128adf498e21224a70b0c2f01459d528da8d798a56f25c08143c87b679690" dmcf-pid="z9BGW5vmkF" dmcf-ptype="general">(지디넷코리아=남혁우 기자)엔비디아가 대규모 생성형 인공지능(AI)·전문가 혼합(MoE) 모델 서비스 가속화에 나섰다.</p> <p contents-hash="9bb9a7b6a93d9350c71f86497a31b15a8cf206fcca3b38b28b529fa6ef34fe5f" dmcf-pid="q2bHY1TsAt" dmcf-ptype="general">엔비디아는 자체 추론 플랫폼 '엔비디아 다이나모'를 통해 멀티 노드 추론 성능과 효율성을 높이고 주요 클라우드 사업자와 통합했다고 17일 밝혔다.</p> <p contents-hash="e8a6a329014ba03cdc13b34ede5dc2daad7125fb8b858503d111ce025f179430" dmcf-pid="BVKXGtyOo1" dmcf-ptype="general">주요 참가기업으로는 <span>아마존웹서비스(AWS), 구글 클라우드, 마이크로소프트 애저, 오라클 클라우드 인프라스트럭처(OCI) 등이다. </span></p> <figure class="figure_frm origin_fig" contents-hash="bf347d7b6545bf5ba6eb1d1da100e08ef30449395252fcf11b61d2937e973025" dmcf-pid="bf9ZHFWIc5" dmcf-ptype="figure"> <p class="link_figure"><img alt="엔비디아, AWS·구글·마이크로소프트·OCI와 협력해 다이나모 기반 AI 추론 가속화(이미지=엔비디아)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202511/17/ZDNetKorea/20251117175714048uggp.jpg" data-org-width="640" dmcf-mid="uOGDksjJg0" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/17/ZDNetKorea/20251117175714048uggp.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 엔비디아, AWS·구글·마이크로소프트·OCI와 협력해 다이나모 기반 AI 추론 가속화(이미지=엔비디아) </figcaption> </figure> <p contents-hash="9d71805cf2792f2cf527657f733397d8d7d57662114cb91c7abcb2b767f1c9d0" dmcf-pid="K425X3YCaZ" dmcf-ptype="general">이를 통해 기업들은 GB200, GB300 NVL72를 포함한 엔비디아 블랙웰 시스템 전반에서 동일한 소프트웨어 스택으로 분산형 AI 추론을 확장할 수 있게 됐다.</p> <p contents-hash="46cb13285f0cd998a7a839e3972b94064b286e3fdafd063e2dfa33e842866054" dmcf-pid="98V1Z0GhaX" dmcf-ptype="general">엔비디아에 따르면 블랙웰 아키텍처는 최근 세미애널리시스가 수행한 인퍼런스MAX v1 벤치마크에서 테스트된 모든 모델과 활용 사례 전반에 걸쳐 가장 높은 성능과 효율성, 가장 낮은 총소유비용(TCO)을 기록했다. </p> <p contents-hash="0e228284d64586570b9aec32597edef44e815ceb39e6b06e50ae856bc977f129" dmcf-pid="26ft5pHlkH" dmcf-ptype="general">젠슨 황 엔비디아 창립자 겸 CEO는 엔비디아 GTC 워싱턴 D.C. 기조연설에서 블랙웰이 기존 엔비디아 '호퍼(Hopper)' 대비 10배 성능을 제공해 10배 수익을 창출할 수 있다고 강조한 바 있다. 회사 측은 "이 성능을 실제 서비스 환경에서 구현하려면 멀티 노드 분산 추론이 필수"라고 설명했다.</p> <p contents-hash="74354ac700112d6effe32ddcf6af9e028d8b1d4340273416b9b5170ce695ead3" dmcf-pid="VP4F1UXSgG" dmcf-ptype="general">최근 대규모 전문가 혼합(MoE) 모델과 초거대 언어 모델(LLM)이 확산되면서 서비스 사업자는 수백만 명 동시 사용자를 대상으로 긴 입력 시퀀스를 처리해야 하는 상황에 직면하고 있다.</p> <p contents-hash="fa6835fef4f30b72cab350e0f7c596204439da2157f760bfcc24e6ccda519636" dmcf-pid="fQ83tuZvAY" dmcf-ptype="general">이 경우 하나의 GPU·서버에 모델을 올려 쓰는 방식만으로는 응답 지연과 자원 낭비가 발생하기 쉽다. </p> <p contents-hash="79540043f0b796897bc9354cc5471af1cb882bb95ff6dada9c8c80130363c6d3" dmcf-pid="4x60F75TNW" dmcf-ptype="general">엔비디아는 다이나모 플랫폼이 이러한 환경에서 추론 작업을 여러 서버(노드)에 지능적으로 분산해, 벤치마크에서 입증된 성능과 효율성을 실제 클라우드·온프레미스 환경에서도 재현할 수 있도록 지원한다고 밝혔다.</p> <p contents-hash="b49ae069a48a647f729434114fc597c9faf5e063d40df44059d52c0671f64fe7" dmcf-pid="8MPp3z1yoy" dmcf-ptype="general">엔비디아는 특히 추론 작업을 '프리필(prefill)'과 '디코드(decode)'라는 두 단계로 나눠 최적화하는 분산형 서빙(disaggregated serving) 방식을 강조했다. </p> <p contents-hash="d678dcfab7123000f5d1c2b014e1ebd2be65c3aa08ed43fe72abc427203937ba" dmcf-pid="6RQU0qtWoT" dmcf-ptype="general">기존에는 두 단계가 동일한 GPU에서 실행돼 메모리·연산 자원이 비효율적으로 사용되는 경우가 많았다. 분산형 서빙은 프리필과 디코드를 서로 다른 특화 GPU·노드에 분리 배치해 각 단계에 가장 적합한 최적화 기법으로 처리할 수 있게 한다. 딥시크-R1과 같은 최신 대규모 AI 추론 및 MoE 모델에서는 이러한 분산 서비스가 사실상 필수라는 설명이다.</p> <p contents-hash="e4ee4357ce03cd2806705b0442c1fdcd50bd11015c4bcf534bef6342754d95e0" dmcf-pid="Pgn9b4ztkv" dmcf-ptype="general">엔비디아는 외부 벤치마크 사례도 제시했다. 시그널65의 러스 펠로우즈 수석 애널리스트는 최근 보고서에서 여러 노드에 동일 모델 복제본을 병렬 배치하는 방식으로 72개 엔비디아 블랙웰 울트라 GPU를 활용해 초당 110만 토큰(TPS)을 처리하는 기록적인 처리량을 달성했다고 분석했다. </p> <p contents-hash="83178c1c116fc7bdf75e0412972984cbaaf0791e0cd1f135f4c2bde91e9b4d35" dmcf-pid="QaL2K8qFjS" dmcf-ptype="general">또 AI 인프라 플랫폼 기업 베이스텐은 엔비디아 다이나모를 도입해 장문 코드 생성 추론 속도를 2배, 처리량을 1.6배 높이면서도 추가 하드웨어 없이 성능을 끌어올렸다고 소개했다. 엔비디아는 "소프트웨어 기반 최적화만으로도 AI 서비스 제공 비용을 크게 낮출 수 있음을 보여주는 사례"라고 강조했다.</p> <p contents-hash="d4dc50096d3d80be551b517d616a42f58f3fc779b928e4e5ebf728d3ac450ed4" dmcf-pid="xNoV96B3kl" dmcf-ptype="general">클라우드 환경에서는 쿠버네티스 통합이 핵심 축이다. 컨테이너 오케스트레이션 표준인 쿠버네티스를 기반으로 수십·수백 개 노드에 걸쳐 모델 복제본과 분산형 서빙 컴포넌트를 관리하는 구조가 이미 대규모 AI 훈련에서 검증된 만큼 추론 영역으로 확장되고 있다는 것이다. </p> <p contents-hash="9750947e4005dff1fbdf46f9e613c2cc1e5d81320ee04a310335321fdd49c088" dmcf-pid="y0tIsSwaAh" dmcf-ptype="general">엔비디아는 이번 통합으로 AWS 아마존 EKS, 구글 클라우드, 마이크로소프트 애저 쿠버네티스 서비스, OCI 슈퍼클러스터 등 주요 관리형 쿠버네티스 서비스에서 다이나모 기반 멀티 노드 추론을 공식 지원하게 됐다고 설명했다.</p> <p contents-hash="37edaf0714b78f8fa7f88dd6bf962c4ada4094c085bb91201207b45f1d8945a4" dmcf-pid="WpFCOvrNgC" dmcf-ptype="general">구체적으로 AWS에서는 아마존 EKS와 다이나모 통합을 통해 생성형 AI 추론을 가속화한다. 구글 클라우드는 'AI 하이퍼컴퓨터(Hypercomputer)' 환경에서 엔터프라이즈급 거대 언어 모델 추론을 최적화하기 위한 다이나모 레시피를 제공한다.</p> <p contents-hash="e17e4a7d16b918224c49bd2c51eefc1e850aa7337f9a462335ea0c8ed93f7e7f" dmcf-pid="YU3hITmjAI" dmcf-ptype="general">마이크로소프트 애저는 애저 쿠버네티스 서비스(AKS)에서 ND GB200-v6 GPU와 다이나모를 기반으로 멀티 노드 LLM 추론을 지원하고, OCI는 OCI 슈퍼클러스터에 엔비디아 다이나모를 결합해 대규모 멀티 노드 LLM 추론을 구현한다. </p> <p contents-hash="275d65cebcae2759f28e909d85939516cf8e8aa803bb07257ac16baa026ee1b4" dmcf-pid="Gu0lCysANO" dmcf-ptype="general">엔비디아는 "하이퍼스케일러 전반으로 다이나모 기반 분산 추론이 확산되면서 엔터프라이즈 AI 배포의 성능·유연성·안정성이 함께 향상될 것"이라고 전망했다.</p> <p contents-hash="684bc2d50ad1a9c9d6ce54105e179ecfb0e34bc24b28b0ee5e4ee7e90a7dfc05" dmcf-pid="H7pShWOcAs" dmcf-ptype="general">이 같은 흐름은 하이퍼스케일 클라우드를 넘어 특화 클라우드 사업자로도 확장되고 있다. 예를 들어 네비우스(Nebius)는 엔비디아 가속 컴퓨팅 인프라를 바탕으로 대규모 추론 워크로드에 특화된 클라우드를 설계하고 있으며, 엔비디아 다이나모 생태계 파트너로 협력 중이다. </p> <p contents-hash="a0d9ef472138847f23d014f2334fd6560515cb91ff1bbdf8faa1ade70e57e864" dmcf-pid="XzUvlYIkgm" dmcf-ptype="general">엔비디아는 다이나모가 다양한 규모·형태의 클라우드 사업자가 대규모 추론 서비스를 보다 쉽게 구축하도록 돕는 공통 플랫폼 역할을 할 것으로 기대하고 있다.</p> <p contents-hash="c61ab39132cb277836dd7f018a9b9881d0c33973e58115ecf6af7ac9fccbbb3e" dmcf-pid="ZquTSGCEcr" dmcf-ptype="general">또 다이나모 위에서 동작하는 '엔비디아 그로브(Grove)' API를 공개해, 쿠버네티스 환경에서 복잡한 분산 추론 구성을 단일 고수준 사양으로 정의하고 운영할 수 있도록 했다. </p> <p contents-hash="c81d94d5684bb4436c268ed0b3d4f0d236e273a70e81968f7afe2b7f8569167c" dmcf-pid="5B7yvHhDaw" dmcf-ptype="general">사용자는 예를 들어 '프리필에는 GPU 노드 3개, 디코드에는 GPU 노드 6개를 할당하고, 단일 모델 복제본에 속한 모든 노드는 동일한 고속 인터커넥트에 배치한다'는 요구사항을 한 번에 기술할 수 있다. 그로브는 이 사양에 맞춰 각 구성 요소를 올바른 비율로 확장하고 실행 순서와 종속성을 관리하며, 클러스터 전반에 최적 배치하는 작업을 자동으로 처리한다.</p> <p contents-hash="95b1dbadf69871401d15f5860740004b98e6db9c3d0037ca3d7e632f122fd877" dmcf-pid="1bzWTXlwAD" dmcf-ptype="general">엔비디아는 AI 추론이 점점 더 분산 구조로 옮겨가면서 쿠버네티스, 엔비디아 다이나모, 엔비디아 그로브 조합이 개발자의 애플리케이션 설계 방식을 크게 단순화할 것이라고 내다봤다. </p> <p contents-hash="224ef15ec3ba62b5550b3f058ae8f0307690a1f212416d2131493fa7f470a9f8" dmcf-pid="tKqYyZSrgE" dmcf-ptype="general">회사는 자체 대규모 AI 시뮬레이션(AI-at-scale simulation)을 통해 하드웨어 구성과 배포 방식 선택이 성능·효율·사용자 경험에 미치는 영향을 검증하고 있으며, 결과를 기반으로 블랙웰·GB200 NVL72 시스템과 다이나모가 협력해 추론 성능을 높이는 최적 구성을 제시하겠다고 밝혔다.</p> <p contents-hash="e32d135ea358a868b996a1403fcdf43128e435c5b0de4d83ee5439fb582a2613" dmcf-pid="F9BGW5vmkk" dmcf-ptype="general">엔비디아는 마지막으로 풀스택 추론 플랫폼 최신 동향을 다루는 '엔비디아 띵크 스마트(Think SMART)' 뉴스레터를 통해 선도적인 AI 서비스 제공업체와 개발자, 기업이 추론 성능과 투자 대비 수익(ROI)을 높일 수 있는 방법을 지속적으로 공유하겠다고 전했다.</p> <p contents-hash="1dce478945057d083d74863b55e69f5bf53a9cdd17b904ab5dee06b2f6dad4bc" dmcf-pid="32bHY1Tsac" dmcf-ptype="general">남혁우 기자(firstblood@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기