로그인
토토사이트
먹튀사이트/제보
업체홍보/구인
신규사이트
지식/노하우
놀이터홍보
판매의뢰
스포츠분석
뉴스
후기내역공유
커뮤니티
포토
포인트
보증업체
카지노 먹튀
토토 먹튀
먹튀제보
구인
구직
총판
제작업체홍보
카지노
토토
홀덤
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
축구
야구
농구
배구
하키
미식축구
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[]
美 “핵 해체” vs 이란 “핵협상은 나중”…종전 MOU 곳곳 엇갈려
N
[스포츠뉴스]
[오피셜] 이러다 안세영 쓰러진다!…귀국 일주일도 안 됐는데→7월 日 오픈·中 오픈 '출전 확정'
N
[스포츠뉴스]
'손에 샤넬백' 日얼짱 올림픽 메달리스트, 유니폼 벗으니→'여신 강림' 반전 사복 패션
N
[]
이란 "종전 MOU 서명 14일은 아냐"…막판 신경전(종합)
N
[IT뉴스]
'TBH: 태스크바 히어로', 동접 50만 코앞…식지 않는 열기
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
목록
글쓰기
[IT뉴스]한국어 맥락 이해하는 K-AI 지표 나온다
온카뱅크관리자
조회:
29
2026-06-11 17:47:28
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">AI모델 측정 평가기준 구축 위해<br>과기정통부·NIA 연내 사업 완료<br>국어 복합적 의미 해석 역량 높여<br>독자적 벤치마크 데이터셋 확보</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="9CF1PccnSA"> <figure class="figure_frm origin_fig" contents-hash="4a0efcfc5b4428849f2570e47e5e7e6e33f9a687785738f95b36502e822517a5" dmcf-pid="2h3tQkkLWj" dmcf-ptype="figure"> <p class="link_figure"><img alt="한국형 AI 모델 벤치마크 데이터셋 개요. 제미나이 생성" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202606/11/seouleconomy/20260611174128085xlhz.png" data-org-width="1200" dmcf-mid="KQkAHKKpCc" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202606/11/seouleconomy/20260611174128085xlhz.png" width="658"></p> <figcaption class="txt_caption default_figure"> 한국형 AI 모델 벤치마크 데이터셋 개요. 제미나이 생성 </figcaption> </figure> <p contents-hash="7445cdd7838697530c956ec10032f0c58734489a47d80cfaea7447cc8946b875" dmcf-pid="Vl0FxEEoSN" dmcf-ptype="general">인공지능(AI)의 한국어 문맥 이해 능력을 정밀하게 측정할 수 있는 새로운 공공 평가 체계가 나올 전망이다. 글로벌 벤치마크를 단순 차용하거나 오래된 기준을 재조합하던 방식에서 벗어나 고어와 방언을 포함해 한국 고유의 언어적·문화적 특성을 제대로 검증하겠다는 취지다. AI 에이전트 도입이 확산함에 따라 AI의 범용적 능력보다는 실제 업무 환경에서 얼마나 잘 활용될 수 있는지가 중요해졌기 때문이다.</p> <p contents-hash="71ec6dbd7244fcad71935cf0008ea5cc9e8b7b04dc48147562941ace5fb34dd8" dmcf-pid="fSp3MDDgya" dmcf-ptype="general">11일 정보기술(IT) 업계에 따르면 과학기술정보통신부와 한국지능정보사회진흥원(NIA)은 AI 모델 벤치마크 데이터셋 구축 사업을 진행 중이다. 이를 위해 최근 개발업체 등 사업자를 선정했으며 결과물 검증 등을 거쳐 올해 안에 프로젝트를 완료한다는 방침이다.</p> <p contents-hash="0b00c6f80f0f05ecd0a477dfab76195b92c9c794626337a5eca052edffaf3b03" dmcf-pid="4vU0Rwwayg" dmcf-ptype="general">벤치마크 데이터셋은 표준화된 문제와 평가 기준을 통해 동일한 조건에서 여러 AI 모델의 성능을 비교·검증하는 테스트베드 역할을 한다. 이번 사업은 AI 모델의 성능을 측정·비교하는 평가 기준(벤치마크)을 국내 맞춤형으로 고도화해 한국형 AI 모델의 글로벌 경쟁력을 확보하는 데 초점이 맞춰졌다. 그동안 국내 AI 벤치마크는 해외 유명 데이터셋을 한국어로 번역하거나 여러 해외 벤치마크를 한국 상황에 맞게 조합하는 수준에 머물렀다. 특히 법률·의료 등 전문 도메인이나 AI 안전성을 검증할 독자적인 평가 체계는 찾아보기 어려운 실정이다.</p> <p contents-hash="91500b2548d950f038ce9b37c31a7ae05b057f9e701ca593c7012c2e830472f9" dmcf-pid="8TuperrNho" dmcf-ptype="general">NIA 관계자는 “기존의 글로벌 벤치마크 평가 방식으로는 한국적 특성 및 한국의 언어·문화·사회적 맥락을 충분히 반영하지 못하는 한계가 있다”면서 “신뢰할 수 있는 성능 지표를 제공함으로써 한국형 AI 모델 도입·확산 생태계를 조성할 것”이라고 설명했다.</p> <p contents-hash="0389cb4c18ca988243a8081c792063981123e363ab605af7abdfa9481acc8bbf" dmcf-pid="6y7UdmmjhL" dmcf-ptype="general">NIA는 AI가 한국어의 복합적인 의미를 해석할 수 있는지 판별할 수 있는 독자 벤치마크를 개발하겠다는 구상이다. 이를 위해 데이터셋에는 중세, 근대 시대에 쓰이던 고어나 지역 사투리, 신조어 등을 포함할 방침이다. 한국어 문법은 물론 조선시대 문헌이나 지역별 사투리까지 넘나드는 고도의 추론·문제 해결 능력을 갖춰야 제대로 된 AI라는 판단에서다.</p> <p contents-hash="51bd54081dcc33678113a7fdd7641c6fd790adf16fc3cec3d122e60066cbc835" dmcf-pid="PmZHfaaeSn" dmcf-ptype="general">이처럼 새로운 벤치마크의 필요성이 커지고 있는 것은 AI 에이전트 시대를 맞아 AI 성능은 물론 활용도까지 중요해지고 있기 때문이다. 실제로 해외에선 MMLU-프로와 같은 기존 벤치마크가 변별력을 상실했다는 지적이 나왔다. MMLU는 범용 능력 벤치마크로 언어 이해, 지식 활용, 추론 능력 등을 폭넓게 측정한다. 글로벌 AI 전문 평가기관 아티피셜 애널리시스는 올해 들어 기존 평가 체계를 전면 개편하면서 MMLU-프로를 제외했다. 단순 정답률 중심 시험에서 벗어나 AI가 경제적 가치를 창출하는 업무를 수행할 수 있는지를 묻는 방향으로 기준이 바뀌었기 때문이다.</p> <p contents-hash="c372c7a512d8cfbd06ab97866a099ac9f8e08c76d18bbfde1806695474ff5488" dmcf-pid="Qs5X4NNdvi" dmcf-ptype="general">AI가 실제 환경에서 얼마나 유용하게 작동하는지 검증하는 목적 지향형 벤치마크도 늘어나는 추세다. AI 에이전트의 문제해결력을 평가하는 ‘에이전트벤치(AgentBench)’, 허위정보와 환각 생성 여부를 보는 ‘트루스풀QA(TruthfulQA)’, 사용자 지시 이행도를 측정하는 ‘IFEval’ 등이 대표적이다.</p> <p contents-hash="da96c6346fa7de7e2deb94968c4c8076a86a67b841ef30b4b41acdcb937b8574" dmcf-pid="xO1Z8jjJvJ" dmcf-ptype="general">김기혁 기자 coldmetal@sedaily.com</p> </section> </div> <p class="" data-translation="true">Copyright © 서울경제. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기