로그인
토토사이트
먹튀사이트/제보
업체홍보/구인
신규사이트
지식/노하우
놀이터홍보
판매의뢰
스포츠분석
뉴스
후기내역공유
커뮤니티
포토
포인트
보증업체
카지노 먹튀
토토 먹튀
먹튀제보
구인
구직
총판
제작업체홍보
카지노
토토
홀덤
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
축구
야구
농구
배구
하키
미식축구
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[연예뉴스]
‘나혼산’ 유지태, 서범준이 준비한 빵에 감격…‘두쫀쿠’ 맛본 반응은?
N
[스포츠뉴스]
"긴장하지 말고 즐겨"→"준비한대로 실수 없이" 설렘과 각오 가득, 밀라노-코르티나로 떠난 태극전사들
N
[연예뉴스]
‘판사 이한영’ 지성 “삐끗하면 끝장”
N
[연예뉴스]
김영철, 청담동에 럭셔리 사무실 오픈..."임대료 몇 백 아니야?" ('김영철 오리지널')
N
[스포츠뉴스]
충격! 美 스키 스타 린지 본, 올림픽 일주일 앞두고 최종 점검 도중 부상
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
목록
글쓰기
[IT뉴스]AI도 못 푸는 ‘초고난도 시험’ 등장…한국인도 같이 문제 냈다
온카뱅크관리자
조회:
11
2026-01-29 10:27:29
<div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="zyWnLgx2HR"> <figure class="figure_frm origin_fig" contents-hash="2a57ee2d13f782036330360e91fc1a8f147f156d0b902d212c329bacb908385a" dmcf-pid="qWYLoaMVZM" dmcf-ptype="figure"> <p class="link_figure"><img alt="'Humanity’s Last Exam', HLE. /intuitionlabs.ai" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/29/chosun/20260129102646377frmt.jpg" data-org-width="1344" dmcf-mid="uYvdJn6bZd" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/29/chosun/20260129102646377frmt.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 'Humanity’s Last Exam', HLE. /intuitionlabs.ai </figcaption> </figure> <p contents-hash="4d3d8ed6bae323c275a7c0a01534e75a37ec8347fe216c9fff7f78251fab9068" dmcf-pid="BYGogNRf1x" dmcf-ptype="general">전 세계 학자들이 힘을 합쳐 인공지능(AI)의 성능을 비교하기 위해 만든 초고난도 시험 문제 ‘인류의 마지막 시험’(Humanity’s Last Exam·HLE)의 내용이 28일 국제 학술지 네이처에 공개됐다.</p> <p contents-hash="2668c641e1436fbf35c4310e265ba228126187acf426451fd43ecc34ed5db9a2" dmcf-pid="bGHgaje4HQ" dmcf-ptype="general">HLE는 전 세계 50개국 500여 기관 교수와 연구자, 약 1000여명의 전문가가 모여 다양한 분야에서 제출한 문제 2500문항으로 구성됐다.</p> <p contents-hash="8c71c579c54b48f28140ceb41afc839267c647a76795d47cb0888585123d29ac" dmcf-pid="KHXaNAd81P" dmcf-ptype="general">제출자 중엔 AI스타트업 에임인텔리전스의 박하언 최고기술책임자(CTO), 김대현 연세대 교수를 비롯, KAIST·한국기술교육대 등의 국내 연구자들도 포함됐다.</p> <p contents-hash="6c0f3b646512e9c3b131d4e7326a0eefec6eabc4b461de7a4748e72f0d3aa178" dmcf-pid="9XZNjcJ616" dmcf-ptype="general">HLE는 미국 비영리단체 AI안전센터(CAIS)와 스타트업 스케일AI가 지난해 1월 처음 공개한 프로젝트다. 이후 1년 정도 검증기간을 거쳐 이날 공식 논문으로 발표됐다. 최근 AI 성능이 빠르게 고도화되면서 기존 성능 평가 기준들이 더 이상 변별력을 갖기 어려워지자, 이를 보완할 새로운 벤치마크를 마련하기 위해 기획됐다.</p> <p contents-hash="ff20e2ae581515cafddb9c0b14dd6d4402d1b825e5b57c6b3260e17407d6d167" dmcf-pid="2Z5jAkiPt8" dmcf-ptype="general">◇인공지능도 못 푸는 초고난도 문제</p> <figure class="figure_frm origin_fig" contents-hash="8b5aa7a410e64296c14770ee429039b21172c1f94e079038f260584dcff2dc8a" dmcf-pid="V51AcEnQ54" dmcf-ptype="figure"> <p class="link_figure"><img alt="HLE에 포함된 로마 비문 번역 문제 /HLE" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/29/chosun/20260129102647692idgk.jpg" data-org-width="2065" dmcf-mid="730DwmaeXe" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/29/chosun/20260129102647692idgk.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> HLE에 포함된 로마 비문 번역 문제 /HLE </figcaption> </figure> <p contents-hash="163e001860149c6a838e3962c3a354b629d1941001915064add8695665766943" dmcf-pid="fsOPQM9UHf" dmcf-ptype="general">HLE 시험 문항은 수학부터 인문학까지 100여 개 세부 분야를 망라한다. 글과 그림을 함께 해석해야 풀 수 있는 문제도 포함돼 있다.</p> <p contents-hash="700aff29a073629e9166385ff1ed13a850d458e1e2514f6dbb47276770683ac6" dmcf-pid="4OIQxR2uGV" dmcf-ptype="general">수학 문제가 전체 41%로 가장 많다. 로마 시대 묘비에 새겨진 비문을 해석하거나, 벌새 뼈 구조를 묻는 등 인간 전문가 수준의 지식을 요구하는 문제도 다수 출제됐다.</p> <p contents-hash="ecb56c23515f897aaf2058daa292e400d11c412580bd3771fae3400c2b62e6e9" dmcf-pid="8ICxMeV712" dmcf-ptype="general">출제자들은 문제를 낼 당시에 나왔던 최고 성능의 AI도 풀지 못한 문제만을 선별해 최종 문항으로 남겼다고 한다.</p> <p contents-hash="9232488ef24c7479f992c9aca71b10ce6e648ed1cc088ba769a798e88a40970f" dmcf-pid="6ChMRdfzH9" dmcf-ptype="general">◇제미나이도 챗GPT도 ’40점 미만'</p> <p contents-hash="8a5b9c71051b7d745289832295a99290d7b79dc6b092c20c965295083ea1a53d" dmcf-pid="PhlReJ4qXK" dmcf-ptype="general">실제로 이 문제들을 최신 AI에게 풀게 했을 때, AI들은 모두 40점에도 못 미치는 점수를 기록했다.</p> <p contents-hash="428d2ffd4b4d32e71c0fc9040290a9ee2ccab2006a77a4f0e86cf47ffba09686" dmcf-pid="QlSedi8B5b" dmcf-ptype="general">CAIS에 따르면, 구글 ‘제미나이 3 프로’는 정확도 38.3점으로 가장 높은 점수를 기록했다. 오픈AI의 GPT-5.2는 29.9점, 오푸스 4.5는 25.8점, 딥시크 3.2는 21.8점에 그쳤다.</p> <p contents-hash="eec4c0135c8c28079d59f0bc940173ec8db3360953b253a1842b0099047b3709" dmcf-pid="xSvdJn6bZB" dmcf-ptype="general">국내 AI 모델들의 성적은 더 낮다. 텍스트 문항만을 대상으로 한 평가에서 LG AI연구원의 ‘엑사원’은 13.6점, 업스테이지의 ‘솔라 오픈’은 10.5점, SK텔레콤의 ‘A.XK1′은 7.6점을 받았다.</p> <p contents-hash="ea923e045035acd229b089563e60024f8cf2dee48db45034612483c63e388155" dmcf-pid="y6PHX5SrGq" dmcf-ptype="general">다만 출제자들은 HLE의 의미를 과도하게 해석하는 데는 선을 그었다. HLE에서 높은 점수를 기록해도 이는 학술 문제에 대한 전문 지식과 추론 능력이 높아졌음을 의미할 뿐, 인간처럼 새로운 연구를 주도하거나 범용 인공지능(AGI)까지 도달했다는 것은 아니란 얘기다. 출제자들은 “HLE가 인류의 마지막 벤치마크일 거라고는 생각하지 않고, 정말 범용적인 AGI를 시험하는 벤치마크는 없다고 생각한다”고도 했다.</p> <p contents-hash="5585a5b6dd32c2af9840bc656c6ffa546c04ea4f684019d64958c968dee35638" dmcf-pid="WPQXZ1vm1z" dmcf-ptype="general">※참고 <span>A benchmark of expert-level academic questions to assess AI capabilities | Nature</span></p> </section> </div> <p class="" data-translation="true">Copyright © 조선일보. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기