로그인
토토사이트
먹튀사이트/제보
업체홍보/구인
신규사이트
지식/노하우
놀이터홍보
판매의뢰
스포츠분석
뉴스
후기내역공유
커뮤니티
포토
포인트
보증업체
카지노 먹튀
토토 먹튀
먹튀제보
구인
구직
총판
제작업체홍보
카지노
토토
홀덤
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
축구
야구
농구
배구
하키
미식축구
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[IT뉴스]
“중국게임 우습게 봤다간 다쳐”…대작부터 덕질게임까지 한중대결
N
[IT뉴스]
과학은 나이든 남성 전유물?…비주류 여교수, 과총 60년천장 뚫었다
N
[연예뉴스]
김태리, 사라진 최현욱 찾다 '정자'서 발견…강남 "비닐봉지인 줄 알았어" 깜짝 ('방과후 태리쌤')
N
[연예뉴스]
‘24억 건물주’ 권은비, 5성급 호텔 상무에 인정 받았다..“되게 질투나네” ('사당귀')[종합]
N
[스포츠뉴스]
충격 또 충격! 안세영? "불과 몇 세트 더 운동했을 뿐인데"...中 "왕즈이, 이기는 방법 찾아내"
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
목록
글쓰기
[IT뉴스]챗GPT·제미나이의 '높은 벽'… 국산 AI로 수능 수학 풀면 낙방
온카뱅크관리자
조회:
66
2025-12-15 11:27:31
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">서강대 김종락 교수팀, 해외 AI 모델과 한국 모델 수능 수학 테스트… 정답률 큰 차이</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="bL0c7pwa5I"> <figure class="figure_frm origin_fig" contents-hash="11d22fb59e35da18940e3ab5c1e94bb2437a2b19bda8fec802b282d20e7fb12b" dmcf-pid="KauDB7sAXO" dmcf-ptype="figure"> <p class="link_figure"><img alt="오픈AI 챗GPT 이미지. /사진=로이터" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202512/15/moneyweek/20251215112546061hokw.jpg" data-org-width="596" dmcf-mid="B2O4lIQ91C" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202512/15/moneyweek/20251215112546061hokw.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 오픈AI 챗GPT 이미지. /사진=로이터 </figcaption> </figure> <div contents-hash="7abd4149e4a6ad7cc0eefe9c2082c194664f89d9f2c67746ef5c196a0ddd8a02" dmcf-pid="9N7wbzOcts" dmcf-ptype="general"> 한국 대표 거대언어모델(LMM)들이 해외 모델들과 비교해 수학 수능·논술 문제 풀이에서 성능이 뒤지는 것으로 나왔다. </div> <p contents-hash="3d52760c95587d23cc8c554d4cb3ca6c2077952acc5b4b67ccc5e32079317909" dmcf-pid="2jzrKqIkZm" dmcf-ptype="general">김종락 서강대 수학과 교수 연구팀은 국내 대표 AI 도전 5개 팀의 LLM 모델과 챗GPT·제미나이 등 5개 모델을 대상으로 수능 수학 20문제·논술 30문제를 풀게 한 결과를 공개했다.</p> <p contents-hash="8a53e882af945640145a2aa4af0d66f208af59882fc84e18c8ce579e6385e20b" dmcf-pid="VAqm9BCE1r" dmcf-ptype="general">연구팀은 수능 수학의 ▲공통과목 ▲확률과 통계 ▲미적분 ▲기하 영역에서 가장 어려운 5문항씩 총 20문제, 서울 주요대학 10곳의 논술 기출문제와 인도 대학 입시, 일본 도쿄대 공대 대학원 입시문제 각 10문항씩 총 30문제를 선정해 평가를 진행했다.</p> <p contents-hash="eb0db0d4dd9d32f463dbb9cf628e41a1f37c521264806d93f15fe3cad8e378a3" dmcf-pid="fcBs2bhD5w" dmcf-ptype="general">한국 모델은 ▲업스테이지 솔라 프로-2 ▲LG AI연구원 엑사원 4.0.1 ▲네이버 HCX-007 ▲SK텔레콤 A.X 4.0(72B) ▲엔씨소프트 라마 바르코 8B 인스트럭트 등을 시험했다. 미국·중국 등 해외 모델의 경우 ▲오픈AI GPT-5.1 ▲구글 제미나이 3 프로 프리뷰 ▲앤트로픽 클로드 오푸스 4.5 ▲xAI 그록 4.1 패스트 ▲딥시크 V3.2 등을 적용했다. </p> <p contents-hash="2721f1fa36fa0a89e3e7238409b9229534b559f8e5807d522dd0ba8f87e3b020" dmcf-pid="4kbOVKlwXD" dmcf-ptype="general">해외 모델 점수는 76점~92점을 기록했지만 한국 모델은 솔라 프로-2가 58점으로 가장 높았고 나머지는 20점대였다. 경량모델인 라마 바르코 8B 인스트럭트는 2점이었다. </p> <p contents-hash="4020318a44e86eb705782c0c4f0f56ad0add0f471a04dfd8d91215d1410ad2cd" dmcf-pid="8EKIf9SrZE" dmcf-ptype="general">연구팀은 한국 모델들이 단순 추론으로는 대부분 문제를 풀지 못해 파이선(Python) 계산 툴을 활용할 수 있도록 설정했음에도 낮은 정답률을 보였다고 설명했다.</p> <p contents-hash="267b27d142540829a60a8c8b225b89f6b2931f81523392ac3f007759b26334dd" dmcf-pid="6D9C42vm5k" dmcf-ptype="general">연구진이 대학생 수준부터 교수급 연구 난도까지 세분화한 자체 문제 세트 '엔트로피매스'(EntropyMath) 100문제 중 10문항을 추가로 구성해 진행한 테스트에서도 격차는 컸다. 미·중 모델은 82.8점에서~90점, 한국 모델은 7.1점에서~53.3점에 그쳤다.</p> <p contents-hash="8db609bc4829973ea04d14754f96a0d6038c7aae0ae15def988ac377d9371b83" dmcf-pid="Pw2h8VTsHc" dmcf-ptype="general">문제 풀이를 3번 시도해 정답을 맞히면 통과하도록 기준을 완화했을 땐 미국과 중국 모델은 대부분 90점 이상을 받았고 그록은 만점을 기록했다. 그럼에도 솔라 프로-2는 70점, 엑사원은 60점, HCX-007은 40점, A.X 4.0은 30점, 라마 바르코는 20점에 머물렀다.</p> <p contents-hash="36285658daecc956d2792e85809fae9251be6b2c8640a9803c432cabcaa3930b" dmcf-pid="QrVl6fyOYA" dmcf-ptype="general">김 교수는 "주위에서 왜 수능 문제에 대한 국내 5개 소버린 AI 모델 평가가 없는지 문의가 많아 팀원들과 테스트했다"며 "국내 모델 수준이 해외 모델보다 많이 뒤처짐을 알 수 있었다"고 했다. 이어 "한국 5개 모델은 기존 공개 버전인 만큼 각 팀의 국가대표 AI 버전이 새로 공개되면 자체 개발 문제로 다시 성능을 테스트하겠다"고 부연했다.</p> <p contents-hash="59e00dbb203101b1cc46dca11dc533037e3bb8fd9d820e7048d5bcbb0ce01128" dmcf-pid="xmfSP4WIYj" dmcf-ptype="general">양진원 기자 newsmans12@mt.co.kr</p> </section> </div> <p class="" data-translation="true">Copyright © 머니S & moneys.co.kr, 무단 전재 및 재배포 금지</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기