로그인
토토사이트
먹튀사이트/제보
업체홍보/구인
신규사이트
지식/노하우
놀이터홍보
판매의뢰
스포츠분석
뉴스
후기내역공유
커뮤니티
포토
포인트
보증업체
카지노 먹튀
토토 먹튀
먹튀제보
구인
구직
총판
제작업체홍보
카지노
토토
홀덤
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
축구
야구
농구
배구
하키
미식축구
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[연예뉴스]
개코·김수미, 15년 만에 이혼 "부모로서 책임 끝까지 이어갈 것"
N
[연예뉴스]
에이핑크 윤보미도 반했다…겨울철 면역력 올리는 문정희의 ‘1℃ 밥상’ (편스토랑)
N
[연예뉴스]
'잉꼬부부' 개코·김수미, 결혼 14년차 충격 파경 "지난해 이혼, 양육은 함께" [종합]
N
[연예뉴스]
차가원 측 "100억 대 사기 혐의 피소? 고소장 받은 적 없다" [공식]
N
[연예뉴스]
이광민 정신과 전문의, 송은이 만나 직장인 고민 상담 完····‘비밀보장’ 출연까지 약속!(쎄오로그)
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
목록
글쓰기
[IT뉴스]AI, 일본 변호사 됐다...96점으로 시험 합격
온카뱅크관리자
조회:
34
2026-01-08 14:28:02
<div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="9dv5z4FYoT"> <p contents-hash="49a2081205964334e359328cfb759a058a9d3cc7e36790b1325ff1cdf77fc1cd" dmcf-pid="2FdjOWkLAv" dmcf-ptype="general">(지디넷코리아=AI 에디터 )</p> <figure class="figure_frm origin_fig" contents-hash="cc12df4fe3d984207f9a214802bb7ff4fe908af4f3bc50415dfd8afb7d641a55" dmcf-pid="V3JAIYEogS" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/08/ZDNetKorea/20260108141942820ztwq.jpg" data-org-width="640" dmcf-mid="Kp9xgwe4Ay" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/08/ZDNetKorea/20260108141942820ztwq.jpg" width="658"></p> </figure> <p contents-hash="eacf4702940b1f4532a357c717bd8561b043a5cd1846839e0a21fd082787d022" dmcf-pid="f0icCGDgAl" dmcf-ptype="general">인공지능(AI)이 복잡한 법률 시험에서 합격선을 넘은 것은 이번이 처음이다. 일본 게이오대학교 연구팀은 오픈AI의 GPT-4.1을 일본 변호사 시험에 맞게 학습시키고 스스로 답을 검증하는 방법을 적용해 객관식 부분을 통과했다고 발표했다. 이 연구는 AI가 단순히 법률 지식을 외우는 수준을 넘어, 여러 문제를 동시에 판단하고 정해진 형식에 맞춰 답할 수 있음을 보여준다.</p> <p contents-hash="d38ac0c624bb69c3afc23222b23256494434a9afbbfc99be7fd661a56fa1898b" dmcf-pid="4pnkhHwaoh" dmcf-ptype="general"><strong>문제 쪼개지 않고 원본 그대로 학습해 96점 획득</strong></p> <p contents-hash="7d023ee30f64a54b8bdf5ed656d883f02c65dceef87100ad45c2028b29284801" dmcf-pid="8ULElXrNaC" dmcf-ptype="general">연구팀이 GPT-4.1을 학습시킨 결과, 2024년 일본 변호사 시험에서 96점을 받았다. 합격 기준인 93점을 넘긴 것이다. 가장 중요한 점은 시험 문제를 쉽게 바꾸지 않고 원본 형태 그대로 학습시켰다는 것이다. 일본 변호사 시험 객관식 문제는 특이한 방식으로 출제된다. 여러 개의 문장이 맞는지 틀렸는지 판단한 뒤, 그 결과를 조합해서 답해야 한다. 예를 들어 "112"처럼 각 문장의 정답 번호를 이어 붙여 제출해야 하는데, 하나라도 틀리면 전체가 오답 처리된다.</p> <p contents-hash="12fabe0595fc235b3efa176ef3eb1ddef58cfedcb7a3fe9fd74ca3d4ce7e2106" dmcf-pid="6uoDSZmjoI" dmcf-ptype="general">기존 연구들은 이런 복잡한 문제를 개별 O/X 퀴즈로 쪼개서 AI를 학습시켰다. 대표적으로 일본 변호사 시험 질의응답 데이터셋(JBE-QA)은 하나의 시험 문제를 여러 개의 독립된 질문으로 나눴다. 이 방식으로는 2,770개의 많은 문제로 학습할 수 있었다. 연구팀이 GPT-4.1을 JBE-QA로 학습시켜 실제 시험 형식으로 평가했을 때 64점밖에 받지 못했다. 반면 원본 형식을 유지한 460개 문제(2019-2023년 과거 시험)로 학습시킨 GPT-4.1은 92.3점을 기록했다.</p> <p contents-hash="f997e29b2bab638f7043ffc251aa7541fe5556db4278624e111d6ea6deee2300" dmcf-pid="P7gwv5sAoO" dmcf-ptype="general"><strong>AI가 스스로 답을 재검토해 정답률 49%까지 향상</strong></p> <p contents-hash="254eb3b7624c828570de1970b2dc574d54f0e2c1e5cc3b7a11145398b26ec451" dmcf-pid="QzarT1Occs" dmcf-ptype="general">연구팀은 '자체 검증'이라는 방법을 추가로 적용했다. 이는 학습된 GPT-4.1이 답을 낸 후, 같은 모델이 스스로 그 답이 문제 조건에 맞는지 다시 확인하는 것이다. 중요한 것은 별도의 AI를 추가하는 게 아니라, 같은 GPT-4.1 모델에 다른 질문 방식(프롬프트)을 적용해 자기 답을 점검하게 만든다는 점이다. 이 과정은 한 번의 추가 계산만 필요하다.</p> <p contents-hash="56be94362afbdb35a679adef9a53e419c1d2c26ba282794b7b49de2cdde366fd" dmcf-pid="xqNmytIkcm" dmcf-ptype="general">자체 검증을 적용한 결과, 정답률은 46.8%에서 49.4%로 올랐고, 시험 점수는 92.3점에서 94.7점으로 증가했다. 이는 모델이 법률 지식이 부족해서가 아니라, 여러 문장을 함께 판단할 때 일관성을 유지하지 못해서 틀리는 경우가 많다는 것을 보여준다. 자체 검증은 이런 논리적 모순을 효과적으로 고쳐준다.</p> <p contents-hash="b61138798fac230535b0e7fc9e2c3d8ef0e4823c1af91759723cb327300fbc34" dmcf-pid="yD0KxoV7ar" dmcf-ptype="general">흥미로운 점은 이 방법이 학습하지 않은 기본 GPT-4.1에도 적용 가능하다는 것이다. 추가 학습 없는 기본 GPT-4.1 모델은 자체 검증으로 68.3점에서 76.3점으로, JBE-QA로 학습한 GPT-4.1은 64점에서 80.7점으로 성적이 올랐다. 이는 자체 검증이 특정 학습 방식에만 효과적인 게 아니라 범용적으로 사용할 수 있는 기법임을 보여준다.</p> <p contents-hash="2738d395d8fe26d09d28d2b49b9fadb4f49bc26bb4880f5fc6812fac461359ad" dmcf-pid="Wwp9Mgfzgw" dmcf-ptype="general"><strong>여러 AI 협력보다 혼자 푸는 게 더 효과적</strong></p> <p contents-hash="8f4b4354af4c38d4da01305c1530a0607c84c873f33e157258ed0d6f590cdd90" dmcf-pid="YrU2Ra4qcD" dmcf-ptype="general">연구팀은 여러 AI가 협력하는 방식도 실험했다. 정보를 찾는 AI, 검증하는 AI, 지식을 추출하는 AI, 최종 답을 내는 AI로 구성된 시스템을 만들었다. 법률 분야에서 여러 AI가 협력하면 좋다는 기존 연구들과 달리, 이번 실험에서는 오히려 성적이 떨어졌다.</p> <p contents-hash="7a846680925ebc3e4bbbb45ba3bd9c005e3ab61ad7afed34f8bdb076c1cbfcf5" dmcf-pid="G8mTtqYCgE" dmcf-ptype="general">같은 학습된 모델을 여러 역할로 나눠 사용한 시스템은 75.7점, 역할마다 따로 학습한 모델들을 사용한 시스템은 71.0점에 그쳤다. 이는 단일 모델의 94.7점에 비해 훨씬 낮은 점수다. 연구팀은 엄격한 형식 규칙이 있는 시험에서는 AI들 사이에서 오류가 전달되고 쌓이는 문제가 생긴다고 분석했다. 특히 따로 학습된 모델들은 서로 다른 방식으로 생각해서 결과를 합치기 어려웠다.</p> <p contents-hash="5afec7aa23e67dca85881329c67b57328724f920e30be20072e1dcdaafb6aa4f" dmcf-pid="H6syFBGhNk" dmcf-ptype="general"><strong>원본 형식 유지가 법률 AI 성능의 핵심</strong></p> <p contents-hash="bb9679d8b7ea1cc190852dd1b7021555fc8d6fae200cf36fed19a9505f428bb8" dmcf-pid="XPOW3bHlAc" dmcf-ptype="general">이번 연구는 법률 AI 평가에서 중요한 교훈을 준다. 쉬운 테스트에서 높은 점수를 받는다고 해서 실제 시험을 통과할 수 있는 건 아니라는 것이다. JBE-QA로 학습한 GPT-4.1은 2,770개의 많은 문제로 법률 지식을 배웠지만, 여러 문장을 함께 판단하는 능력은 배우지 못했다. 그 결과 개별 문장 정답률이 50%가 넘어도 전체 답안에서는 0점을 받는 경우가 자주 발생했다.</p> <p contents-hash="586e8f76ef5acb842ec0b66fab0a035ab38f1f1206ce34fe23f008c54ccc1e19" dmcf-pid="ZQIY0KXSAA" dmcf-ptype="general">연구팀은 원본 형식을 지키는 것이 법률 AI 학습의 핵심이라고 강조한다. 원본 시험 형식을 유지한 학습 문제가 비록 460개로 적더라도, GPT-4.1 안에 이미 있는 숨겨진 지식을 효과적으로 끌어낸다는 것이다. 자체 검증은 이 효과를 더욱 키워서, 모델이 자신의 답을 다시 평가하고 정리하도록 만든다.</p> <p contents-hash="57f8c21df8abd6566ed8e14404d66ee4f559fb482b5d89fc35a0c67821df61f6" dmcf-pid="5xCGp9ZvAj" dmcf-ptype="general">시험 과목별로는 헌법, 민법, 형법 중 민법에서 42.3점으로 가장 높은 점수를 받았다. 일본 변호사 시험은 각 과목에서 40% 이상의 점수를 받아야 하는데, 연구팀이 학습시킨 GPT-4.1은 이 조건도 충족했다. 다만 이번 연구는 객관식 부분만 다뤘으며, 논술형 문제는 포함하지 않았다.</p> <p contents-hash="966e869ac62002d14e42148bf3184160ed8e1be6c1006804a9ef644edd6aef0a" dmcf-pid="1MhHU25TgN" dmcf-ptype="general"><strong>FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)</strong></p> <p contents-hash="8c5726d7d9d282d5b6d004079f44e3f977f7b2b35a9a88692719a0b0b9e463a6" dmcf-pid="tRlXuV1yNa" dmcf-ptype="general"><strong>Q. 자체 검증이란 무엇이며 어떻게 작동하나요?</strong></p> <p contents-hash="d63ce5fc6aebd44b6aaf6c2b2449ba91d579abb3055c95ddc8840cb997b6d460" dmcf-pid="FeSZ7ftWkg" dmcf-ptype="general">A. 자체 검증은 AI가 답을 낸 후 스스로 그 답이 맞는지 다시 확인하는 방법입니다. 같은 모델(GPT-4.1)에 다른 방식의 질문(프롬프트)을 주어 자기 답을 문제와 대조하며, 명백히 틀렸을 때만 수정합니다. 추가 학습 없이 한 번의 계산만으로 가능하며, 여러 문장을 함께 판단할 때 생기는 모순을 효과적으로 고쳐줍니다.</p> <p contents-hash="6861f7e137680d7d30e336be48d0daf5e0dfffe5d6c5a95b9ea54ef206243e89" dmcf-pid="3dv5z4FYoo" dmcf-ptype="general"><strong>Q. 왜 문제를 쪼개지 않고 원본 형식으로 학습했나요?</strong></p> <p contents-hash="29fd1831b0be4b67629dc8beba9842d1f176d0f8a403198622ba7912c04d5624" dmcf-pid="0JT1q83GNL" dmcf-ptype="general">A. 일본 변호사 시험은 여러 문장을 동시에 판단해 정해진 형식으로 답해야 합니다. 문제를 개별 O/X로 쪼개면 각 문장은 잘 판단할 수 있지만, 실제 시험에서 요구하는 종합 판단 능력은 배울 수 없습니다. 실제로 개별 정답률이 50%가 넘어도 전체 답안 형식에서는 0점을 받는 경우가 많았습니다.</p> <p contents-hash="ebe23b5085d79cf2eabb04e741a2841995a01d8bd558dfd1df4ed1e8a86825ca" dmcf-pid="piytB60Han" dmcf-ptype="general"><strong>Q. 이 AI가 실제 변호사 일을 할 수 있나요?</strong></p> <p contents-hash="2268cca174f28f4cd9c6d6431ab295919e802c605d6e4581efd5e7738589ea17" dmcf-pid="UnWFbPpXji" dmcf-ptype="general">A. 아니요. 이번 연구는 객관식 시험 통과만을 다뤘으며, 실제 법률 상담이나 논술형 법률 논증 능력은 평가하지 않았습니다. 시험 합격이 실무 능력이나 윤리적 판단력을 의미하지는 않으므로, 법률 분야에서 AI를 활용할 때는 반드시 전문가의 감독이 필요합니다.</p> <p contents-hash="9bb975e26863f5f190fe4446d6e2bde0d2c50843649e7d30057eb965d28ee46f" dmcf-pid="uLY3KQUZgJ" dmcf-ptype="general">■ 이 기사는 AI 전문 매체 ‘<span>AI 매터스</span>’와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. </p> <p contents-hash="cc9da43b8362c5199f154145be2ac6f75eb265a800c5dbd80379bbb0ea5b26d5" dmcf-pid="7oG09xu5kd" dmcf-ptype="general">AI 에디터 (media@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기