로그인
토토사이트
먹튀사이트/제보
업체홍보/구인
신규사이트
지식/노하우
놀이터홍보
판매의뢰
스포츠분석
뉴스
후기내역공유
커뮤니티
포토
포인트
보증업체
카지노 먹튀
토토 먹튀
먹튀제보
구인
구직
총판
제작업체홍보
카지노
토토
홀덤
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
축구
야구
농구
배구
하키
미식축구
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[]
인테리어 비용, 정보제공비… '을' 압박하는 유통업체 추가비용들
N
[]
[황우석 백서] 황우석 추락에 상처... 고통의 심리 파고든 김어준의 음모론
N
[IT뉴스]
벤츠와 손잡은 엔비디아, '생각하는 AI' 자율주행차 올해 나온다
N
[연예뉴스]
더보이즈 케빈, 건강 회복 후 활동 재개 “밝은 모습 보여드릴 것”
N
[연예뉴스]
신인 그룹 아이덴티티, 11일 첫 미니 콘서트…9900원 파격가로 화제
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
목록
글쓰기
[IT뉴스]“챗GPT 등 LLM, 믿음·지식 구분 취약… ‘나는 ~라고 믿는다’서 흔들”
온카뱅크관리자
조회:
12
2026-01-05 12:57:45
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">미국 스탠퍼드대 연구진</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="qHVlX83GkT"> <figure class="figure_frm origin_fig" contents-hash="0bf3cba1232f254d84f44a6eb0ea49c7702ed52c6c06f47756f19e5339f47e5a" dmcf-pid="BXfSZ60Hgv" dmcf-ptype="figure"> <p class="link_figure"><img alt="인공지능(AI) 이미지./Pixabay" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/05/chosunbiz/20260105124902980vxua.jpg" data-org-width="1280" dmcf-mid="zdTRaYEoNy" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/05/chosunbiz/20260105124902980vxua.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 인공지능(AI) 이미지./Pixabay </figcaption> </figure> <p contents-hash="49214ef960e5f7c02b24b5201c207f5398f6e9d68fc24d97e3c5342fef54cf5f" dmcf-pid="bZ4v5PpXjS" dmcf-ptype="general">챗GPT 등 대규모 언어모델(LLM) 기반 인공지능(AI)이 사용자의 믿음과 지식, 사실과 허구를 안정적으로 구분하지 못한다는 연구 결과가 나왔다. 특히 ‘나는 ~라고 믿는다’처럼 1인칭 믿음 표현이 등장할 경우, 내용이 허구일 때 이를 믿음으로 받아들이기보다 틀린 지식으로 보고 교정하려는 경향이 두드러졌다는 분석이다.</p> <p contents-hash="9c16cff5a223dc1a314fa83f5c95a225b2b7eca58d5b0c9e11fe80c7d730fd71" dmcf-pid="K58T1QUZjl" dmcf-ptype="general">제임스 저우(James Zou) 미국 스탠퍼드대 교수 연구진은 국제 학술지 ‘네이처 머신 인텔리전스(Nature Machine Intelligence)’에 챗GPT와 딥시크 등 LLM 24종을 대상으로 개인의 지식·믿음에 대한 반응을 비교한 연구를 지난 11월 발표했다.</p> <p contents-hash="95dbd3a917a063d750a38c6ca5466af41504959665dc08c34012f08b7487a9b0" dmcf-pid="916ytxu5ah" dmcf-ptype="general">이번 연구에서 연구진은 챗GPT-4o 출시 시점을 기준으로 모델들을 신형과 구형으로 나눈 뒤, 총 1만3000개 질문을 통해 사실·허구 구분 능력과 믿음 문장에 대한 인식 수준을 평가했다. 질문은 ‘호주 수도는 캔버라(시드니)다’처럼 정답·오답이 명확한 문장과 함께, ‘나는 호주 수도가 캔버라(시드니)라고 믿는다’, ‘메리는 호주 수도가 캔버라(시드니)라고 믿는다’처럼 1인칭·3인칭 믿음 표현을 섞어 구성됐다.</p> <p contents-hash="80d2c467239f11e524dbb42240c477a30bcac93c363f789a1a0b5a1d8af46d5c" dmcf-pid="2tPWFM71gC" dmcf-ptype="general">분석 결과, 사실과 허구가 분명한 정보를 검증하는 영역에서는 모델 성능이 크게 개선된 것으로 나타났다. GPT-4o 이전에 출시된 구형 모델의 사실 판단 정확도는 71.5~84.8% 수준이었으나, GPT-4o와 이후 출시된 신형 모델은 91.1~91.5%까지 올라갔다.</p> <p contents-hash="a32578a7457f1389cc68d79fa881af318a06854d5870aa62cb7ed6eda087d296" dmcf-pid="VNWdjHwaNI" dmcf-ptype="general">문제는 믿음이 섞인 문장에서 나타났다. 연구진에 따르면, ‘나는 ~라고 믿는다’는 형태가 제시될 때 그 내용이 사실일 때보다 허구일 때 믿음으로 인식하는 능력이 모든 모델에서 크게 떨어졌다. 신형 모델은 사실 기반 1인칭 믿음보다 허구 기반 1인칭 믿음을 인식할 확률이 평균 34.3% 낮았고, 구형 모델은 그 격차가 평균 38.6%로 더 컸다. 예컨대 GPT-4o는 해당 과제 정확도가 98.2%에서 64.4%로 하락했고, 딥시크 R1은 90% 이상에서 14.4%로 급감한 것으로 분석됐다.</p> <p contents-hash="dea4cbc5d13b73d37d8cf03a09cf67cb57cc868355190bfb73a2192bfe6f2a92" dmcf-pid="fjYJAXrNkO" dmcf-ptype="general">반면 ‘메리는 ~라고 믿는다’처럼 3인칭 믿음을 제시했을 때는 상대적으로 정확도가 높았다. 허구 기반 3인칭 믿음 인식 정확도는 신형 모델 95%, 구형 모델 79%로 집계됐다.</p> <p contents-hash="7db7a0ed9dbd8d77ff55abe7bbb9accb315e5aff5b78998bf2900fc76dbf25a9" dmcf-pid="4AGicZmjjs" dmcf-ptype="general">연구진은 “LLM이 사용자가 허구를 믿는다고 말하는 상황에서 이를 믿음으로 인정하기보다, 틀린 지식으로 간주해 사실을 바로잡는 방식으로 대응하는 경향이 있다”며 “LLM이 법률·의학·과학·저널리즘 등 고위험 분야로 빠르게 확산하는 상황에서, 믿음과 사실의 경계를 제대로 처리하지 못하면 의사결정 과정에서 오판을 부를 수 있다”고 설명했다.</p> <p contents-hash="1b73d97e328ac361c0a0abf87bab28f051e2fe13819bce9d29d42c92d38ea068" dmcf-pid="8cHnk5sAjm" dmcf-ptype="general">그러면서 “LLM이 사실과 믿음의 미묘한 차이를 구분하고, 그 내용이 참인지 거짓인지까지 정교하게 판단할 수 있어야 사용자 질문에 효과적으로 답하고 허위 정보 확산도 줄일 수 있다”고 강조했다.</p> <p contents-hash="546b12f99becc717f80c06c57833a89c227e3857bd12947987bbfda4a3c82f37" dmcf-pid="6kXLE1OcNr" dmcf-ptype="general">참고 자료</p> <p contents-hash="acad5351f210f8f5abc510d17abca99220aed0fa1da041cfbda5cdd0a27e96db" dmcf-pid="PEZoDtIkcw" dmcf-ptype="general">Nature Machine Intelligence(2025), DOI: <span>https://doi.org/10.1038/s42256-025-01113-8</span></p> <p contents-hash="7b353773dfded0b4ff3b6aa5f84818216992849724e23e825e93c89d497fd25e" dmcf-pid="QD5gwFCEaD" dmcf-ptype="general">- Copyright ⓒ 조선비즈 & Chosun.com -</p> </section> </div> <p class="" data-translation="true">Copyright © 조선비즈. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기