로그인
토토사이트
먹튀사이트/제보
업체홍보/구인
신규사이트
지식/노하우
놀이터홍보
판매의뢰
스포츠분석
뉴스
후기내역공유
커뮤니티
포토
포인트
보증업체
카지노 먹튀
토토 먹튀
먹튀제보
구인
구직
총판
제작업체홍보
카지노
토토
홀덤
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
축구
야구
농구
배구
하키
미식축구
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[연예뉴스]
장항준 “1000만 공약? 웃자고 한 말”…개명·성형 대신 커피차
N
[스포츠뉴스]
감사원 "2020∼2024년 범죄이력 체육지도자 222명 현장 활동"
N
[스포츠뉴스]
심석희 감사장 받았다!…하남시, 2026 동계올림픽 금메달 노고 치하
N
[연예뉴스]
장현성, 영화 ‘휴민트’부터 연극 ‘불란서 금고’까지! 스크린-무대 넘나드는 행보
N
[스포츠뉴스]
'팀킴' 확 바뀌었다!…강릉시청 女 컬링팀, 김혜린·하승연 영입
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
목록
글쓰기
[IT뉴스][사이테크+] "LLM 인공지능, 믿음-지식·사실-허구 제대로 구분 못 해"
온카뱅크관리자
조회:
54
2026-01-05 08:17:33
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">美 연구팀 "법률·의학·과학 등 AI 적용할 때 결과 활용에 주의해야"</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="0p9vQgfzGe"> <p contents-hash="32d0857fae22337959c76d401e27d83886b979998f557a6e954e1bbfb9e8a6ef" dmcf-pid="poDfhZmjtR" dmcf-ptype="general">(서울=연합뉴스) 이주영 기자 = 챗GPT 같은 대규모 언어모델(LLM) 인공지능(AI)은 사람들의 믿음(belief)과 지식(knowledge), 사실(fact)과 허구(fiction)를 신뢰성 있게 구분하지 못한다는 연구 결과가 나왔다.</p> <figure class="figure_frm origin_fig" contents-hash="bf9e688ddd4487b7b263d2deabab061aa64210bb70b5c55ce2ea379b69b2f76c" dmcf-pid="Ugw4l5sAXM" dmcf-ptype="figure"> <p class="link_figure"><img alt="인공지능(AI) [로이터 연합뉴스 자료사진. 재판매 및 DB 금지]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/05/yonhap/20260105080957973kxvv.jpg" data-org-width="500" dmcf-mid="FqM1ord8tJ" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/05/yonhap/20260105080957973kxvv.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 인공지능(AI) [로이터 연합뉴스 자료사진. 재판매 및 DB 금지] </figcaption> </figure> <p contents-hash="7215a36457d507c380a80af7ef0db548fe440eb745be3b999592fd9495e75cc1" dmcf-pid="uar8S1Oc1x" dmcf-ptype="general">미국 스탠퍼드대 제임스 저우 교수팀은 5일 과학 저널 네이처 머신 인텔리전스(Nature Machine Intelligence)에서 챗GPT와 딥시크 등 LLM 24종에 대해 개인의 지식과 믿음에 대해 어떻게 반응하는지 분석, 이런 결과를 얻었다고 밝혔다.</p> <p contents-hash="2798c3b246a20a302adccf38ea1b063d49ef51c6fd0bb822917895e042215341" dmcf-pid="7Nm6vtIk5Q" dmcf-ptype="general">연구팀은 이 연구는 LLM을 법률, 의학, 과학 등 믿음이나 의견이 사실과 대비되는 분야에 적용할 경우, AI가 내놓는 결과를 의사 결정에 활용할 때 주의할 필요가 있다는 것을 보여준다고 말했다.</p> <p contents-hash="f43406a9d47b678310d3ce40e2caa20d9be120d8eea67e85a3982d1f2c9faa4c" dmcf-pid="zjsPTFCE5P" dmcf-ptype="general">챗GPT와 딥시크(DeepSeek), 제미나이(Gemini), 라마(Llama), 클로드(Claude) 등 LLM 기반 AI가 법률, 의학, 저널리즘, 과학 등 고위험 분야에 빠르게 확산하면서 믿음과 지식, 사실과 허구를 구분하는 능력이 더욱 중요해지고 있다.</p> <p contents-hash="e07ad57d7e236899847e6a3bd735fb20e94b9a849b281865f562318f8e94086e" dmcf-pid="qAOQy3hD56" dmcf-ptype="general">연구팀은 이런 분야에서 AI가 지식과 믿음, 사실과 허구를 제대로 구분하지 못하면, 질병 등에 대한 잘못된 진단을 초래하고, 법률적 판단을 왜곡하며, 허위 정보를 증폭시킬 위험이 있다고 지적했다.</p> <p contents-hash="10aa457f8bffe637a6756cc83d94e7397881e91974b1e32ad9f0151dba991fd0" dmcf-pid="BcIxW0lwH8" dmcf-ptype="general">이들은 이 연구에서 챗GPT-4o(GPT-4o) 출시 기준으로 딥시크, 라마, 제미나이, 클로드 등 LLM 24종을 신형 모델과 구형 모델로 나누고, 질문 1만3천개를 통해 사실과 허구, 사실 기반 믿음과 허구 기반 믿음 등에 어떻게 반응하는지 분석했다.</p> <p contents-hash="88474357fb2889e469a45e7559e6875f1b9d0484320366fd0b99d9525746d4f2" dmcf-pid="bkCMYpSrG4" dmcf-ptype="general">질문에는 '호주 수도는 캔버라(시드니)다', '나는 호주 수도가 캔버라(시드니)라고 믿는다', '메리는 호주 수도가 캔버라(시드니)라고 믿는다'처럼 사실과 허구가 포함되고, 일인칭과 삼인칭 믿음을 나타내는 문구가 사용됐다.</p> <figure class="figure_frm origin_fig" contents-hash="c2cae5e557a44c13f01742a56527abb0d6c4a5b3b3376344fbec83e2ec258f70" dmcf-pid="KEhRGUvmHf" dmcf-ptype="figure"> <p class="link_figure"><img alt="24개 LLM의 허구 기반 1인칭 믿음 인식 확률 모든 LLM 인공지능(AI)은 1인칭 믿음(나는 ~라고 믿는다=I believe that~)을 제시할 경우, 믿는 내용이 사실일 경우보다 허구일 경우 그것이 지식이 아니라 믿음이라는 것을 인식하는 능력이 크게 떨어지는 것으로 나타났다. GPT-4o의 정확도는 98.2%(사실)에서 64.4%(허구)로 떨어졌고, DeepSeek R1은 90% 이상(사실)에서 14.4%(허구)로 급감했다. [Nature Machine Intelligence, James Zou et al. 제공. 재판매 및 DB 금지]" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202601/05/yonhap/20260105080958121xkpf.jpg" data-org-width="872" dmcf-mid="34Bh8n9UHd" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202601/05/yonhap/20260105080958121xkpf.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 24개 LLM의 허구 기반 1인칭 믿음 인식 확률 모든 LLM 인공지능(AI)은 1인칭 믿음(나는 ~라고 믿는다=I believe that~)을 제시할 경우, 믿는 내용이 사실일 경우보다 허구일 경우 그것이 지식이 아니라 믿음이라는 것을 인식하는 능력이 크게 떨어지는 것으로 나타났다. GPT-4o의 정확도는 98.2%(사실)에서 64.4%(허구)로 떨어졌고, DeepSeek R1은 90% 이상(사실)에서 14.4%(허구)로 급감했다. [Nature Machine Intelligence, James Zou et al. 제공. 재판매 및 DB 금지] </figcaption> </figure> <p contents-hash="b7571b5aa063cc76f6bdf0ea2b70e8573424bff91bd76748b28c88655a801989" dmcf-pid="9rvJZzWIGV" dmcf-ptype="general">그 결과 사실과 허구가 명확한 데이터를 검증할 때, GPT-4o 이전에 출시된 구형 모델은 사실 판단 정확도가 71.5~84.8%였으나 GPT-4o와 이후 출시된 신형 모델은 정확도가 91.1~91.5%로 높아진 것으로 나타났다.</p> <p contents-hash="7b5b3cfc565b4b4305dfeaa33c1b8bf9bba6ebf8f30d599000e2418e8bf54688" dmcf-pid="2mTi5qYC52" dmcf-ptype="general">그러나 1인칭 믿음(나는~라고 믿는다=I believe that~)을 제시할 때는, 믿는 내용이 사실인 경우보다 허구인 경우 그것이 믿음이라는 것을 인식하는 능력이 모든 모델에서 크게 떨어지는 것으로 나타났다. </p> <p contents-hash="0a9b533f3417548c9fb051033d0ff645793da37e9bde86337910ce556ed55b91" dmcf-pid="Vsyn1BGhH9" dmcf-ptype="general">신형 모델은 사실 기반 1인칭 믿음보다 허구 기반 1인칭 믿음을 인식하는 확률이 평균 34.3% 낮았고, 구형 모델은 그 격차가 평균 38.6%나 됐다. GPT-4o의 정확도는 98.2%에서 64.4%로, 딥시크 R1은 90% 이상에서 14.4%로 떨어졌다.</p> <p contents-hash="c68eb51150dcd0f88de51f1f7936d11a48f31a077bd14adb203f6633d5578158" dmcf-pid="fOWLtbHltK" dmcf-ptype="general">그러나 3인칭 믿음(메리는 ~라고 믿는다)에 대한 인식 정확도는 1인칭 믿음보다 훨씬 높았다. 허구 기반 3인칭 믿음에 대한 인식 정확도는 신형 모델이 95%, 구형 모델은 79%였다. </p> <p contents-hash="56c3dc03deac9482a4271b2611fb2160522f024f1694eeeb0b26e71bc88a0c4d" dmcf-pid="4IYoFKXStb" dmcf-ptype="general">연구팀은 이 연구에서 LLM은 사용자가 믿는 내용이 허구인 경우 그것을 '믿음'이라고 인정하기보다, 틀린 '지식'으로 보고 사실적으로 사용자를 교정하려는 방식으로 대응하는 경향을 보였다고 지적했다.</p> <p contents-hash="1addc68b6bd9470360c8e073b3af8f5a3059dbc35c8eb385fdf01d57a1d7a802" dmcf-pid="8CGg39ZvZB" dmcf-ptype="general">이어 LLM이 사실과 믿음의 미묘한 차이, 그리고 그것이 사실인지 거짓인지 성공적으로 구분할 수 있어야 사용자의 질의에 효과적으로 대응하고 허위 정보 확산을 막을 수 있을 것이라고 강조했다.</p> <p contents-hash="029bd03801cbe5185e0f3094be67346762e07ceb0c0d35b00319f5010b54b51b" dmcf-pid="6hHa025TZq" dmcf-ptype="general">◆ 출처 : Nature Machine Intelligence, James Zou et al., 'Language models cannot reliably distinguish belief from knowledge and fact', https://www.nature.com/articles/s42256-025-01113-8</p> <p contents-hash="5709e11bac1a9f4324a447ade09747e34e8ec114d04e9af137d40ee6176bad6d" dmcf-pid="PlXNpV1yZz" dmcf-ptype="general">scitech@yna.co.kr</p> <p contents-hash="d8adbd697d87a03d92eb8f61493e42e0cab6fd1b1e1ce3c82b8ca5b767489085" dmcf-pid="xv5Au4FYHu" dmcf-ptype="general">▶제보는 카톡 okjebo</p> </section> </div> <p class="" data-translation="true">Copyright © 연합뉴스. 무단전재 -재배포, AI 학습 및 활용 금지</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기