로그인
보증업체
신규사이트
스포츠분석
먹튀사이트/제보
지식/노하우
놀이터홍보
판매의뢰
업체홍보/구인
뉴스
후기내역공유
커뮤니티
포토
포인트
보증카지노
보증토토
카지노
토토
홀덤
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[]
"곧 결혼인데 어쩌나"…전셋집 구하려던 30대 직장인 '절규'
N
[IT뉴스]
KT·롯데카드 청문회…“보안 부실·사후대처 미흡” 질타
N
[연예뉴스]
한지민, 김혜수에 예쁨받는 후배..선물에 감동 "매번 감사해요"
N
[연예뉴스]
11월 KGMA, ENA 통해 방영
N
[연예뉴스]
르세라핌, '북미 영향력' 확장…7개 도시 매진 투어 성료
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
제휴문의 텔레그램 @dognus11
목록
글쓰기
[IT뉴스]오픈AI, 기술적 한계 왔나…'o3' 등 최신 추론 AI 모델 '환각' 더 심해져
온카뱅크관리자
조회:
91
2025-04-20 12:27:28
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">'o3·o4-미니' 환각률 이전 모델 대비 2배 이상…오픈AI, 원인 파악도 못해</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="Bbq8xmhLkg"> <p contents-hash="725e2f8c662eff5f1e93edbde78f1dbc349f7a062cb1abd80a8d59e569c7985a" dmcf-pid="bKB6Msloco" dmcf-ptype="general">(지디넷코리아=장유미 기자)최근 새로운 인공지능(AI) 모델을 선보인 오픈AI가 할루시네이션(환각·왜곡) 현상을 해결하지 못하며 기술적 한계를 드러내고 있다. </p> <p contents-hash="eeda39994e458e5519642c7fe4f9d00f4f28fb5a9aca676173f536502d8cc096" dmcf-pid="K9bPROSggL" dmcf-ptype="general">20일 테크크런치 등 주요 외신에 따르면 오픈AI는 사람에 대한 모델의 지식 정확도를 측정하는 사내 벤치마크인 퍼슨(Person) QA에서 'o3'가 33%의 질문에 대해 환각을 일으킨다는 사실을 발견했다. 이는 각각 16%와 14.8%를 기록한 오픈AI의 이전 추론 모델인 'o1'과 'o3-미니' 대비 2배 이상 높은 것이다. </p> <p contents-hash="58f2548d6940d9304fbe778490e01be77b1316d9f6e571e6a4a0f816855978a3" dmcf-pid="92KQeIvakn" dmcf-ptype="general"><span>'o4-미니'는 무려</span><span> </span><span>48%로,</span><span> </span><span>더 </span><span>낮은 </span><span>성적을 기록했다. 또</span><span> '</span><span>o3'와 '</span><span>o4-미니'는</span><span> 심지어 </span><span>오픈AI의 비추론 모델인 'GPT-4o'보다도 더 자주 환각에 </span><span>빠지는 </span><span>것으로 </span><span>드러났다. </span></p> <figure class="figure_frm origin_fig" contents-hash="e0ecc9367a832a64b84803495853191751290791808ad30fffd1ec0f817aa786" dmcf-pid="2V9xdCTNoi" dmcf-ptype="figure"> <p class="link_figure"><img alt="오픈AI o3 (사진=오픈AI)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202504/20/ZDNetKorea/20250420122525345xmhn.png" data-org-width="640" dmcf-mid="qTKQeIvaka" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202504/20/ZDNetKorea/20250420122525345xmhn.png" width="658"></p> <figcaption class="txt_caption default_figure"> 오픈AI o3 (사진=오픈AI) </figcaption> </figure> <p contents-hash="d2f459576b5cd0f7f00d9645049578cea3c2825d70da31b699f3dae07e921902" dmcf-pid="Vf2MJhyjcJ" dmcf-ptype="general">오픈AI는 그동안 새 모델을 내놓을 때마다 환각 문제에 대해 꾸준히 개선된 결과를 내놨다. 그러나 이번에는 그렇지 못한 데다 "더 많은 연구가 필요하다"며 정확한 이유를 밝히기를 꺼렸다. 'o3' 및 'o4-미니' 관련 기술보고서에선 "전반적으로 더 많은 주장을 한다"며 "더 정확한 주장뿐만 아니라 더 부정확하거나 왜곡된 주장을 하게 된다"고 밝혔다.</p> <p contents-hash="abf470ec0e6941cbca9f388dd6792edcdb2ca9e8b363046f0d5b8b4eea272e57" dmcf-pid="f4VRilWAAd" dmcf-ptype="general">앞서 오픈AI는 지난 16일 "이미지로 생각하고 판단할 수 있는 첫 번째 모델"이라는 설명과 함께 'o3'와 'o4-미니'를 출시했다. 단순히 이미지를 보는 것뿐 아니라 시각 정보를 추론 과정에서 직접 통합할 수 있다고 설명하며 자신감을 드러내기도 했다.</p> <p contents-hash="a781c8a2743efb5be632e0b640ca479deba5b00b00ced846ba672a9e21388e7b" dmcf-pid="48fenSYcge" dmcf-ptype="general">오픈AI에 따르면 사용자가 'o3'와 'o4-미니'에 화이트보드 스케치, PDF 다이어그램처럼 다양한 이미지를 업로드하면 모델은 이를 분석한 뒤 사고 흐름을 구성해 응답한다. 흐릿하거나 저해상도 이미지도 인식 가능해 시각 정보 기반 질문에도 안정적인 추론을 이어간다.</p> <p contents-hash="65e1f6f4a1535456b06ff7ecdab100fc06ea55f1808367083a881983315c44b7" dmcf-pid="864dLvGkgR" dmcf-ptype="general">하지만 환각 현상이 심하면 기존 모델들보다 활용성이 떨어질 것이란 시각이 지배적이다. 비영리 AI연구소 트랜슬루스(Transluce)는 'o3'가 답변 도출 과정에서 자신이 취한 행동에 대해 짜맞추는 경향을 테스트를 통해 발견한 바 있다.</p> <p contents-hash="2719fd94b2376759015d360c194571a582a26097a914d1638761b74d174c162a" dmcf-pid="6IsyHfQ0AM" dmcf-ptype="general">업계에선 이번 일을 두고 향후 추론형 모델의 신뢰성에 대한 의구심을 키우는 상황으로 이어질 수 있다고 보고 있다. 특히 세무나 회계, 법조계처럼 답변의 정확성이 다른 업종보다 중요한 분야에서는 환각 이슈가 해결되지 않을 경우 추론형 AI의 사용이 어려워질 가능성이 크다.</p> <p contents-hash="5fe414b9d55512823a25a3ef8cedef8302dc006335ba7ab27eef8b5c311ebb54" dmcf-pid="PCOWX4xpox" dmcf-ptype="general">이에 대해 오픈AI 측은 "모든 모델에서 할루시네이션 문제를 해결하는 것은 지속적인 연구 분야"라며 "정확성과 신뢰성을 개선하기 위해 지속적으로 노력하고 있다"고 말했다.</p> <p contents-hash="bd7eaf6a58a4b52ad473ad0e4267a5d718e6859b6ca3fbdb40f5bb5300edbd87" dmcf-pid="QhIYZ8MUNQ" dmcf-ptype="general">장유미 기자(sweet@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기