로그인
보증업체
신규사이트
스포츠분석
먹튀사이트/제보
지식/노하우
놀이터홍보
판매의뢰
업체홍보/구인
뉴스
후기내역공유
커뮤니티
포토
포인트
보증카지노
보증토토
카지노
토토
홀덤
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[]
김건희 첫 재판 종료…남색 정장에 수용번호 '4398'
N
[IT뉴스]
AI는 기대, SNS는 글쎄…'대변신' 카카오톡 업데이트의 역설
N
[IT뉴스]
[비즈톡톡] 회비 7000만원 못내서 협회 탈퇴?… LG헬로비전 이탈로 불거진 알뜰폰협회 엑소더스 우려
N
[IT뉴스]
네이버 실검 폐지 4년…대중은 또다시 ‘불투명한 순위’ 속으로
N
[연예뉴스]
이진호, 불법도박 자숙 중 100km 만취 운전…'무너진' 다짐(종합)
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
제휴문의 텔레그램 @dognus11
목록
글쓰기
[IT뉴스]오픈AI 최신 추론모델 `o3`, 할루시네이션 더 심해져
온카뱅크관리자
조회:
57
2025-04-20 07:10:48
<div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="q68efjDxlP"> <figure class="figure_frm origin_fig" contents-hash="b21bf3ddf3e0f9112da53958170f0ac37b6563dc932da6006bd04fba53b51609" dmcf-pid="BP6d4AwMC6" dmcf-ptype="figure"> <p class="link_figure"><img alt="로이터 연합뉴스 자료사진" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202504/20/dt/20250420070619717pvak.jpg" data-org-width="540" dmcf-mid="1KJNBnNfTL" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202504/20/dt/20250420070619717pvak.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 로이터 연합뉴스 자료사진 </figcaption> </figure> <p contents-hash="c72a40b5a27738c6052e3172e7c9c0dcd274ce5ccf6d9245b113b11f03e06b3a" dmcf-pid="bQPJ8crRW8" dmcf-ptype="general">오픈AI가 최근 출시한 인공지능(AI) 모델인 'o3'와 'o4'-미니가 높은 성능에도 불구하고 할루시네이션(환각·왜곡) 현상은 더 심해진 것으로 나타났다. 회사도 그 원인에 대해 정확히 파악하지 못한 모양새다.</p> <p contents-hash="61f0a9a065e2598a1f879640321b86c70e3d2a44f829d3e202a910327b858589" dmcf-pid="KxQi6kmey4" dmcf-ptype="general">지난 18일(현지시간) 테크크런치 보도에 따르면, 오픈AI는 내부 테스트에서 새로운 추론모델인 o3와 o4-미니가 기존 o1, o1-미니, o3-미니는 물론이고 비추론모델인 GPT-4o보다도 할루시네이션이 더 자주 발생하는 것으로 확인했다.</p> <p contents-hash="70e19c78ff503052c6a45b21bd79aefbc47aca7d4eef81d5afe0dd7d8d3518df" dmcf-pid="9MxnPEsdhf" dmcf-ptype="general">대형언어모델(LLM)이 구조적으로 안고 있는 할루시네이션 문제에 대해 그동안 오픈AI는 새 모델을 내놓을 때마다 꾸준히 개선된 결과를 내왔다. 하지만 이번엔 그렇지 못했고, 그 이유에 대해서도 "더 많은 연구가 필요하다"고 밝힌 상태다. o3 및 o4-미니 관련 기술보고서에서 "전반적으로 더 많은 주장을 한다"면서 "더 정확한 주장뿐만 아니라 더 부정확하거나 왜곡된 주장을 하게 된다"고 기술했다. </p> <p contents-hash="016df299947cb5d88cfaebb1873db683d755ca12184cc7be92523576f6514aca" dmcf-pid="2RMLQDOJSV" dmcf-ptype="general">사람에 대한 모델의 지식 정확도를 측정하는 오픈AI 사내 벤치마크(PersonQA)에서 o3는 33%의 질문에 대해 할루시네이션을 일으키는 결과를 냈다. 기존 추론모델인 o1(16%)와 o3-미니(14.8%)보다 할루시네이션이 약 2배 더 심한 것이다. o4-미니의 경우 더 성적이 나빠서 48%에 육박했다.</p> <p contents-hash="d711bba098ba02274acdc8a8d315660ffb1be8d6d829f6a7996b5915204a09ad" dmcf-pid="VeRoxwIih2" dmcf-ptype="general">심해진 할루시네이션 때문에 기존 모델들보다 덜 유용할 것이란 지적도 제기된다. 비영리 AI연구소 트랜슬루스(Transluce)도 o3가 답변 도출 과정에서 자신이 취한 행동에 대해 짜맞추는 경향을 테스트를 통해 발견했다. 전 오픈AI 직원인 닐 차우두리(Neil Chowdhury) 트랜슬루스 연구원은 테크크런치에 "o시리즈 모델에 쓰인 강화학습 유형이 표준 사후학습 파이프라인에 의해 일반적으로 완화돼온 문제를 증폭시켰을 수 있다"는 가설을 제기했다.</p> <p contents-hash="034ef9cbbfb9d5cc6c3e7e454613caef45bb390cb5e0b5b61bf3b9384b386b56" dmcf-pid="fdegMrCnS9" dmcf-ptype="general">일반적으로 할루시네이션 저감에 널리 쓰이는 방법은 검색증강생성(RAG)을 통해 웹 등에서 추가로 정보를 탐색케 하는 것이다. GPT-4o도 웹 검색 기능을 갖춘 이후론 오픈AI 사내 벤치마크에서 할루시네이션이 10% 수준으로 개선됐다. 다만 AI의 창의성과 효율성에 이점을 주고 있는 추론모델의 사고 능력이 그 반대급부로 모델 자체의 정확성과 신뢰성을 저해한다면 이에 대한 근본적인 해결책이 필요해질 수 있다.</p> <p contents-hash="560774cf19497fcf1209b723033fef80fb672da25628ca633e9b11829d74a845" dmcf-pid="4JdaRmhLhK" dmcf-ptype="general">오픈AI는 지난 16일(현지시간) o3를 출시하면서 수학·과학·코딩 등에서 이전 모델들을 능가하는 자사의 가장 정교한 추론모델이자, 이미지에 대해 단순히 보는 것을 넘어 이해·분석하는 첫 모델이라고 소개한 바 있다. 증가한 할루시네이션에 대해 오픈AI 측은 "모든 모델에서 할루시네이션 문제를 해결하는 것은 지속적인 연구 분야이며, 정확성과 신뢰성을 개선하기 위해 지속적으로 노력하고 있다"고 전했다.팽동현기자 dhp@dt.co.kr</p> </section> </div> <p class="" data-translation="true">Copyright © 디지털타임스. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기