로그인
토토사이트
먹튀사이트/제보
업체홍보/구인
신규사이트
지식/노하우
놀이터홍보
판매의뢰
스포츠분석
뉴스
후기내역공유
커뮤니티
포토
포인트
보증업체
카지노 먹튀
토토 먹튀
먹튀제보
구인
구직
총판
제작업체홍보
카지노
토토
홀덤
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
축구
야구
농구
배구
하키
미식축구
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[]
이 대통령 "감사합니다"...'100원 생리대' 깨끗한나라, 주가도 급등
N
[IT뉴스]
국가 전산망 마비사태 없도록…정부합동 AI정부 인프라 총괄 조직 만든다
N
[IT뉴스]
“영하 55℃~영상 150℃서도 구동” 저전력 차세대 ‘스핀메모리’ 개발
N
[IT뉴스]
과기정통부, 데이터안심구역 신규 지정 공모... 고품질 미개방데이터 보유사 5개 선정
N
[연예뉴스]
에이티즈, 미니 13집 美 '빌보드 200' 2주 연속 진입...글로벌 흥행 가도
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
목록
글쓰기
[IT뉴스]오픈AI 최신 추론모델 `o3`, 할루시네이션 더 심해져
온카뱅크관리자
조회:
98
2025-04-20 07:10:48
<div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="q68efjDxlP"> <figure class="figure_frm origin_fig" contents-hash="b21bf3ddf3e0f9112da53958170f0ac37b6563dc932da6006bd04fba53b51609" dmcf-pid="BP6d4AwMC6" dmcf-ptype="figure"> <p class="link_figure"><img alt="로이터 연합뉴스 자료사진" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202504/20/dt/20250420070619717pvak.jpg" data-org-width="540" dmcf-mid="1KJNBnNfTL" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202504/20/dt/20250420070619717pvak.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 로이터 연합뉴스 자료사진 </figcaption> </figure> <p contents-hash="c72a40b5a27738c6052e3172e7c9c0dcd274ce5ccf6d9245b113b11f03e06b3a" dmcf-pid="bQPJ8crRW8" dmcf-ptype="general">오픈AI가 최근 출시한 인공지능(AI) 모델인 'o3'와 'o4'-미니가 높은 성능에도 불구하고 할루시네이션(환각·왜곡) 현상은 더 심해진 것으로 나타났다. 회사도 그 원인에 대해 정확히 파악하지 못한 모양새다.</p> <p contents-hash="61f0a9a065e2598a1f879640321b86c70e3d2a44f829d3e202a910327b858589" dmcf-pid="KxQi6kmey4" dmcf-ptype="general">지난 18일(현지시간) 테크크런치 보도에 따르면, 오픈AI는 내부 테스트에서 새로운 추론모델인 o3와 o4-미니가 기존 o1, o1-미니, o3-미니는 물론이고 비추론모델인 GPT-4o보다도 할루시네이션이 더 자주 발생하는 것으로 확인했다.</p> <p contents-hash="70e19c78ff503052c6a45b21bd79aefbc47aca7d4eef81d5afe0dd7d8d3518df" dmcf-pid="9MxnPEsdhf" dmcf-ptype="general">대형언어모델(LLM)이 구조적으로 안고 있는 할루시네이션 문제에 대해 그동안 오픈AI는 새 모델을 내놓을 때마다 꾸준히 개선된 결과를 내왔다. 하지만 이번엔 그렇지 못했고, 그 이유에 대해서도 "더 많은 연구가 필요하다"고 밝힌 상태다. o3 및 o4-미니 관련 기술보고서에서 "전반적으로 더 많은 주장을 한다"면서 "더 정확한 주장뿐만 아니라 더 부정확하거나 왜곡된 주장을 하게 된다"고 기술했다. </p> <p contents-hash="016df299947cb5d88cfaebb1873db683d755ca12184cc7be92523576f6514aca" dmcf-pid="2RMLQDOJSV" dmcf-ptype="general">사람에 대한 모델의 지식 정확도를 측정하는 오픈AI 사내 벤치마크(PersonQA)에서 o3는 33%의 질문에 대해 할루시네이션을 일으키는 결과를 냈다. 기존 추론모델인 o1(16%)와 o3-미니(14.8%)보다 할루시네이션이 약 2배 더 심한 것이다. o4-미니의 경우 더 성적이 나빠서 48%에 육박했다.</p> <p contents-hash="d711bba098ba02274acdc8a8d315660ffb1be8d6d829f6a7996b5915204a09ad" dmcf-pid="VeRoxwIih2" dmcf-ptype="general">심해진 할루시네이션 때문에 기존 모델들보다 덜 유용할 것이란 지적도 제기된다. 비영리 AI연구소 트랜슬루스(Transluce)도 o3가 답변 도출 과정에서 자신이 취한 행동에 대해 짜맞추는 경향을 테스트를 통해 발견했다. 전 오픈AI 직원인 닐 차우두리(Neil Chowdhury) 트랜슬루스 연구원은 테크크런치에 "o시리즈 모델에 쓰인 강화학습 유형이 표준 사후학습 파이프라인에 의해 일반적으로 완화돼온 문제를 증폭시켰을 수 있다"는 가설을 제기했다.</p> <p contents-hash="034ef9cbbfb9d5cc6c3e7e454613caef45bb390cb5e0b5b61bf3b9384b386b56" dmcf-pid="fdegMrCnS9" dmcf-ptype="general">일반적으로 할루시네이션 저감에 널리 쓰이는 방법은 검색증강생성(RAG)을 통해 웹 등에서 추가로 정보를 탐색케 하는 것이다. GPT-4o도 웹 검색 기능을 갖춘 이후론 오픈AI 사내 벤치마크에서 할루시네이션이 10% 수준으로 개선됐다. 다만 AI의 창의성과 효율성에 이점을 주고 있는 추론모델의 사고 능력이 그 반대급부로 모델 자체의 정확성과 신뢰성을 저해한다면 이에 대한 근본적인 해결책이 필요해질 수 있다.</p> <p contents-hash="560774cf19497fcf1209b723033fef80fb672da25628ca633e9b11829d74a845" dmcf-pid="4JdaRmhLhK" dmcf-ptype="general">오픈AI는 지난 16일(현지시간) o3를 출시하면서 수학·과학·코딩 등에서 이전 모델들을 능가하는 자사의 가장 정교한 추론모델이자, 이미지에 대해 단순히 보는 것을 넘어 이해·분석하는 첫 모델이라고 소개한 바 있다. 증가한 할루시네이션에 대해 오픈AI 측은 "모든 모델에서 할루시네이션 문제를 해결하는 것은 지속적인 연구 분야이며, 정확성과 신뢰성을 개선하기 위해 지속적으로 노력하고 있다"고 전했다.팽동현기자 dhp@dt.co.kr</p> </section> </div> <p class="" data-translation="true">Copyright © 디지털타임스. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기