로그인
보증업체
신규사이트
스포츠분석
먹튀사이트/제보
지식/노하우
놀이터홍보
판매의뢰
업체홍보/구인
뉴스
후기내역공유
커뮤니티
포토
포인트
보증카지노
보증토토
카지노
토토
홀덤
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[]
"곧 결혼인데 어쩌나"…전셋집 구하려던 30대 직장인 '절규'
N
[IT뉴스]
KT·롯데카드 청문회…“보안 부실·사후대처 미흡” 질타
N
[연예뉴스]
한지민, 김혜수에 예쁨받는 후배..선물에 감동 "매번 감사해요"
N
[연예뉴스]
11월 KGMA, ENA 통해 방영
N
[연예뉴스]
르세라핌, '북미 영향력' 확장…7개 도시 매진 투어 성료
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
제휴문의 텔레그램 @dognus11
목록
글쓰기
[IT뉴스]"믿었던 챗GPT가 환각률 48%라니...", 챗GPT 어쩌나
온카뱅크관리자
조회:
64
2025-04-20 13:07:29
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">테크크런치 오픈AI 사내 벤치마크서 나온 환각율 보도<br>챗GPT o3, 환각률 33%<br>챗GPT o4미니는 48% 환각률 보여<br>오픈AI " 더 많은 연구가 필요하다"</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="bjPW6DOJg0"> <figure class="figure_frm origin_fig" contents-hash="009f3d0b9967c24272040bf2f86b9d1a1c9214af43ca83090e936b9025b43df2" dmcf-pid="KAQYPwIig3" dmcf-ptype="figure"> <p class="link_figure"><img alt="[보스턴=AP/뉴시스] 챗GPT 개발사인 오픈AI 로고. /사진=뉴시스" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202504/20/fnnewsi/20250420125936407wdvt.jpg" data-org-width="800" dmcf-mid="BHGiY26Fkp" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202504/20/fnnewsi/20250420125936407wdvt.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> [보스턴=AP/뉴시스] 챗GPT 개발사인 오픈AI 로고. /사진=뉴시스 </figcaption> </figure> <div contents-hash="1f0e2858d8afca49375aad2965aaf19b7bc4aca54c8662dd0f1b17bcd0a545bd" dmcf-pid="9LVl2jDxoF" dmcf-ptype="general"> [파이낸셜뉴스] 오픈AI가 최근 공개한 추론형 AI 모델 ‘o3’와 ‘o4 미니’가 이전 세대보다 강력해진 성능을 갖췄지만, 환각(hallucination) 현상은 오히려 더 심해졌다는 평가가 나왔다. 환각은 생성형 AI가 실제 존재하지 않는 정보를 사실처럼 만들어내는 현상을 말한다. </div> <div contents-hash="a45022a2f4de621a646e798efafce8172d0d66d0835118ba6b5a4ab5e27c112a" dmcf-pid="2ofSVAwMot" dmcf-ptype="general"> <div data-mce-desctitle="smtitle"> <strong>챗GPT o4 미니, 환각률 48%</strong> </div>20일 테크크런치는 오픈AI의 사내 벤치마크인 ‘퍼슨(Person) QA’ 평가 결과를 인용해, o3 모델이 33%의 질문에 대해 환각을 일으켰다고 보도했다. 이는 o1(16%)과 o3 미니(14.8%)보다 두 배 이상 높은 수치다. 더 심각한 것은 o4 미니다. 이 모델은 무려 48%의 환각률을 기록하며 GPT-4o를 포함한 기존 모델들보다도 더 불안정한 모습을 보였다. </div> <p contents-hash="c5e536b0ed0ae84211c45e9726a7bb3c16ceda743d74b4f7a1af8ded6018c989" dmcf-pid="Vg4vfcrRA1" dmcf-ptype="general">오픈AI는 지난 16일, 이들 모델을 “이미지를 사고 과정에 통합할 수 있는 최초의 모델”이라고 소개하며 출시했다. 단순히 이미지를 인식하는 것을 넘어, 시각 정보 자체를 추론 과정에 활용할 수 있다는 설명이다. 실제로 o3와 o4 미니는 사용자가 올린 화이트보드 그림, 도표, 그래프 등을 분석하고, 흐릿하거나 회전된 이미지도 처리할 수 있는 능력을 갖췄다. </p> <p contents-hash="24072bebea753a320c672277258e0d5780b263795012bc352c5eb26e899a262f" dmcf-pid="fa8T4kmeA5" dmcf-ptype="general">성능 측면에서도 코딩 관련 벤치마크인 SWE 테스트에서 o3는 69.1%, o4 미니는 68.1%를 기록해, 이전 모델인 o3 미니(49.3%)는 물론, 경쟁 모델인 클로드 3.7 소넷(62.3%)보다도 높은 수치를 보였다. 하지만 이러한 기술적 진보에도 불구하고, 환각률은 오히려 이전보다 증가했다. 그동안 새로운 모델이 출시될 때마다 환각 문제는 점진적으로 개선되어 왔다는 점에서, 이번 결과는 이례적이라는 지적이 나온다. </p> <div contents-hash="25d8aed6bb7ff9be3004421ac4a26b4ea89313da9f2aba374052fd2fdcd5d1fb" dmcf-pid="4N6y8EsdoZ" dmcf-ptype="general"> <div data-mce-desctitle="smtitle"> <strong>오픈AI, "더 많은 연구 필요"</strong> </div>오픈AI는 이 현상의 원인에 대해 아직 명확한 설명을 내놓지 못하고 있다. 기술 보고서에서는 “모델이 이전보다 더 많은 주장을 하게 되면서, 정확한 정보뿐 아니라 잘못된 주장도 함께 증가한 것으로 보인다”고 분석하면서, 환각 증가의 정확한 원인을 규명하기 위해 “더 많은 연구가 필요하다”고 밝혔다. </div> <p contents-hash="cfabcdac979e8318643071202e3f3bf71280e0eceafa2366907f071631594dfd" dmcf-pid="8jPW6DOJAX" dmcf-ptype="general">AI 업계는 이번 사례가 추론형 모델에 대한 신뢰성에 의문을 제기할 수 있다고 본다. 특히 법률, 회계, 세무 등 고정확도가 요구되는 산업군에서는 환각 문제가 해결되지 않을 경우, 추론형 AI 도입 자체가 어려워질 수 있다는 우려가 나온다. 오픈AI 측은 “모든 문제 영역에서 환각을 완전히 제거하는 것은 지속적인 연구 과제”라며, “정확성과 신뢰성을 높이기 위한 노력을 이어가고 있다”고 해명했다. <br>#인공지능 #AI #챗봇 #오류 #환각 #챗GPT #오픈AI #환각률 </p> <p contents-hash="63283cb43e4d25efcd2c04635ad122fea6d97bed9b3abceff04966c4c311a5fe" dmcf-pid="6AQYPwIicH" dmcf-ptype="general">ksh@fnnews.com 김성환 기자</p> </section> </div> <p class="" data-translation="true">Copyright © 파이낸셜뉴스. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기