로그인
토토사이트
먹튀사이트/제보
업체홍보/구인
신규사이트
지식/노하우
놀이터홍보
판매의뢰
스포츠분석
뉴스
후기내역공유
커뮤니티
포토
포인트
보증업체
카지노 먹튀
토토 먹튀
먹튀제보
구인
구직
총판
제작업체홍보
카지노
토토
홀덤
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
축구
야구
농구
배구
하키
미식축구
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[연예뉴스]
종갓집 맏며느리였던 홍진경, 제사상 대신 캐리어 끈다‥명절에 홀로 도쿄行
N
[IT뉴스]
마이크론, AI 수요 겨냥한 서버용 PCIe 6.0 SSD 양산
N
[IT뉴스]
"설 명절 피싱 문자 쏟아진다"…내 계정 털렸는지 3분 만에 확인하는 법
N
[연예뉴스]
김호남, 하루 아침에 3억 잃었다…"사업 투자, 천 만원씩 적자 나"
N
[연예뉴스]
유아·아린도 합류…오마이걸, 완전체 컴백
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
목록
글쓰기
[IT뉴스]“AI 성능 개선 한계 왔나”… 오픈AI GPT-4.5, 성능·가격 논란
온카뱅크관리자
조회:
86
2025-02-28 16:37:29
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">벤치마크 테스트서 경쟁사 서비스에 밀려<br>“‘스케일링 법칙’만으로 성능 올리는 데 한계“<br>오픈AI, GPT-5부터 일반+추론 모델 통합</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="1eIj6GXDzN"> <figure class="figure_frm origin_fig" contents-hash="14c558854a93a41414c65babd30bb770fa283db52e1cb91eb231d06d062bc2e4" dmcf-pid="tdCAPHZw0a" dmcf-ptype="figure"> <p class="link_figure"><img alt="샘 올트먼 오픈AI CEO./연합뉴스" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202502/28/chosunbiz/20250228163329313fhxx.jpg" data-org-width="5000" dmcf-mid="Zo5lazBW7A" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202502/28/chosunbiz/20250228163329313fhxx.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 샘 올트먼 오픈AI CEO./연합뉴스 </figcaption> </figure> <p contents-hash="f6323a20c0c295545f531c09a6753e4dcc149d1db064b691a355fe14a9eac487" dmcf-pid="FJhcQX5rug" dmcf-ptype="general">오픈AI가 27일(현지시각) 최신 인공지능(AI) 모델 ‘GPT-4.5′를 공개했지만, 성능과 가격을 둘러싼 논란이 확산되고 있다. 벤치마크 결과 일부 항목에서 경쟁사에 밀리거나 큰 차이를 보이지 못하면서, 오픈AI의 경쟁력이 흔들리는 것이 아니냐는 분석이 나온다. 앤트로픽, xAI, 딥시크 등이 오픈AI의 성능을 빠르게 따라잡으며 시장의 판도를 바꾸고 있다는 평가다.</p> <p contents-hash="d8146e9cffaa4f5afdb6f8685d0fdf0dadb7f40af730f7a090171cfa40b3df33" dmcf-pid="3ilkxZ1mzo" dmcf-ptype="general">28일 업계에 따르면 오픈AI는 GPT-4.5의 환각률이 이전 모델보다 감소했다고 발표했지만, 벤치마크 테스트 결과 경쟁 모델 대비 정보 제공 능력에서 확실한 우위를 보이지 못했다.</p> <p contents-hash="42ebf57ceabaaa4f1d7b5cd1858e355c0186ff17a865bc1924a2c4499d688c80" dmcf-pid="0Msa4WGkFL" dmcf-ptype="general">오픈AI는 이날 GPT-4.5가 지금까지 출시된 대화형 AI 모델 중 “가장 크고 강력하다”고 발표했다. 감성지능(EQ)이 강화돼 사람과 더욱 자연스러운 대화가 가능해졌으며, 패턴을 인식하고 연관성을 찾는 능력이 향상됐다고 강조했다. 또한, 환각 현상이 감소했다고 밝혔다.</p> <p contents-hash="2d9d1f60fe531ec56f845553185d42c8af6f96826176237dd94cb95babbca45f" dmcf-pid="pRON8YHEUn" dmcf-ptype="general">하지만 실제 벤치마크 결과는 오픈AI의 발표와 차이가 있다. AI 벤치마크 테스트에서 GPT-4.5는 에이전트 코딩 평가(Agentic Coding Evaluation)에서 65%의 점수를 기록하며 67%를 기록한 앤트로픽의 클로드 소넷(Sonnet) 3.7에 밀렸다. 이전 버전인 소넷 3.5(new)와 비교해도 불과 3% 앞서는 것에 그쳤다.</p> <figure class="figure_frm origin_fig" contents-hash="4cd881a0219e583e7ff66c8d4dd066d3c1209ad44233e61e9404cd91bbead1b9" dmcf-pid="UeIj6GXDzi" dmcf-ptype="figure"> <p class="link_figure"><img alt="에이전트 코딩 벤치마크" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202502/28/chosunbiz/20250228163330849hudd.jpg" data-org-width="850" dmcf-mid="5NyrdF0Cuj" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202502/28/chosunbiz/20250228163330849hudd.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 에이전트 코딩 벤치마크 </figcaption> </figure> <p contents-hash="ba115b7b80b156c7017da3b2c8e16554171c974c1d79d111b1ab15335f8dd95b" dmcf-pid="udCAPHZw7J" dmcf-ptype="general">AI의 수학·과학·코딩 역량을 평가하는 GPQA(AIME) 및 LCB 벤치마크에서는 항목별로 성능 차이가 확인됐다. 과학(GPQA)에서는 GPT-4.5가 71.4%로 그록3(75%)와 비슷한 수준을 보였지만, 수학(AIME 24)에서는 그록3(52) 대비 낮은 36.7%를 기록했다. 코딩 벤치마크에서는 그록3(57%), 소넷 3.7(57%)보다 낮은 41%로 격차를 보였다.</p> <p contents-hash="8a151db313ca5505180b5344aa3173ceecb7022761e6950f982175fa1be3473b" dmcf-pid="7JhcQX5rUd" dmcf-ptype="general">AI의 일반화 능력을 평가하는 ARC-AGI 벤치마크에서도 GPT-4.5는 논란의 중심에 섰다. 경쟁 모델들과 비교할 때, 성능 대비 비용이 지나치게 높다는 점도 문제로 지적된다. 벤치마크 결과, GPT-4.5는 앤트로픽의 클로드 소넷 3.7(Thinking 8K), O3 Mini Low, R1 모델 등에 비해 성능은 비슷하거나 떨어지는 반면, API(응용 프로그램 인터페이스) 접근 비용은 10배 이상 비싸다. 성능 향상 대비 구독 가격이 과도하게 높아졌다는 점에서 이용자들 사이에서 논란이 커지고 있는 것이다.</p> <p contents-hash="ad6825e69f47a3fcc5b351ef20475d714c3af3df549486af891d383031b4d745" dmcf-pid="zilkxZ1mze" dmcf-ptype="general">업계에서는 이를 두고 “이제 단순히 모델 크기(파라미터 수)와 컴퓨팅 파워를 늘리는 ‘스케일링 법칙’만으로 AI 성능을 올리는 것이 한계에 다다른 것이 아니냐”는 분석을 내놓는다.</p> <p contents-hash="9937de3a93f4baee0f4a58d1113bf7e025a57b9614e5bd0bdd102e47d3b8ba0e" dmcf-pid="qnSEM5tsFR" dmcf-ptype="general">오픈AI는 지난해 일반 LLM(초거대언어모델)에서 성능 우위를 점하며 AI 시장을 선도해 왔다. 하지만 최근 AI 업계에서는 추론 모델과 ‘에이전트 AI’가 차세대 기술로 떠오르고 있다. 에이전트 AI는 사용자의 목표에 따라 자율적으로 작업을 수행하는 AI이며, 추론 모델은 복잡한 논리적 사고와 문제 해결에 최적화된 AI다.</p> <p contents-hash="02be682a248e7d7fdc84ffdc6a31d242041668b1ba6caa8d27d86bff6e79573a" dmcf-pid="BLvDR1FO0M" dmcf-ptype="general">강재우 고려대 컴퓨터학과 교수는 “GPT-4에서 추론 모델인 o1이 파생된 것처럼, GPT-4.5 역시 이를 기반으로 한 새로운 추론 모델이 나올 가능성이 있다”며 “오픈AI가 GPT-5부터 일반 모델과 추론 모델을 통합할 계획을 밝힌 만큼, 앞으로는 AI가 특정 작업에서 추론 능력을 발휘하고, 일반 작업에서는 효율적으로 동작하는 방식으로 발전할 것”이라고 말했다.</p> <p contents-hash="7596872e959830887847e7bae196d08cd8b594a8157f55cc3cfae84735a3490b" dmcf-pid="boTwet3I7x" dmcf-ptype="general">그는 이어 “기술이 고도화될수록 일반 모델과 추론 모델을 구분할 필요가 없어지고, 경쟁사들도 동일한 방향으로 나아갈 가능성이 높다”고 했다.</p> <p contents-hash="4156f5b6e7ba20d4c1d972e74d0e4782ca9db6ae5785c066ffc50287a61e54d0" dmcf-pid="KgyrdF0CpQ" dmcf-ptype="general">- Copyright ⓒ 조선비즈 & Chosun.com -</p> </section> </div> <p class="" data-translation="true">Copyright © 조선비즈. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기