로그인
보증업체
신규사이트
스포츠분석
먹튀사이트/제보
지식/노하우
놀이터홍보
판매의뢰
업체홍보/구인
뉴스
후기내역공유
커뮤니티
포토
포인트
보증카지노
보증토토
카지노
토토
홀덤
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[]
“노력·공부해서 뭐하나”…中당국 ‘비관·염세주의’ 유포 단속
N
[]
아서 헤이즈 “美, 전쟁 위해 돈 찍어낼 것…비트코인 100만달러 가능” [KBW2025]
N
[연예뉴스]
딘딘, ‘놀면 뭐하니?’ 서울가요제 이어 소극장 콘서트 개최 ‘맹활약’
N
[IT뉴스]
"과기부총리제, R&D 국가전략성 극대화해야...예산 안정성 필요"
N
[IT뉴스]
가짜기지국부터 해저케이블까지…글로벌 통신사 사이버공격 '비상'
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
제휴문의 텔레그램 @dognus11
목록
글쓰기
[IT뉴스]과학 분야 답변은 이 인공지능이 ‘최고’
온카뱅크관리자
조회:
39
2025-07-18 09:37:29
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true"><font color="#333333">곽노필의 미래창</font><br> 인공지능 23개 모델 평가한 결과<br> 오픈AI ‘o3’가 모든 분야에서 1위<br> 나머지 모델은 분야별로 성능 달라</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="xaXd3jWAra"> <figure class="figure_frm origin_fig" contents-hash="989155851f6d80a2eb4d4e0beb1ec6758bf716cdb8946678fc14a6d757a3e873" dmcf-pid="y3JHapMUsg" dmcf-ptype="figure"> <p class="link_figure"><img alt="오픈에이아이(OpenAI)의 인공지능 모델 오쓰리(o3)가 다양한 분야의 과학 질문에 답할 수 있는 최고의 인공지능으로 평가받았다. 앨런인공지능연구소 제공" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202507/18/hani/20250718093638965drng.jpg" data-org-width="800" dmcf-mid="PBaFEBnbsj" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202507/18/hani/20250718093638965drng.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 오픈에이아이(OpenAI)의 인공지능 모델 오쓰리(o3)가 다양한 분야의 과학 질문에 답할 수 있는 최고의 인공지능으로 평가받았다. 앨런인공지능연구소 제공 </figcaption> </figure> <p contents-hash="014461a3a52e6283236cca49db0e3ca0940f04a9e6a08a6b653c314fc056cc66" dmcf-pid="W0iXNURuro" dmcf-ptype="general"> 챗지피티 개발업체인 오픈에이아이(OpenAI)의 인공지능 모델 오쓰리(o3)가 다양한 분야의 과학 질문에 답할 수 있는 최고의 인공지능으로 평가받았다.<br><br> 미국 시애들의 앨런인공지능연구소(Ai2)가 자체 개발한 인공지능 평가 플랫폼인 사이아레나(SciArena)를 이용해 23개 거대언어모델(LLM)의 과학 질문에 답변 능력을 평가한 결과다다.<br><br> 연구소는 102명의 연구자가 이 플랫폼에 참여해 질문을 던진 뒤 각각의 인공지능이 제시한 답변에 대해 투표한 결과, 총 1만3천표 이상의 투표 중 오픈에이아이의 o3가 자연과학, 의료, 공학, 인문학 및 사회과학 분야 모두에서 가장 우수하다는 평가를 받았다고 밝혔다. 오픈에이아이는 지난해 9월 추론 능력에 중점을 둔 o1 모델을 출시한 데 이어 올해 성능을 개선한 o3를 내놓았다.<br><br> 나머지 인공지능은 분야별로 성능에 차이를 보였다. 예컨대 중국 항저우의 딥시크(DeepSeek)가 개발한 딥시크-알원(DeepSeek-R1)은 자연과학 분야 2위, 공학 분야 4위를 차지했다. 구글의 제미나이2.5프로(Gemini-2.5-Pro)는 자연과학 분야 3위, 공학 및 의료 분야 5위를 기록했다. 클로드4 오푸스(Claude-4-Opus)는 의료 분야에서 2위에 올랐다.<br><br> 연구자들이 o3에 몰표를 준 이유는 뭘까? 연구소의 아만 코핸 연구원은 네이처에 “오쓰리가 인용 문헌에 대한 자세한 정보를 제공할 뿐 아니라, 기술적으로 미묘한 부분까지 정교하게 설명하기 때문인 것으로 보인다”고 말했다.<br><br> 그는 그러나 대부분의 모델은 각 회사가 독점적으로 소유하고 있는 것이어서 각 모델의 성능이 왜 다른지는 설명하기가 어렵다고 강조했다. 다만 훈련 데이터의 차이, 그리고 모델이 어떤 것에 최적화돼 있는지 등이 부분적인 이유가 될 수 있다고 덧붙였다.<br><br></p> <figure class="figure_frm origin_fig" contents-hash="7a797445ea9106404ff000623ce43feace6e585bef11ce30633fdfc0d3d7996e" dmcf-pid="YpnZjue7EL" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202507/18/hani/20250718093640451ybwj.jpg" data-org-width="800" dmcf-mid="QKQvJ541EN" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202507/18/hani/20250718093640451ybwj.jpg" width="658"></p> </figure> <p contents-hash="f5549ded0eecf58b32e8ddb6ebcb679afc22bc1416bd895d4f5e39515ce3cbbc" dmcf-pid="GUL5A7dzIn" dmcf-ptype="general"><strong> “인공지능 요약본이 논문 읽기 대체할 순 없어”</strong><br><br> 사이아레나는 인공지능 모델의 성능을 평가하는 최신 플랫폼 중 하나로, 과학 분야에서 클라우드소싱 피드백, 즉 많은 사람들의 의견을 모아 평가하는 것이 특징이다. 연구자가 과학 질문을 던지면, 사이아레나가 두 개의 무작위로 선택된 모델로부터 얻은 답변을 연구자에게 제시하고, 연구자는 두 답변을 비교한 뒤 평가 투표를 한다.<br><br> 사이아레나(https://sciarena.allen.ai/)는 현재 일반에 공개돼 있어 일반인들도 무료로 질문을 할 수 있고 두 모델로부터 답변을 받을 수 있다. 이용 약관에 동의하면 평가 투표에도 참여할 수 있다.<br><br> 오스트레일리아 시드니대의 인공지능 연구원 조너선 쿠머펠드는 네이처에 “거대언어모델(LLM)에 과학 분야 질문을 하고 신뢰할 수 있는 답변을 받는다면, 연구자들이 자신의 분야에서 최신 연구 문헌을 따라잡는 데 큰 도움이 될 것”이라며 “이런 능력은 연구자들이 어쩌면 놓쳤을 수도 있는 다른 연구 작업을 찾아내는 데 도움이 될 것”이라고 말했다.<br><br> 오스트레일리아국립대의 라훌 쇼메 연구원(인공지능)은 그러나 “거대언어모델이 인용 논문과 상충되는 내용을 제시하거나 용어를 잘못 이해하고, 질문에 정확하게 답변하지 못할 수 있다는 점도 명심해야 한다”며 “인공지능이 생성한 논문 요약을 읽는 것이 논문을 직접 읽는 것을 대체할 수는 없다”고 강조했다.<br><br> 곽노필 선임기자 nopil@hani.co.kr</p> </section> </div> <p class="" data-translation="true">Copyright © 한겨레신문사 All Rights Reserved. 무단 전재, 재배포, AI 학습 및 활용 금지</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기