로그인
보증업체
신규사이트
스포츠분석
먹튀사이트/제보
지식/노하우
놀이터홍보
판매의뢰
업체홍보/구인
뉴스
후기내역공유
커뮤니티
포토
포인트
보증카지노
보증토토
카지노
토토
홀덤
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[연예뉴스]
김구라 “수억 줘도 자녀 방송 출연 안 해... 딸 예뻐서 만족”
N
[연예뉴스]
윤일상, 유승준 병역 기피 논란 “대중과의 약속, 진정한 사과 없었다”
N
[연예뉴스]
박찬욱 "인기 감독들 영화 보며 험담...저만 그런가요?" (유퀴즈)[종합]
N
[연예뉴스]
박찬욱 감독 "비디오 가게 운영…내 추천 영화 보면 발길 끊어"
N
[연예뉴스]
천명훈 양평 펜션, 연예인 밀회 성지? “김종민♥히융 다녀가, 다른 형님들도”(신랑수업)
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
제휴문의 텔레그램 @dognus11
목록
글쓰기
[IT뉴스]칭찬은 AI도 춤추게 한다?…간단하게 AI 성능 높인 韓 연구팀 비법은
온카뱅크관리자
조회:
55
2025-04-21 11:07:32
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">윤성환 UNIST 인공지능대학원 교수 연구팀 <br>AI 실수에도 보상 값 유지…성능 안정화 <br>세계 3대 AI 학회서 발표 논문 채택</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="uVvYFtUl1Q"> <figure class="figure_frm origin_fig" contents-hash="13b89c6235d834f757695aea4f2f27c6c5549799674fcf7de3ad6db2af8ede88" dmcf-pid="7fTG3FuSXP" dmcf-ptype="figure"> <p class="link_figure"><img alt="윤성환 UNIST 인공지능대학원 교수 연구팀이 환경 변화에도 성능이 저하하지 않고 안정적으로 작동하는 AI 강화학습 기법을 개발했다. /사진=MT AI로 생성한 이미지" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202504/21/moneytoday/20250421105827381smyj.jpg" data-org-width="500" dmcf-mid="Uc7b68MUGx" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202504/21/moneytoday/20250421105827381smyj.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 윤성환 UNIST 인공지능대학원 교수 연구팀이 환경 변화에도 성능이 저하하지 않고 안정적으로 작동하는 AI 강화학습 기법을 개발했다. /사진=MT AI로 생성한 이미지 </figcaption> </figure> <p contents-hash="0776be7e886e1b7ae8f4944b9cb0ba735bedd5dd3c6f6313de23c4f6928366be" dmcf-pid="za7b68MUG6" dmcf-ptype="general"><br>작은 실수를 저지른 AI(인공지능)에 강한 벌점을 부과하지 않고 보상을 평탄하게 유지했더니, AI 성능이 좋아졌다. 이렇게 학습한 AI는 경험해보지 않은 새로운 환경에서도 성능을 유지했다. </p> <p contents-hash="72f04d1f6dc8f2ef15775e23168278d775c870f6514f05f4b8e9256dc54d7cae" dmcf-pid="qNzKP6Ru58" dmcf-ptype="general">UNIST(울산과학기술원)는 윤성환 인공지능대학원 교수 연구팀이 환경 변화에도 성능이 저하하지 않고 안정적으로 작동하는 AI 강화학습 기법을 개발했다고 21일 밝혔다. </p> <p contents-hash="a21985098a7f1aaeeae3a98dbe251535e49f2f272defe1729e18aa1f294618c5" dmcf-pid="Bjq9QPe7H4" dmcf-ptype="general">연구 결과는 세계 3대 AI 학회로 꼽히는 'ICLR'의 구두 발표 논문으로 채택됐다. 학회에 제출된 1만여건 논문 중 상위 2%만 구두 발표의 기회를 얻는다.</p> <p contents-hash="8beedad32910d8188e6a2914295ded010de770650d6af35dedbb88c733daffe1" dmcf-pid="bAB2xQdzYf" dmcf-ptype="general">강화학습은 정답을 미리 알려주는 지도학습과 달리, AI가 시행착오를 통해 얻는 보상을 최대화해 AI 스스로 문제해결 전략을 찾게 하는 학습 방법이다. 경험을 토대로 해결책을 찾는다는 점에서 인간의 사고방식과 비슷하다. 다만 기존 강화학습은 학습하지 않은 낯선 환경에서 성능이 급격히 떨어지는 한계가 있었다.</p> <p contents-hash="3b627974055abc8c3e02eeab0f3840f3fc49c17235ecbb6109ff2bf918164002" dmcf-pid="KcbVMxJqGV" dmcf-ptype="general">연구팀은 이를 해결했다. AI가 문제를 완벽하게 해결할 때와 그렇지 못할 때의 보상 차이를 완만하게 조절했다. </p> <p contents-hash="c142db3dca6b4129a0de6fafe8e411c2c55a960b367a5b55d77ee206be160598" dmcf-pid="9kKfRMiBZ2" dmcf-ptype="general">보상함수는 AI가 특정 행동을 했을 때 그 행동이 얼마나 좋았는지 점수로 나타낸 함수다. 반대 개념은 손실함수다. 예를 들어 로봇이 '앞으로 걷기' 동작을 성공적으로 수행하면 높은 점수(보상)를 받고, 넘어지면 낮은 점수(또는 실점)를 받도록 설계한다. 누적 보상은 행동이 이뤄진 전체 과정에서 AI가 받은 보상의 누적값이다. AI는 누적 보상을 최대화하는 방향으로 행동을 배운다. </p> <p contents-hash="f5ac1cd5e23cf7bc230622326ae699c842fe3d9a93601830919b994d9eb4ca18" dmcf-pid="2E94eRnb19" dmcf-ptype="general">이번 연구의 핵심은 누적 보상 값에 변화가 있더라도 AI가 이에 영향을 받지 않고 성능을 유지하게 한 데 있다. 기존 방식은 자율주행차가 눈길에서 감속 타이밍을 살짝 놓칠 경우 실점을 매겼고, '누적 보상을 최대화한다'는 AI의 기본 학습 규칙이 무너지자 AI의 성능도 따라 떨어졌다. </p> <p contents-hash="f3e2f123eae7a464966e14c7f9233eae3d8ac61ca6c9b24c8839e26a45e45f62" dmcf-pid="VD28deLKHK" dmcf-ptype="general">연구팀은 평균 보상 값이 80~90%에서 유지되도록 학습 기법을 바꿨다. AI가 정답에서 벗어난 정도를 계산한 '손실함수'가 갑자기 커지지 않도록 완만하고 평평한 구간을 찾고, 이를 학습에 적용했다. 그 결과 AI는 상황이 바뀌거나 경험이 없는 환경에서도 높은 수준의 안정성을 보였다.</p> <p contents-hash="213ba38d7ad7ca9155a1ed5ad2cfce42fdbcd47ef86eb907a8a754c508c87c73" dmcf-pid="fwV6Jdo9Zb" dmcf-ptype="general">제1 저자인 이현규 연구원은 "효과적이면서도 적용이 쉬운 방식"이라고 설명했다. 윤성환 교수는 "높은 수준의 일반화 성능을 갖는 강화학습 모델이 필요한 로보틱스, 자율주행 등에 활용할 수 있을 것"이라고 전망했다.</p> <p contents-hash="289776e73144870ac85ba5fbf3a1a5b20a661557cd7bc0c7999818cf353ba4a2" dmcf-pid="4rfPiJg2YB" dmcf-ptype="general">이번 연구는 정보통신기획평가원, 한국연구재단, UNIST의 지원을 받아 수행됐다. </p> <p contents-hash="d0887f6a6d9d315cb9902e0f6514564efe23f08d998d5bc3a3210496ab3b4788" dmcf-pid="8m4QniaVZq" dmcf-ptype="general">박건희 기자 wissen@mt.co.kr</p> </section> </div> <p class="" data-translation="true">Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기