로그인
토토사이트
먹튀사이트/제보
업체홍보/구인
신규사이트
지식/노하우
놀이터홍보
판매의뢰
스포츠분석
뉴스
후기내역공유
커뮤니티
포토
포인트
보증업체
카지노 먹튀
토토 먹튀
먹튀제보
구인
구직
총판
제작업체홍보
카지노
토토
홀덤
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
축구
야구
농구
배구
하키
미식축구
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[]
경남 함양 산불, 올해 첫 대형산불로...'대응 2단계'
N
[IT뉴스]
'301조' 꺼내든 美, 韓 디지털 규제 겨누나
N
[연예뉴스]
랄랄, 코 수술 6일 차에 '확' 달라진 얼굴…"좀 더 착해진 것 같기도"
N
[연예뉴스]
서하얀, '83kg→52kg' 유지 비결… "저녁 식사 대신 물 500ml"
N
[스포츠뉴스]
막 내리는 밀라노·코르티나 올림픽...한국은 금메달 3개 '종합 13위'
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
목록
글쓰기
[IT뉴스]인공지능, ‘튜링 테스트’에서 사람에 압승
온카뱅크관리자
조회:
113
2025-04-07 09:37:27
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true"><font color="#333333">곽노필의 미래창</font><br> 4가지 인공지능 모델 시험한 결과<br> 사람보다 더 사람 같은 답변 내놔<br> 지피티4.5, 7 대 3으로 사람 압도</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="fBRqZte7sh"> <figure class="figure_frm origin_fig" contents-hash="c0b0a96518ef698a7179a275c1949f844ed9013d2771dfc7db060cc1700c21af" dmcf-pid="4Wuyws7vsC" dmcf-ptype="figure"> <p class="link_figure"><img alt="인공지능이 사람과 얼마나 비슷하게 사고하는지를 평가하는 ‘튜링 테스트’를 통과했다. 픽사베이" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202504/07/hani/20250407093507861wwap.jpg" data-org-width="800" dmcf-mid="9VJHOhbYIv" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202504/07/hani/20250407093507861wwap.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 인공지능이 사람과 얼마나 비슷하게 사고하는지를 평가하는 ‘튜링 테스트’를 통과했다. 픽사베이 </figcaption> </figure> <p contents-hash="56d22c0a368f6d629bc7d3b169787772ddc501da4591655e2324061f77e8d41f" dmcf-pid="8Y7WrOzTsI" dmcf-ptype="general"> 인공지능이 사람과 얼마나 비슷하게 대화할 수 있는지를 평가하는 척도인 ‘튜링 테스트’를 통과했다.<br><br> 미국 샌디에이고 캘리포니아대(UCSD) 연구진은 4가지 인공지능 모델을 대상으로 튜링 테스트를 진행한 결과, 오픈에이아이의 생성형 거대언어모델(LLM) 지피티4.5(GPT 4.5)가 사람보다 훨씬 더 높은 비율로 ‘사람 같다’는 평가를 받았다고 사전출판논문 공유집 아카이브에 발표했다. <br><br> 연구자들이 지금까지 진행한 튜링 테스트에서 인공지능이 사람보다 높은 승률을 기록한 건 처음이다. 지난 2월에 나온 지피티4.5는 지금까지 나온 지피티 중 대화 능력이 가장 뛰어난 모델이다.<br><br> 이번 시험에 사용한 인공지능 모델은 1960년대에 개발된 초기 대화형 컴퓨터 프로그램 엘리자(ELIZA)와 오픈에이아이의 지피티포오(GPT-4o), 지피티4.5(GPT4.5), 메타의 라마3.1(LLaMa-3.1-405B)이다.<br><br> 튜링 테스트는 1950년 영국 수학자 앨런 튜링이 제안한 인공지능의 능력을 판별하는 시험을 말한다. 표준적인 튜링 테스트 방법은 심문자 1인과 답변자 1인, 답변용 컴퓨터가 참여하는 3자 시험 방식이다. 심문자가 던진 질문에 대해 사람과 컴퓨터가 각각 답변을 제시하도록 하고, 심문자가 이 가운데 어느 것이 사람 답변인지 구별하지 못하거나 컴퓨터 답변을 사람 답변으로 착각하면 시험을 통과하는 것으로 본다. 즉 컴퓨터도 사람처럼 생각할 수 있는 것으로 간주한다. 튜링이 생전에 테스트 통과 기준을 제시한 적은 없다. 다만 50년 후 컴퓨터가 5분 대화에서 사람으로 오인받을 수 있는 확률을 30%로 예측했다. 일각에선 이를 기준으로 보기도 하지만, 일반적으론 우연히 맞힐 확률, 즉 동전 던지기 확률 50%를 기준으로 삼는다. <br><br></p> <figure class="figure_frm origin_fig" contents-hash="d9d035a64a184ef230071b3eb0270b27e3757598a6c697c217e8b267ff624f4d" dmcf-pid="6GzYmIqyrO" dmcf-ptype="figure"> <p class="link_figure"><img alt="튜링 테스트에서는 심문자(C)가 던진 질문에 대해 사람(B)과 컴퓨터(A)가 각각 답변을 제시하도록 하고, 심문자가 컴퓨터 답변을 사람 답변으로 착각하면 시험을 통과하는 것으로 본다." class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202504/07/hani/20250407093509649gnuv.jpg" data-org-width="661" dmcf-mid="2tlNxeSgES" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202504/07/hani/20250407093509649gnuv.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> 튜링 테스트에서는 심문자(C)가 던진 질문에 대해 사람(B)과 컴퓨터(A)가 각각 답변을 제시하도록 하고, 심문자가 컴퓨터 답변을 사람 답변으로 착각하면 시험을 통과하는 것으로 본다. </figcaption> </figure> <p contents-hash="da9d38b3b55ec032e7bd2d51958e21703ab8e3952d333d21ec55bbe095cccd27" dmcf-pid="PHqGsCBWOs" dmcf-ptype="general"><strong> 인격을 지정하지 않을 땐 사람보다 승률 낮아</strong><br><br> 연구진은 300명의 참가자를 무작위로 심문자나 답변자로 배정한 뒤, 온라인을 통해 8라운드 1023회에 걸쳐 5분씩 대화하는 실험을 진행했다. 인공지능에겐 두 가지 유형의 지시가 떨어졌다. 하나는 단순히 ‘심문자를 설득해 인간임을 확신시키라’는 몰인격형(비페르소나형), 다른 하나는 ‘인터넷문화를 잘 알고 속어를 즐겨 쓰는 내성적인 20대 젊은이라는 특정 인격체를 전제로 답변하라’는 인격형(페르소나형)이다.<br><br> 그 결과 페르소나형이냐 아니냐에 따라 큰 차이가 났다. 지피티4.5 모델은 페르소나형 대화에서 73%의 비율로 ‘사람 같다’는 평가를 받았다. 이는 우연히 맞출 확률 50%을 크게 웃도는 것이자, 경쟁자인 사람을 약 3배 압도하는 승률이다. 메타의 라마3.1은 56%의 비율로 사람과 큰 차이가 없었다. 지피티4.5는 그러나 비페르소나형 대화에선 ‘사람 같다’는 평가를 받은 비율이 36%로 떨어졌다.<br><br> 현재 텍스트, 음성, 이미지 등 다양한 형태의 정보를 처리할 수 있는 지피티포오는 21%에 그쳤다. 다만 지피티포오는 비페르소나형 대화만 진행했다. 엘리자 모델은 23%로 지피티포오를 약간 넘는 정도였다.<br><br> 연구를 주도한 캐머런 존스 연구원은 소셜미디어 엑스를 통해 “이번 연구는 거대 언어 모델(LLM)이 튜링 테스트를 통과했다는 매우 강력한 증거”라고 말했다.<br><br></p> <figure class="figure_frm origin_fig" contents-hash="b66db5372736e68dd096f1a4a19e1f193fab5ec579cfcff50dc468fadb9ed3d5" dmcf-pid="QXBHOhbYIm" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202504/07/hani/20250407093511170tian.jpg" data-org-width="704" dmcf-mid="VCHrLaXDwl" dmcf-mtype="image" height="auto" src="https://img4.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202504/07/hani/20250407093511170tian.jpg" width="658"></p> </figure> <p contents-hash="c77ea37e3e4ccb571ca8cd36e06c92aa31c6bd0dc49119e332e645a254571260" dmcf-pid="xZbXIlKGIr" dmcf-ptype="general"><strong> 뛰어난 인간 모방 능력…상담·교육 분야 유용</strong><br><br> 인공지능이 튜링 테스트를 통과한 것이 처음은 아니다. 지난해 같은 대학 연구진이 1 대 1 대화 방식으로 진행한 튜링 테스트에서 지피티 모델은 ‘우연의 확률’ 50%를 넘어섰다. 하지만 인간에 비해선 승률이 낮았다. 당시 500명이 참가한 실험에서 인간은 67%, 지피티4는 54%, 지피티3.5는 50%, 엘리자는 22%의 승률을 기록했다. 인공지능 모델이 인간보다 훨씬 높은 점수를 받은 건 오픈에이아이의 최신 모델인 지피티4.5가 처음이다.<br><br> 물론 인공지능이 튜링 테스트를 통과했다고 해서 인공지능이 사람과 같은 지능을 가졌다거나 사람처럼 생각하는 건 아니다. 튜링이 말했듯, 튜링 테스트의 본질은 어디까지나 ‘모방 게임’이다. 튜링 테스트를 통과했다는 건 짧고 일상적인 대화에서 사람 흉내를 내는 능력이 더 좋아졌다는 걸 뜻할 뿐이다. <br><br> 연구진은 “근본적으로 튜링 테스트는 지능에 대한 테스트가 아니라 인간과 비슷한지에 대한 테스트”라고 말했다. 산타페연구소의 멜라니 미첼 교수는 지난해 사이언스 논평 논문에서 “자연어로 유창하게 말하는 능력이 일반 지능의 결정적인 증거는 아니다”라고 말했다.<br><br> 따라서 튜링 테스트 통과의 의미는 기계가 인간과 상호작용하는 능력이 갈수록 능숙해지면서 이제 자연스러운 대화까지 가능하다는 걸 보여준다는 점이다. <br><br> 지피티4.5가 보여준 높은 수준의 소통 능력은 심리 상담이나 교육 등의 분야에서 유용하게 활용할 수 있다. 그러나 인공지능의 답변 생성 과정이 불투명한 상태에서, 사람들이 인간과 기계를 확실하게 구별할 수 없게 되면 새로운 사회적 문제가 발생할 수도 있다.<br><br> 연구진은 “위조 화폐가 실제 통화의 가치를 떨어뜨리는 것처럼 이러한 가상의 상호작용은 실제 인간 상호작용의 가치를 떨어뜨릴 수 있다”고 지적했다.<br><br> *논문 정보<br><br> Large Language Models Pass the Turing Test.<br><br> https://doi.org/10.48550/arXiv.2503.23674<br><br> 곽노필 선임기자 nopil@hani.co.kr</p> </section> </div> <p class="" data-translation="true">Copyright © 한겨레신문사 All Rights Reserved. 무단 전재, 재배포, AI 학습 및 활용 금지</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기