로그인
토토사이트
먹튀사이트/제보
업체홍보/구인
신규사이트
지식/노하우
놀이터홍보
판매의뢰
스포츠분석
뉴스
후기내역공유
커뮤니티
포토
포인트
보증업체
카지노 먹튀
토토 먹튀
먹튀제보
구인
구직
총판
제작업체홍보
카지노
토토
홀덤
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
축구
야구
농구
배구
하키
미식축구
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[IT뉴스]
통번역은 챗GPT?…토종 AI, B2B서 두각
N
[IT뉴스]
“AI 혜택 공유돼야” 印 AI 정상회의서 공동선언
N
[연예뉴스]
'천하제빵' 권성준 "포기할 거면 지금 나가라"…팝업스토어 팀워크 '비상'
N
[연예뉴스]
이효리 “가만히 있는 게 제일 어려워”…요가로 찾은 삶의 균형
N
[연예뉴스]
아이브, 23일 ‘REVIVE+’ 컴백 쇼케이스 생중계...‘블랙홀’ 무대 최초 공개
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
목록
글쓰기
[IT뉴스]AI의 '인간 연기', 실제 인간보다 더 인간답다…충격적 결과
온카뱅크관리자
조회:
85
2025-04-03 16:57:33
<div id="layerTranslateNotice" style="display:none;"></div> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="fAThiv2XAd"> <p contents-hash="49a2081205964334e359328cfb759a058a9d3cc7e36790b1325ff1cdf77fc1cd" dmcf-pid="4cylnTVZje" dmcf-ptype="general">(지디넷코리아=AI 에디터 )</p> <figure class="figure_frm origin_fig" contents-hash="6d8b4726bab277f31e5b4559d523cb44e3b7c33281ecb3f3ccc57840a6f5dd57" dmcf-pid="8kWSLyf5aR" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202504/03/ZDNetKorea/20250403165255699sthd.jpg" data-org-width="640" dmcf-mid="2LfyaG6FNi" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202504/03/ZDNetKorea/20250403165255699sthd.jpg" width="658"></p> </figure> <p contents-hash="0f872e2d43f04934b23e4df6172ad147d1c28d7f98cd2ec7ac663c9ec10b4701" dmcf-pid="6EYvoW41aM" dmcf-ptype="general"><strong>GPT-4.5, 73% 성공률로 실제 인간 참가자보다 더 인간답게 평가받아</strong></p> <p contents-hash="27507f8f9e7270649ca2b62566636d406907d9ceb8b308cd49f3ef764f5cddcc" dmcf-pid="Pdrk8wphjx" dmcf-ptype="general">캘리포니아 샌디에이고 대학(UC San Diego)의 연구팀이 최신 대규모 언어 모델(Large Language Model, LLM)인 GPT-4.5와 LLaMa-3.1-405B를 대상으로 튜링 테스트를 실시한 결과, 이들 모델이 인간과 구별되지 않을 정도로 인간답게 대화할 수 있음을 입증했다. 특히 GPT-4.5는 인간 참가자보다 더 인간적으로 보이는 놀라운 결과를 보였다.</p> <p contents-hash="704361eb287ddfd7227c6e70ae3f044993361b124c10a6fe40db0cfa68e336c5" dmcf-pid="QJmE6rUlNQ" dmcf-ptype="general">튜링 테스트는 영국의 수학자 앨런 튜링(Alan Turing)이 1950년에 제안한 것으로, 기계가 인간과 구별할 수 없을 정도로 지능적인지 평가하는 방법이다. 이 테스트에서는 질문자가 두 명의 대화 상대(한 명은 인간, 한 명은 AI)와 텍스트로만 대화를 나누고, 누가 인간인지 판단해야 한다. 질문자가 일관되게 인간과 기계를 구별하지 못한다면, 그 기계는 테스트를 통과한 것으로 간주된다.</p> <p contents-hash="9065e1d6539cdbf5efe26186f3e5a8d078a3f19253113472db30a41d40b069f4" dmcf-pid="xisDPmuSaP" dmcf-ptype="general">연구팀은 대학생 126명과 온라인 플랫폼 Prolific에서 모집한 158명의 참가자를 대상으로 실험을 진행했다. GPT-4.5, LLaMa-3.1-405B, GPT-4o, ELIZA 등 4개의 AI 시스템을 평가했으며, 특정 페르소나(persona)를 부여한 경우와 그렇지 않은 경우로 나누어 테스트했다.</p> <p contents-hash="b4410d5488763a86cd1c53dc0bba359002b38bc9b3cc5898ec117335f9e6a3ea" dmcf-pid="yZ9qvKc6a6" dmcf-ptype="general"><strong>특정 성격 부여받은 AI, 성공률 73% 달성... 페르소나 없는 AI는 36~38%에 그쳐</strong></p> <p contents-hash="377fa7e36fbff1bad75d1c37e142919a3b80140820ad9209bc83449ba12310a4" dmcf-pid="W52BT9kPc8" dmcf-ptype="general">가장 주목할 만한 결과는 특정 페르소나를 부여받은 GPT-4.5(GPT-4.5-PERSONA)가 테스트에서 73%의 성공률을 보였다는 점이다. 이는 질문자들이 실제 인간 참가자보다 GPT-4.5를 더 자주 인간으로 판단했음을 의미한다. LLaMa-3.1 역시 동일한 페르소나 설정으로 56%의 성공률을 달성했다.</p> <p contents-hash="9e8eccf3dbf1632a6c2ed26ec9219aeadb5c61853808bb4d59ad1176f420f176" dmcf-pid="Y1Vby2EQk4" dmcf-ptype="general">반면, 페르소나가 부여되지 않은 GPT-4.5-NO-PERSONA와 LLaMa-NO-PERSONA는 각각 36%와 38%의 성공률을, 기준 모델인 GPT-4o-NO-PERSONA와 ELIZA는 21%와 23%의 낮은 성공률을 보였다. 이는 AI 모델이 특정 성격과 스타일을 가진 인간을 모방하도록 지시받았을 때 훨씬 인간답게 행동할 수 있음을 시사한다.</p> <p contents-hash="98d59edf31b2bfe59b19b4b5dc0222b1a8cd2b3a17d8e9754f38befce2854ea1" dmcf-pid="GtfKWVDxcf" dmcf-ptype="general">연구에 사용된 페르소나는 인터넷 문화와 비디오 게임을 좋아하는 10대 후반의 내향적인 젊은이였다. 이 페르소나는 슬랭을 사용하고, 문장 끝에 마침표를 사용하지 않으며, 약어를 사용하는 등 특정 언어 스타일을 가지도록 설계되었다.</p> <figure class="figure_frm origin_fig" contents-hash="fba19c2fb134bceb35423a6b64c1b3a8db27bd6b8a42676a6f7d3c801243e83b" dmcf-pid="HF49YfwMcV" dmcf-ptype="figure"> <p class="link_figure"><img class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202504/03/ZDNetKorea/20250403165257104pksx.jpg" data-org-width="640" dmcf-mid="Vlptr0iBAJ" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202504/03/ZDNetKorea/20250403165257104pksx.jpg" width="658"></p> </figure> <p contents-hash="17c6fa93b3c86b03c60911238b705a9389ada2c958af306d807d5d74bacd6275" dmcf-pid="X382G4rRg2" dmcf-ptype="general"><strong>일상 대화 61%, 감정 탐색 50%... 인간 구별에 사용된 전략과 성공률</strong></p> <p contents-hash="aa5e35f32c556781730773c491d120a59e3b021e53ecc7f4e7d43b6e21d1aacb" dmcf-pid="Z06VH8meA9" dmcf-ptype="general">참가자들이 인간과 AI를 구별하기 위해 사용한 전략과 이유를 분석한 결과, 61%의 게임에서 질문자들은 일상적인 대화를 통해 상대방을 평가했다. 예를 들어 직업이나 개인적인 세부 사항에 대해 물어보는 방식이었다. 50%의 경우에는 감정, 유머, 경험 등 사회적·감정적 특성을 탐색했다.</p> <p contents-hash="29af29827baeb8b742cec39305355dac6194996eafa060d06c92ebb0aef7e609" dmcf-pid="5pPfX6sdNK" dmcf-ptype="general">가장 효과적인 전략은 이상한 말을 해서 반응을 살피거나 전형적인 AI 제약을 우회하려는 시도(jailbreak)였다. 반면, 날씨나 인간 경험에 대해 물어보는 것은 가장 효과가 낮은 전략으로 나타났다.</p> <p contents-hash="34476bf2a89d5d89e0871c633034a0ffaf8dcdc8dce7531222b23dc9ea24c0fb" dmcf-pid="1UQ4ZPOJjb" dmcf-ptype="general">참가자들이 판단 이유로 가장 자주 언급한 것은 언어 스타일(27%)과 상호작용 역학(23%)이었다. 많은 참가자들이 "직감"으로 판단했다고 응답해, 구체적인 판단 이유를 항상 명확히 설명할 수 없었음을 보여주었다.</p> <p contents-hash="0f82c05932caa7eb285b3d84e7b68f8b04148e0724c39dab89721dd2a89b9ea1" dmcf-pid="tux85QIioB" dmcf-ptype="general"><strong>위조된 사람들'의 등장: 구별 불가능한 AI가 가져올 사회적 파장</strong></p> <p contents-hash="e2a1f5d9158a868b60bd6d5794fa220a0213bb7c43c40a29b15b71bf638d106b" dmcf-pid="F7M61xCnAq" dmcf-ptype="general">이번 연구는 현대 AI 시스템이 처음으로 원래 형태의 튜링 테스트를 통과했음을 보여준다는 중요한 의미를 갖는다. 특히 GPT-4.5는 질문자들이 무작위로 추측하는 것보다 더 자주 인간으로 판단되었을 뿐만 아니라, 실제 인간 참가자보다 더 인간적으로 인식되었다.</p> <p contents-hash="f4448e56cfc281ff0eaf4b4470fb499b46d198c61406522d6d0fb56fc83b142d" dmcf-pid="3zRPtMhLkz" dmcf-ptype="general">연구자들은 이러한 결과가 단순히 AI의 지능을 입증하는 것을 넘어, 현대 사회에 중요한 실질적 함의를 갖는다고 지적한다. 인간과 구별할 수 없을 정도로 인간을 모방할 수 있는 시스템들은 직업을 자동화하고, 온라인 상호작용을 대체하며, 소셜 엔지니어링이나 허위정보 확산에 활용될 수 있다.</p> <p contents-hash="6d99f6101ad484fe8ba119a6705c3505c50ea99fb3efccf4e371904554bcd692" dmcf-pid="0bJM0dvaA7" dmcf-ptype="general">다른 한편으로, 이러한 "위조된 사람들(counterfeit people)"의 출현은 진정한 인간 상호작용의 가치를 약화시키고, 사회적 교류의 본질을 변화시킬 수 있다. 연구자들은 "기계가 튜링 테스트를 처음 통과한 지금, 이는 이야기의 끝이 아니라 새로운 시작"이라며, 인간들이 더 나은 친구, 예술가, 교사, 부모, 연인이 되기 위해 노력하게 될 것이라고 전망했다.</p> <p contents-hash="3c0d7df42faee7dff9299bf5155af584d84af9e55eae47c6e2769efc5ce457a7" dmcf-pid="pKiRpJTNju" dmcf-ptype="general"><strong>FAQ</strong></p> <p contents-hash="55f06f8cb1e456435988589452e9c0964fc555007d11d459b22e5c4d5dadc040" dmcf-pid="U9neUiyjjU" dmcf-ptype="general"><strong>Q: 튜링 테스트란 정확히 무엇이며 왜 중요한가요?</strong></p> <p contents-hash="dbd08e48e416a41e8cfe0e95296fcf18e00ccdb36b175b428e406d7f3a6bab87" dmcf-pid="u2LdunWAjp" dmcf-ptype="general">A: 튜링 테스트는 기계가 인간과 구별할 수 없을 정도로 지능적인지 평가하는 방법입니다. 질문자가 텍스트 대화만으로 인간과 AI를 구별하지 못한다면 AI가 테스트를 통과한 것으로 간주됩니다. 이 테스트는 AI가 단순한 계산이나 패턴 인식을 넘어 인간과 유사한 소통 능력을 갖추었는지 판단하는 중요한 지표입니다.</p> <p contents-hash="0e725e34348ecf39ff5cb7869034a142c8b5b44fc4425751c953228f0727fb50" dmcf-pid="7VoJ7LYcj0" dmcf-ptype="general"><strong>Q: AI가 튜링 테스트를 통과했다는 것이 일상생활에 어떤 영향을 미칠까요?</strong></p> <p contents-hash="5146743f588782550202d2c5af8aa11071c33bf1e86ca228e044db89e5162fc1" dmcf-pid="zfgizoGko3" dmcf-ptype="general">A: AI가 인간과 구별되지 않게 대화할 수 있다는 것은 고객 서비스, 온라인 상담, 교육 등 다양한 영역에서 인간-AI 상호작용이 더욱 자연스러워질 수 있음을 의미합니다. 동시에 온라인에서 만나는 상대방이 실제 인간인지 AI인지 구별하기 어려워져 디지털 신뢰 문제가 더욱 복잡해질 수 있습니다.</p> <p contents-hash="dcd860ea1ab368197a560d0c892099aa1dec6756ff768137e37a1f23e8cc1ffa" dmcf-pid="q4anqgHEAF" dmcf-ptype="general"><strong>Q: 페르소나 설정이 왜 AI의 인간성 인식에 큰 차이를 만들었나요?</strong></p> <p contents-hash="511c4d2e46768a9436e6af651968b1bc7e2962a2512609163057437574c72fcb" dmcf-pid="B8NLBaXDct" dmcf-ptype="general">A: 페르소나 설정은 AI에게 특정 성격, 언어 스타일, 관심사를 가진 인간을 모방하도록 구체적인 지침을 제공합니다. 이러한 구체성이 AI가 일관되고 자연스러운 대화 스타일을 유지하도록 도와주며, 일반적인 AI 응답에서 나타날 수 있는 형식적이거나 지나치게 완벽한 표현을 줄여줍니다. 실제 인간들도 각자 고유한 성격과 대화 스타일을 가지고 있으므로, 이를 모방하는 AI가 더 인간적으로 느껴지는 것입니다.</p> <p contents-hash="b6969d64d0785c0f665c01b521fbe48440a4af005409def0318be1c86d05e35e" dmcf-pid="b6jobNZwo1" dmcf-ptype="general">■ 이 기사는 AI 전문 매체 ‘<span>AI 매터스</span>’와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. </p> <p contents-hash="bd178a0f805bb85f482a2a19cbab09403eb053448211512567f29b2cccd8355b" dmcf-pid="KPAgKj5rN5" dmcf-ptype="general">AI 에디터 (media@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기