로그인
토토사이트
먹튀사이트/제보
업체홍보/구인
신규사이트
지식/노하우
놀이터홍보
판매의뢰
스포츠분석
뉴스
후기내역공유
커뮤니티
포토
포인트
보증업체
카지노 먹튀
토토 먹튀
먹튀제보
구인
구직
총판
제작업체홍보
카지노
토토
홀덤
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
축구
야구
농구
배구
하키
미식축구
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[]
경찰, '음주운전' 전 산림청장 조만간 소환..."휴대전화 꺼둬"
N
[연예뉴스]
AI 기본법 시행 한 달…플랫폼업계, 생성물 표시 의무 본격화
N
[IT뉴스]
SNS 알고리즘, 사용자 정치 성향 극우로 바꾼다 [달콤한 사이언스]
N
[IT뉴스]
AI붐으로 자산 폭등한 美 빅테크 리더들, ‘절세’하러 회사도 집도 옮긴다
N
[연예뉴스]
염혜란 주연 '매드 댄스 오피스' 컬래버 음원, '흔들려도 괜찮아' 오늘(22일) 발매
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
목록
글쓰기
[IT뉴스]LG CNS "금융 특화 LLM 평가 도구, AI 도입 기준점 될 것"
온카뱅크관리자
조회:
92
2025-04-03 11:07:29
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">비공개 데이터 기반 객관적 성능 검증… GPT·클로드·딥시크 등 수십 개 모델 평가</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="57GwVhbYcK"> <p contents-hash="abf45ca3b7e3c6822f17e636eeaa4d4a5af4c86052d05b3037b08ee6bd705d8d" dmcf-pid="1zHrflKGNb" dmcf-ptype="general">(지디넷코리아=남혁우 기자)금융권에서도 생성형 AI에 대한 관심이 높아지고 있지만, 보안과 정확성 문제로 인해 실제 도입은 쉽지 않다.</p> <p contents-hash="0d36f782597ad98167440193958ec5ec840d38fa7c06602eae24987049c8fd96" dmcf-pid="tqXm4S9HkB" dmcf-ptype="general">LG CNS는 이런 현실적인 장벽을 해결하기 위해, 금융 업무에 특화된 대규모언어모델(LLM) 평가 도구를 자체 개발했다. AI를 실제로 도입할 수 있는지 여부를 객관적으로 판단할 수 있도록 설계돼, 금융 현장에서의 신뢰성과 실용성을 함께 고려한 것이 특징이다.</p> <p contents-hash="4ffc1d82106404a5c1ff4aa7e07045acb27a9c092f1173f6f9eaf75e35907400" dmcf-pid="FBZs8v2Xgq" dmcf-ptype="general">이 도구는 LG CNS가 미리 구축한 금융 특화 데이터셋을 바탕으로 시중에 공개된 수십 개의 개방형 LLM(Open-source LLM)을 평가하고 비교해 뱅킹, 보험, 증권 등 다양한 금융 업무 환경에 가장 적합한 모델을 추천한다.</p> <figure class="figure_frm origin_fig" contents-hash="1c4800da78da2249354ca11bf56789109d09cd0c419eed25471873c6c7f27c07" dmcf-pid="3b5O6TVZoz" dmcf-ptype="figure"> <p class="link_figure"><img alt="(왼쪽부터) LG CNS AI센터 어드밴스드 생성형AI 연구소 황윤구 팀장, 강민수 선임, 이민형 선임(사진=남혁우 기자)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202504/03/ZDNetKorea/20250403110257129udoi.jpg" data-org-width="640" dmcf-mid="Z47Wi1RuN9" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202504/03/ZDNetKorea/20250403110257129udoi.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> (왼쪽부터) LG CNS AI센터 어드밴스드 생성형AI 연구소 황윤구 팀장, 강민수 선임, 이민형 선임(사진=남혁우 기자) </figcaption> </figure> <p contents-hash="5de2939fbb08295a9c3ceb94edce214a619df14bd3f871bda5a9a24d3b28b558" dmcf-pid="0iVtA7g2j7" dmcf-ptype="general"><strong>"도입보다 신뢰가 우선"… 금융에 맞춘 자체 평가 도구</strong></p> <p contents-hash="5722f2e6727a60981d7196c2a754488fa96503a1b4dd5b9d2d585ba1a1f1127e" dmcf-pid="pnfFczaVgu" dmcf-ptype="general">3일 서울 마곡 LG CNS 사옥에서 만난 AI센터 어드밴스드 생성형AI 연구소의 황윤구 팀장은 "금융은 보안과 규제가 모두 중요한 환경이라 일반 AI처럼 쉽게 적용하기 어려운면이 있다"며 "만약 이자율을 잘못 알려주거나 금융용어를 잘못 해석하는 순간 그 피해가 치명적일 수 있다"라고 설명했다.</p> <p contents-hash="f9e26e72dbfbe9546d98c67218223343bc7dc663c4a478f3021eed73df308455" dmcf-pid="UL43kqNfcU" dmcf-ptype="general">그는 이어 "그래서 우리는 AI를 '신뢰하고 도입할 수 있는가’를 판단할 수 있는 기준이 먼저 필요하다고 봤다"고 강조했다.</p> <p contents-hash="14d617e9142761ce39282041679f4cca40a98a0470e32d63688c44cb7563e1b1" dmcf-pid="uo80EBj4kp" dmcf-ptype="general">이러한 문제의식은 실제 프로젝트 경험에서 출발했다. LG CNS는 다양한 금융사와의 시스템 통합(SI) 프로젝트에서 AI 도입이 실패하거나 지연되는 사례를 반복적으로 목격했고, 이를 해결하기 위한 방법론을 내부에서 구축하기로 한 것이다.</p> <p contents-hash="19e434c0331a93d6502a25594eed2bca6e5b4337fcc7fbc459eaf174156c9628" dmcf-pid="7g6pDbA8j0" dmcf-ptype="general">황 팀장은 "우리가 직접 부딪히며 실패하고 배운 것들을 하나씩 정리해간 결과물이 바로 이번 평가 도구"라고 설명했다.</p> <p contents-hash="b30bc84ee10bcb9fc60724ddb11a3266c8cc920d6bd2d0ae029d8ebc769702e0" dmcf-pid="zaPUwKc6k3" dmcf-ptype="general">평가 도구는 총 29개 세부 테스크로 구성돼 있으며, 약 1천200개의 비공개 질문·지문 데이터셋을 기반으로 운영된다. 외부에 공개된 수능형 문제처럼 명확한 정답이 있는 문항도 있고, '모른다’라고 답하는 것이 오히려 정답이 되는 문항도 포함돼 있다.</p> <p contents-hash="221689dc9848bd28af292642e4bc5d4cba2d2d2d85f1a382db2770e0fbdc42cd" dmcf-pid="qNQur9kPjF" dmcf-ptype="general">공개된 리더보드는 학습·평가용 데이터가 외부에 노출돼 있어, 모델이 문제 유형을 암기해 정답률을 높이는 방식으로 성능이 과장될 수 있기 때문이다.</p> <p contents-hash="e036a1c874ec22aa4a756efe25ddfb68f5b0db2b5e34cb030266689a5a10eb33" dmcf-pid="Bjx7m2EQjt" dmcf-ptype="general">황윤구 팀장은 "벤치마크 데이터를 공개하는 순간, 고도화된 LLM은 문제 유형을 학습해 정답률을 인위적으로 끌어올릴 수 있다"며 "이 경우 실제 역량과 상관없이 높은 점수를 받을 수 있기 때문에, 평가의 객관성이 훼손될 우려가 있다"라고 설명했다.</p> <p contents-hash="ce28bcba8aeaec9a0f4c4f65b873db26dd26cfeb99d94a35bf3e7fd85dbe4c52" dmcf-pid="bAMzsVDxg1" dmcf-ptype="general">정량적 평가지표도 체계적으로 설계돼 있다. LG CNS는 ▲정답 유사도 ▲지문 기반 내용 일치도 ▲지시 수행 정확도 등 세 가지 기준을 종합해 점수를 산정하며, 평가 결과는 단순 스코어가 아닌 실무 도입 가능성을 가늠하는 기준으로 사용된다.</p> <p contents-hash="25c6d76c7cd7fddb3829dc18f4c42ab207ed64cdfb20b3df49ae77acd0b44e04" dmcf-pid="KcRqOfwMo5" dmcf-ptype="general">또한 금융 도메인 지식과 문맥 이해도를 평가하기 위해, 질문에 포함된 용어와 문장의 배경 의미를 얼마나 정확히 해석했는지도 주요 요소로 반영된다.</p> <p contents-hash="3e7b4385cbb78f0ed6467702656d9cad9b4f96bc56935499b9f33faebced0c5f" dmcf-pid="98UTdZxpkZ" dmcf-ptype="general">이민영 선임은 "단순히 질문에 대답하는 것이 아니라, 오히려 '대답하지 않는 게 맞는 상황’에서 어떤 선택을 하는지가 금융에서는 더 중요하다"며 "그런 정교한 평가 항목이 저희 도구의 특징"이라고 설명했다.</p> <p contents-hash="de39b665bef1c82172d7ef7b795d57ff87058f6637dbaec6537a59138f6d5eb7" dmcf-pid="26uyJ5MUoX" dmcf-ptype="general"><strong>모델별 성능 비교…"GPT·클로드 상위, 딥시크는 예상보다 낮아"</strong></p> <p contents-hash="a22111cbdd9316458d61a4a6e6975ac7a78d5fe5de9750362af568569c47f967" dmcf-pid="VP7Wi1RukH" dmcf-ptype="general">모델별 성능 비교도 진행됐다. GPT-4, 클로드 등 상용 API 모델이 평가에서 가장 높은 성능을 보이는 것으로 나타났다. 다만 퍼블릭 클라우드만 지원하는 만큼 금융사 등에서 적극적으로 활용하기엔 한계가 있다는 지적이 있었다.</p> <p contents-hash="fdb48975239a20f1ab1224f473480845876ca0d39f68f5e5a4d32f0e17b4a506" dmcf-pid="fQzYnte7NG" dmcf-ptype="general">최근 주목받는 오픈소스 LLM인 딥시크(DeepSeek)는 평가에서 대부분 낮은 점수를 기록했다.</p> <p contents-hash="6b87f2ca7653763bff76680cbef009d7a651213168c9aca9f363195589b199d2" dmcf-pid="4xqGLFdzAY" dmcf-ptype="general">황윤구 팀장은 "딥시크는 성능뿐 아니라 학습 데이터의 출처와 개인정보 이슈 등 여러 면에서 금융사 입장에서 채택하기 어려웠다"며 "특히 컴플라이언스 관점에서 리스크가 큰 것으로 나타났습니다"라고 밝혔다.</p> <p contents-hash="2dfd8cd02f2910fffb159c9e010cf88e82168ed14481ce2f4e38e7e798c50530" dmcf-pid="8MBHo3JqcW" dmcf-ptype="general">반면 LG 그룹의 자체 LLM인 엑사원(Exaone)은 상대적으로 높은 평가를 받았다. 이민영 선임은 "질문과 관련 없는 내용이 지문에 섞여 있어도, 질문에만 집중해 정확하게 응답하는 능력이 뛰어났다"며 "특히 다양한 정보가 뒤섞인 긴 지문에서도 흔들리지 않고 핵심을 잘 잡는 모습을 보였다"며 대화형 AI에 높은 성능을 제공한다고 설명했다.</p> <p contents-hash="7e15a4f03616c27af270cf2edbb2d2533e33b8f92cf1a57321799d593825e849" dmcf-pid="6RbXg0iBjy" dmcf-ptype="general">또한 이번 평가 도구의 평가 테스크는 고정된 항목이 아니라 고객사 니즈나 기술 트렌드에 따라 지속적으로 업데이트된다.</p> <p contents-hash="b968d491296955c783ec15f9857226b88a44ed37e7377e4c0a885f8a813fb815" dmcf-pid="PeKZapnbNT" dmcf-ptype="general">생성형AI 연구소는 올해 이 평가 도구를 실제 금융 현장에 적용해 활용 사례를 축적하는 데 집중하고 있다.</p> <p contents-hash="4ae615bc7854e990766f9e2617bc34821cf35ba922f5e50efe98af36f3d54c75" dmcf-pid="Qd95NULKov" dmcf-ptype="general">이민영 선임은 "지난해에는 평가도구를 만드는 것 자체가 목표였다면 올해는 이 도구를 적용해 실제 금융 AI 평가 로그를 얼마나 확보하는지가 주요 실행 과제"라며 "이제는 실적 기반으로 이 툴이 얼마나 많이 쓰이느냐가 핵심이 될 것"이라고 밝혔다.</p> <p contents-hash="db0d212b0f511278d840f2e9f2bebe35d2ae757cd38b6b41993b72ba4ccef8d0" dmcf-pid="xJ21juo9NS" dmcf-ptype="general">LG CNS는 계열사를 중심으로 엑사원 테스트를 완료했으며, 일부 금융사들과도 PoC 형태로 적용 가능성을 검토 중이다. 다만 보안 및 계약 이슈로 인해 외부 공개는 제한적이다.</p> <p contents-hash="731418a31cd4dd15c4ad9d7e79afd661e8d3ee48c84c6153fcb9f24415ddefa6" dmcf-pid="y0Tcbs7vol" dmcf-ptype="general"><strong>금융 넘어 공공·제조 확산 목표</strong></p> <p contents-hash="d5fe07cd552f499f7d7e393c271407d984895803189543dee00f2accdfee7a50" dmcf-pid="WpykKOzTkh" dmcf-ptype="general">LG CNS는 <span>향후 공공 문서나 제조 환경처럼 금융과 유사한 폐쇄형·도메인 특화 환경으로의 확장도 고려하고 있다.</span></p> <p contents-hash="b82cb6997b8e1e4c10d9906063703a1ffaf2888170fa3f4009a000927be223b5" dmcf-pid="YUWE9IqyNC" dmcf-ptype="general">이민영 선임은 "공공기관 보도자료나 행정문서는 형식이 딱 정해져 있는 만큼, 우리의 금융 평가 프레임워크를 확장하면 충분히 적용 가능할 거라 예상한다"라고 말했다.</p> <p contents-hash="e05300c2709b3dad123cb014bd2851274a393ba8b1cff68ccb31f0b523dee6f6" dmcf-pid="GuYD2CBWaI" dmcf-ptype="general">황윤구 팀장은 "금융처럼 민감한 환경에서는 '잘 쓴다’보다 '믿고 쓸 수 있는가’가 더 중요하다"며 "우리는 먼저 금융환경에 적합한 기준을 세운 후, 직접 사용해보고 끊임없이 개선해가고 있다"고 말했다.</p> <p contents-hash="5cf34871c17c34326833c09fc0f9d36db96439da6011a4d55824088125f36015" dmcf-pid="H7GwVhbYcO" dmcf-ptype="general">이어 그는 "AI 기술의 발전도 중요하지만, 결국 기업이 그것을 신뢰하고 안심하고 쓸 수 있는 '기준선’을 만드는 것이 더 본질적"이라며 "LG CNS가 만든 이 평가 도구가 금융권의 AI 도입을 앞당기고 다양한 선업에서 적용 가능한 신뢰의 기준의 '눈금자’가 되기를 기대한다"라며 포부를 밝혔다.</p> <p contents-hash="36c1c765bf9dbc5c953a9375bebb3153b9c9b42e46d0f9e3130cf3b81638e7e7" dmcf-pid="XzHrflKGNs" dmcf-ptype="general">남혁우 기자(firstblood@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기