로그인
보증업체
신규사이트
스포츠분석
먹튀사이트/제보
지식/노하우
놀이터홍보
판매의뢰
업체홍보/구인
뉴스
후기내역공유
커뮤니티
포토
포인트
보증카지노
보증토토
카지노
토토
홀덤
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[]
가교자 李·협상가 文···타임사진에 갈린 두 리더십 [송종호의 국정쏙쏙]
N
[연예뉴스]
정대현, 끝나가는 무더위에 남긴 청춘 감성
N
[연예뉴스]
[2025 TMA] 스트레이 키즈, 무대 예고…"뭘 좋아할지 몰라 다 준비"
N
[연예뉴스]
[2025 TMA] 에스파, '4인 4색' 소감…"올해도 잘 보내…뿌듯하다"
N
[연예뉴스]
[2025 TMA] '핫티스트' 클로즈 유어 아이즈…대세 신인 입증
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
제휴문의 텔레그램 @dognus11
목록
글쓰기
[IT뉴스]LG CNS "금융 특화 LLM 평가 도구, AI 도입 기준점 될 것"
온카뱅크관리자
조회:
50
2025-04-03 11:07:29
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">비공개 데이터 기반 객관적 성능 검증… GPT·클로드·딥시크 등 수십 개 모델 평가</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="57GwVhbYcK"> <p contents-hash="abf45ca3b7e3c6822f17e636eeaa4d4a5af4c86052d05b3037b08ee6bd705d8d" dmcf-pid="1zHrflKGNb" dmcf-ptype="general">(지디넷코리아=남혁우 기자)금융권에서도 생성형 AI에 대한 관심이 높아지고 있지만, 보안과 정확성 문제로 인해 실제 도입은 쉽지 않다.</p> <p contents-hash="0d36f782597ad98167440193958ec5ec840d38fa7c06602eae24987049c8fd96" dmcf-pid="tqXm4S9HkB" dmcf-ptype="general">LG CNS는 이런 현실적인 장벽을 해결하기 위해, 금융 업무에 특화된 대규모언어모델(LLM) 평가 도구를 자체 개발했다. AI를 실제로 도입할 수 있는지 여부를 객관적으로 판단할 수 있도록 설계돼, 금융 현장에서의 신뢰성과 실용성을 함께 고려한 것이 특징이다.</p> <p contents-hash="4ffc1d82106404a5c1ff4aa7e07045acb27a9c092f1173f6f9eaf75e35907400" dmcf-pid="FBZs8v2Xgq" dmcf-ptype="general">이 도구는 LG CNS가 미리 구축한 금융 특화 데이터셋을 바탕으로 시중에 공개된 수십 개의 개방형 LLM(Open-source LLM)을 평가하고 비교해 뱅킹, 보험, 증권 등 다양한 금융 업무 환경에 가장 적합한 모델을 추천한다.</p> <figure class="figure_frm origin_fig" contents-hash="1c4800da78da2249354ca11bf56789109d09cd0c419eed25471873c6c7f27c07" dmcf-pid="3b5O6TVZoz" dmcf-ptype="figure"> <p class="link_figure"><img alt="(왼쪽부터) LG CNS AI센터 어드밴스드 생성형AI 연구소 황윤구 팀장, 강민수 선임, 이민형 선임(사진=남혁우 기자)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202504/03/ZDNetKorea/20250403110257129udoi.jpg" data-org-width="640" dmcf-mid="Z47Wi1RuN9" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202504/03/ZDNetKorea/20250403110257129udoi.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> (왼쪽부터) LG CNS AI센터 어드밴스드 생성형AI 연구소 황윤구 팀장, 강민수 선임, 이민형 선임(사진=남혁우 기자) </figcaption> </figure> <p contents-hash="5de2939fbb08295a9c3ceb94edce214a619df14bd3f871bda5a9a24d3b28b558" dmcf-pid="0iVtA7g2j7" dmcf-ptype="general"><strong>"도입보다 신뢰가 우선"… 금융에 맞춘 자체 평가 도구</strong></p> <p contents-hash="5722f2e6727a60981d7196c2a754488fa96503a1b4dd5b9d2d585ba1a1f1127e" dmcf-pid="pnfFczaVgu" dmcf-ptype="general">3일 서울 마곡 LG CNS 사옥에서 만난 AI센터 어드밴스드 생성형AI 연구소의 황윤구 팀장은 "금융은 보안과 규제가 모두 중요한 환경이라 일반 AI처럼 쉽게 적용하기 어려운면이 있다"며 "만약 이자율을 잘못 알려주거나 금융용어를 잘못 해석하는 순간 그 피해가 치명적일 수 있다"라고 설명했다.</p> <p contents-hash="f9e26e72dbfbe9546d98c67218223343bc7dc663c4a478f3021eed73df308455" dmcf-pid="UL43kqNfcU" dmcf-ptype="general">그는 이어 "그래서 우리는 AI를 '신뢰하고 도입할 수 있는가’를 판단할 수 있는 기준이 먼저 필요하다고 봤다"고 강조했다.</p> <p contents-hash="14d617e9142761ce39282041679f4cca40a98a0470e32d63688c44cb7563e1b1" dmcf-pid="uo80EBj4kp" dmcf-ptype="general">이러한 문제의식은 실제 프로젝트 경험에서 출발했다. LG CNS는 다양한 금융사와의 시스템 통합(SI) 프로젝트에서 AI 도입이 실패하거나 지연되는 사례를 반복적으로 목격했고, 이를 해결하기 위한 방법론을 내부에서 구축하기로 한 것이다.</p> <p contents-hash="19e434c0331a93d6502a25594eed2bca6e5b4337fcc7fbc459eaf174156c9628" dmcf-pid="7g6pDbA8j0" dmcf-ptype="general">황 팀장은 "우리가 직접 부딪히며 실패하고 배운 것들을 하나씩 정리해간 결과물이 바로 이번 평가 도구"라고 설명했다.</p> <p contents-hash="b30bc84ee10bcb9fc60724ddb11a3266c8cc920d6bd2d0ae029d8ebc769702e0" dmcf-pid="zaPUwKc6k3" dmcf-ptype="general">평가 도구는 총 29개 세부 테스크로 구성돼 있으며, 약 1천200개의 비공개 질문·지문 데이터셋을 기반으로 운영된다. 외부에 공개된 수능형 문제처럼 명확한 정답이 있는 문항도 있고, '모른다’라고 답하는 것이 오히려 정답이 되는 문항도 포함돼 있다.</p> <p contents-hash="221689dc9848bd28af292642e4bc5d4cba2d2d2d85f1a382db2770e0fbdc42cd" dmcf-pid="qNQur9kPjF" dmcf-ptype="general">공개된 리더보드는 학습·평가용 데이터가 외부에 노출돼 있어, 모델이 문제 유형을 암기해 정답률을 높이는 방식으로 성능이 과장될 수 있기 때문이다.</p> <p contents-hash="e036a1c874ec22aa4a756efe25ddfb68f5b0db2b5e34cb030266689a5a10eb33" dmcf-pid="Bjx7m2EQjt" dmcf-ptype="general">황윤구 팀장은 "벤치마크 데이터를 공개하는 순간, 고도화된 LLM은 문제 유형을 학습해 정답률을 인위적으로 끌어올릴 수 있다"며 "이 경우 실제 역량과 상관없이 높은 점수를 받을 수 있기 때문에, 평가의 객관성이 훼손될 우려가 있다"라고 설명했다.</p> <p contents-hash="ce28bcba8aeaec9a0f4c4f65b873db26dd26cfeb99d94a35bf3e7fd85dbe4c52" dmcf-pid="bAMzsVDxg1" dmcf-ptype="general">정량적 평가지표도 체계적으로 설계돼 있다. LG CNS는 ▲정답 유사도 ▲지문 기반 내용 일치도 ▲지시 수행 정확도 등 세 가지 기준을 종합해 점수를 산정하며, 평가 결과는 단순 스코어가 아닌 실무 도입 가능성을 가늠하는 기준으로 사용된다.</p> <p contents-hash="25c6d76c7cd7fddb3829dc18f4c42ab207ed64cdfb20b3df49ae77acd0b44e04" dmcf-pid="KcRqOfwMo5" dmcf-ptype="general">또한 금융 도메인 지식과 문맥 이해도를 평가하기 위해, 질문에 포함된 용어와 문장의 배경 의미를 얼마나 정확히 해석했는지도 주요 요소로 반영된다.</p> <p contents-hash="3e7b4385cbb78f0ed6467702656d9cad9b4f96bc56935499b9f33faebced0c5f" dmcf-pid="98UTdZxpkZ" dmcf-ptype="general">이민영 선임은 "단순히 질문에 대답하는 것이 아니라, 오히려 '대답하지 않는 게 맞는 상황’에서 어떤 선택을 하는지가 금융에서는 더 중요하다"며 "그런 정교한 평가 항목이 저희 도구의 특징"이라고 설명했다.</p> <p contents-hash="de39b665bef1c82172d7ef7b795d57ff87058f6637dbaec6537a59138f6d5eb7" dmcf-pid="26uyJ5MUoX" dmcf-ptype="general"><strong>모델별 성능 비교…"GPT·클로드 상위, 딥시크는 예상보다 낮아"</strong></p> <p contents-hash="a22111cbdd9316458d61a4a6e6975ac7a78d5fe5de9750362af568569c47f967" dmcf-pid="VP7Wi1RukH" dmcf-ptype="general">모델별 성능 비교도 진행됐다. GPT-4, 클로드 등 상용 API 모델이 평가에서 가장 높은 성능을 보이는 것으로 나타났다. 다만 퍼블릭 클라우드만 지원하는 만큼 금융사 등에서 적극적으로 활용하기엔 한계가 있다는 지적이 있었다.</p> <p contents-hash="fdb48975239a20f1ab1224f473480845876ca0d39f68f5e5a4d32f0e17b4a506" dmcf-pid="fQzYnte7NG" dmcf-ptype="general">최근 주목받는 오픈소스 LLM인 딥시크(DeepSeek)는 평가에서 대부분 낮은 점수를 기록했다.</p> <p contents-hash="6b87f2ca7653763bff76680cbef009d7a651213168c9aca9f363195589b199d2" dmcf-pid="4xqGLFdzAY" dmcf-ptype="general">황윤구 팀장은 "딥시크는 성능뿐 아니라 학습 데이터의 출처와 개인정보 이슈 등 여러 면에서 금융사 입장에서 채택하기 어려웠다"며 "특히 컴플라이언스 관점에서 리스크가 큰 것으로 나타났습니다"라고 밝혔다.</p> <p contents-hash="2dfd8cd02f2910fffb159c9e010cf88e82168ed14481ce2f4e38e7e798c50530" dmcf-pid="8MBHo3JqcW" dmcf-ptype="general">반면 LG 그룹의 자체 LLM인 엑사원(Exaone)은 상대적으로 높은 평가를 받았다. 이민영 선임은 "질문과 관련 없는 내용이 지문에 섞여 있어도, 질문에만 집중해 정확하게 응답하는 능력이 뛰어났다"며 "특히 다양한 정보가 뒤섞인 긴 지문에서도 흔들리지 않고 핵심을 잘 잡는 모습을 보였다"며 대화형 AI에 높은 성능을 제공한다고 설명했다.</p> <p contents-hash="7e15a4f03616c27af270cf2edbb2d2533e33b8f92cf1a57321799d593825e849" dmcf-pid="6RbXg0iBjy" dmcf-ptype="general">또한 이번 평가 도구의 평가 테스크는 고정된 항목이 아니라 고객사 니즈나 기술 트렌드에 따라 지속적으로 업데이트된다.</p> <p contents-hash="b968d491296955c783ec15f9857226b88a44ed37e7377e4c0a885f8a813fb815" dmcf-pid="PeKZapnbNT" dmcf-ptype="general">생성형AI 연구소는 올해 이 평가 도구를 실제 금융 현장에 적용해 활용 사례를 축적하는 데 집중하고 있다.</p> <p contents-hash="4ae615bc7854e990766f9e2617bc34821cf35ba922f5e50efe98af36f3d54c75" dmcf-pid="Qd95NULKov" dmcf-ptype="general">이민영 선임은 "지난해에는 평가도구를 만드는 것 자체가 목표였다면 올해는 이 도구를 적용해 실제 금융 AI 평가 로그를 얼마나 확보하는지가 주요 실행 과제"라며 "이제는 실적 기반으로 이 툴이 얼마나 많이 쓰이느냐가 핵심이 될 것"이라고 밝혔다.</p> <p contents-hash="db0d212b0f511278d840f2e9f2bebe35d2ae757cd38b6b41993b72ba4ccef8d0" dmcf-pid="xJ21juo9NS" dmcf-ptype="general">LG CNS는 계열사를 중심으로 엑사원 테스트를 완료했으며, 일부 금융사들과도 PoC 형태로 적용 가능성을 검토 중이다. 다만 보안 및 계약 이슈로 인해 외부 공개는 제한적이다.</p> <p contents-hash="731418a31cd4dd15c4ad9d7e79afd661e8d3ee48c84c6153fcb9f24415ddefa6" dmcf-pid="y0Tcbs7vol" dmcf-ptype="general"><strong>금융 넘어 공공·제조 확산 목표</strong></p> <p contents-hash="d5fe07cd552f499f7d7e393c271407d984895803189543dee00f2accdfee7a50" dmcf-pid="WpykKOzTkh" dmcf-ptype="general">LG CNS는 <span>향후 공공 문서나 제조 환경처럼 금융과 유사한 폐쇄형·도메인 특화 환경으로의 확장도 고려하고 있다.</span></p> <p contents-hash="b82cb6997b8e1e4c10d9906063703a1ffaf2888170fa3f4009a000927be223b5" dmcf-pid="YUWE9IqyNC" dmcf-ptype="general">이민영 선임은 "공공기관 보도자료나 행정문서는 형식이 딱 정해져 있는 만큼, 우리의 금융 평가 프레임워크를 확장하면 충분히 적용 가능할 거라 예상한다"라고 말했다.</p> <p contents-hash="e05300c2709b3dad123cb014bd2851274a393ba8b1cff68ccb31f0b523dee6f6" dmcf-pid="GuYD2CBWaI" dmcf-ptype="general">황윤구 팀장은 "금융처럼 민감한 환경에서는 '잘 쓴다’보다 '믿고 쓸 수 있는가’가 더 중요하다"며 "우리는 먼저 금융환경에 적합한 기준을 세운 후, 직접 사용해보고 끊임없이 개선해가고 있다"고 말했다.</p> <p contents-hash="5cf34871c17c34326833c09fc0f9d36db96439da6011a4d55824088125f36015" dmcf-pid="H7GwVhbYcO" dmcf-ptype="general">이어 그는 "AI 기술의 발전도 중요하지만, 결국 기업이 그것을 신뢰하고 안심하고 쓸 수 있는 '기준선’을 만드는 것이 더 본질적"이라며 "LG CNS가 만든 이 평가 도구가 금융권의 AI 도입을 앞당기고 다양한 선업에서 적용 가능한 신뢰의 기준의 '눈금자’가 되기를 기대한다"라며 포부를 밝혔다.</p> <p contents-hash="36c1c765bf9dbc5c953a9375bebb3153b9c9b42e46d0f9e3130cf3b81638e7e7" dmcf-pid="XzHrflKGNs" dmcf-ptype="general">남혁우 기자(firstblood@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기