로그인
토토사이트
먹튀사이트/제보
업체홍보/구인
신규사이트
지식/노하우
놀이터홍보
판매의뢰
스포츠분석
뉴스
후기내역공유
커뮤니티
포토
포인트
보증업체
카지노 먹튀
토토 먹튀
먹튀제보
구인
구직
총판
제작업체홍보
카지노
토토
홀덤
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
축구
야구
농구
배구
하키
미식축구
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[IT뉴스]
로켓랩, 12조3500억원 들여 이리듐 인수… 발사체 넘어 위성통신까지 확장
N
[스포츠뉴스]
2년만에 윔블던 나선 ‘말년 병장’ 권순우, 란달루세 3-0으로 꺾고 2회전 진출…상대는 25위 토미 폴
N
[]
美대법 "대통령, 독립기관인사 비위없어도 해임가능"…연준은 예외(종합)
N
[]
'선관위 특검' 뜻 모은 여야...민주, '단독 원 구성' 나서나
N
[]
레바논 대통령 "이스라엘 국경까지 군 배치해 통제권 확장"(종합)
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
목록
글쓰기
[IT뉴스]Web3 특화 AI 벤치마크 ‘DMind Benchmark’, KDD 2026 공식 채택
온카뱅크관리자
조회:
46
2026-05-26 14:57:41
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">블록체인 산업 중심 LLM 성능 평가 체계 제안<br>"상용 AI 모델도 Web3 전문 영역에서는 성능 편차 확인"</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="Vc0YXQB3rW"> <p contents-hash="5d4d86b4b5dcc363b8831c30279e4f550ea78935d381bf3d9fc1219217e0fc01" dmcf-pid="fkpGZxb0Oy" dmcf-ptype="general"> [이데일리 김호준 기자] 싱가포르 기반 오픈소스 AI 연구기관 DMind AI가 아시아 주요 연구진과 공동 개발한 ‘DMind Benchmark’ 논문이 오는 8월 제주에서 열리는 국제 학술대회 KDD 2026의 Datasets & Benchmarks 트랙에 채택됐다. </p> <p contents-hash="a8e215dab149fbaabf071f2649100aadcd89c14c76e8238941034d3771978fe1" dmcf-pid="4EUH5MKpmT" dmcf-ptype="general">이번 연구는 Web3와 블록체인 산업 전반에서 대형언어모델(LLM)의 성능을 체계적으로 검증하기 위한 평가 체계를 제시하며, 기존 범용 AI 평가 방식이 산업 전문성을 충분히 반영하지 못한다는 문제를 해결하고자 블록체인 특화 과제를 중심으로 벤치마크를 설계했다.</p> <figure class="figure_frm origin_fig" contents-hash="fee2f768965c80f7d0df2c07f565fb40a07468ff4a4426f1cef6dace417fa1cf" dmcf-pid="8DuX1R9UOv" dmcf-ptype="figure"> <p class="link_figure"><img alt="DMind Benchmark 설명표 (사진=DMind 팀)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202605/26/Edaily/20260526145113767kvcm.jpg" data-org-width="626" dmcf-mid="9MaMdvDgwG" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202605/26/Edaily/20260526145113767kvcm.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> DMind Benchmark 설명표 (사진=DMind 팀) </figcaption> </figure> <div contents-hash="a976f9fd70494ec91c9192214253b120d9dd917d3de57d5f707a28493c2f8abb" dmcf-pid="6w7Zte2usS" dmcf-ptype="general"> 최근 생성형 AI 기술이 금융과 디지털 자산 분야로 빠르게 확산되면서 스마트 컨트랙트 검증, 온체인 데이터 분석, 보안 리스크 탐지 등 전문 영역에서 AI 활용 수요가 증가하고 있다. 이에 따라 특정 산업군에 맞춘 도메인 특화 AI 평가 기준의 필요성이 커지고 있다. DMind Benchmark는 블록체인 기초 개념부터 인프라, 스마트 컨트랙트, 보안 취약점 등 총 9개 핵심 분야를 기반으로 구성됐으며, 단순 지식형 문항뿐 아니라 스마트 컨트랙트 디버깅, 온체인 수치 추론 등 실제 환경 기반 문제를 포함한 점이 특징이다. </div> <p contents-hash="8a6b40527ed1432a02e07795b6701ff1eb8ee5436aa325cc75c5f1180fb7bc65" dmcf-pid="P4OjkFTssl" dmcf-ptype="general">연구팀은 GPT-5 시리즈, Claude, Gemini, DeepSeek, Grok, Qwen 등 총 31개 주요 AI 모델을 대상으로 성능 비교 평가를 진행했다. 그 결과 GPT-5 Medium이 평균 77.63점으로 가장 높은 점수를 기록했으나, 토큰 이코노믹스와 보안 취약점 영역에서는 다수 모델이 상대적으로 낮은 성능을 보였다. 특히 상용화된 AI 모델들도 Web3 전문 추론 분야에서는 한계를 드러냈으며, 복잡한 토큰 구조 해석이나 스마트 컨트랙트 보안 문제에서는 모델별 성능 차이가 크게 나타났다.</p> <figure class="figure_frm origin_fig" contents-hash="6eb1bcf2c7a26dafaecf98896780efeaf72d221a51c8d224060d1a9ae069ed60" dmcf-pid="Q8IAE3yODh" dmcf-ptype="figure"> <p class="link_figure"><img alt="DMind Benchmark 프레임 (사진=DMind 팀)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202605/26/Edaily/20260526145114978otzw.jpg" data-org-width="626" dmcf-mid="2f1vW4u5EY" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202605/26/Edaily/20260526145114978otzw.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> DMind Benchmark 프레임 (사진=DMind 팀) </figcaption> </figure> <div contents-hash="eec92cc9cb38da63145b28975eac67b56154f551acfe91b1607c6bd798669e93" dmcf-pid="x6CcD0WIIC" dmcf-ptype="general"> 비용 대비 효율 측면에서는 일부 오픈소스 모델의 경쟁력도 확인됐다. DMind의 32B 파라미터 오픈소스 모델은 제한된 비용 환경에서도 높은 성능을 기록했으며, 토큰 이코노믹스와 보안 영역에서는 대규모 범용 모델 대비 10~30% 수준의 비용으로 유사하거나 더 높은 성능을 보였다. </div> <p contents-hash="466a916215badd08037c8360191c85f88eeb9702c1bae14c061be77adda36cb4" dmcf-pid="ySfuqNMVwI" dmcf-ptype="general">업계에서는 Web3 기반 서비스 확대와 함께 AI 모델의 신뢰성 검증 중요성이 더욱 커질 것으로 보고 있다. 특히 금융 및 디지털 자산 분야에서는 정확성과 안정성이 핵심 요소로 꼽히는 만큼 산업 특화 평가 체계 구축이 필요하다는 의견이 제기된다. 싱가포르 경영대학교 정보시스템학과 주페이다 교수는 이번 연구가 Web3 AI 분야에서 실질적으로 활용 가능한 평가 기준을 제시했다며, 향후 관련 AI 기술의 안정성과 성능 검증 체계 발전에 기여할 것이라고 평가했다.</p> <p contents-hash="0b545567304084e7fc6ef90629f8cd3e01b109464b542df7e1ead7f3ea252949" dmcf-pid="Wv47BjRfDO" dmcf-ptype="general">한편 DMind 모델은 현재 AI 금융 플랫폼 ‘Minara(미나라)’에 적용돼 운영 중이며, 개인 투자자와 디지털 자산 보유자를 위한 재무 비서 기능 등에 활용되고 있다.</p> <p contents-hash="a5fbf766db1cdb73d1592814f7e6a42a5b7df60e557a3df925abc7413be706df" dmcf-pid="YT8zbAe4Is" dmcf-ptype="general">김호준 (rapk@edaily.co.kr) </p> </section> </div> <p class="" data-translation="true">Copyright © 이데일리. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기