로그인
보증업체
신규사이트
스포츠분석
먹튀사이트/제보
지식/노하우
놀이터홍보
판매의뢰
업체홍보/구인
뉴스
후기내역공유
커뮤니티
포토
포인트
보증카지노
보증토토
카지노
토토
홀덤
축구
야구
농구
배구
하키
미식축구
카지노 먹튀
토토 먹튀
먹튀제보
카지노 노하우
토토 노하우
홀덤 노하우
기타 지식/노하우
유용한 사이트
토토 홍보
카지노 홍보
홀덤 홍보
꽁머니홍보
신규가입머니
제작판매
제작의뢰
게임
구인
구직
총판
제작업체홍보
스포츠뉴스
연예뉴스
IT뉴스
카지노 후기
토토 후기
홀덤 후기
자유게시판
유머★이슈
동영상
연예인
섹시bj
안구정화
출석하기
포인트 랭킹
포인트 마켓
로그인
자동로그인
회원가입
정보찾기
뉴스
더보기
[]
“지출 줄이고, 저축 줄이고"… 미국 경제 불안에 '국장' 영향받을까
N
[]
김병기, 국힘 향해 "내란 세력에 관용은 없다"
N
[IT뉴스]
'세븐나이츠 리버스', '뱀피르'까지...연타석 흥행한 넷마블
N
[IT뉴스]
[창간43주년]“세계 3강 위해 집중할 분야는 버티컬 AI”-국내 C레벨 110명 설문
N
[연예뉴스]
이효리 요가 수업도 대박났다 “또 듣고파” 호평 쏟아져
N
커뮤니티
더보기
[유머★이슈]
바란 은퇴보다 더 소름돋는점
[유머★이슈]
오늘 국군의날 예행연습에 최초 공개된 장비들
[유머★이슈]
손흥민이 한국 병역 시스템에 영향 끼친 것.
[유머★이슈]
시댁의 속터지는 스무고개식 대화법
[유머★이슈]
엄마. 나 여자 임신시켜버렸어
제휴문의 텔레그램 @dognus11
목록
글쓰기
[IT뉴스]“질 높은 AI 원료 구하라”… 이젠 데이터 확보 전쟁
온카뱅크관리자
조회:
46
2025-07-23 00:57:28
<div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">빅테크, 무단 수집 대신 거액 투자</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="03wz0iCnYW"> <figure class="figure_frm origin_fig" contents-hash="7b9e539e154b4ec337075d36c302167ab85b4578ee3b7b4761bf87041b5bd288" dmcf-pid="pNbDj541Zy" dmcf-ptype="figure"> <p class="link_figure"><img alt="그래픽=김현국" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202507/23/chosun/20250723005151295juue.png" data-org-width="1200" dmcf-mid="3X4IwpMUHY" dmcf-mtype="image" height="auto" src="https://img3.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202507/23/chosun/20250723005151295juue.png" width="658"></p> <figcaption class="txt_caption default_figure"> 그래픽=김현국 </figcaption> </figure> <p contents-hash="07ecbe699950d4ed28d23b25e01b7ca009aa9e173d3426181fc12e20c39983b4" dmcf-pid="UjKwA18tZT" dmcf-ptype="general">미국의 이미지 공유 SNS(소셜미디어)인 핀터레스트는 지난주 연봉 24만7200달러(약 3억4000만원)짜리 ‘데이터 라벨링’ 부문 수석 관리자 채용 공고를 냈다. 핀터레스트가 개발하는 인공지능(AI) 학습에 필요한 데이터 수집 전략을 탐색하고, 여러 팀 간 의사소통을 총괄하는 자리다. 미국 빅테크 메타도 연봉 10만9000달러에 보너스와 주식을 지급하는 조건으로 풀타임 제품 데이터 운영 PM(프로젝트 관리자) 채용 공고를 냈다. 데이터를 분류하고 주석을 달아 AI가 학습을 잘할 수 있도록 돕는 역할이다.</p> <p contents-hash="a708133bf007f4d60a94336a1b0f9f4f1fe82c6ca555cd12ac61860df12c83ec" dmcf-pid="uA9rct6FXv" dmcf-ptype="general">AI 개발 경쟁이 뜨거워지면서 ‘AI의 원료’라 불리는 데이터 확보 전쟁도 치열해지고 있다. 아무리 성능 좋은 AI를 개발해도 학습할 데이터가 없으면 깡통 AI에 불과하기 때문이다. 얼마나 양질의 데이터를 얼마나 많이 학습시키느냐가 AI 성능을 좌우한다. 그동안 AI 업체들은 AI 학습과 훈련을 위해 인터넷 사이트 등에서 글이나 사진 같은 데이터를 무단으로 긁어 썼지만, 최근엔 양질의 데이터를 확보하고 이를 전문적으로 분석해 활용 가치를 극대화하기 위해 고심 중이다. 미국·독일 등 각국 정부도 AI에 바로 활용할 수 있는 질 높은 공공 데이터 개방에 적극적으로 나서고 있다.</p> <p contents-hash="7cad838b0af7ac278a44035de98e203d25e7b90af338b08c5b36dd9ab63158b1" dmcf-pid="7c2mkFP31S" dmcf-ptype="general"><strong>◇“데이터가 AI 수준 좌우” 수십조 錢쟁 불붙어</strong></p> <p contents-hash="58afe5f26ebda47c6356eebe59c8ce84e2ac2702e9f00cc0403ad7120361c824" dmcf-pid="zkVsE3Q01l" dmcf-ptype="general">미국 빅테크 메타는 지난달 143억달러(약 19조8000억원)를 투자해 데이터 라벨링 업체 스케일AI 지분 49%를 인수했다. 투자금 규모를 두고 테크 업계에선 “AI에 데이터가 얼마나 중요한지 다시 일깨워 줬다”는 말이 나왔다. 최근 AI 업체들은 단순 데이터보다 분류가 잘돼 있고, 질 좋은 데이터를 확보하기 위해 움직이고 있다. 시급 2달러를 주고 케냐·필리핀 등에서 단순히 데이터를 분류하는 작업에서 벗어나 박사급 최고급 인력을 고용해 데이터의 의미와 활용 방안을 연구하며 가치를 높이는 작업에 몰두하고 있다. 파이낸셜타임스는 “코딩부터 물리학, 금융까지 다양한 분야에서 AI가 좋은 성능을 발휘하기 위해 더욱 정교한 데이터가 필요해졌다”고 했다.</p> <p contents-hash="82b433f36f472a61460256ca6ecf3791702918305761d563bc1515b9c29cd50b" dmcf-pid="qEfOD0xpGh" dmcf-ptype="general"><strong>◇질 좋은 데이터 확보 전쟁</strong></p> <p contents-hash="8f6ffd87fb585e6601a744c6aba4ffb292c6ad415671dfeeb2ac7e8194541013" dmcf-pid="BD4IwpMUZC" dmcf-ptype="general">미 실리콘밸리 테크 기업들도 인터넷에 떠도는 출처 불명의 유령 정보가 아니라 직접 수집한 개인 정보나 대규모 데이터를 활용해 AI를 학습하는 데 집중하고 있다. 챗GPT를 개발한 오픈AI는 지난해 5월 월스트리트저널을 보유한 뉴스코퍼레이션과 5년간 3400억원 규모의 콘텐츠 라이선스 계약을 체결했고, 아마존은 지난 5월 뉴욕타임스와 AI 활용을 위한 기사 콘텐츠 계약을 맺었다. 애플은 2024년 셔터스톡과 AI 학습용 이미지 수백만 장에 대한 라이선스 계약을 맺었고, 구글은 검색 엔진 크롬과 유튜브·지메일 등 자사 플랫폼 내에서 발생하는 대규모 데이터를 AI 학습에 활용하기 시작했다.</p> <p contents-hash="32430de7414e77f421f356d92c8ecefb1241630525e75f9c43ffdf63290e5861" dmcf-pid="bw8CrURuGI" dmcf-ptype="general">AI용 질 좋은 데이터에 대한 수요가 높아지자, 아예 데이터를 공개하고 유료화하는 업체도 늘고 있다. 전 세계 웹 트래픽의 약 20%를 처리하는 클라우드 서비스 업체 클라우드플레어는 최근 AI 크롤러(웹 페이지를 자동으로 탐색하고 색인하는 검색 엔진) 접근 방지 서비스인 ‘크롤링 건당 요금 부과’ 모델을 출시했다. 데이터를 무단으로 긁어가는 크롤링을 1차로 막고, 크롤링이 계속될 경우 돈을 내면 이를 허가해주는 것이다.</p> <p contents-hash="b35737d711779c208038f62fb0be21242216ceb8d74207d315fcfe6d25a13147" dmcf-pid="KZA05MrRZO" dmcf-ptype="general"><strong>◇양질 데이터 확보 위해 뛰는 국가들</strong></p> <p contents-hash="568a9acf47975a0dbf08f55acc3df8ea54535896ce1f67547d1cd3794a483f43" dmcf-pid="95cp1Rme1s" dmcf-ptype="general">각국 정부도 AI 개발과 학습을 돕기 위해 양질의 데이터 확보에 총력을 기울이고 있다. 미 정부는 원천 데이터를 적극적으로 개방해 기업들이 이를 활용해 부가가치를 창출하도록 유도한다. 미 정부가 개설한 공식 데이터 공개 사이트인 ‘Data.gov’에는 미국 내 전기차 데이터, 배출 가스 현황 등 공공 데이터 31만2841개가 있다. 미 스탠퍼드대 주도로 이미지 데이터 1400만개를 모아놓은 이미지넷은 다방면의 AI 연구에 활용되고 있다. 유럽은 유럽 내 국가들의 데이터를 공유하고 활용하기 위한 ‘가이아-X’ 프로젝트를 진행 중이다.</p> <p contents-hash="150d8a3e93269ef65b9e0565db3215766bc63c8871c80d00e69b6a793e6b9180" dmcf-pid="21kUtesdXm" dmcf-ptype="general">반면 한국은 정부나 기업 모두 AI 학습용 데이터 확보와 관리가 미흡한 상태다. 과학기술정보통신부의 ‘2024 데이터산업 현황 조사’에 따르면, 기업들의 데이터 거래 시 애로 사항은 ‘구매 데이터의 가격 부담’이 39.6%로 가장 높았고 ‘쓸 만한 양질의 데이터 부족’(39.1%)이 그 뒤를 이었다. 영어와 달리 한국어로 된 데이터 양이 절대적으로 부족하고, 고품질이거나 정제된 데이터는 가격이 비싸기 때문에 소규모 AI 개발 기업에 부담이 될 수밖에 없다.</p> <p contents-hash="67d27123a7b275f570c208108842cb78ff416c092d2c68e71156f9f3e2732ce6" dmcf-pid="VtEuFdOJZr" dmcf-ptype="general">양질의 공공 데이터가 실시간으로 쌓이지만 공개되지 않아 무용지물이다. 현재 AI 기술 개발에 필요한 개인 정보를 일정 요건하에 동의 없이 처리할 수 있도록 허용하는 ‘개인 정보 보호법’ 개정안이 발의됐지만, 국회에 계류 중이다. 이성엽 고려대 교수는 “의료 데이터나 판례 같은 법률 데이터는 품질이 좋고 양도 많지만, 개인 정보 보호 등의 이유로 개방이 어렵다”며 “일정 조건을 달아 공개하면 AI 개발 기업에 큰 도움이 될 것”이라고 했다.</p> <p contents-hash="86f08257a51aac1eb12c3e9281a1db1cc90225a1b3bc60a2631b619348994aa3" dmcf-pid="fFD73JIi1w" dmcf-ptype="general"><strong>☞데이터 레이블링(data labeling)</strong></p> <p contents-hash="5bd3df2ddb431767cf89548b536006f63607db43358f62c4eacd2d9926e359f1" dmcf-pid="43wz0iCnHD" dmcf-ptype="general">인공지능(AI)에 학습시키는 데이터를 분류하는 작업을 말한다. 예컨대 자율 주행용 AI를 개발하기 위해 영상이나 사진 속 자동차와 사람, 자전거 등에 표지를 붙이는 일이다. AI 개발 초기에는 단순 작업이었지만, 최근엔 박사급 전문가를 고용해 더 정밀하고 가치 있는 데이터 정제가 이뤄진다.</p> </section> </div> <p class="" data-translation="true">Copyright © 조선일보. 무단전재 및 재배포 금지.</p>
댓글등록
댓글 총
0
개
맨위로
이번주
포인트
랭킹
매주 일요일 밤 0시에 랭킹을 초기화합니다.
1
4,000
상품권
2
3,000
상품권
3
2,000
상품권
업체홍보/구인
더보기
[구인]
유투브 BJ 구인중이자나!완전 럭키비키자나!
[구인]
에카벳에서 최대 조건으로 부본사 및 회원님들 모집합니다
[구인]
카지노 1번 총판 코드 내립니다.
[구인]
어느날 부본사 총판 파트너 모집합니다.
[구인]
고액전용 카지노 / 헬렌카지노 파트너 개인 팀 단위 모집중 최고우대
놀이터홍보
더보기
[홀덤 홍보]
텍사스홀덤 핸드 순위- 홀카드의 가치
[홀덤 홍보]
텍사스홀덤 핸드 순위 - 프리플랍(Pre-Flop) 핸드 랭킹
[토토 홍보]
미니게임개발제작 전문업체 포유소프트를 추천드립니다.
[토토 홍보]
2023년 일본 만화 판매량 순위 공개
[토토 홍보]
무료만화 사이트 보는곳 3가지 추천
지식/노하우
더보기
[카지노 노하우]
혜택 트렌드 변화 위험성 다시 가늠해 보기
[카지노 노하우]
호기심이 부른 화 종목 선택의 중요성
[카지노 노하우]
카지노 블랙잭 카드 조합으로 히트와 스탠드를 결정하는 방법
[카지노 노하우]
흥부가 놀부될때까지 7
[카지노 노하우]
5월 마틴하면서 느낀점
판매의뢰
더보기
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
[제작판매]
html5웹미니게임제작 해시게임제작 카드포커게임제작 스포츠토토 카지노 슬롯 에볼루션 토지노 솔루션분양임대재작
포토
더보기
채팅하기