전체기사 최신뉴스 GAM
KYD 디데이
전국 대전·세종·충남

속보

더보기

"이제는 데이터"...AI시장, 데이터 신뢰성 확보 각축전

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

신뢰성 높아진 GPT-4로 데이터 시장 중요성 더 커져
유럽선 데이터 기준 엄격..."평가기술 표준화" 목소리

[서울·대전=뉴스핌] 김수진 기자 = '인공지능(AI)은 학습한 데이터만큼만 똑똑하다'

AI 편향성을 없애기 위한 연구가 활발하다. AI 편향성 문제는 상용화를 가로막는 큰 장벽이기 때문이다. 과거 AI가 흑인을 고릴라로 착각하거나, 성차별적인 발언을 하는 등 사회적 문제를 일으키면서 오히려 관련 산업발전이 잠시 후퇴하는 부작용을 일으킨 뼈 아픈 과거가 있다. 실제로 우리나라에서는 성차별적 발언한 '이루다'를 개발한 스캐터랩이 1억300만원의 과징금·과태료를 부과받으며 사회적으로 큰 비난받기도 했다.

하지만 지난해 연말 등장한 챗GPT가 전 세계적으로 큰 반향을 일으키면서 AI에 대중의 시선이 쏠렸다. 때문에 또 다시 불어온 AI에 대한 시장의 관심을 놓치지 않기 위해 시장에서는 편향성 제거에 열을 올리고 있다.

[사진 = 셔터스톡]

윤리성 '더' 확보한 GPT-4

미국 현지시각 지난 14일 오픈AI가 챗GPT를 넘어서는 GPT-4를 출시하면 뜨거운 관심을 받고 있다. GPT-4는 챗GPT(GPT-3.5)와 비교해 인식 및 추론능력이 향상됐으며 이미지 입력 인식 능력, 대화 메모리 향상 등의 기능을 탑재했다. 기존 GPT-3.5와 비교해 요구한 질의에 대한 문제를 보다 창의적이고 정확하게 작성하며 작문 능력이 크게 향상됐다.

오픈AI는 특히 GPT-4가 기존보다 신뢰성을 확보했다고 주장했다. 사용자의 악의적인 질의에 대한 대응훈련을 통해 기존보다 윤리적인 측면의 답변을 할 수 있도록 진화했다는 것이다. 오픈AI 샘 알트먼 CEO는 "GPT-4가 기존 대비 82% 더 윤리적으로 안전하고 40% 더 정확하다"며 설명했다.

소프트웨어정책연구소도 얼마 전 발간한 AI 브리프 특집호에서 "현재 챗봇은 사용자의 악의적인 이용에 의해 쉽게 오염되는데 GPT-4는 기존 대비 면역력이 강화됐다"며 "기존 제품에 비해 윤리성을 확보했다"고 평가했다.

뉴스핌 DB. 2022.08.24 nn0416@newspim.com

세계는 데이터 신뢰성 전쟁 중...한국은?

산업계에서는 GPT-4의 윤리성 확보가 이슈됨에 따라 데이터 시장 중요성이 더욱 커질 것으로 내다봤다. 미국 통신사 블룸버그는 현재 경기 전망리포트 콘텐츠 30%를 AI에 의존하고 있는데 26년에는 90%이상 늘어날 것으로 전망했다.

국내 한 AI기업 관련 연구원은 "그간 AI 데이터 중요성은 관련 업계 내에서나 이슈돼 왔는데 챗GPT가 전세계적으로 히트치면서 대중들까지도 질 좋은 데이터가 필요하다는 걸 알게 됐다"며 "지금이 데이터 관련 산업을 일으키기에 적기"라고 강조했다.

하지만 막상 국내 데이터 시장을 살펴보면 초라한 상황이다. 과학기술정보통신부가 발표한 현재 우리나라 데이터산업 시장 규모는 2021년 기준 20조 24억원 규모로, 미국의 7.0%, 유럽연합의 16.4%에 불과하다. 지난 문재인 정부 시절 데이터댐' 사업에 수 조원을 투입했지만 아쉬운 성적표다. 구축한 데이터도 대부분이 행정·공공데이터에 치우쳐 있고 제품 품질도 보장할 수 있는 수준이 아니라는 지적도 일고 있다.

AI를 현장에서 활용 중인 산업계에서 데이터 신뢰성 확보는 시급한 문제다. 충북 청주에서 드론 관련 벤처기업을 운영 중인 한영운(31) 대표는 "사실상 현재 정부가 축적한 데이터를 그대로 AI에 적용하기에는 아무래도 위험부담이 있다"며 "이제라도 AI 편향·오류를 최소화하는 표준 기술이나 제도 마련이 있어야 시장이 빠르게 성장할 것"이라고 말했다. 

의료계에서도 AI 데이터 품질 확보가 필수라고 입을 모은다. 지난달 16일 열린 빅데이터임상활용연구회 세미나에서 윤덕용 연세대 의과대학 의생명시스템정보학교실 교수는 "의료 AI 모델 성패는 양질의 데이터에 달렸다"며 "의료 AI모델이 특정 편향된 데이터만 학습할 경우 의료 불평등까지 야기할 수 있다"고 지적하기도 했다. 그는 "양질의 데이터 축적이 중요하다"며 "국민을 대표하는 양질의 표준화된 데이터 확보가 중요하다"고 강조했다.

이미 선진국에서는 AI 데이터 품질 확보에 발빠르게 나선 상태다. 현재 유럽의회가 2025년 제정 목표로 인공지능법 도입을 검토 중인데, 데이터 편향·오류 방지를 의무화하는 내용을 세세하게 규정하고 있다. 관련 법을 어기거나 금지된 분야에 AI기술을 접목할 경우 최대 3000만 유로, 또는 세계 매출액의 6%에 달하는 벌금을 물도록하고 있다.

하지만 국내 도입 준비 중인 AI 관련 법안은 데이터 품질이나 편향 방지에 대해 '언급만' 한 상태로 봐도 무방하다는 지적이다.

미국 워싱턴주 리치먼드의 마이크로소프트(MS) 본사에서 인공지능(AI) 챗봇이 탑재된 검색엔진 빙(Bing)을 체험해보는 시민. 2023.02.07 [사진=블룸버그]

"AI데이터 평가 기술 표준화 필요"

때문에 AI 편향을 막기 위해 AI학습 데이터 개발 및 활용에 정부가 적절히 나서야 한다는 주장이 힘을 얻고 있다. 시장이 폭발적으로 성장함에 따라 AI 기업과 개발자 '양심'에만 맡겨놓을 수 없다는 지적이다.

정부도 관련 산업 활성화를 위해 나서야 한다는데 공감하고 있다. 과기정통부는 AI 부작용 등 제도적 보완을 마련하는 내용으로 2024년부터 5년간 AI 연구에 3000억원을 투입한다는 계획이다. 엄열 과기정통부 인공지능기반정책관은 지난 7일 열린 2023 대한민국 AI토크 콘서트에서 "AI의 편향된 정보나 환각이 위험할 수 있다"며 "오류가 있는 언어 모델 한계를 뛰어넘는 AI 기술 발전을 위해 지원을 늘리겠다"고 말했다.

장진철 소프트웨어정책연구소 디지털통계센터 선임연구원도 "최근 AI는 모델 성능보다 데이터 역할을 강조하는 경향이 커졌다"며 "때문에 데이터관리 체계에 대한 지원이 중요하다"고 밝혔다. 장 선임연구원은 "AI에 활용되는 데이터 최적화와 관리 역량이 AI 시장 확산의 필수요건으로 대두되고 있다"며 "관련 인력 양성 방안이 정부-산업-교육계 협력을 통해 논의돼야 한다"고 강조했다.

산업계에서는 AI데이터 평가 기술 표준화가 필요하다는 목소리가 커지고 있다. AI 데이터를 평가할 기준을 바로 세워달라는 요구가 거세다. 소프트웨어 공학 전문기업 씽크포비엘 박지환 대표는 "객관적인 검증법 없이 단지 담당자의 경험이나 주관에 의존한 검사방법이 문제"라고 지적하며 "NIA가 자체 발간한 가이드가 있지만 '다양하게 수집한다'는 모호한 기준으로 현실적이지 못했다. 데이터의 질적 수준을 검증할 현실적이고 올바른 방법이 없는 상황"이라고 꼬집었다.

그러면서 박지환 대표는 "공공데이터 등 가치를 판단하고 개선점을 찾기 위한 AI 데이터 평가 기술 표준화가 필요하다"며 "지금같은 산업 전환기에 AI 데이터 신뢰성 기준을 빠르게 정립해 AI 시장에서 뒤처지지 않도록 정부와 산업, 학계 모두 힘을 합쳐야 할 시점"이라고 강조했다.

nn0416@newspim.com

[뉴스핌 베스트 기사]

사진
이정후 18게임 연속 안타 행진 [서울=뉴스핌] 박상욱 기자 = KBO 출신 타격 천재 이정후(샌프란시스코 자이언츠)가 메이저리그를 뒤집어 놓고 있다. 한국인 빅리거 최장 연속 경기 안타 신기록을 하루 만에 새로 썼다. 결정적인 순간에 변함없는 클린 히트로 소속팀의 8점 차 대역전승에 기여했다. 이정후는 11일(한국 시각) 미국 캘리포니아주 샌프란시스코 오라클 파크에서 열린 메이저리그(MLB) 워싱턴 내셔널스와의 홈경기에 우익수, 5번 타자로 선발 출전해 4타수 2안타 1볼넷 2득점 1도루를 기록했다. 전날 17경기 연속 안타로 추신수와 김하성을 넘어섰던 이정후는 이날 안타를 추가하며 기록을 18경기로 늘렸다. 일본의 오타니 쇼헤이가 가진 연속 안타 기록과 어깨를 나란히 했다. [샌프란시스코 로이터 =뉴스핌] 박상욱 기자=이정후가 11일(한국시간) MLB 워싱턴 내셔널스와의 홈경기에서 9회 끝내기 만루포를 때린 브라이스 엘드리지와 포옹하고 있다. 2026.6.11 psoq1337@newspim.com 시즌 23번째 멀티히트다. 최근 3경기 연속 2안타 이상을 몰아친 이정후의 시즌 타율은 0.335에서 0.338로 뛰어올랐다. 내셔널리그 타율 선두 오토 로페스(0.342)를 4리 차로 턱밑까지 추격한 메이저리그 전체 2위 기록이다. 이정후는 2회말 첫 타석에서 워싱턴 좌완 선발 포스터 그리핀을 상대로 헛스윙 삼진으로 물러났다. 4회말 두 번째 타석에서도 2루수 땅볼에 그쳤다. 세 번째 타석부터 진가를 드러났다. 팀이 1-6으로 뒤진 6회말 2사 주자 없는 상황. 이정후는 그리핀의 초구 낮은 커브를 감각적인 배트 컨트롤로 걷어 올려 우전 안타를 만들었다. 스트라이크존을 벗어난 유인구였지만 이정후의 방망이를 피해 가지 못했다. 지난달 15일 LA 다저스전부터 시작된 18경기 연속 안타 행진이 완성됐다. [샌프란시스코 로이터 =뉴스핌] 박상욱 기자=이정후가 11일(한국시간) MLB 워싱턴 내셔널스와의 홈경기 8회 2루 도루에 성공하고 있다. 2026.6.11 psoq1337@newspim.com 8회말에는 '발 야구'로 추격의 불씨를 지폈다. 3-9로 뒤진 상황에서 이정후는 풀카운트 승부 끝에 귀중한 볼넷을 골라냈다. 지난달 4일 탬파베이 레이스전 이후 39일 만에 나온 볼넷이다. 출루한 이정후는 곧바로 2루를 훔쳐 시즌 3호 도루를 성공시켰다. 이틀 연속 도루다. 이후 대니얼 수색의 적시 2루타 때 홈을 밟으며 득점까지 올렸다. 자이언츠는 8회에만 맷 채프먼과 라파엘 데버스의 백투백 홈런 등을 묶어 5점을 추격했다. [샌프란시스코 로이터 =뉴스핌] 박상욱 기자=이정후가 11일(한국시간) MLB 워싱턴 내셔널스와의 홈경기 9회 안타를 치고 나가 셀레브레이션을 하고 있다. 2026.6.11 psoq1337@newspim.com 이날의 역전 드라마의 크라이막스는 9회말 정규이닝 마지막 공격이었다. 7-10으로 뒤진 무사 1·2루 찬스가 이정후에게 걸렸다. 워싱턴은 빅리그에서 가장 뜨거운 타자인 이정후를 저격하기 위해 좌완 미첼 파커를 마운드에 올렸다. 이정후는 불리한 볼카운트(1볼-2스트라이크)에 몰렸으나 파커의 5구째 바깥쪽 직구를 가볍게 밀어 쳐 좌전 안타를 날렸다. [샌프란시스코 로이터 =뉴스핌] 박상욱 기자=샌프란시스코 선수들이 11일(한국시간) MLB 워싱턴 내셔널스와의 홈경기에서 역전 만루 홈런을 친 브라이스 엘드리지를 축하하며 역전승을 자축하고 있다. 2026.6.11 psoq1337@newspim.com 순식간에 무사 만루 찬스가 만들어졌고 후속타자 브라이스 엘드리지는 파커를 상대로 우측 담장을 넘기는 끝내기 역전 만루 홈런을 쏘아 올렸다. 1-9로 뒤지던 경기를 11-10으로 뒤집은 오라클 파크 역사에 남을 '극장승'이었다. 이정후의 정교한 타격을 징검다리로 대역전 시나리오가 완성됐다. psoq1337@newspim.com 2026-06-11 08:47
사진
FIFA 월드컵 76조원 베팅 전쟁 [서울=뉴스핌] 고인원 기자= 2026 국제축구연맹(FIFA) 월드컵이 사상 최대 규모의 스포츠 베팅 이벤트가 될 전망이다. 미국 스포츠 베팅 시장이 사실상 처음으로 월드컵 특수를 온전히 누리게 되면서 온라인 스포츠북과 예측시장, 스포츠 데이터 업체들 간 고객 확보 경쟁도 한층 치열해질 것으로 예상된다. CNBC에 따르면 시장에서는 이번 월드컵 기간 전 세계 베팅 규모가 500억달러(약 76조원)를 넘어설 것으로 보고 있다. 이는 2022년 카타르 월드컵 당시 350억달러를 웃돌았던 수준보다 크게 늘어난 규모다. [프라하 로이터=뉴스핌] 월드컵에서 홍명보호와 함께 A조에 속한 체코 대표팀의 주장인 소우체크. 2026.06.09 wcn05002@newspim.com 이번 대회는 48개국 체제로 확대되면서 경기 수가 기존보다 40경기 늘어난 104경기로 치러진다. 개최지도 미국·캐나다·멕시코로 확대됐고, 미국 내 스포츠 베팅 합법화 지역도 크게 늘어나면서 관련 산업 전반의 수혜가 예상된다. 맥쿼리는 이번 월드컵이 스포츠 베팅 업체들의 2027년 EBITDA(상각전영업이익)를 2~5%가량 끌어올릴 것으로 전망했다. ◆ 팬듀얼·드래프트킹스 수혜 기대…스포츠 데이터 기업도 주목 가장 큰 수혜 기업으로는 팬듀얼 모회사인 플러터 엔터테인먼트(Flutter Entertainment)가 꼽힌다. 플러터의 피터 잭슨 최고경영자(CEO)는 최근 CNBC 인터뷰에서 "슈퍼볼 시청자가 약 2억명이라면 2022년 월드컵 결승전은 15억명이 시청했고 전체 대회는 50억명이 지켜봤다"며 "월드컵은 완전히 다른 규모의 이벤트"라고 말했다. 도이체방크는 미국 내 월드컵 베팅 규모만 약 33억달러에 달할 것으로 추산했다. 업체별로는 팬듀얼이 약 13억달러, 드래프트킹스(DKNG)가 11억달러 수준의 베팅을 처리할 것으로 예상했다. 베트MGM, 시저스 엔터테인먼트(CZR), 펜 엔터테인먼트(PENN)도 수혜 기업으로 거론된다. 스포츠 데이터 업체들도 주목받고 있다. 지니어스 스포츠(GENI)와 스포트레이더(SRAD)는 최근 예측시장 플랫폼 칼시(Kalshi)에 축구·야구·하키·UFC 관련 데이터를 제공하는 계약을 체결했다. 시장에서는 베팅 산업 성장에 따라 경기 데이터와 실시간 통계의 가치도 함께 높아질 것으로 보고 있다. ◆ 칼시·폴리마켓 급성장…예측시장도 월드컵 특수 이번 월드컵은 예측시장 플랫폼의 성장 여부를 가늠할 중요한 시험대가 될 전망이다. 파이퍼 샌들러에 따르면 칼시와 폴리마켓의 합산 거래량은 최근 70억달러를 돌파하며 사상 최고치를 기록했다. 칼시는 이번 월드컵과 관련해 약 500개의 예측 시장을 개설했다. 현재 가장 활발한 거래가 이뤄지는 시장은 결승전 우승팀 예측으로, 스페인과 프랑스가 우승 후보로 꼽히고 있다. 최근 팬애틱스, 팬듀얼, 드래프트킹스도 예측시장 사업에 뛰어들며 시장 경쟁이 한층 치열해지고 있다.   시장에서는 월드컵이 단순한 스포츠 이벤트를 넘어 스포츠 베팅, 예측시장, 스포츠 데이터 산업 전반의 판도를 바꾸는 초대형 비즈니스 이벤트가 될 것으로 보고 있다. 특히 미국 스포츠 베팅 시장이 성숙기에 접어든 가운데 이번 월드컵이 관련 기업들의 성장성을 시험하는 분수령이 될 것이라는 평가가 나온다. koinwon@newspim.com 2026-06-10 22:35
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동