과학기술정보통신부, 디지털 뉴딜 핵심 '데이터 댐' 구축
2020년도 AI 학습용 데이터 20개 과제 선정
[서울=뉴스핌] 나은경 기자 = 정부가 디지털 뉴딜 정책의 핵심인 '데이터 댐'을 구축하기 위해 본격적으로 나섰다. 총 사업비 390억원 규모의 과제를 선정한 데 이어 연내 추가경정예산으로 2925억원을 추가 확보할 방침이다.
과학기술정보통신부는 오는 22일 인공지능(AI) 개발에 필수적인 양질의 데이터를 대규모로 구축·개방하는 'AI 학습용 데이터 구축 사업' 20개 과제를 확정한다고 21일 밝혔다.
올해는 작년보다 예산 및 과제가 두 배 늘어난 20개 과제(10개 지정공모, 10개 자유공모)를 390억원 규모(2019년 195억원)로 추진한다. 과제에는 총 92개 사업자가 참여해 평균 4.6대 1의 경쟁률을 기록했다.
[서울=뉴스핌] 나은경 기자 = 2020년 AI 학습용 데이터 구축 과제 선정결과 [자료=과기정통부] 2020.06.21 nanana@newspim.com |
선정 분야는 ▲자연어처리 분야 ▲자율주행기술 분야 ▲음성, 시각, 언어 등 융합 분야와 같이 국가적·산업적으로 활용가치가 높고 데이터 확보 필요성이 시급한 과제와 ▲헬스 케어 분야 ▲딥페이크 방지 기술 분야 ▲장애인의 삶의 질 향상 분야 등 국민 생활을 윤택하게 만들고 사회적 문제를 해결할 수 있는 것들이다.
AI 학습용 데이터 수집 및 가공에 많은 인력이 필요한 만큼, 모든 과제에는 크라우드소싱 방식을 전면 적용해 일자리를 만들어가겠다는 복안이다. 앞서 과기정통부는 지난해 두 개의 과제를 크라우드소싱 방식으로 추진한 바 있다. 지난해 AI 학습용 데이터 구축사업을 분석한 결과 일반적 데이터 가공에 10억당 38.1명이, 크라우드소싱 방식에는 10억당 200명의 일자리 창출 효과가 발생했다.
특히 AI 학습용 데이터 구축 사업은 올해 추가경정예산을 통해 확대 추진될 예정이다. 연내 2925억원 규모의 150종 데이터가 추가 구축되는 것. 이를 위해 AI 통합 지원 플랫폼인 AI 허브를 통해 무료 개방한다.
과기정통부 관계자는 "중소기업과 스타트업 등은 비용부담과 인력부족 때문에 필요한 AI 학습용 데이터를 직접 구축하는 데 어려움이 많아, 양질의 데이터 확보에 대한 수요가 크다"며 "시장에서 필요한 양질의 AI 학습용 데이터를 많이 확보하는 것이 단기간에 우리나라 AI 경쟁력을 끌어 올릴 수 있는 해결책이 될 것"이라고 말했다.
nanana@newspim.com