성균관대 산학협력단 주도 다기관 협력 기술 개발
95% 수준 오른 음성 탐지기술 올해 상용화 기대
[세종=뉴스핌] 이경태 기자 = 딥페이크 범죄를 사전에 차단할 국내 기술이 글로벌 수준에 도달한 것으로 파악됐다. 음성 탐지는 이미 글로벌 수준에 도달해 올해 기술 이용이 가능할 것으로 기대된다. 영상 역시 글로벌 수준에 상당수준 도달한 것으로 확인됐다.
29일 <뉴스핌> 취재 결과, 성균관대 산학협력단(우사이먼성일교수 책임)은 '악의적 변조 콘텐츠 대응을 위한 딥페이크 탐지 고도화 및 생성억제 기술개발'이라는 주제로 딥페이크 과제를 수행중인 것으로 확인됐다.
해당 연구·개발(R&D) 과제에는 라온데이터, 숭실대, 연세대 등이 참역관으로 동참했다.
AI를 기반으로 하는 악의적 변조 컨텐츠에 의한 사회적 역기능 탐지, 전파 예측 및 차단을 통해 능동적으고 선제적으로 대응하는 복합지능 기술 연구가 이번 연구의 목표다. 이 연구는 지난해 4월 시작해 내년 12월 마무리된다.
텔레그램 채팅방에서 중국발 딥페이크 기술로 만든 한 K-POP 아이돌 그룹의 나체 영상이 유포돼 논란이 되고 있다. 현재 국내에 해당 기술이 일부 판매된 것으로 알려지고 있다. [사진=뉴스핌DB] |
실제 딥페이크 콘텐츠의 생성을 원천적으로 억제할 수 있는 기술 연구를 비롯해 딥페이크 탐지 모델의 고도화 및 일반화, 딥페이크의 유포, 확산 및 전파에 대한 미연에 탐지 및 적극적 대응, 악의적이고 정교하게 조작된 이미지, 영상, 음성 변조 콘텐츠 탐지 기법 개발, 다양해지고 고도화되는 딥페이크 매체에 대해 일반화하고 저화질 딥페이크도 효율 적으로 탐지하는 모델 개발, 악의적으로 변조된 콘텐츠의 유포 방지를 위한 전파과정 예측 모델 개발 등이 과제 목표로 지정됐다.
올해에는 딥페이크 생성 자체를 원천적으로 억제·차단하는 기술 연구 및 개발, 생성 억제기법에 대한 평가 기법 수립 및 생성모델 강건성 연구, 적대적 생성 신경망(GAN)을 적용한 딥페이크 콘텐츠 생성을 억제하는 기술 개발, 실환경의 딥페이크 음성 탐지 강화기술 연구, 부분 변조 딥페이크 데이터세트 생성 및 딥페이크 음성 탐지 모델 평가, 딥페이크 탐지 모델 강건성 검증 방법론 연구 및 입력 변환 기법 연구, 안티-딥페이크 통합 솔루션 환경 구축 및 GPU 가속화 파이프라인 개발 등이 구체화된다.
이번 연구가 주목받는 이유는 이미 영상 및 음성 탐지율이 국제적인 수준에 상당부분 도달했기 때문이다.
공동연구에 참여하고 있는 정수환 숭실대 정보통신전자공학부 교수는 "현재 이번 연구를 통해 영상 탐지 기술, 음성 탐지 기술, 확산 방지 기술을 개발하고 있다"고 설명했다.
정수환 교수는 "딥페이크 탐지와 관련된 글로벌 기술 수준은 영상은 85%, 음성은 95%"라며 "이번 연구를 토대로 현재 기술 수준은 영상 80%정도, 음성 94~95% 수준까지 도달했다"고 말했다.
이번 연구 과제가 내년까지 진행되지만 이미 글로벌 수준에 도달한 기술력을 보유한 것으로 평가된다.
정 교수는 "음성의 경우에는 올해에도 충분히 플랫폼 기업에서 활용해서 사전에 방지할 수 있을 것"이라며 "영상과 음성을 토대로 한 딥페이크, 변조 등의 범죄를 소셜네트워크서비스 등 플랫폼 기업들이 사전에 차단해야 유포 등의 피해가 줄어들 것"이라고 덧붙였다.
유성규 한국인공지능협회 기획이사는 "얼마전 텔레그램방에서 중국인 개발자가 판매한 프로그램이 국내에도 유통된 듯하다"며 "딥페이크 기술은 이젠 쉬운 기술이 됐고 이를 어떻게 차단하고 계속된 피해가 발생하지 않도록 관리하는 것이 중요하다"고 말했다.
유성규 이사는 "그동안에는 연예인이나 유명인을 대상으로 했지만 이제는 최근 범죄화되고 있는 것처럼 일반인도 딥페이크에서 자유로울 수 없게 됐다"며 "SNS에 자녀나 개인 사진을 더이상 올리지 못할 것 같다"고 말했다.
biggerthanseoul@newspim.com