챗GPT 출시 후 아바타 AI로 전세계 시선 집중
최초 얼굴 이미지 비식별화 솔루션 개발 창업
저울이 기울어지지 않도록 윤리 규정 개발 필요
[세종=뉴스핌] 이경태 기자 = "AI에 조만간 터질 거품이 있다고들 말하지만 저는 단지 거품일 뿐이라고 생각하지 않습니다."
이스라엘 생성형 AI 스타트업 'D-ID'의 길 페리(Gil Perry) 대표의 말이다. D-ID는 지난해 초거대AI 언어모델인 챗GPT의 출시 이후 전세계적으로 덩달아 관심을 받고 있는 AI 아바타 영상제작 서비스다. 전 세계적으로 AI 아바타 애니메이션의 대표 서비스로 평가되고 있다. 길 페리 대표는 공동 창업가들과 함께 최초의 얼굴 이미지 비식별화 솔루션을 만들어 2017년에 창업했다.
페리 대표는 지난 4일 본보의 질의에 서면 답변으로 이같이 밝혔다. 그는 "다양한 산업분야에서 AI의 엄청난 잠재력이 있지만 일부에서는 조만간 터질 AI 거품이 있다고 말하기도 한다"면서 "닷컴 거품이나 암호화폐 거품과 같은 과거의 거품과 달리 생성AI는 견고한 과학과 기술의 원칙에 기반해 앞으로도 계속해서 혁신과 발전을 주도해 나갈 것"이라고 내다봤다.
길 페리(Gil Perry) D-ID 대표 [자료=D-ID] 2023.05.08 biggerthanseoul@newspim.com |
그는 "생성AI는 실제 응용 프로그램과 입증된 가치가 있는 기술이며 복잡한 문제를 해결하고 효율성을 향상시키기 위해 이미 의료, 금융, 교육, 마케팅 등에 이르기까지 광범위한 분야와 부문에서 사용되고 있다"며 "무엇보다도 의약품용 단백질을 설계하고 유전 연구를 지원하며 물리적 개체를 개발하는 데 사용되고 있다"고 말했다.
스탠퍼드 대학보고서에 따르면 2021년에만 14만개의 AI 특허가 출원되기도 했다. 이런 상황을 토대로 그는 "AI와 관련해 출원된 많은 특허는 이 기술이 진지한 연구·과학 기반 분야로 취급될 가치가 있다는 강력한 표시"라며 "기술의 성숙도와 사용 사례의 다양성, 다시 말해 텍스트 생성, 이미지 생성, 비디오 생성 등은 투기 거품에서 자주 발생하는 갑작스러운 붕괴에서 취약하지 않다"고 강조했다.
그는 "챗GPT, 미드저니(MidJourney, 이미지 생성AI), 달리(DALL-E, 이미지 생성AI)와 같은 기타 생성 플랫폼의 공개와 최근 몇 달 동안 얻은 인기로 인해 사람들은 AI의 실제 사용에 대해 훨씬 더 많이 인식하게 됐다"며 "D-ID는 그러한 소프트웨어를 실험하려는 대중의 의지로부터 이익을 얻었으며 AI 생성 이미지 또는 텍스트를 비디오로 전환하려는 사람들을 위한 완벽한 무료 도구로 부상했다"고 설명했다. 생성 AI는 계속 성장해 산업과 작업 방식을 변화시킬 것이라는 게 그의 생각이기도 하다.
직업의 미래에 대해 페리 대표는 "AI가 인간의 작업을 대규모로 대체하기보다는 증강하고 향상시킬 가능성이 더 높다고 본다"고 강조했다.
그는 "인공 지능과 자동화는 대규모 언어 모델(LLM)을 사용해 많은 반복적이고 단순한 사무 작업을 자동화하기 때문에 고용 시장을 혼란에 빠뜨릴 수도 있을 것"이라면서 "이런 종류의 작업을 AI에 위임해 직원들은 비판적 사고 및 창의적인 문제 해결과 같은 인간의 기술이 필요한 작업에 집중할 수 있고 합성 아바타와 챗봇은 보다 개인적이고 인간적인 디지털 고객 경험을 촉진할 것"이라고 말했다.
페리 대표는 "예술 및 창의성 분야에서 AI는 작곡 및 시각 예술 창작과 같은 작업을 지원할 수 있지만 AI가 종종 창작 작업의 중심에 있는 고유한 관점과 인간의 감정을 완전히 대체할 수 있을 것 같지는 않다"며 "창조 산업은 AI를 채택할 때 인간의 감독과 지시가 필요한 경우가 많기 때문에 새로운 직책과 경력 경로가 열릴 것"이라고 내다봤다.
길 페리 D-ID 대표와 공동 창업자들의 모습 [자료=D-ID] 2023.05.08 biggerthanseoul@newspim.com |
그는 AI 윤리 문제 등에 대해 "세상은 이미 AI를 이용하려는 방향으로 움직이기 시작했고, 이러한 지니(알라딘의 요술램프에서 나오는 요정)를 다시 병 속에 넣을 수는 없다"면서 "AI는 분명히 많은 산업의 미래이지만 우리는 긍정적인 이용을 위해 규제를 시행할 방법을 찾아야 한다"고 말했다.
페리 대표는 "미국의 AI 권리법안, 중국의 규제 이니셔티브, 유럽연합(EU)의 새로운 AI 법 등을 포함해 국제 사회에서 규정과 지침을 수립하는 것을 살펴보고 있다"며 "D-ID가 참여하는 윤리 이니셔티브를 위해 업계 역시 노력중"이라고 말했다.
그는 젊은 세대에 대한 충고도 빠트리지 않았다. 페리 대표는 "많은 사람들은 우리가 살고 있는 새로운 AI 기술의 출현을 인터넷의 발명과 비교하고 일부는 지금 우리가 보고 있는 혼란을 산업 혁명과 비교하기도 한다"며 "젊은이들이 앞으로 그들의 삶에서 중요한 역할을 할 것이기 때문에 새로운 역량에 대해 스스로 학습을 해야 한다"며 "모든 새로운 도구의 마스터가 될 필요는 없지만 AI와 상호작용하는 방법, 강점, 약점 등을 이해하고 이를 토대로 나아갈 길을 계획하는 것이 중요하다"고 조언했다.
◆ 다음은 길 페리 D-ID 대표와의 일문일답
-D-ID를 시작하게 된 배경을 듣고 싶다.
▲D-ID는 온라인에 자신의 이미지를 게시할 때 사람들의 개인 정보를 보호하기 위해 최초의 얼굴 이미지 비식별화 솔루션을 만든 (저를 포함한)3명의 혁신가가 2017년에 설립했다. 사람들의 신원을 가릴 수 있는 동일한 딥 러닝 기술이 스틸 이미지 애니메이션에 적용될 수 있다는 것을 깨달았고, 이것이 D-ID의 현재 솔루션 뒤에 있는 비전을 탄생시켰다.
-D-ID의 활용도는 다양할 것 같습니다. 어떻게 활용될 것이라고 생각하나.
▲D-ID 기술의 장점은 다양한 사용 사례에 대한 솔루션을 제공한다는 것이다. 모든 사용자는 특정 고충을 극복하는 데 가져오는 가치를 식별한다. 대체로 우리의 두 가지 주요 목표 시장은 콘텐츠 제작자와 기업 지원 개발자다. 전자의 경우 D-ID의 크리에이티브 리얼리티 스튜디오(Creative Reality Studio)는 주로 마케팅, 학습, 개발, 엔터테인먼트 분야에서 수많은 사용 사례를 위한 참신하고 매력적인 비디오를 제작할 수 있는 환상적인 방법을 제공한다.
주로 응용프로그램 인터페이스(API)를 통해 기능에 접근하는 개발자의 경우 직원 교육 및 내부 커뮤니케이션과 같은 내부 용도와 고객 대면 경험을 위해 새롭고 흥미로운 애플리케이션을 구축할 수 있는 모든 규모의 비즈니스를 위한 플랫폼을 제공한다. 이 소프트웨어는 자동화되거나 향상된 기술 지원, 고객 서비스 및 맞춤형 기업 커뮤니케이션 등을 통해 고객 경험을 향상시키는 혁신적이고 새로운 방법의 기반을 제공할 수 있다.
D-ID 서비스를 사용하는 모습 [자료=D-ID] 2023.05.08 biggerthanseoul@newspim.com |
-비슷한 서비스도 나오는 것 같다. D-ID의 경쟁력은 무엇인가
▲D-ID의 크리에이티브 리얼리티 스튜디오는 이미지와 텍스트 생성을 모두 활성화한 다음 두 가지를 함께 결합해 애니메이션 비디오를 만드는 최초의 다중 모달 생성 AI 비디오 플랫폼이다. 미리 만들어진 얼굴을 선택해 사용자를 제한하는 대부분의 다른 합성 아바타 소프트웨어와 달리 D-ID는 사용자가 사람 얼굴의 단일 이미지를 업로드하거나 상상력과 키워드 기반 이미지 생성AI툴인 스테이블 디퓨전(Stable Diffusion)을 사용해 원본을 생성, 자신의 얼굴을 만들 수 있다.
그런 다음에 사용자는 플랫폼에 통합된 GPT-3에서 생성된 텍스트를 추가해 스크립트를 작성하고 아바타가 말할 내용을 결정할 수 있다.
우리는 다른 합성 아바타 및 챗봇 제공업체가 복제할 수 없는 다른 세계의 생물의 얼굴인 경우에도 얼굴 표정이 최대한 자연스럽게 보이고 자연스럽게 움직이도록 5년 동안 기술을 연구해 왔다. 현실적인 사람을 만들 수 있는 기능을 제공하는 공급자는 동작을 복제하기 위해 완전한 전문 스튜디오가 필요한 반면, 우리는 AI 및 딥 러닝 기술을 사용해 개발했다.
-D-ID의 최종 목표는 무엇인가
▲D-ID의 비전은 인간과 디지털 세계 사이의 다리를 만드는 것이다. 사람들이 AI 디지털 인간을 사용해 기업과 상호 작용할 수 있는 인터페이스가 되는 것이다. 이를 달성하기 위해 크리에이터와 개발자가 우리 기술을 광범위한 애플리케이션에 통합할 수 있는 방법으로 D-ID의 API를 제공한다.
지난해 LLM이 폭발적으로 증가하면서 대화형 AI의 품질과 보급률이 급격히 증가했다. 이러한 경향이 앞으로 몇 년 동안만 성장할 것이며 오늘날의 챗봇에 얼굴, 목소리 및 성격을 추가하는 것이 매끄럽고 매력적인 인간-기계 상호 작용을 만드는 다음 단계가 될 것이라고 믿는다.
D-ID를 활용한 콘텐츠 제작 과정 [자료=D-ID] 2023.05.08 biggerthanseoul@newspim.com |
-현재 챗GPT와 같은 초거대 AI에 대한 기대가 높다. 구글(Google), 메타(Meta) 등의 기업도 이 시장에서 강력한 AI 모델로 경쟁하고 있다. 이 시장을 어떻게 평가하나
▲실제로 다양한 산업 분야에서 AI의 엄청난 잠재력이 있다. 일부에서는 조만간 터질 'AI 거품'에 있다고 말하고 있지만 AI가 단지 거품일 뿐이라고 생각하지 않는다. 닷컴 거품이나 암호화폐 거품과 같은 과거의 거품과 달리 생성 AI는 과대 광고나 추측에 기반하지 않고 견고한 과학 및 기술 원칙에 기반한다. 앞으로도 계속해서 혁신과 발전을 주도할 연구개발의 기반이 탄탄한 분야다.
생성AI는 실제 응용 프로그램과 입증된 가치가 있는 기술이다. 복잡한 문제를 해결하고 효율성을 향상시키기 위해 이미 의료, 금융, 교육, 마케팅에 이르기까지 광범위한 분야와 부문에서 사용되고 있다. 생성AI는 무엇보다도 의약품용 단백질을 설계하고 유전 연구를 지원하며 물리적 개체를 개발하는 데 사용되고 있다. 그리고 은행에서는 사기 감지, 거래 예측, 합성 데이터 생성 및 위험 요인 모델링에도 이용된다.
최근 몇 년간 이 분야에서 출원된 많은 특허(스탠퍼드대학 보고서에 따르면 2021년에만 14만개의 AI 특허가 출원)는 이 기술이 진지한 연구 및 과학 기반 분야로 취급될 가치가 있다는 강력한 표시이다. 기술의 성숙도와 사용 사례의 다양성, 즉 텍스트 생성, 이미지 생성, 비디오 생성 등은 투기 거품에서 자주 발생하는 갑작스러운 붕괴에 덜 취약하다는 것을 의미한다.
구글, 메타, 엔비디아, 마이크로소프트, IBM 등 현재 생성AI 분야에서 일하고 있는 많은 회사와 조직은 대단한 실적과 함께 그에 걸맞은 명성을 얻고 있다. 이들 회사는 앞으로도 이 분야에 투자하고 대대적으로 발전시킬 것이다.
-이 시장의 변화가 어떻게 흘러갈 것으로 예상하나
▲챗GPT, 미드저니(MidJourney), 달리(DALL-E)와 같은 기타 생성 플랫폼의 공개 릴리스와 최근 몇 달 동안 얻은 인기로 인해 사람들은 AI의 실제 사용에 대해 훨씬 더 많이 인식하게 됐다. D-ID는 그러한 소프트웨어를 실험하려는 대중의 의지로부터 이익을 얻었으며 우리 회사는 AI 생성 이미지 또는 텍스트를 비디오로 전환하려는 사람들을 위한 완벽한 무료 도구로 부상했다.
일반적으로 AI, 특히 생성 AI는 계속 성장해 산업과 작업 방식을 변화시킬 것이다.
D-ID가 제공하고 있는 챗 서비스 모습 [자료=D-ID] 2023.05.08 biggerthanseoul@newspim.com |
-실제로 본격적인 AI 시대에 접어들면서 많은 일자리가 줄어들 것이라는 우려가 있다. 직업의 미래를 어떻게 보고 있나
▲AI가 인간의 작업을 대규모로 대체하기보다는 증강하고 향상시킬 가능성이 더 높다고 본다. 인공지능과 자동화는 대규모 언어 모델(LLM)을 사용, 반복적이고 단순한 사무 작업을 자동화해 고용 시장을 혼란에 빠뜨릴 수 있는 잠재력을 가지고 있기도 하다.
다만 이런 종류의 작업을 AI에 위임해 직원들은 비판적 사고 및 창의적인 문제 해결과 같은 인간의 기술이 필요한 작업에 집중할 수 있다. 합성 아바타와 챗봇 또한 보다 개인적이고 인간적인 디지털 고객 경험을 촉진할 것이다.
예술 및 창의성 분야에서 AI는 작곡 및 시각 예술 창작과 같은 작업을 지원할 수 있지만 AI가 종종 창작 작업의 중심에 있는 고유한 관점과 인간의 감정을 완전히 대체할 수 있을 것 같지 않다. 또한 창조 산업은 AI를 채택할 때 인간의 감독과 지시가 필요한 경우가 많기 때문에 새로운 직책과 경력 경로가 열릴 것이다.
AI를 채택하려면 숙련된 전문가가 데이터 과학 및 AI 엔지니어링과 같은 분야에서 새로운 역할과 경력 기회를 창출하는 기술을 설계, 구현 및 유지 관리해야 하는 경우가 많다는 점도 주목할 가치다.
-최근 챗GPT의 AI 개발을 중단해야 한다는 얘기도 있다. 이에 대해 어떻게 생각하나
▲세상은 이미 이 방향(AI 개발)으로 움직이기 시작했고, 이 지니를 다시 병 속에 넣을 수는 없다. 그 제안은 실제로 몇 주 전에 헤드라인을 장식했지만 진지하게 고려된 적이 없다고 생각한다.
AI는 분명 많은 산업의 미래이지만 우리는 좋은 용도를 위해 저울의 치우침을 조절하고 규제를 마련할 방법을 찾아야 한다.
많은 정부들이 이미 AI 규제와 지침을 마련하고 있다. 미국의 AI 권리 법안, 중국의 규제 이니셔티브, 유럽연합(EU)의 새로운 AI 법 등이 있다. 산업 리더들은 D-ID가 참여한 AI 윤리 이니셔티브를 비롯한 AI 윤리 이니셔티브를 추진하고 있다.
-인공지능은 어떤 면에서 사람의 학습능력을 떨어뜨린다는 말이 있다. 어떻게 생각하나
▲그 반대라고 생각한다. 인공지능은 사실상 가장 가치 있는 교육 도구 중 하나이다. 사람들이 손끝에서 막대한 양의 정보를 얻을 수 있으며, 대화를 통해 직관적인 방식으로 정보와 상호작용할 수 있다는 것은 게임 체인저이다. 이를 통해 누구나 전례 없는 방식으로 자신의 관심사를 추구할 수 있다. 교육 시스템을 조정해야 할 필요가 있을 것이다. 그러나 전체적인 이점은 단기적인 도전을 능가한다.
-젊은 세대나 다음 세대에게 하고 싶은 말이 있다면
▲우리는 급격하고 커다란 변화의 시기를 살고 있다. 새로운 인공지능 기술을 발전시키는 현재를 인터넷의 발명, 심지어는 산업혁명에 대응하는 시기와 비교하는 사람들도 있다. 우리는 오늘의 젊은 세대에게 떠오르는 능력에 대해 교육해야 한다. 새로운 도구마다 전문가가 되어야 할 필요는 없지만, 인공지능과 상호작용하는 방식, 강점 및 약점을 이해하는 것이 중요하며, 이를 염두에 두고 앞으로의 발걸음을 진행하면 좋을 것이다.
-한국은 문화 콘텐츠가 발달한 나라다. 그 중 K-콘텐츠라는 한류가 있다. 그래서 한국인들이 이 서비스를 이용한다면 정말 다양한 콘텐츠가 많이 나올 것 같다. 한국의 잠재 고객들에게 하고 싶은 말이 있다면
▲우리는 한국 사용자들에게 우리가 모든 사용자들에게 말하는 것과 같은 것을 말할 것이다. 당신의 창의성을 포용해야 한다. 우리 기술을 사용하는데 옳고 그른 방법은 없다. 우리는 매일 사람들이 만드는 것들, 우리가 결코 예상할 수 없는 콘텐츠, 우리가 상상할 수 없는 도구들의 조합에 놀라움을 금치 못한다. 실험에 열광하길 바란다. 당신의 열정을 따르면 된다. 실패를 두려워하지 않길 바란다. 스스로 자랑스러워하는 무언가를 만들었다면 다른 사람들이 당신의 작업에서 영감을 받을 수 있도록 세상과 공유하고 D-ID를 태그하면 된다.
biggerthanseoul@newspim.com