같은 규모에서 고성능·저비용 AI 설계 독자 기술력 입증
[서울=뉴스핌] 이성화 기자 = 네이버클라우드는 독자 기술을 활용해 '프롬 스크래치(from scratch, 토대부터)' 방식으로 개발한 경량화 추론 모델 'HyperCLOVA X SEED 14B Think'를 상업용으로 이용할 수 있는 무료 오픈소스로 공개했다고 22일 밝혔다.
HyperCLOVA X SEED 14B Think는 지난달 30일 발표된 추론모델 HyperCLOVA X THINK를 안정적이고 비용 효율적으로 서비스에 접목할 수 있게 경량화한 모델이다. 중요도가 낮은 파라미터를 가지치기하되 원본 모델이 가진 지식을 최대한 보존하고, 가지치기 과정에서 손실된 큰 모델의 지식을 작은 모델에 전이하는 방식으로 학습 비용을 크게 낮춘 것이 특징이다.

네이버클라우드는 상용화된 해외 오픈소스 모델을 개조한 것이 아닌 원천기술로 추론 능력과 경량화 기술을 결합해 개발한 AI로 국내 AI 역량을 한층 끌어올리는 데 기여할 것으로 예상한다. 또한 AI 에이전트 서비스의 핵심 기술로 주목받는 추론모델을 연구용으로만 제한하지 않고 비즈니스에도 적용할 수 있게 공개해 다양한 국내 AI 생태계를 한층 활성화할 것으로 전망된다.
네이버클라우드에 따르면 HyperCLOVA X SEED 14B Think는 약 140억개 파라미터 규모의 모델임에도 불구하고 5억개 파라미터로 구성된 글로벌 오픈소스 모델보다 더 적은 비용(GPU Hours)으로 학습됐다. 동일 크기의 글로벌 오픈소스 모델과 비교하면 1회 학습 비용은 약 100분의 1 수준이다.
이처럼 적은 비용으로 학습됐음에도 한국어·한국문화와 코딩·수학 관련 성능 평가에서 동일 크기(140억) 또는 더 큰 규모(320억)의 모델과 비슷하거나 더 높은 평균 점수를 기록해 비용 및 규모 대비 뛰어난 성능을 입증했다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 "독자적 기술로 생성형 AI 모델을 꾸준히 업그레이드하며 구축한 고성능 플래그십과 효율적인 학습 전략을 바탕으로 동일 규모에서 비용·성능 등이 더 효과적인 추론모델을 구축할 수 있었다"며 "해외의 상용 모델을 개조한 기술로 그들의 생태계에 편입되기보다는 토대부터 자체 기술로 구축한 하이퍼클로바X가 국내 AI 생태계의 본격적 성장을 이끌 수 있기를 기대한다"고 말했다.
shl22@newspim.com












