140억 파라미터 규모 추론모델 무료 오픈소스로 공개
같은 규모에서 고성능·저비용 AI 설계 독자 기술력 입증
[서울=뉴스핌] 이성화 기자 = 네이버클라우드는 독자 기술을 활용해 '프롬 스크래치(from scratch, 토대부터)' 방식으로 개발한 경량화 추론 모델 'HyperCLOVA X SEED 14B Think'를 상업용으로 이용할 수 있는 무료 오픈소스로 공개했다고 22일 밝혔다.
HyperCLOVA X SEED 14B Think는 지난달 30일 발표된 추론모델 HyperCLOVA X THINK를 안정적이고 비용 효율적으로 서비스에 접목할 수 있게 경량화한 모델이다. 중요도가 낮은 파라미터를 가지치기하되 원본 모델이 가진 지식을 최대한 보존하고, 가지치기 과정에서 손실된 큰 모델의 지식을 작은 모델에 전이하는 방식으로 학습 비용을 크게 낮춘 것이 특징이다.
![]() |
네이버클라우드는 경량화 추론 모델 'HyperCLOVA X SEED 14B Think'를 상업용으로 이용할 수 있는 무료 오픈소스로 공개했다고 22일 밝혔다. [사진=네이버클라우드] |
네이버클라우드는 상용화된 해외 오픈소스 모델을 개조한 것이 아닌 원천기술로 추론 능력과 경량화 기술을 결합해 개발한 AI로 국내 AI 역량을 한층 끌어올리는 데 기여할 것으로 예상한다. 또한 AI 에이전트 서비스의 핵심 기술로 주목받는 추론모델을 연구용으로만 제한하지 않고 비즈니스에도 적용할 수 있게 공개해 다양한 국내 AI 생태계를 한층 활성화할 것으로 전망된다.
네이버클라우드에 따르면 HyperCLOVA X SEED 14B Think는 약 140억개 파라미터 규모의 모델임에도 불구하고 5억개 파라미터로 구성된 글로벌 오픈소스 모델보다 더 적은 비용(GPU Hours)으로 학습됐다. 동일 크기의 글로벌 오픈소스 모델과 비교하면 1회 학습 비용은 약 100분의 1 수준이다.
이처럼 적은 비용으로 학습됐음에도 한국어·한국문화와 코딩·수학 관련 성능 평가에서 동일 크기(140억) 또는 더 큰 규모(320억)의 모델과 비슷하거나 더 높은 평균 점수를 기록해 비용 및 규모 대비 뛰어난 성능을 입증했다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 "독자적 기술로 생성형 AI 모델을 꾸준히 업그레이드하며 구축한 고성능 플래그십과 효율적인 학습 전략을 바탕으로 동일 규모에서 비용·성능 등이 더 효과적인 추론모델을 구축할 수 있었다"며 "해외의 상용 모델을 개조한 기술로 그들의 생태계에 편입되기보다는 토대부터 자체 기술로 구축한 하이퍼클로바X가 국내 AI 생태계의 본격적 성장을 이끌 수 있기를 기대한다"고 말했다.
shl22@newspim.com