서울대 KoBALT 등 고난도 한국어 평가서 최고 수준 기록
시각 정보 기반 추론 능력 확보, 멀티모달 확장 가능성도
오픈소스 공개 계획...국내 AI 생태계 기여 기대
[서울=뉴스핌] 양태훈 기자 = 네이버가 고차원적 추론 능력을 갖춘 생성형 AI 모델 'HyperCLOVA X THINK'를 공개하고, 언어 이해와 시각 추론 성능을 담은 기술 보고서를 통해 모델 설계와 평가 결과를 상세히 발표했다.
30일 네이버는 AI의 사고력 향상을 목표로 한 추론모델 'HyperCLOVA X THINK'를 개발 완료하고, 기술적 세부 사항을 담은 테크니컬 리포트를 발표했다. 이 모델은 사용자의 질문에 대해 혼잣말하듯 사고 과정을 거쳐 답변을 계획하고 도출하는 방식으로 작동하며, 복잡한 문제 해결과 실수 교정 능력을 갖춘 것이 특징이다.
특히 이 모델은 서울대학교 언어학과가 개발한 'KoBALT-700' 벤치마크를 포함해 국내외 주요 언어모델과의 비교 평가에서 최고 수준의 점수를 기록했다. 통사론, 의미론, 화용론 등 고급 한국어 능력을 평가하는 이 시험에서 HyperCLOVA X THINK는 유사 규모의 국내외 추론모델을 상회하는 성능을 보였다. 'HAERAE-Bench' 등 다른 한국어 평가에서도 우수한 결과를 얻으며, 에이전틱(Agentic) AI로서 자유로운 언어 상호작용 능력을 입증했다.
![]() |
네이버가 AI의 사고력 향상을 목표로 한 추론모델 'HyperCLOVA X THINK'를 개발 완료하고, 기술적 세부 사항을 담은 테크니컬 리포트를 발표했다. [사진=네이버] |
HyperCLOVA X THINK는 언어 외에도 시각 정보를 통한 추론도 가능하다. 네이버는 수능 생명과학 문제 등 STEM(과학·기술·공학·수학) 영역의 시각 문제를 이미지로 입력해 모델이 내용을 분석하고 지식과 결합해 정답을 도출한 사례를 소개했다. 이는 별도 멀티모달 학습 없이 달성된 결과로, 향후 멀티모달 AI 확장 가능성도 시사한다.
유강민 네이버클라우드 리더는 "멀티모달을 겨냥한 모델이 아님에도 시각 추론에서 의미 있는 성과를 거뒀다"며 "향후 더욱 고도화된 멀티모달 추론 능력을 갖춘 모델로 진화시킬 것"이라고 전했다.
네이버는 HyperCLOVA X THINK를 오픈소스로 공개할 계획도 밝혔다. 앞서 4월 공개한 경량 모델 'HyperCLOVA X SEED'는 한 달 만에 50만 다운로드를 기록하는 등 국내 AI 생태계 성장에 기여한 바 있다. 이번 추론모델 역시 경쟁력 있는 한국어 LLM의 확산에 이바지할 것으로 기대된다.
모델 설계에 사용된 기술력도 주목된다. 네이버는 이번 모델에 'Peri-LN(Peripheral Layer Normalization)' 기법을 적용했으며, 이는 세계적 AI 학회 'ICML 2025'에 채택됐다. 이 밖에도 자체 강화학습 방식을 개발해 글로벌 학계와 공유함으로써 기술의 확장성과 학술적 기여를 동시에 꾀하고 있다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 "HyperCLOVA X를 지능 향상과 감각 확장이라는 두 축으로 고도화하고 있으며, 이번 THINK 모델은 지능 측면에서 의미 있는 진전을 이뤘다"며 "글로벌 선두권 기술을 확보해 나가는 동시에, 사용자에게 실질적인 가치를 제공하는 방향으로 기술을 발전시켜 나가겠다"고 강조했다.
dconnect@newspim.com