추론 특화 모델 첫 공개…도구 호출·지시 이행 능력 강화
MLA·MoE 적용으로 연산 비용 절감·응답 속도 향상
온디바이스 경량 모델·AI 에이전트 특화 모델 개발 예고
[서울=뉴스핌] 양태훈 기자 = 카카오가 에이전틱(Agentic) AI 구현에 최적화된 차세대 자체 언어모델 'Kanana-2'를 오픈소스로 공개하며, 사용자 명령을 능동적으로 수행하는 AI 개발 경쟁에 본격 나섰다.
19일 카카오는 허깅페이스(Hugging Face)를 통해 에이전틱 AI 구현에 최적화된 차세대 자체 언어모델 'Kanana-2'를 오픈소스로 공개했다고 밝혔다. 지난해 카카오는 자체 AI 모델 '카나나(Kanana)' 라인업을 선보인 이후, 경량 모델부터 고난도 문제 해결에 특화된 'Kanana-1.5'까지 다양한 모델을 지속적으로 오픈소스로 공개해왔다.
'Kanana-2'는 이러한 흐름을 잇는 최신 모델로, 사용자 명령의 맥락을 파악해 능동적으로 동작하는 AI 구현에 초점을 맞췄다.

이번에 공개된 모델은 ▲베이스(Base) ▲인스트럭트(Instruct) ▲추론(Thinking) 특화 모델 등 총 3종이다. 특히 추론 특화 모델은 이번에 처음 선보이는 형태로, 개발자들이 자체 데이터를 활용해 자유롭게 파인튜닝할 수 있도록 학습 단계의 웨이트를 모두 공개했다.
Kanana-2는 에이전틱 AI의 핵심 기능인 도구 호출(Tool Calling)과 사용자 지시 이행 능력이 크게 향상됐다. 이전 모델 대비 다중 대화 도구 호출 능력을 3배 이상 개선했으며, 복잡한 단계별 요구 사항을 정확하게 이해하고 수행하도록 설계됐다. 지원 언어도 기존 한국어와 영어에서 일본어, 중국어, 태국어, 베트남어를 포함한 6개 언어로 확대됐다.
기술적으로는 MLA(Multi-head Latent Attention)와 MoE(Mixture of Experts) 구조를 적용해 효율성을 높였다. 이를 통해 긴 문맥을 적은 메모리 자원으로 처리할 수 있게 됐으며, 추론 시 필요한 파라미터만 활성화해 연산 비용을 낮추고 응답 속도를 개선했다. 대규모 동시 요청을 빠르게 처리하는 고처리량 성능도 확보했다.
성능 평가에서도 글로벌 경쟁력을 확인했다. 인스트럭트 모델은 동일 구조의 최신 모델 'Qwen3-30B-A3B'와 유사한 수준을 기록했으며, 최근 열린 'AI 에이전트 경진대회'에서 실제 에이전트 개발 환경에서의 활용성이 검증됐다. 추론 특화 모델 역시 다양한 사고 능력을 요구하는 벤치마크에서 유사 모델과 견줄 만한 성능을 보였다.
카카오는 향후 동일한 MoE 구조를 기반으로 모델 규모를 확장하고, 복잡한 AI 에이전트 시나리오에 특화된 모델과 온디바이스 경량 모델 고도화를 지속 추진할 계획이다.
김병학 카카오 카나나 성과리더는 "혁신적인 기술과 기능을 갖춘 AI 서비스의 근간은 기반이 되는 언어모델의 성능과 효율"이라며 "높은 성능에 초점을 둔 모델을 넘어 실제 AI 서비스에 적용돼 빠르고 효과적으로 동작할 수 있는 실용성을 갖춘 AI 모델을 개발하고, 꾸준히 오픈소스로 공유하며 국내외 AI 연구 생태계 활성화에 기여할 계획"이라고 말했다.
dconnect@newspim.com












