에이전틱 AI 핵심 지표서 최상위권…업무 자동화 경쟁력 입증
40B 이하 모델로 효율성·범용 지능 동시 확보
[서울=뉴스핌] 양태훈 기자 = KT는 5일 자체 개발한 AI 모델 '믿:음 K'가 글로벌 AI 성능 평가 플랫폼 AAII(Artificial Analysis Intelligence Index)에서 국내 중소형 모델 가운데 1위를 달성했다고 밝혔다.
AAII는 AI 평가 전문 기관인 Artificial Analysis가 운영하는 플랫폼으로, 단일 시험이 아닌 다수의 공개 벤치마크 결과를 종합해 전 세계 주요 AI 모델의 성능을 비교·제공한다. 이 플랫폼에는 LG 엑사원, 네이버 하이퍼클로바, 업스테이지 솔라, 모티프 등 국내 주요 AI 모델도 함께 등재돼 있다.
KT에 따르면 믿:음 K는 추론 능력과 전문 지식, 수학·프로그래밍, 에이전트 수행 능력 등 10여 개 핵심 평가 항목에서 전반적으로 높은 점수를 기록했다. 단순 질의응답을 넘어 목표를 이해하고 필요한 도구와 시스템을 활용해 과업을 완수하는 '에이전틱 AI'로서 경쟁력을 공식적으로 인정받았다는 설명이다.

특히 에이전틱 AI 성능을 평가하는 주요 지표인 'τ²-bench(타우 스퀘어 벤치)'에서 87%를 기록해 최상위권 모델로 분류됐다. 이는 실제 업무 환경에서 사람과 협업하며 여러 도구를 활용해 과업을 수행할 수 있는지를 평가하는 지표로, 구글의 최신 모델인 제미나이3와 유사한 수준의 성능을 보였다고 KT는 설명했다.
믿:음 K는 에이전틱 지표 외에도 MMLU Pro, GPQA, HLE 등 고난도 추론 및 전문 지식 평가 벤치마크에서 고르게 우수한 성적을 기록했다. 특히 한국어 이해 성능에서는 국내 최고 수준의 점수를 받았으며, 매개변수 40B 이하급 모델로 구현돼 효율성과 경제성을 동시에 확보했다는 평가다.
KT는 믿:음 K를 보고서 작성, 문서 요약, 데이터 분석, 고객 응대 등 기업 실무에 즉시 활용 가능한 'B2B 맞춤형 AI'로 개발했다고 밝혔다. 이를 위해 국내외 데이터 보유 기관과 데이터 얼라이언스를 구축하고, 저작권이 확보된 고품질 데이터를 학습에 활용했으며 주요 기업 고객과의 협업을 통해 현장 적용성을 높였다.
KT는 이번 성과를 계기로 금융·공공·제조 등 산업별 맞춤형 에이전틱 AI를 본격 확산해 기업 고객의 AI 전환(AX)을 선도한다는 전략이다.
오승필 KT 기술혁신부문장 부사장은 "이번 AAII 등재는 KT의 자체 AI 기술력이 글로벌 기준에 도달했음을 객관적으로 입증한 성과"라며 "에이전틱 AI를 통해 한국 기업들의 업무 혁신과 디지털 전환을 이끄는 최고의 AI 파트너가 되겠다"고 말했다.
dconnect@newspim.com












