720억·70억 매개변수 모델 2종 공개…허깅페이스 통해 배포
GPT-4o보다 높은 한국어 처리 성능, 토큰 효율성 33% 개선
온프레미스 설치 지원…기업 데이터 보안 및 독립 운영 가능
[서울=뉴스핌] 양태훈 기자 = SK텔레콤이 한국어 특화 대규모 언어모델(LLM) 'A.X 4.0'을 오픈소스로 공개했다. 높은 한국어 이해도와 토큰 처리 효율을 갖춘 데다, 온프레미스 설치도 지원해 민감 정보가 많은 기업 환경에서 활용이 가능하다.
3일, SK텔레콤은 한국어 특화 LLM 'A.X(에이닷 엑스) 4.0'을 오픈소스 형태로 공개했다고 밝혔다. 해당 모델은 글로벌 오픈소스 플랫폼 허깅페이스(Hugging Face)를 통해 표준 모델(72억 개 매개변수)과 경량 모델(7억 개 매개변수) 2종으로 제공된다.
A.X 4.0은 오픈소스 모델인 Qwen 2.5를 기반으로, SK텔레콤가 방대한 한국어 데이터를 추가 학습시켜 국내 환경에 맞춰 최적화한 AI 모델이다. SK텔레콤는 자체 설계한 토크나이저를 통해 동일 문장에서 GPT-4o 대비 약 33% 향상된 토큰 효율을 확보해 고용량 정보 처리와 운영 비용 절감 효과를 동시에 실현했다고 밝혔다.
![]() |
사진은 A.X 4.0의 대규모 학습(Continual Pre-Training, CPT)을 진행한 SK텔레콤 자체 구축 슈퍼컴퓨터 '타이탄'. [사진=SK텔레콤] |
한국어 능력 평가 지표인 KMMLU에서 A.X 4.0은 78.3점을 기록하며 GPT-4o(72.5점)를 상회했고, 한국 문화·언어 이해도를 평가하는 CLIcK에서도 83.5점을 얻어 GPT-4o(80.2점)보다 우수한 성능을 입증했다.
또한 A.X 4.0은 기업 내부망(온프레미스) 환경에 설치해 운영할 수 있도록 지원돼, 데이터 유출 우려가 큰 기업 고객도 안심하고 활용할 수 있다. 특히 해당 모델은 대규모 학습 과정(CPT)을 외부 연동 없이 자체 데이터만으로 수행해 데이터 주권 확보 측면에서도 의미를 가진다고 SK텔레콤는 강조했다.
SK텔레콤은 A.X 4.0을 지난 5월부터 자사 AI 서비스 '에이닷'의 통화 요약 기능에 적용하고 있으며, 향후 그룹 내 다양한 서비스에도 확장 적용할 계획이다. 기업 고객들은 이를 바탕으로 자체 목적에 맞는 파생형 모델을 개발하거나 연구에도 활용할 수 있다.
SK텔레콤는 이달 중 수학 문제 해결과 코드 생성 능력을 강화한 추론형 모델을 추가로 공개할 예정이며, 이미지와 텍스트를 동시에 처리할 수 있는 멀티모달 기능도 순차적으로 개발 중이다. 또한 기존 A.X 3.0에 적용한 '프롬 스크래치(From Scratch)' 방식도 병행하여 향후 모델 고도화를 지속할 방침이다.
김지원 SK텔레콤 AI Model Lab장은 "A.X 4.0은 SK텔레콤의 다양한 서비스를 고도화할 뿐 아니라, 한국어 기반 AI 모델의 새로운 표준으로 자리매김할 것"이라며 "앞으로도 국내 비즈니스 환경에 특화된 기술 개발을 지속하겠다"고 밝혔다.
dconnect@newspim.com