전체기사 최신뉴스 GAM
KYD 디데이
산업 생활경제

속보

더보기

SKT 정예팀, A.X K1 기술 보고서 공개

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

[서울=뉴스핌] 송은정 기자 = SK텔레콤 정예팀은 매개변수 519B(5190억 개) 규모의 초거대 AI 모델 'A.X K1(에이닷엑스 케이원)'의 기술 보고서를 오픈소스 플랫폼 허깅페이스에 공개했다고 7일 밝혔다.

SK텔레콤 로고. [사진=SK텔레콤]

SK텔레콤 정예팀은 4개월여의 짧은 개발기간과 제한된 GPU 자원에도 불구하고 다양한 기술과 효율성을 극대화한 설계로 국내 첫 500B 이상 초거대 모델 A.X K1을 완성했다.

한정된 시간 안에 519B 규모를 갖췄음에도 주요 벤치마크에서 딥시크-V3.1 등 세계적으로 많이 활용되는 초거대 모델과 유사하거나 더 높은 성능을 달성한 점은 고무적이다.

통상 매개변수가 많아질수록 최적화 시간과 GPU 자원 투입이 늘어날 수밖에 없는데, 타 정예팀 대비 최소 2배 이상의 모델 규모임에도 높은 성능까지 확보해 주목할만하다.

A.X K1은 향후 추가 연구 기간에 따라 더 많은 컴퓨팅 자원과 데이터를 투입해 성능을 더욱 높일 수 있는 모델이다. SKT는 연내 멀티모달 기능을 추가하고 조 단위 파라미터로 확대할 계획이다.

◆제한된 자원에도 개발 효율 극대화…학습 효과와 성능 높여

SKT 정예팀은 1000개의 GPU 자원을 활용해 A.X K1 학습을 진행했다. 학습 기간과 GPU 규모를 바탕으로 가능한 총 학습량을 추산하고, 이를 바탕으로 최대 모델 크기를 스케일링 이론(모델 성능은 투입 자원에 비례한다는 이론)에 근거해 설계했다.

그 결과 세계적으로도 독창적인 매개변수 구조인 519B 규모의 모델을 목표로 정하고 약 10조(10T) 개의 데이터를 투입해 학습했다.

정예팀은 개발 기간 동안 상시 1000개 이상의 GPU를 인공지능 훈련에 활용했다. 투여된 GPU 자원 대비 효과를 극대화하기 위해 최적의 학습 연산량을 수학적으로 설계하고 관리했다.

특히 A.X K1은 이번 개발기간 동안 정부 지원을 받지 않고 자체 GPU 조달만으로 목표를 달성했다는 점에서 더욱 의미가 깊다.

모델 학습에는 웹 데이터, 코드, 이공계 데이터 (STEM, Science, Technology, Engineering, Mathematics), 추론 데이터 등 다양한 고품질 데이터를 활용했다. 한국어 특화 PDF 문서를 파싱 및 합성 데이터를 생성했고, 난이도별 커리큘럼 학습 방식도 적용했다.

◆수학, 코딩 등 다양한 분야에서 우수한 성능 구현

A.X K1은 수학과 코딩 등 초거대 인공지능 모델의 능력을 필요로 하는 분야에서 우수한 성능을 구현했다.

이번 보고서에 기술된 벤치마크 지표는 매개변수 6850억 개(685B)의 '딥시크-V3.1', 매개변수 3570개(357B)의 'GLM-4.6' 오픈소스 모델과 비교해 규모 대비 성능을 비교할 수 있도록 했다.

수학은 AIME25 벤치마크에서 89.8점을 받아 딥시크-V3.1 모델(88.4점) 대비 102% 수준으로 앞선 성능을 확인했다. AIME25는 미국 고등학생 수학 올림피아드 문제로 AI의 수학 실력을 측정하며, 창의적이고 복잡한 난이도의 문제가 출제된다.

코딩 활용도 측면에서 측정한 LiveCodeBench는 영어 기반 75.8점, 한국어 기반 73.1점을 기록하며 실시간 코딩 문제 해결 능력을 입증했다. 영어 기반 69.5점, 한국어 기반 66.2점을 받은 딥시크-V3.1 대비 각각 109%, 110% 수준의 높은 성능을 보였다.

LiveCodeBench는 AI가 실시간으로 나오는 최신 코딩 문제를 얼마나 잘 푸는지 측정하는 시험이다. 인공지능이 미리 볼 수 없는 최신 문제들로 구성돼 실제 코딩 능력을 테스트한다.

◆실용적인 구조 설계로 훈련 안정성 확보

A.X K1은 519B 규모의 파라미터 가운데 33B만 선택적으로 활성화하는 방식으로 효율성을 높였다. 전문가 혼합(MoE, Mixture of Expert) 구조를 채택해 AI 훈련 과정의 안정성과 효율을 동시에 확보한 것이 특징이다.

MoE란 여러 개의 작은 전문가 모델들이 모여서 하나의 큰 문제를 해결하는 방식으로 각 전문가 모델은 특정 유형의 데이터를 잘 처리하도록 특화되어 있고, 입력 데이터에 따라 가장 적합한 전문가가 선택되어 문제를 해결한다.

그 밖에도 A.X K1은 한 번에 128K 토큰의 긴 문맥도 처리할 수 있는 능력을 갖췄다. 이는 한국어 기준 약 10만 단어로서, 인공지능 모델이 소설책 한 권 또는 기업 연간 보고서 한 권도 동시에 검토할 수 있게 해 준다.

yuniya@newspim.com

[뉴스핌 베스트 기사]

사진
인텔, "애플과 미국서 반도체 생산" [뉴욕=뉴스핌] 김민정 특파원 = 반도체 회사 인텔 주가가 18일(현지시간) 급등해 장중 사상 최고치를 경신했다. 도널드 트럼프 미국 대통령이 인텔이 애플과 협력해 미국 내에서 반도체를 설계·생산할 것이라고 밝히면서 주가는 강세를 보이고 있다. 미국 동부 시간 오후 2시20분 인텔 주가는 전장보다 11.02% 오른 134.45달러를 기록했다. 장중 주가는 135.48달러까지 오르며 사상 최고치를 경신했다. 트럼프 대통령은 소셜미디어 트루스소셜 게시물에서 엔비디아와 일론 머스크의 반도체 제조 사업 '테라팹' 구상을 추켜세운 뒤 인텔과 애플의 협업을 언급했다. 그는 "우리가 바로 여기 미국에서 칩을 설계하고 만들어야 하기에 인텔을 돕기로 결정했다"며 "애플이 미국에서 칩을 설계하고 만들기 위해 인텔과 협력하기로 합의했다"고 적었다. 앞서 블룸버그통신은 아이폰 제조사인 애플이 자사 기기의 주요 프로세서를 미국에서 생산하기 위해 인텔과 삼성전자를 활용하는 방안을 두고 탐색적 논의를 해왔다고 보도한 바 있다. 인텔과 애플 로고.[사진=로이터 뉴스핌] 2026.06.19 mj72284@newspim.com 이번 협력은 인텔에 상당한 의미가 있다. 칩 생산을 위한 외부 고객을 확보하는 것은 립부 탄 최고경영자(CEO) 체제에서 인텔 부활 계획의 핵심 축이기 때문이다. 칩 생산을 대만 TSMC에 크게 의존해온 애플로서는 이번 협력으로 공급처를 다변화하는 효과를 누릴 수 있는 기회가 된다. 이는 부품과 기기 가격을 끌어올리는 공급 부족을 완화하는 데 도움이 될 수 있다. 다만 전문가들은 양사의 협력이 초기 점진적으로 이뤄질 것으로 본다. 인텔은 아직 자사 공장이 첨단 제조에서 대만 TSMC 시설의 생산 능력에 맞먹을 수 있음을 입증하지 못했다. 번스타인의 스테이시 라스곤 애널리스트는 노트에서 "인텔은 더 실질적인 수주를 따내기 전에 당연히 실력을 증명해야 할 것이나 첫걸음이 늘 가장 어려운 만큼 적어도 그 걸음을 떼는 것으로 보인다"며 "초기의 어떤 파운드리 관계든 소량의, 덜 중요한 부품일 가능성이 크다"고 말했다. 인텔은 지난해 트럼프 행정부와 이례적인 거래를 맺어 미국 정부를 인텔의 최대 투자자 중 하나로 만들었다. 이 합의에 따라 인텔은 정부 지원의 대가로 약 10%에 달하는 지분을 정부에 매각했다. mj72284@newspim.com 2026-06-19 03:25
사진
'군기누설' 김용현 오늘 1심 선고 [서울=뉴스핌] 박민경 기자 = 12·3 비상계엄 당시 노상원 전 국군정보사령관에게 정보사 명단을 전달한 혐의로 기소된 김용현 전 국방부 장관의 1심 결과가 19일 열린다. 서울중앙지법 형사합의21부(재판장 조순표)는 이날 김 전 장관의 군형법상 군기누설 및 개인정보보호법 위반 혐의 사건의 1심 선고기일을 연다. 12·3 비상계엄 당시 노상원 전 국군정보사령관에게 정보사 명단을 전달한 혐의로 기소된 김용현 전 국방부 장관의 1심 결과가 19일 열린다. 사진은 김 전 장관. [사진=뉴스핌 DB] 조은석 내란특별검사팀(특검팀)은 지난달 12일 결심공판에서 징역 5년을 구형했다. 특검팀은 "이 사건 범행은 위헌·위법한 비상계엄 선포 후 민주주의의 근간인 선거제도를 부정하고 영장주의를 위배하여 중앙선거관리위원회를 점거해 그 직원들을 불법적으로 체포·구금하려는 등 헌정질서를 유린하려 한 반헌법적 중대 범행"이라고 짚었다. 그러면서 "이와 같은 범죄의 중대성과 이 사건 범행으로 극도의 국가적 혼란과 군기 문란이 초래된 점, 피고인의 범행 가담 정도, 수사 및 재판에 임하는 태도 등 정상을 종합적으로 고려하여, 피고인에게 징역 5년을 구형했다"며 구형 이유를 밝혔다. 김 전 장관은 2024년 10월~11월 문상호 전 정보사령관, 김봉규 전 정보사 중앙신문단장, 정성욱 전 정보사 100여단 2사업단장 등과 공모해 특수임무대(HID) 요원을 비롯한 정보사 요원 40여명의 이름 등 인적 사항을 노 전 사령관에게 누설한 혐의로 재판에 넘겨졌다. 정보사 요원의 개인정보는 3급 군사기밀로, 2019년 3월 군에서 제적돼 민간인이었던 노 전 사령관에게 군사기밀을 누설했다는 것이다. 특검팀은 김 전 장관 등이 중앙선거관리위원회 관련 부정선거 의혹을 수사할 '제2수사단'을 구성하기 위해 정보사 요원 명단을 전달한 것으로 보고 있다. 한편 김 전 장관은 내란 중요임무 종사 혐의로 1심에서 징역 30년을 선고받았으며 일반이적, 직권남용 권리행사방해 혐의로도 1심에서 징역 30년을 선고받은 바 있다. pmk1459@newspim.com 2026-06-19 06:05
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동