전체기사 최신뉴스 GAM 라씨로
KYD 디데이
산업 전기·전자

속보

더보기

[Tech 스토리] '수학 천재'에 코딩도 잘하는 LG '엑사원 딥'

기사입력 : 2025년03월30일 09:00

최종수정 : 2025년03월31일 09:13

수학·과학·코딩까지 섭렵…에이전트 AI의 새 기준 제시
작은 모델로도 AIME·GPQA 1위…'작지만 똑똑한' AI
추론 기반의 문제 해결 능력, 인간 연구 파트너 머지 않아

기업들의 신기술 개발은 지속 가능한 경영의 핵심입니다. 이 순간에도 수많은 기업은 신기술 개발에 여념이 없습니다. 기술의 진화는 결국 인간 삶을 바꿀 혁신적인 제품 탄생을 의미합니다. 기술을 알면 우리 일상의 미래를 예측해볼 수 있습니다. 각종 미디어에 등장하지만 독자들에게 아직은 낯선 기술 용어들. 그래서 뉴스핌에서는 'Tech 스토리'라는 고정 꼭지를 만들었습니다. 산업부 기자들이 매주 일요일마다 기업들의 '힙(hip)한' 기술 이야기를 술술 풀어 독자들에게 전달합니다.

[서울=뉴스핌] 서영욱 기자 = 사람이 시키지 않아도 스스로 생각하고, 가설을 세우고, 문제를 해결하는 똑똑한 인공지능(AI)이 등장하고 있습니다. 이런 AI를 '에이전트 AI(Agentic AI)'라고 부릅니다. 앞으로는 이런 AI가 점점 더 많아질 예정입니다. 하지만 이 AI가 정말 똑똑해지려면 '추론' 능력이 아주 중요합니다.

추론이란 주어진 정보를 바탕으로 새로운 사실을 알아내는 능력입니다. 예를 들어 "하늘이 흐리면 비가 올 수 있다"는 식으로 생각하는 것이죠. 그런데 이 능력을 높이기란 쉽지 않아서 세계에서도 아주 소수의 AI 회사만이 직접 이런 모델을 만들고 있습니다.

LG AI연구원은 최근 '엑사원 딥(EXAONE Deep)'이라는 아주 똑똑한 AI 모델을 공개했습니다. 이 모델은 수학 문제를 잘 풀고, 과학을 이해하고, 컴퓨터 코딩까지 잘하는 AI입니다. 엑사원 딥은 이렇게 '생각하는 힘'을 키우는 데 초점을 맞춰 개발됐습니다.

엑사원 딥과 타 AI의 수학 부문 성능 비교 [사진=LG AI연구원]

엑사원 딥은 수학 문제를 푸는 능력이 아주 뛰어납니다. 우리나라 고등학생이 보는 2025학년도 수능 수학 시험에서 최고 점수를 받았고, 미국의 어려운 수학 시험인 AIME 2024에서도 훌륭한 성적을 거뒀습니다.

특히 엑사원 딥 32B 모델은 AIME 시험에서 무려 90.0점을 받아서, 사람보다도 더 똑똑한 수학 실력을 보여줬습니다. 이 모델은 다른 AI보다 훨씬 작은 크기임에도 불구하고, 아주 복잡한 수학 문제도 척척 풀어냅니다.

작은 모델인 7.8B와 2.4B도 놀라운 성과를 냈습니다. 이 모델들은 스마트폰 같은 작은 기기에서도 돌아갈 수 있는 모델인데, MATH-500, AIME 2025 같은 시험에서 각각 1위를 차지했습니다.

엑사원 딥은 수학뿐 아니라 과학과 컴퓨터 프로그래밍에서도 뛰어난 실력을 보입니다. 박사급 수준의 과학 시험인 GPQA 다이아몬드 테스트에서 66.1점을 받았고, 실시간으로 코딩 실력을 평가하는 라이브코드벤치(LiveCodeBench) 테스트에서는 59.5점을 기록했습니다. 이 정도면 사람과 함께 연구하거나 프로그래밍하는 일도 가능할 만큼 실력이 좋다는 뜻입니다.

엑사원 딥의 2025년 수능 수학 영역 평가 결과 [사진=LG AI연구원]

작은 모델인 7.8B와 2.4B도 GPQA와 라이브코드벤치에서 1위를 차지하며, 작은 몸집에도 뛰어난 능력을 보여줬습니다. 작년에는 엑사원 3.5 모델이 세계 최대 AI 모델 평가 사이트인 '허깅페이스(Hugging Face)'의 엣지 부문 1위를 차지한 데 이어, 엑사원 딥까지 좋은 성과를 냈습니다.

엑사원 딥은 수학, 과학, 코딩뿐 아니라 일반적인 문제도 잘 푸는 AI입니다. MMLU(멀티태스크 언어이해) 테스트에서 83.0점을 받아, 우리나라가 만든 AI 모델 중 최고 성능을 기록했습니다.

이 테스트는 여러 분야의 상식을 묻는 문제로 구성돼 있어서, AI의 전반적인 실력을 평가하는 데 사용됩니다. 엑사원 딥은 이 테스트에서도 뛰어난 추론 능력을 보이며, 다방면으로 똑똑한 AI임을 증명했습니다.

LG AI연구원이 만든 엑사원 딥은 단순히 문제를 푸는 것을 넘어, 스스로 생각하고 판단하는 새로운 시대의 AI입니다. 앞으로도 우리 생활을 더 편리하고 똑똑하게 만드는 데 기여하기를 기대해 봅니다.

엑사원 딥과 타 AI의 코딩 부문 성능 비교 [사진=LG AI연구원]

syu@newspim.com

[뉴스핌 베스트 기사]

사진
SKT '유심 교체' 북새통...내 차례 올까 [인천=뉴스핌] 김학선 기자 = 가입자 유심(USIM) 정보를 해킹 당한 SK텔레콤이 유심 무료교체 서비스를 시작한 28일 인천의 한 대리점에서 고객들이 유심 교체를 위해 줄을 서 차례를 기다리고 있다. SKT는 사이버침해 피해를 막기 위해 이날 오전 10시부터 전국 2600여곳의 T월드 매장에서 희망 고객 대상 유심 무료교체 서비스를 진행한다. 2025.04.28 yooksa@newspim.com   2025-04-28 12:12
사진
"화웨이, 엔비디아 H100 능가 칩 개발" [서울=뉴스핌]박공식 기자 = 중국 화웨이가 미국이 수출 금지한 엔비디아 칩을 대체할 최신 인공지능(AI) 칩을 개발해 제품 시험을 앞두고 있다고 월스트리트저널(WSJ)이 현지 시간 27일 보도했다. 신문은 화웨이가 일부 중국 기술기업에 새로 개발한 '어센드(Ascend) 910D'의 시험을 의뢰했다고 전했다. 어센드 910D는 엔비디아의 H100보다 성능이 더 우수한 것으로 평가되고 있으며 이르면 5월 말 시제품이 나올 것으로 예상된다. 앞서 로이터통신은 21일 화웨이가 자체 개발한 AI칩 910C를 내달 초 중국 기업에 대량 출하할 계획이라고 보도한 바 있다. 화웨이를 비롯한 중국 기업들은 데이터를 알고리즘에 제공해 더 정확한 결정을 내리게 하는 훈련 모델용으로 엔비디아 칩에 필적하는 첨단 칩을 개발하는 데 주력해왔다. 미국은 중국의 기술 개발을 억제하기 위해 B200 등 최첨단 엔베디아 칩의 중국 수출을 금지하고 있다. H100의 경우 2022년 제품 출하 전에 중국 수출을 금지했다.  중국 베이징에 있는 화웨이 매장 [서울=뉴스핌]박공식 기자 = 2025.04.28 kongsikpark@newspim.com kongsikpark@newspim.com 2025-04-28 12:26
안다쇼핑
Top으로 이동