전체기사 최신뉴스 GAM
KYD 디데이
산업 전기·전자

속보

더보기

[Tech 스토리] '수학 천재'에 코딩도 잘하는 LG '엑사원 딥'

기사입력 : 2025년03월30일 09:00

최종수정 : 2025년03월31일 09:13

수학·과학·코딩까지 섭렵…에이전트 AI의 새 기준 제시
작은 모델로도 AIME·GPQA 1위…'작지만 똑똑한' AI
추론 기반의 문제 해결 능력, 인간 연구 파트너 머지 않아

기업들의 신기술 개발은 지속 가능한 경영의 핵심입니다. 이 순간에도 수많은 기업은 신기술 개발에 여념이 없습니다. 기술의 진화는 결국 인간 삶을 바꿀 혁신적인 제품 탄생을 의미합니다. 기술을 알면 우리 일상의 미래를 예측해볼 수 있습니다. 각종 미디어에 등장하지만 독자들에게 아직은 낯선 기술 용어들. 그래서 뉴스핌에서는 'Tech 스토리'라는 고정 꼭지를 만들었습니다. 산업부 기자들이 매주 일요일마다 기업들의 '힙(hip)한' 기술 이야기를 술술 풀어 독자들에게 전달합니다.

[서울=뉴스핌] 서영욱 기자 = 사람이 시키지 않아도 스스로 생각하고, 가설을 세우고, 문제를 해결하는 똑똑한 인공지능(AI)이 등장하고 있습니다. 이런 AI를 '에이전트 AI(Agentic AI)'라고 부릅니다. 앞으로는 이런 AI가 점점 더 많아질 예정입니다. 하지만 이 AI가 정말 똑똑해지려면 '추론' 능력이 아주 중요합니다.

추론이란 주어진 정보를 바탕으로 새로운 사실을 알아내는 능력입니다. 예를 들어 "하늘이 흐리면 비가 올 수 있다"는 식으로 생각하는 것이죠. 그런데 이 능력을 높이기란 쉽지 않아서 세계에서도 아주 소수의 AI 회사만이 직접 이런 모델을 만들고 있습니다.

LG AI연구원은 최근 '엑사원 딥(EXAONE Deep)'이라는 아주 똑똑한 AI 모델을 공개했습니다. 이 모델은 수학 문제를 잘 풀고, 과학을 이해하고, 컴퓨터 코딩까지 잘하는 AI입니다. 엑사원 딥은 이렇게 '생각하는 힘'을 키우는 데 초점을 맞춰 개발됐습니다.

엑사원 딥과 타 AI의 수학 부문 성능 비교 [사진=LG AI연구원]

엑사원 딥은 수학 문제를 푸는 능력이 아주 뛰어납니다. 우리나라 고등학생이 보는 2025학년도 수능 수학 시험에서 최고 점수를 받았고, 미국의 어려운 수학 시험인 AIME 2024에서도 훌륭한 성적을 거뒀습니다.

특히 엑사원 딥 32B 모델은 AIME 시험에서 무려 90.0점을 받아서, 사람보다도 더 똑똑한 수학 실력을 보여줬습니다. 이 모델은 다른 AI보다 훨씬 작은 크기임에도 불구하고, 아주 복잡한 수학 문제도 척척 풀어냅니다.

작은 모델인 7.8B와 2.4B도 놀라운 성과를 냈습니다. 이 모델들은 스마트폰 같은 작은 기기에서도 돌아갈 수 있는 모델인데, MATH-500, AIME 2025 같은 시험에서 각각 1위를 차지했습니다.

엑사원 딥은 수학뿐 아니라 과학과 컴퓨터 프로그래밍에서도 뛰어난 실력을 보입니다. 박사급 수준의 과학 시험인 GPQA 다이아몬드 테스트에서 66.1점을 받았고, 실시간으로 코딩 실력을 평가하는 라이브코드벤치(LiveCodeBench) 테스트에서는 59.5점을 기록했습니다. 이 정도면 사람과 함께 연구하거나 프로그래밍하는 일도 가능할 만큼 실력이 좋다는 뜻입니다.

엑사원 딥의 2025년 수능 수학 영역 평가 결과 [사진=LG AI연구원]

작은 모델인 7.8B와 2.4B도 GPQA와 라이브코드벤치에서 1위를 차지하며, 작은 몸집에도 뛰어난 능력을 보여줬습니다. 작년에는 엑사원 3.5 모델이 세계 최대 AI 모델 평가 사이트인 '허깅페이스(Hugging Face)'의 엣지 부문 1위를 차지한 데 이어, 엑사원 딥까지 좋은 성과를 냈습니다.

엑사원 딥은 수학, 과학, 코딩뿐 아니라 일반적인 문제도 잘 푸는 AI입니다. MMLU(멀티태스크 언어이해) 테스트에서 83.0점을 받아, 우리나라가 만든 AI 모델 중 최고 성능을 기록했습니다.

이 테스트는 여러 분야의 상식을 묻는 문제로 구성돼 있어서, AI의 전반적인 실력을 평가하는 데 사용됩니다. 엑사원 딥은 이 테스트에서도 뛰어난 추론 능력을 보이며, 다방면으로 똑똑한 AI임을 증명했습니다.

LG AI연구원이 만든 엑사원 딥은 단순히 문제를 푸는 것을 넘어, 스스로 생각하고 판단하는 새로운 시대의 AI입니다. 앞으로도 우리 생활을 더 편리하고 똑똑하게 만드는 데 기여하기를 기대해 봅니다.

엑사원 딥과 타 AI의 코딩 부문 성능 비교 [사진=LG AI연구원]

syu@newspim.com

[뉴스핌 베스트 기사]

사진
온열질환 사망자 전년 대비 2배 증가 [서울=뉴스핌] 조민교 기자 = 찜통더위가 이어지면서 올여름 온열질환자 수가 작년 대비 급증했다. 온열질환 추정 사망자는 최근 2명이 추가돼 현재까지 7명으로 집계됐다. 7일 질병관리청의 온열질환 응급실감시체계 신고 현황에 따르면 지난 6일 59명이 온열질환으로 응급실에 내원했다. 이중 2명은 온열질환으로 인해 사망했다. 질병청이 지난 5월 15일부터 전국 의료기관 517곳 응급실을 대상으로 온열질환 감시체계를 가동한 이래 전날까지 누적 온열질환자는 모두 875명이다. [서울=뉴스핌] 김학선 기자 = 서울 전역에 올해 첫 폭염주의보가 발효된 30일 오후 서울 성동구 마장역 인근에서 시민들이 무더위에 힘겨워하고 있다. 2025.06.30 yooksa@newspim.com 지난해 같은 기간(5월 20일~7월 6일)과 비교하면 온열질환자는 469명에서 859명으로 83.2% 증가했다. 올해 온열질환 추정 사망자는 모두 7명으로, 작년 같은 기간(3명)과 비교해 2배 이상 늘어났다. 현재까지 발생한 온열질환자의 76.5%는 남성이었으며 여성은 23.5%였다. 연령별로는 60대가 19.5%로 가장 많았으며 이어 50대, 40대, 30대, 80세 이상, 70대, 20대 순이었다. 65세 이상 고령층이 전체 온열질환자의 33.3%를 차지했다. 직업별로는 단순 노무 종사자(21.0%), 무직(12.0%), 농림어업 숙련 종사자(10.4%)가 많았다. 발생 시간을 보면 오후 4~5시(12.2%), 오후 3~4시(11.5%), 오후 1~2시(9.5%), 오전 10~11시 (9.0%) 등으로 나타났다. 실외 발생이 81.4%였으며 작업장 25.6%, 논밭 16.6%, 길가 14.1% 등이었다. 온열질환은 열로 인해 발생하는 급성질환으로 통상 두통, 어지러움, 근육경련, 피로감 등의 증상을 동반한다. 제때 조치하지 않으면 의식 저하가 나타나면서 자칫 생명이 위태로울 수도 있다. 흔히 일사병으로 불리는 열탈진과 열사병이 대표적이다. 평소 온열질환을 예방하려면 한낮에는 가급적 외출과 야외활동을 삼가고, 갈증을 느끼지 않더라도 물을 자주 마시면서 체내 수분을 적절히 공급해 주는 게 좋다. mkyo@newspim.com 2025-07-07 20:26
사진
삼성전자, 2Q 영업익 56% 뒷걸음 [서울=뉴스핌] 서영욱 기자 = 삼성전자가 전년 동기 대비 절반 이상 하락한 2분기 잠정 영업 실적을 내놨다. 삼성전자가 8일 올해 2분기 잠정 실적을 공시하고 매출 74조원, 영업이익은 4조6000억원을 달성했다고 밝혔다. 전 분기 보다 매출은 6.5%, 영업이익은 31% 줄었다. 작년 동기 대비 매출은 비슷했지만, 영업이익은 56% 가까이 내려앉았다. 서울 서초구 삼성전자 서초사옥 전경 [사진=뉴스핌DB] 이번 잠정치는 한국채택 국제회계기준(IFRS)에 따라 추정한 수치다. 결산을 마치기 전 투자자들의 편의를 위해 먼저 공개한 것이다. 삼성전자는 2009년 7월 국내 기업 처음으로 분기 실적 예상치를 내놨다. 2010년 IFRS를 먼저 적용해 글로벌 기준에 맞춘 정보 제공을 이어가며 투자자들이 보다 정확히 실적을 가늠하고 기업 가치를 판단할 수 있도록 하고 있다. 삼성전자는 이번에도 주주와 소통을 꾀한다. 실적발표 콘퍼런스콜에서 사전에 받은 질문을 중심으로 관심 높은 사안에 답할 계획이다. syu@newspim.com 2025-07-08 07:52
안다쇼핑
Top으로 이동