전체기사 최신뉴스 GAM
KYD 디데이
스포츠 국내스포츠

속보

더보기

[단독] "NHN 개발한 'AI 한돌'은 '알파고' 능가… 승률 90~100%"

기사입력 : 2019년12월18일 14:20

최종수정 : 2019년12월19일 06:25

[편집자] '바둑판의 풍운아' 이세돌 9단이 현역에서 물러납니다. 상대의 의표를 찔러 난전을 즐겼던 승부사. 평범을 거부했기에 인공지능(AI)을 극복한 세계 유일의 기사. 은퇴 이벤트도 이목을 집중시킵니다. AI와 의 재대결. 구글 '알파고'와 대결후 3년9개월만입니다. 국내 기술진이 만든 '한돌'과 세 판을 둡니다. 종합뉴스통신 뉴스핌이 '세돌과 한돌의 대결'을 두 가지 측면에서 조명합니다. 인간과 AI의 두뇌싸움이란 측면과 알파고(구글)와 한돌(NHN)의 AI기술 대결입니다.  

[서울=뉴스핌] 정윤영 기자 = "이세돌과 한돌 대국의 승부는 2대1 또는 1대2 정도 되지 않을까?"

이세돌(37)과 NHN 바둑 인공지능(AI) 한돌 대국'이 첫 진행되는 가운데 개발에 관여한 NHN 관계자는 뉴스핌과의 인터뷰에서 "한돌은 앙상블 추론과 통계를 통해 시뮬레이션을 효율적으로 할 수 있도록 만들었다. 한돌의 수준은 세계최고 AI인 알파고 제로와 유사하다"고 설명했다. 

지난 2016년 이세돌은 구글 딥마인드가 개발한 인공지능 AI 알파고(AlphaGo)와의 대결에서 4번째 대국서 승리, '알파고'와의 대결에서 승리한 유일한 인간이다.

총 3차례 치러지는 이번 대국 결과에 대해 관계자는 "2승1패 또는 1승2패"라고 조심스럽게 예측했다. 

이날 이세돌과 대결한 한돌은 무작위·자가대국으로 만든 기보로부터 학습한 정책망과 더 정확한 가치망을 사용해 롤아웃 없이 MCTS(Monte Carlo Tree Search) 수읽기 알고리즘을 통해 다음 수를 예측한다. 

또한 이 기술에 대해 "사람으로 치면 여러 사람이 동시에 다음 수에 대한 논의를 하는 것"이라고 설명했다. NHN IT팀 6여명의 개발자들이 3년간 투입돼, 현재의 바둑 인공지능 한돌을 완성시켰다.  

한돌은 대국에서 생성한 기보를 이용해 학습하는 과정을 반복하며, 지속적으로 성능을 개선시키고 있다.

이는 NHN이 1999년부터 '한게임 바둑'을 통해 쌓아온 데이터를 기반으로 자체 개발한 AI 바둑 프로그램이다.

NHN은 2017년부터 약 10개월간의 개발 기간을 거쳐 2017년 12월 한돌 1.0을 출시했다. 이후 나온 한돌 2.0은 1.0에 비해 90%이상의 승률, 한돌 3.0은 2.0에 비해 90% 이상의 승률을 보인다. 한돌은 지난해 12월 '프로기사 TOP5 vs 한돌 빅매치'에서 '국내 1위' 신진서 9단, 신민준 9단, 이동훈 9단, 김지석 9단, 박정환 9단 등을 상대로 전승을 기록했다. 또 올해는 중국 산둥성에서 열린 '2019 중신증권배 세계 AI 바둑대회'에 처음으로 참가한 세계 대회서 3위에 입상했다.

이번 3번기에서 이세돌은 기본 대국료 1억5000만원 외에 1승 때마다 승리 수당 5000만원을 추가로 받는다. 목표대로 2승을 기록하면 2억5000만원, 1승에 그치면 2억원이다. 이세돌은 2016년 알파고와 대결할 당시 대국료와 승리 수당을 합해 2억원을 받았다.

▲ 다음은 NHN 관계자와의 일문일답: 

-알파고와 한돌의 차이점은?
:"알파고는 이미 은퇴해서 알파고와 승부 차이는 말씀드리기는 곤란하다. 그러나 알파고 구글팀 딥마인드의 논문을 보면, 경기를 통한 기억의 수치가 있는데 이 것을 통해서 상대 비교를 하면, (버전업된) 알파고 제로, 알파 제로 수준이지 않을까 짐작하고 있다. 실제 알파고와의 다른점은, 원래 바둑 프로그램은 MCTS(Monte Carlo Tree Search)를 사용해서 성능이 좋아졌다. 기존에는 아마추어에게도 이기기 힘들었지만, 이 알고리즘을 사용하게되면서 성능이 좋아졌다. 아마추어를 이기는 것 까지는 가능했지만, 프로 기사를 이기지는 못했다. 프로기사를 이기게 된 것이 구글 딥 러닝을 결합하면서 이기게 됐다. 처음 MCTS 딥러닝을 결합시키면서 프로기사를 뛰어넘는 수준의 기억을 갖게 됐다. 저희도 비슷하게 MCTS 딥러닝을 사용하고 있다. 알파고와의 차이점은, 우리 사용방법이 앙상블 추론과 시뮬레이션을 통해 같은 데이터라도 학습시킬 때 효율적으로 트레이닝을 시키려고 노력하고 있다. 알파고는 모델을 하나만 사용한다. 모델이라는 것은 다음 수에대한 예측을 하거나, 승리에 대한 확률을 예측하는 것이다. 앙상블 추론은, 사람으로 치면 여러 사람이동시에 다음 수에 대한 의논하는 것이다. 앙상블 추론과 통계를 통해 시뮬레이션을 효율적으로 할 수 있도록 만들었다.

-개발하는데 소요된 시간은?
:"2017년 초부터 개발을 시작해 그해 1.0버전이 나왔다. 1.0버전은 알파고와 유사하다. 프로기사 60% 승률이 나왔다. 한돌 대국만 사용해서 학습한 버전이 2.0버전이다. 톱5 1~2가 포함된 대국에서 전승을 했다. 90~100% 승률이 나오고 있다. 3.0은 세계대회 인공지능에 첫 출전이지만 3위를 기록했다. 내년에는 4.0으로 순위를 끌어올릴 것을 예상한다."

-승부를 어떻게 예측하는가?
:"첫 바둑 대국을 요청받은 것은 불과 2달 전이다. 3.0에서는 테스트를 할 시간이 짧아서 승부를 예측하기는 힘들겠지만, 1대2, 2대1 이런 식으로 갈릴 것 같다.

[서울=뉴스핌] 정윤영 기자 = 전세계 AI바둑 프로그램. [사진=NHN] 2019.12.18 yoonge93@newspim.com
[서울=뉴스핌] 최상수 기자 = 이세돌 9단이 18일 오후 서울 강남구 바디프렌드 도곡타워에서 열린 '브레인마사지배 이세돌VS한돌 - Goodbye 이세돌'에서 생각에 잠겨 있다. 2019.12.18 kilroy023@newspim.com
[서울=뉴스핌] 정윤영 기자 = 이세돌이 18일 강남 도곡동에 위치한 바디프랜드 사옥에서 열린 '바디프랜드 브레인마사지배 이세돌 VS 한돌 대국'에 참가했다. [사진=정윤영 기자] 2019.12.18 yoonge93@newspim.com

yoonge93@newspim.com

[뉴스핌 베스트 기사]

사진
오광수 낙마로 본 정권 인사 수난사 [서울=뉴스핌] 이재창 정치전문기자 = 인사는 만사다. 인사를 잘하면 지지율 상승과 함께 국정 동력을 확보할 수 있다. 반대로 인사가 망사가 되면 지지율이 떨어져 국정 운영에 어려움을 겪을 수 있다. 역대 대통령은 조각에서 난맥상을 보이며 후보자들의 잇따른 낙마로 애를 먹었다. 거의 예외가 없었다. 매 정권마다 초기 인사에 대한 비판적인 조어가 등장했다. 이명박 정부의 고소영(고려대·소망교회·영남), 문재인 정부의 캠코더(캠프·코드·더불어민주당), 윤석열 정부의 서오남(서울대·50대·남성)이 대표적이다. 국민에게 감동을 주는 인사와는 거리가 멀었다. 국민의 싸늘한 시선에 직면했다.  [서울=뉴스핌] 이재명 대통령이 12일 서울 서초구 한강홍수통제소에서 열린 수해 대비 현장 점검 회의에서 발언하고 있다. [사진=대통령실] 2025.06.13 photo@newspim.com 이재명 정권도 예외는 아니다. 이재명 대통령의 인사에서 첫 낙마자가 나왔다. 이 대통령은 지난 13일 오광수 대통령실 민정수석비서관의 사의를 수용했다. 지난 8일 임명된 지 닷새 만이다. 공직기강 확립과 인사 검증을 담당하는 민정수석이 낙마한 게 더 아플 수밖에 없다. 인사 검증 작업에 차질이 생길 경우 인선이 늦어질 수 있다. 박근혜 정부는 조각에 52일 걸렸고, 문재인 정부는 195일 만에 조각을 완성했다. 윤석열 정부는 조각에 181일이 소요됐다. 강유정 대통령실 대변인은 이날 오전 브리핑을 통해 "오 수석이 어젯밤 이 대통령에게 사의를 표명했다"며 "이 대통령은 공직기강 확립과 인사 검증을 담당하는 민정수석의 중요성을 감안해 오 수석의 사의를 받아들였다"고 했다. 오 전 수석은 검찰 '특수통' 출신으로 이 대통령의 사법연수원 18기 동기다. '검찰 개혁'의 특명을 부여받았으나 대출 및 부동산 차명 관리 의혹이 잇따라 제기돼 결국 낙마했다. 이 대통령은 사법 개혁 의지와 국정 철학을 이해하는 인사로 조속한 시일 내에 차기 민정수석을 임명할 예정이지만 인사에 신중을 기할 수밖에 없게 됐다. 자연스레 인사 검증 기준이 높아질 가능성이 높다. 그렇지 않아도 제안을 받는 인사 열에 일곱 정도는 스스로 "검증 통과를 자신할 수 없다"며 손사래를 치는 것으로 전해졌다. 인사가 더 어려워질 수 있다. 오 전 수석에 이어 추가 낙마자가 나오면 치명타가 될 수 있다. 자칫 임기 초반 인사로 어려움을 겪었던 전 정권의 전철을 밟을 수도 있다. 여당 내에서 자성의 목소리가 나온 이유다. 김용민 민주당 원내정책수석부대표는 이날 KBS 라디오에서 "여당 의원의 일원으로서 집권 초기에 이런 문제가 불거진 것에 대해 국민의 눈높이에 맞지 못한 부분이 있었다면 사죄드린다"고 말했다. 인사 수난사는 역대 정권에서 되풀이됐다. 이명박 정부는 2008년 2월 발표한 1차 조각에서 남주홍 통일부 장관 후보자, 박은경 환경부 후보자, 이춘호 여성부 장관 후보자가 인사청문회 과정에서 부동산 투기와 위장 전입 의혹에 휘말려 낙마했다. 박근혜 정부의 초대 내각 인사도 이명박 정부의 닮은꼴이었다. 김용준 국무총리 지명자는 부동산 투기와 아들 병역 면제 의혹이 불거져 지명 5일 만에 자진 사퇴했다. 김종훈 미래창조과학부 장관 후보자와 김병관 국방부 장관 후보자, 황철주 중소기업청장 내정자도 스스로 물러났다. 2014년 6월에는 사의를 밝힌 정홍원 총리 후임으로 지명한 안대희(고액 수임 전관예우 논란), 문창극(역사관 논란) 후보자가 잇따라 낙마했다. 문재인 정부 조각 과정도 순탄치 않았다. 안경환 법무부 장관 후보자는 불법 혼인신고 사건 등으로 사퇴했다. 조대엽 고용노동부 장관 후보자, 이유정 헌법재판소 재판관 후보자, 박성진 중소벤처기업부 장관 후보자도 인사청문회 과정에서 각종 논란이 불거지면서 낙마했다. 윤석열 정부도 다르지 않았다. 김인철 사회부총리 겸 교육부 장관 후보자를 비롯해 정호영·김승희 보건복지부 장관 후보자, 송옥렬 공정거래위원장 후보자가 낙마했고, 박순애 사회부총리 겸 교육부 장관은 35일 만에 학제 개편 논란 등으로 사퇴했다. 역대 정부에서 낙마자가 속출한 것은 인사 검증 시스템이 부실한 것이 원인이지만 대통령의 오기 인사도 한몫했다. 대통령이 특정 인사를 고집하면 주변에서 누구도 강하게 반기를 들기 어렵다. 결국 주요 보직에 임명되거나 지명된 뒤 논란이 불거져 낙마하는 악순환이 되풀이됐다. leejc@newspim.com 2025-06-14 06:00
사진
李대통령, 대북 전단 처벌대책 지시 [세종 = 뉴스핌] 김범주 기자 = 이재명 대통령이 14일 대북 전단 살포와 관련해 예방과 사후 처벌에 대한 대책을 관련 부처에 지시했다. 대통령실 강유정 대변인은 서면 브리핑을 통해 이 대통령이 이같이 지시했다고 밝혔다. 지난 13일 이재명 대통령이 경기도 연천군 육군 25사단 비룡전망대를 방문해 장병들을 격려하고 있다/사진=이재명 대통령 인스타그램 이날 새벽 강화도에서 민간 단체가 북한 지역으로 전단을 살포한 것이 확인되면서 내린 지시로 파악됐다. 강 대변인은 "이재명 정부는 접경지역 주민의 일상과 안전을 위협하고 한반도의 군사적 긴장을 고조시킬 수 있는 불법적인 대북 전단 살포는 중단돼야 한다는 입장을 밝혔다"며 "정부가 입장을 밝혔음에도 이를 위반한 데 대한 상황을 엄중히 인식하고 있다"고 밝혔다. 이 대통령의 지시로 오는 16일 통일부 주관으로 유관 부처 회의를 열어 대북 전단과 관련한 종합 대책을 논의할 예정이다. 한편 대북 전단을 살포한 민간 단체와 개인에 대해서는 법 위반 여부를 따져 조치하겠다는 방침도 밝혔다. 이 대통령은 전날 접경지역 주민 간담회에서 통일부의 대북 전단 불법 살포 자제 요청에 '이를 어기고 대북 전단 살포 행위를 할 경우 처벌하겠다'는 취지의 입장을 밝힌 바 있다. wideopen@newspim.com 2025-06-14 19:50
안다쇼핑
Top으로 이동