전체기사 최신뉴스 GAM 라씨로
KYD 디데이
산업 ICT

네이버, 국내 최초 '초대규모 AI' 하이퍼클로바 공개…"모두를 위한 AI시대"

기사입력 : 2021년05월25일 14:00

최종수정 : 2021년05월25일 14:00

오픈AI가 개발한 GPT-3보다 6500배 많은 한국어 데이터 학습
204B 규모의 세계 최대 한국어 언어모델로 AI 주권 확보
검색어 교정 시작으로 다양한 네이버 서비스에 상용화 계획

[서울=뉴스핌] 구윤모 기자 = 네이버는 25일 국내 기업 최초의 '초대규모 AI'인 '하이퍼클로바(HyperCLOVA)'를 공개했다. 국내 AI 퍼스트무버(first mover)를 넘어 글로벌 AI 기술 리더로 발돋움하겠다는 계획도 밝혔다. 기존 한국어 AI의 패러다임을 바꾸는 '하이퍼클로바'를 통해 사용자, 중소상공인(SME), 크리에이터에게 새롭고 차별화된 경험을 선보이며 '모두를 위한 AI' 시대를 이끌어가겠다는 계획이다.

네이버는 이날 온라인으로 열린 'NAVER AI NOW' 컨퍼런스에서 지난해 10월 슈퍼컴퓨터 도입 이후 네이버 AI 기술의 성과와 앞으로의 방향성을 공개했다.

[서울=뉴스핌] 구윤모 기자 = 네이버 하이퍼클로바 [사진=네이버] 2021.05.25 iamkym@newspim.com

◆ 국내 최초 초대규모 AI, 세계 최대 한국어 언어모델 '하이퍼클로바'

하이퍼클로바는 네이버가 국내 기업 최초로 자체 개발한 초대규모 AI다. 정석근 네이버 CLOVA CIC(Company-In-Company) 대표는 키노트에서 "글로벌 기술 대기업들은 대형 AI 모델이 가져올 파괴적 혁신에 대한 기대로 투자를 가속화하고 있다"며 "한국의 AI 기술이 글로벌 플랫폼에 종속되지 않기 위해서는 이미 공개된 기술을 활용하고 따라잡는 수준에 그칠 수 없다고 판단했다"고 개발 배경을 밝혔다.

하이퍼클로바는 '오픈AI'의 GPT-3(175B)를 뛰어넘는 204B(2040억개) 파라미터(parameter, 매개변수) 규모로 개발됐다. AI 모델의 크기를 나타내는 파라미터의 수가 높아질수록 AI는 더욱 많은 문제를 해결할 수 있게 된다.

하이퍼클로바는 GPT-3보다 한국어 데이터를 6500배 이상 학습한 현재 전세계에서 가장 큰 한국어 초거대 언어모델이기도 하다. 영어가 학습 데이터의 대부분을 차지하는 GPT-3와 달리, 하이퍼클로바 학습 데이터는 한국어 비중이 97%에 달한다. 영어 중심의 글로벌 AI 모델과 달리 한국어에 최적화한 언어모델을 개발함으로써 AI 주권을 확보한다는 의미도 있다.

◆ 네이버 "글로벌 수준의 인프라, 데이터, AI 전문성으로 기술 주도권 잡을 것"

네이버는 지난 10월 국내 기업 최초로 700 페타플롭(PF) 성능의 슈퍼컴퓨터를 도입하며 대용량 데이터 처리를 위한 인프라를 갖췄다.

국내 최대 인터넷 플랫폼을 운영하며 쌓아온 대규모 데이터 처리 능력도 하이퍼클로바만의 중요한 경쟁력이다. 네이버는 하이퍼클로바 개발을 위해 5600억개 토큰(token)의 한국어 대용량 데이터를 구축했다.

슈퍼컴퓨터 인프라와 한국어 데이터 외에 네이버가 보유한 전세계 최고 수준의 AI 연구 개발 역량 역시 하이퍼클로바 자체 개발의 중요한 요소다. 네이버는 작년 한해 동안 글로벌 Top AI 컨퍼런스에서 국내 기업 중 가장 많은 43개의 정규 논문을 발표하며 기술력을 인정받았다. 

또한 서울대학교와 '서울대-네이버 초대규모(Hyperscale) AI 연구센터'를 설립하고, 카이스트 AI 대학원과는 '카이스트-네이버 초창의적(Hypercreative) AI 연구센터'를 설립하는 등 긴밀하고 강력한 산학협력을 통해 AI 공동 연구에 더욱 박차를 가하고 있다.

네이버는 앞으로 한국어 외 다른 언어로 언어 모델을 확장하고, 언어뿐만 아니라 영상이나 이미지 등도 이해하는 '멀티모달(Multimodal) AI'로 하이퍼클로바를 계속해서 발전시켜나갈 계획이다.​

◆ 네이버 서비스에 하이퍼클로바 상용화...사용자 경험 차별화

하이퍼클로바는 AI 개발과 적용의 패러다임을 완전히 바꿔 일상 속에서 AI가 더욱 많이, 널리 사용되도록 한다. 기존에는 해결하고자 하는 문제별로 데이터를 확보하고 정제해 모델을 개발했다면 하이퍼클로바는 하나의 'Big Model'에 방대한 데이터를 학습시켜 다양한 문제에 적용할 수 있다. 이를 통해 AI를 더욱 효율적으로 개발할 수 있을 뿐만 아니라 AI의 확장성이 대폭 높아진다.

네이버는 하이퍼클로바의 기술을 네이버 서비스에 적용해 사용자들에게 차별화된 경험을 제공할 예정이다. 첫번째 사례로 지난 6일 검색 서비스에 하이퍼클로바를 적용, 사용자가 검색어를 잘못 입력하는 경우 올바른 단어로 전환해 검색해주거나 적절한 검색어를 추천해주는 기능을 선보인 바 있다.​

 ◆ SME, 크리에이터, 스타트업 등 기술이 필요한 '모두의 능력'으로

네이버는 하이퍼클로바가 SME, 크리에이터, 스타트업 등 기술의 도움이 필요한 '모두의 능력'이 될 수 있도록 지원한다는 계획이다. 간단한 설명과 예시를 제시하는 소수학습(Few-shot learning) 방식으로 AI를 동작시킬 수 있기 때문에 AI 전문가가 아니어도 누구나 손쉽게 AI 서비스를 만들 수 있다.

예를 들어 상품 판매에 도움이 되는 적절한 마케팅 문구를 AI가 자동으로 작성해주는 일, 공부해야 할 내용을 AI가 빠르게 요약하거나 모르는 내용을 질문했을 때 자연스럽게 답변해주는 일 등이 가능해지게 된다. 네이버는 향후 적극적인 사업 및 연구 협력을 통해 다양한 방식의 기술 제공을 계획하고 있다.

​정석근 네이버 CLOVA CIC 대표는 "더 짧은 시간과 더 적은 리소스를 사용해서 이전에 우리가 상상만 헀던, 또는 우리가 상상하지 못했던 일들마저 가능해지는 새로운 AI의 시대가 열리고 있다"며 "하이퍼클로바를 통해 SME와 크리에이터를 포함해 AI 기술이 필요한 모두에게 새로운 경험을 제공할 것"이라고 말했다.

 

iamkym@newspim.com

[뉴스핌 베스트 기사]

사진
강릉 옥계항 코카인 추정 마약 대량 적발 [세종=뉴스핌] 백승은 기자 = 관세청과 해양경찰청이 강릉 옥계항에 입항하는 외국 무역선 선박을 수색애 코카인으로 의심되는 마약을 대량 적발해 조사 중이라고 2일 밝혔다. 전날 두 기관은 미국 연방수사국(FBI)과 국토안보수사국(HSI)으로부터 A선밖에 마약이 숨겨져 있다는 정보를 입수했다. A 선박은 벌크선으로 3만2000톤이며, 승선원 외국인은 20명이다. 관세청과 해양경찰청이 강릉 옥계항에 입항하는 외국 무역선 선박을 수색해 코카인으로 의심되는 마약을 대량 적발했다. [사진=관세청] 2025.04.02 100wins@newspim.com 두 기관은 합동 검색작전을 수립하고, 선박의 규모가 길이 185미터(m)인 점과 검색 범위 등을 고려해 서울세관·동해해경청 마약 수사요원 90명 및 세관 마약탐지견 2팀 등 합동 검색팀을 구성했다. 검색팀은 2일 오전 6시 30분 옥계항에 긴급 출동해 A 선박이 입항한 직후 선박에 올라타 집중 수색을 실시했다. 수색 중 검색팀은 선박 기관실 뒤편에서 밀실을 발견했고, 집중 수색 결과 개당 약 20킬로그램(kg) 전후 마약으로 의심되는 물질이 담긴 박스 수십 개를 발견했다. 검색팀이 간이시약으로 검사한 결과 코카인 의심 물질로 확인됐다. 정확한 중량은 하선 이후 정밀 계측기를 통해 측정하고 마약 종류는 국가과학수사연구원에 의뢰해 확인할 예정이다. 앞으로 관세청과 해경청은 합동수사팀을 운영해 해당 선박의 선장 및 선원 등 20여명을 대상으로 밀수 공모 여부와 적발된 마약의 출처 등을 수사할 계획이다. 국제 마약 밀매 조직과의 연관성도 고려해 미국 FBI와 HSI 등 관계 기관과의 공조를 통해 수사를 확대할 방침이다. 100wins@newspim.com 2025-04-02 17:57
사진
재주는 트럼프가, 돈은 브라질이 [서울=뉴스핌] 최원진 기자= 도널드 트럼프 미국 행정부의 관세 공세로 글로벌 무역전쟁이 격화하는 가운데, 브라질이 주요 승자로 부상하고 있다고 월스트리트저널(WSJ)이 1일(현지시간) 보도했다. 보도에 따르면, 중국은 트럼프 대통령이 부과한 대중(對中) 관세에 맞서 미국산 농산물에 보복 관세를 매기며 대체 수입처로 브라질을 주목하고 있다. 수출입 컨테이너 [사진=블룸버그] 중국 가공업체들은 트럼프 대통령이 지난 1월 취임하기 전부터 브라질산 대두를 비축하기 시작했고, 올해 1분기 필요한 물량의 거의 전량을 브라질에서 조달했다. 이는 지난해 같은 기간 54% 수준이었던 브라질산 비중과 비교하면 큰 폭의 증가다. 가격도 상승세다. 상파울루대학 산하 연구기관 세페아(CEPEA)에 따르면, 브라질 항구에서 선적되는 대두의 프리미엄은 중국이 미국산 대두에 10% 관세를 발표한 직후 일주일 동안 약 70% 급등했다. 3월 선적 기준으로는 부셸당 85센트를 기록해 3년 만에 최고치를 찍었다. 닭고기와 달걀 수출도 두 자릿수 증가율을 보인다. 브라질의 가금류·돼지고기·달걀 수출업체를 대표하는 브라질동물단백질협회(ABPA)의 히카르두 산틴 협회장은 올해 들어 브라질의 닭고기 수출은 지난해 같은 기간보다 9%, 달걀 수출은 20% 증가했다고 밝혔다. 브라질은 미국과 달리 조류 인플루엔자를 겪고 있지 않아, 안정적인 공급처로 주목받고 있다. 여기에 중국이 미국산 닭고기에 15%의 보복관세를 부과하면서 브라질산이 대안으로 떠오르고 있다는 설명이다. 사실 브라질과 중국의 교역 관계는 최근 수년 빠르게 확대됐다. 중국은 2009년에 미국을 제치고 브라질의 최대 무역 파트너로 부상했다. 쇠고기, 철광석, 석유 등 자원이 풍부한 브라질은 중국의 막대한 수요에 맞춰 수출을 확대해 왔고, 중국은 브라질의 인프라 건설에 대규모 자본을 투입하고 있다. 현재 중국은 브라질 전체 전력 공급의 약 10%를 차지하고 있으며, 항만과 도로, 철도 등 주요 기반 시설 건설에도 깊숙이 관여하고 있다. 브라질은 미국 시장에서도 수출 확대 가능성을 보고 있다. 중국은 미국의 주요 신발 수출국인데, 미국이 중국산 제품에 고율 관세를 부과할 경우 아시아를 제외하고 최대 신발 생산국인 브라질이 그 자리를 일부 대체할 수 있다는 전망이 나온다다. 하롤두 페헤이라 브라질 신발산업협회(Abicalçados) 회장은 "브라질산 제품에 별다른 관세가 없다면, 미국 수출 확대의 기회가 될 수 있다"라고 밝혔다. 글로벌 무역전쟁 국면에서 오히려 특수를 누릴 것이라는 기대는 브라질 증시에도 훈풍으로 작용했다. 올 들어 브라질 증시는 9% 넘게 오르며 뉴욕 증시를 아웃퍼폼하고 있다. 올 들어 브라질 증시는 9% 넘게 상승, 연중 5% 가까이 하락한 뉴욕증시의 S&P500 지수와 대조를 이룬다 [사진=koyfin] wonjc6@newspim.com   2025-04-02 15:30
안다쇼핑
Top으로 이동