전체기사 최신뉴스 GAM
KYD 디데이
산업 ICT

속보

더보기

카카오, 한국어 최적화 멀티모달 AI '카나나' 2종 성능 공개

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

통합 멀티모달 언어모델 '카나나-o', 지시이행 능력 개선
이미지 기반 검색 기술 '임베딩'…"韓 문화 이해도 탁월"

[서울=뉴스핌] 이성화 기자 = 카카오가 사람처럼 보고 듣고 말하며 한국어와 한국 문화를 가장 잘 이해하는 고도화된 멀티모달 인공지능(AI) 기술 연구 성과를 공개했다.

카카오는 12일 테크블로그를 통해 한국적 맥락 이해에 최적화된 통합 멀티모달 언어모델 '카나나-o(Kanana-o)'와 멀티모달 임베딩 모델 '카나나-v-임베딩(Kanana-v-embedding)'의 개발 과정과 성능을 공개했다.

Kanana-o와 글로벌 경쟁모델 벤치마크 성능비교. [사진=카카오]

'카나나-o'는 텍스트와 음성, 이미지를 동시에 이해하고 실시간으로 답변하는 통합 멀티모달 언어모델이다. 글로벌 모델 대비 한국어 맥락 이해에서 압도적 성능을 보유하고 있으며 사람처럼 자연스럽고 풍부한 표현력을 갖춘 것이 특징이다.

카카오는 기존 멀티모달 모델들이 텍스트 입력 시 강점을 보이지만 음성 대화에서는 답변이 단순해지고 추론 능력이 떨어지는 한계에 주목해 이를 보완했다. '카나나-o'의 지시 이행 능력을 고도화해 사용자의 숨은 의도와 복잡한 요구사항까지 파악할 수 있도록 개선했으며 자체 구축 데이터셋으로 학습해 다양한 모달리티 입출력에서도 기존 언어모델 성능을 유지하고 요약, 감정 및 의도 해석, 오류 수정, 형식 변환, 번역 등 다양한 과업을 수행할 수 있도록 성능을 끌어올렸다.

또한 고품질 음성 데이터와 직접 선호 최적화(DPO) 기술을 적용해 억양, 감정, 호흡 등을 정교하게 학습시켰다. 이를 통해 기쁨, 슬픔, 분노, 공포 등 상황별 생생한 감정 표현은 물론 미세한 음색과 어조 변화에 따른 감정 표현 능력도 향상됐다. 호스트와 게스트가 대화를 주고받는 팟캐스트 형태의 대화 데이터셋을 구축해 끊김 없이 자연스러운 멀티턴 대화도 가능해졌다.

벤치마크 평가 결과 '카나나-o'는 영어 음성 성능에서 GPT-4o와 유사한 수준을 보였고 한국어 음성 인식 및 합성, 감정 인식 능력에서는 월등히 높은 수준을 기록했다. 카카오는 향후 더욱 자연스러운 동시 대화와 상황에 맞는 소리환경 실시간 생성이 가능한 진화된 모델로 발전시킬 계획이다.

함께 공개된 '카나나-v-임베딩'은 이미지 기반 검색의 핵심 기술로 텍스트와 이미지를 동시에 이해해 처리할 수 있는 한국형 멀티모달 모델이다. 텍스트로 이미지를 검색하거나 사용자가 선택한 이미지와 관련된 정보를 찾고 이미지가 포함된 문서 검색도 지원한다.

Kanana-v-embedding 벤치마크 성능 비교. [사진=카카오]

특히 한국어와 한국 문화에 대한 이해도가 탁월해 '경복궁', '붕어빵' 같은 고유명사뿐만 아니라 '하멜튼 치즈'처럼 오타가 포함된 단어도 문맥을 파악해 정확한 이미지를 찾아준다. '한복 입고 찍은 단체 사진'처럼 복합 조건도 정확히 이해해 조건 일부에만 해당하는 사진을 걸러내는 높은 변별력을 갖췄다.

현재 '카나나-v-임베딩'은 카카오 내부에서 광고 소재 유사도 분석 및 심사 시스템에 적용 중이며 향후 비디오나 음성으로 범위를 확대해 다양한 서비스에 적용할 계획이다.

한편 카카오는 지난 5월 에이전틱 AI 구현을 위한 기능 강화에 중점을 둔 언어모델 '카나나-1.5'를 기반으로 모바일 기기 등 온 디바이스 환경에서 동작할 수 있는 멀티모달 모델의 경량화 연구를 진행하고 있다. 또한 전문가 혼합 구조인 MoE(Mixture of Experts)를 적용한 고성능·고효율 모델 '카나나-2' 개발도 준비하고 있다.

김병학 카카오 카나나 성과리더는 "카카오 자체 AI 모델 카나나는 단순 정보 나열을 넘어 사용자의 감정을 이해하며 친숙하고 자연스럽게 대화하는 AI가 될 수 있도록 한국적 맥락 이해와 표현력을 높여가고자 한다"며 "실제 서비스 환경을 통해 사용자들의 일상 속 AI 기술 경험을 만들어 나가고 사람처럼 상호작용할 수 있는 AI 구현에 주력할 것"이라고 말했다.

shl22@newspim.com

[뉴스핌 베스트 기사]

사진
발견 어려운 췌장암 AI로 조기 진단 [베이징=뉴스핌] 조용성 특파원 = 중국 알리바바가 개발한 AI 솔루션이 췌장암 조기 진단을 해내는 것으로 나타났다. 췌장암은 발견하기가 극히 어려운 암으로, 보통 말기에 발견된다. 때문에 췌장암은 진단 후 5년 생존율이 10%에 불과하다. 중국의 AI 솔루션이 중국의 한 병원에서 시범 적용되고 있으며, 이를 통해 췌장암 조기 발견 사례가 늘고 있다고 뉴욕타임스 중문판이 6일 전했다. 알리바바가 개발한 이 솔루션의 명칭은 'PANDA(인공지능 췌장암 검사 시스템)'이다. 촬영된 CT 영상을 AI가 판독해 췌장암 확진을 결정하는 소프트웨어다. PANDA는 중국 내 여러 병원에서 임상을 진행 중이다. 이 중 한 곳은 닝보(寧波)대학 인민병원이다. 닝보대학 인민병원은 2024년 11월 PANDA를 도입해 임상시험을 시작했다. 현재까지 PANDA는 18만 건 이상의 복부 혹은 흉부 CT를 분석했고, 이를 통해 20건 이상의 췌장암을 발견했다. 이 중 14건은 조기 진단이었다. 췌장암은 조기 진단될 경우 수술을 통한 제거가 가능하다. 한 환자의 경우 복부 팽만감과 메스꺼움의 증상으로 병원을 찾아 CT를 촬영했으며, 췌장 전문 검사를 받지 않았지만, 췌장암 판정을 받았다. 현지 의사는 "PANDA의 식별이 없었으면 결코 췌장암 판정을 못 하는 상황이었으며, PANDA로 인해 환자의 췌장암이 조기에 발견됐고 수술을 통해 완치될 수 있었다"며 "AI가 환자의 생명을 구했다고 볼 수 있다"고 소개했다. 아직은 오차율이 비교적 높은 상태다. PANDA는 그동안 1400건의 스캔 영상에 대해 췌장암 가능 경고를 했다. 전문의들은 이 중 300개에 대해서만 정밀 진단이 필요하다고 판단했다. 이후 300명의 환자는 재검사를 받았다. 이 중 20여 건이 췌장암으로 판정받았다. PANDA를 개발한 곳은 알리바바 산하 다모(達摩)연구소다. 연구소의 베테랑 알고리즘 전문가는 2000명 이상의 췌장암 환자의 CT 영상을 취득해 방사선 전문의들에게 병변 위치를 수작업으로 표시하도록 요청했다. 그리고 결과물을 AI 학습으로 훈련시켰으며, 이를 통해 PANDA는 선명도가 낮은 CT 이미지에서도 췌장암을 식별할 수 있게 됐다. 알리바바의 PANDA는 지난해 4월 미국 식품의약국(FDA)으로부터 패스트트랙 의료 기기로 선정됐다. 해당 제도는 성능이 뛰어난 의료 기기의 경우 임상 시험 기간을 단축시켜준다. 캘리포니아 대학의 한 교수는 "임상 경험이 풍부한 전문가보다 PANDA가 의사들에게 더 가치가 있을 것"이라며 "PANDA와 같은 솔루션은 지방 병원이나 진료소의 유용한 보조수단이 될 것"이라고 평가했다. 중국 병원 자료사진. [신화사=뉴스핌 특약] ys1744@newspim.com 2026-01-06 11:36
사진
9월 북극항로 첫 시범운항 [부산=뉴스핌] 최영수 선임기자 = 해양수산부가 올해 북극항로 개척에 본격 나선다. 오는 8월 말에서 9월 중 컨테이너선(3000TEU급)을 투입해 시범운항을 실시할 예정이다. 이를 위해 상반기 중 시범운항에 참여할 선사 및 화주를 모집해 선정할 방침이다. ◆ 북극항로 개척 원년…첫 시범운항 주목 김성범 해양수산부 장관직무대행(차관)은 지난 5일 부산청사 해양수산부에서 신년 기자간담회를 열고 이 같은 내용을 포함한 새해 정책방향을 제시했다. 그는 "오는 9월 전후에 시범운항을 할 수 있도록 준비하고 있다"면서 "3000TEU급 컨테이너선을 투입할 예정"이라고 밝혔다. 이어 "3000TEU급 컨테이너선이 대형에 비하면 작다고 할 수 있지만, 크기는 중요하지 않다"면서 "중국이 지난해 운항한 선박도 4000TEU급 수준"이라고 설명했다. 김성범 해양수산부 장관직무대행(차관)이 지난 5일 부산청사 해양수산부에서 신년 기자간담회를 열고 새해 정책방향을 설명하고 있다. [사진=해양수산부] 2026.01.06 dream@newspim.com 김 대행은 "시범운항을 위해 올해 상반기 중에는 선사와 화주를 선정할 예정"이라면서 "시범운항이라는 면에서 여러 가지 인센티브를 제공할 방침"이라고 밝혔다. 다만 "선사가 선정되면 선사가 희망하는 게 있기 때문에 이를 반영해서 잘 결정하겠다"고 덧붙였다. 부산신청사 건립과 관련해서는 "내년 예산에 (신청사)설계비를 반영할 예정"이라면서 "내년부터 구체적인 (청사 건립)절차를 시작할 계획"이라고 밝혔다. UN해양총회 개최지와 관련해서는 "개최도시 선정은 UN과도 협의해야 할 사항"이라면서 "(유치에)관심 있는 도시들과 협의해서 결정하겠다"고 설명했다. ◆ 부산해양수도 조성 첫발…유관기관 모으기 가속 김 대행은 지난 5일 부산청사에서 열린 해수부 시무식에서 신년사를 통해 "북극항로 시대에 대비한 동남권 대도약을 실현하겠다"고 제시했다. 이를 위해 해양수산분야 유관기관을 부산으로 모으는 작업이 본격화될 전망이다. 해수부 산하기관들도 올해 부산 이전이 본격화될 것으로 보인다.  김 대행은 "기업, 공공기관, 해사법원, 동남권투자공사 등이 집적화된 해양클러스터 조성을 추진해 나가겠다"면서 "부산항을 세계 최대 규모의 항만으로 개발하고, 터미널 운영 효율화와 종합 항만서비스 제공을 통해 글로벌 물류 요충지로 성장시키겠다"고 다짐했다. 이어 "북극항로 시대에 대비한 동남권 대도약을 실현하겠다"면서 "부산에서 로테르담까지 북극항로 시범운항을 추진하고 해양수도권 육성전략을 조속히 수립하겠다"고 강조했다. 2026년 해양수산부 업무계획 [자료=해양수산부] 2025.12.23 dream@newspim.com dream@newspim.com 2026-01-06 11:00
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동