전체기사 최신뉴스 GAM
KYD 디데이
산업 ICT

속보

더보기

카카오, 한국어 최적화 멀티모달 AI '카나나' 2종 성능 공개

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

통합 멀티모달 언어모델 '카나나-o', 지시이행 능력 개선
이미지 기반 검색 기술 '임베딩'…"韓 문화 이해도 탁월"

[서울=뉴스핌] 이성화 기자 = 카카오가 사람처럼 보고 듣고 말하며 한국어와 한국 문화를 가장 잘 이해하는 고도화된 멀티모달 인공지능(AI) 기술 연구 성과를 공개했다.

카카오는 12일 테크블로그를 통해 한국적 맥락 이해에 최적화된 통합 멀티모달 언어모델 '카나나-o(Kanana-o)'와 멀티모달 임베딩 모델 '카나나-v-임베딩(Kanana-v-embedding)'의 개발 과정과 성능을 공개했다.

Kanana-o와 글로벌 경쟁모델 벤치마크 성능비교. [사진=카카오]

'카나나-o'는 텍스트와 음성, 이미지를 동시에 이해하고 실시간으로 답변하는 통합 멀티모달 언어모델이다. 글로벌 모델 대비 한국어 맥락 이해에서 압도적 성능을 보유하고 있으며 사람처럼 자연스럽고 풍부한 표현력을 갖춘 것이 특징이다.

카카오는 기존 멀티모달 모델들이 텍스트 입력 시 강점을 보이지만 음성 대화에서는 답변이 단순해지고 추론 능력이 떨어지는 한계에 주목해 이를 보완했다. '카나나-o'의 지시 이행 능력을 고도화해 사용자의 숨은 의도와 복잡한 요구사항까지 파악할 수 있도록 개선했으며 자체 구축 데이터셋으로 학습해 다양한 모달리티 입출력에서도 기존 언어모델 성능을 유지하고 요약, 감정 및 의도 해석, 오류 수정, 형식 변환, 번역 등 다양한 과업을 수행할 수 있도록 성능을 끌어올렸다.

또한 고품질 음성 데이터와 직접 선호 최적화(DPO) 기술을 적용해 억양, 감정, 호흡 등을 정교하게 학습시켰다. 이를 통해 기쁨, 슬픔, 분노, 공포 등 상황별 생생한 감정 표현은 물론 미세한 음색과 어조 변화에 따른 감정 표현 능력도 향상됐다. 호스트와 게스트가 대화를 주고받는 팟캐스트 형태의 대화 데이터셋을 구축해 끊김 없이 자연스러운 멀티턴 대화도 가능해졌다.

벤치마크 평가 결과 '카나나-o'는 영어 음성 성능에서 GPT-4o와 유사한 수준을 보였고 한국어 음성 인식 및 합성, 감정 인식 능력에서는 월등히 높은 수준을 기록했다. 카카오는 향후 더욱 자연스러운 동시 대화와 상황에 맞는 소리환경 실시간 생성이 가능한 진화된 모델로 발전시킬 계획이다.

함께 공개된 '카나나-v-임베딩'은 이미지 기반 검색의 핵심 기술로 텍스트와 이미지를 동시에 이해해 처리할 수 있는 한국형 멀티모달 모델이다. 텍스트로 이미지를 검색하거나 사용자가 선택한 이미지와 관련된 정보를 찾고 이미지가 포함된 문서 검색도 지원한다.

Kanana-v-embedding 벤치마크 성능 비교. [사진=카카오]

특히 한국어와 한국 문화에 대한 이해도가 탁월해 '경복궁', '붕어빵' 같은 고유명사뿐만 아니라 '하멜튼 치즈'처럼 오타가 포함된 단어도 문맥을 파악해 정확한 이미지를 찾아준다. '한복 입고 찍은 단체 사진'처럼 복합 조건도 정확히 이해해 조건 일부에만 해당하는 사진을 걸러내는 높은 변별력을 갖췄다.

현재 '카나나-v-임베딩'은 카카오 내부에서 광고 소재 유사도 분석 및 심사 시스템에 적용 중이며 향후 비디오나 음성으로 범위를 확대해 다양한 서비스에 적용할 계획이다.

한편 카카오는 지난 5월 에이전틱 AI 구현을 위한 기능 강화에 중점을 둔 언어모델 '카나나-1.5'를 기반으로 모바일 기기 등 온 디바이스 환경에서 동작할 수 있는 멀티모달 모델의 경량화 연구를 진행하고 있다. 또한 전문가 혼합 구조인 MoE(Mixture of Experts)를 적용한 고성능·고효율 모델 '카나나-2' 개발도 준비하고 있다.

김병학 카카오 카나나 성과리더는 "카카오 자체 AI 모델 카나나는 단순 정보 나열을 넘어 사용자의 감정을 이해하며 친숙하고 자연스럽게 대화하는 AI가 될 수 있도록 한국적 맥락 이해와 표현력을 높여가고자 한다"며 "실제 서비스 환경을 통해 사용자들의 일상 속 AI 기술 경험을 만들어 나가고 사람처럼 상호작용할 수 있는 AI 구현에 주력할 것"이라고 말했다.

shl22@newspim.com

[뉴스핌 베스트 기사]

사진
한동훈, '최대 격전지' 북구갑 당선 [서울=뉴스핌] 신정인 박서영 기자 = 6·3 국회의원 보궐선거에서 한동훈 무소속 부산 북구갑 후보가 접전 끝에 당선됐다. 중앙선거관리위원회에 따르면 4일 오전 2시 기준, 한 후보는 42.99%의 득표율(3만4920표)을 기록해 당선이 확정됐다. 한동훈 무소속 부산 북구갑 국회의원 보궐선거 후보가 29일 오전 부산광역시 북구 만덕2동행정복지센터에 마련된 사전투표소에서 아내인 진은정 씨와 함께 사전투표를 마치고 나서고 있다. [사진 = 뉴스핌DB] 마지막까지 치열한 경합을 벌인 하정우 더불어민주당 후보는 41.24%(3만3495표)를 얻어 2위에 머물렀다. 두 후보 간의 격차는 1.75%포인트(1425표)에 불과했다. 박민식 국민의힘 후보는 15.76%(1만2802표)의 득표율로 3위에 그쳤다. 한 후보는 이날 북갑 선거사무실에서 "역사적인 승리로 북구의 미래와 보수 재건의 길을 열어주신 북구의 위대한 시민들께 진심으로 감사드린다"며 "제게 맡겨주신 임무를 북구 시민과 부산 시민, 대한민국 국민을 먼저 생각하면서 반드시 완수해내겠다"고 소감을 밝혔다. 이어 "북구를 발전시키고 보수를 재건하며, 이재명 정권의 폭주를 제어해 대한민국의 균형추를 맞추겠다"면서 "민심이 대단히 두렵고 위대하다는 것을 다시 한번 실감했다. 오직 민심만 보고 가는 정치인이 되겠다"고 말했다.  석패한 하 후보는 '북구 발전의 열망, 잊지 않고 더 낮은 자세로 정진하겠습니다'라는 낙선 인사를 통해 "이번 보궐선거 결과를 겸허히 받아들이며, 저를 믿고 지지해주신 모든 분의 성원에 깊은 감사를 드린다. 승리하신 한동훈 후보께도 축하의 말씀을 전한다"고 말했다. 하 후보는 "결과로 보답하지 못해 송구하고, 지난 한 달간 확인한 주민분들의 북구 발전에 대한 뜨거운 열망을 가슴 깊이 새기며 앞으로도 낮은 자세로 북구를 지키겠다"고 했다. 이번 보궐선거는 거대 양당 후보 사이에서 무소속으로 출마한 한 후보가 막판 스퍼트로 역전에 성공하며 부산 지역 정치 지형에 새로운 파장을 몰고 올 것으로 전망된다. allpass@newspim.com 2026-06-04 02:20
사진
'대구 달성' 이진숙 당선 확실 [서울=뉴스핌] 신정인 기자 = 6·3 국회의원 보궐선거 대구 달성군에서 이진숙 국민의힘 후보의 당선이 확실한 것으로 전망됐다. 1961년생으로 올해 64세인 이 후보는 경북대학교 영어교육학과를 졸업하고 서강대학교 언론대학원에서 언론학 석사 학위를 받은 언론인 출신이다. 이 후보는 1987년 MBC 기자로 입사했다. 최초의 여성 종군기자로 이름을 알렸으며, 이후 대전MBC 사장을 역임하는 등 언론계에서 굵직한 커리어를 쌓아왔다. 이 후보는 윤석열 정부에서 방송통신위원회 위원장으로 발탁되며 정권의 핵심 인사로 주목받았다. 방통위원장 재임 시절 공영방송 개혁 등을 추진하며 보수 진영의 강력한 지지를 받았다. 이번 6·3 국회의원 보궐선거를 앞두고 '보수의 심장'이자 박근혜 전 대통령의 정치적 고향인 대구 달성군에 국민의힘 후보로 전략 공천돼 출마했다. 이 후보는 선거 운동 기간 내내 높은 인지도를 바탕으로 대구 달성군의 정권 심판론을 차단하고 지역 표심을 빠르게 흡수해 왔다. 당선이 확실시됨에 따라 이 후보는 언론계와 행정부를 거쳐 국회의원으로서 여의도 정계에 교두보를 마련하게 됐다. allpass@newspim.com 2026-06-04 00:20
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동