전체기사 최신뉴스 GAM
KYD 디데이

카카오, 텍스트·음성·이미지 통합 AI 공개

기사입력 : 2025년05월01일 11:37

최종수정 : 2025년05월01일 11:37

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

국내 최초 멀티모달 언어모델 'Kanana-o' 성능 발표
억양·감정까지 분석해 자연스러운 음성 응답
한국어 벤치마크서 글로벌 모델 대비 우위 입증

[서울=뉴스핌] 양태훈 기자 = 카카오가 텍스트, 음성, 이미지 정보를 동시에 처리할 수 있는 멀티모달 언어모델 'Kanana-o'를 공개하고, 감정까지 이해하는 대화형 인공지능 기술 경쟁력 강화를 본격화했다.

1일 카카오는 공식 테크블로그를 통해 텍스트·음성·이미지를 통합적으로 이해하고 응답할 수 있는 멀티모달 언어모델 'Kanana-o'의 성능과 개발 후기를 공개했다고 밝혔다.

Kanana-o는 국내 최초로 텍스트, 음성, 이미지 형태의 정보를 동시에 처리하는 통합형 AI 모델이다. 질문이 텍스트·음성·이미지 중 어떤 조합으로 입력되더라도 상황에 맞는 텍스트 또는 음성으로 응답이 가능하도록 설계됐다.

[자료=카카오]

이번 모델은 이미지 처리에 특화된 'Kanana-v', 음성 이해와 생성에 강점을 지닌 'Kanana-a'를 '모델 병합(Model Merging)' 기술로 결합해 개발됐으며, 이후 '병합 학습(Joint Training)'을 통해 세 가지 입력 정보를 통합적으로 학습했다.

Kanana-o는 음성 감정 인식 기술을 활용해 사용자의 억양, 말투, 목소리 떨림 등 비언어적 신호를 분석하고, 대화 맥락에 맞는 감정적이고 자연스러운 음성 응답을 생성할 수 있다. 특히 대규모 한국어 데이터를 기반으로 지역 방언까지 인식하고 표준어로 변환해 자연스러운 한국어 음성 생성이 가능하다.

또한 스트리밍 기반 음성 합성 기술이 적용돼 긴 대기 시간 없이 응답이 이뤄진다. 예컨대 이미지와 함께 "이 그림에 어울리는 동화를 만들어 줘"라고 요청하면, 해당 음성을 인식하고 감정과 상황을 분석해 즉석에서 이야기를 들려주는 방식이다.

카카오에 따르면, Kanana-o는 한국어 및 영어 벤치마크에서 글로벌 최고 수준의 성능을 기록했으며, 특히 감정 인식 능력에서는 큰 차이를 보이며 경쟁력을 입증했다. 이미지·음성 질의응답 등 복합적 멀티모달 과제에서도 우수한 결과를 나타냈다.

카카오는 향후 Kanana-o를 기반으로 ▲다중 턴 대화 처리 ▲양방향 통신(Full-duplex) 대응 ▲안전한 응답 제공 등을 위한 연구를 지속해, 실제 대화와 유사한 자연스러운 상호작용을 구현해나갈 계획이다.

김병학 카카오 카나나 성과리더는 "카나나 모델은 복합적인 정보를 통합적으로 처리해 텍스트 중심 AI에서 사람처럼 보고, 듣고, 말하며 공감하는 AI로 진화하고 있다"며 "독자 기술 기반의 멀티모달 역량을 통해 인공지능 기술 경쟁력을 강화하고, 연구 결과 공유를 통해 국내 AI 생태계 발전에 기여해 나가겠다"고 밝혔다.

한편, 카카오는 지난해 자체 개발한 AI 모델 'Kanana' 라인업을 공개했으며, 테크블로그를 통해 언어모델, 멀티모달 모델, 비주얼 생성모델 등의 성능과 개발기를 지속적으로 소개해왔다. 올해 2월에는 'Kanana Nano 2.1B'를 깃허브에 오픈소스로 배포하고, 연구 성과를 아카이브(arXiv)에 공개한 바 있다.

dconnect@newspim.com

[뉴스핌 베스트 기사]

사진
김주애, 아빠 따라 첫 외교무대 데뷔 [서울=뉴스핌] 이영종 통일전문기자 = 김정은 북한 국무위원장의 딸 주애(12)가 중국 방문길에 동행한 것으로 확인됐다. 북한 관영 조선중앙통신은 2일 밤 김정은의 베이징역 도착 소식을 전하면서 3장의 사진을 공개했다. [서울=뉴스핌] 이영종 통일전문기자 = 김정은 북한 국무위원장이 2일 오후 전용열차 편으로 베이징역에 도착해 중국 측 인사들의 환영을 받고 있다. 김정은 뒤편으로 딸 주애(붉은 원)와 최선희 외무상이 보인다. 김주애가 해외 방문에 나선 건 이번이 처음이다. [사진=조선중앙통신] 2025.09.02 yjlee@newspim.com 여기에는 환영나온 왕이 외교부장 등 중국 측 인사와 만나는 김정은 바로 뒤에 서있는 딸 주애가 드러난다. 김주애가 해외 방문에 나선 건 지난 2022년 11월 공개석상에 등장한 이후 처음이다. 김주애는 검은색 바지 정장 차림으로 김정은을 따라 전용열차에서 내렸고, 그 뒤는 최선희 외무상이 따랐다. 그러나 붉은 카페트를 걸어가는 의전행사에는 빠져 공식 수행원에 명단을 올리지는 않을 것으로 보인다. 김주애가 중국 전승절(3일) 행사참석을 위해 방중한 김정을을 수행함으로써 그의 후계자 지명 관측에는 더 힘이 실릴 것으로 보인다.  또 시진핑 국가주석 등 중국 지도부와 김정은이 만나는 자리에 주애가 동행할 가능성이 높다는 점에서 '알현 행사' 성격을 띠게 될 것이란 관측도 나온다. yjlee@newspim.com 2025-09-02 22:00
기사 번역
결과물 출력을 준비하고 있어요.
기사제목
기사가 번역된 내용입니다.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동