전체기사 최신뉴스 GAM
KYD 디데이
산업 전기·전자

속보

더보기

[Tech 스토리] "사람처럼 사진을 본다"...LG '캡셔닝 AI' 기술

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

처음 접한 이미지도 자연어로 설명
자료 처리 및 영상 학습 등 다양한 분야 활용 기대

기업들의 신기술 개발은 지속가능한 경영의 핵심입니다. 이 순간에도 수많은 기업들은 신기술 개발에 여념이 없습니다. 기술 진화는 결국 인간 삶을 바꿀 혁신적인 제품 탄생을 의미합니다. 기술을 알면 우리 일상의 미래를 점쳐볼 수 있습니다. 각종 미디어에 등장하지만 독자들에게 아직은 낯선 기술 용어들. 그래서 뉴스핌에서는 'Tech 스토리'라는 고정 꼭지를 만들었습니다. 산업부 기자들이 매주 일요일마다 기업들의 '힙(hip)' 한 기술 이야기를 술술~ 풀어 독자들에게 전달합니다.

[서울=뉴스핌] 이지용 기자 = "아이가 그물로 물고기를 잡으려고 하고 있네요".

이제 인공지능(AI)이 텍스트뿐만 아니라 사진과 그림 등의 이미지까지 스스로 설명할 수 있는 시대가 왔습니다. AI는 처음 접하는 이미지도 사람처럼 이해하고 설명할 수 있습니다.

이미지 상의 다양한 요소와 특징을 인식해 설명 글과 키워드를 생성하는 캡셔닝 AI. [사진=LG]

LG가 최근 세계 최대 컴퓨터 비전학회 'CVPR 2023'에서 생성형 AI 상용화 서비스인 '캡셔닝 AI'를 선보였습니다. 이 캡셔닝 AI는 처음 보는 이미지를 자연어로 설명할 수 있는 AI로 이미지와 텍스트를 기반으로 배경과 인물, 행동 등 이미지의 다양한 요소를 인식해 설명하는 기술입니다. 어떤 이미지든 입력만 하면 그 이미지에 어떤 의미가 담겨 있는지, 어떤 상황이 일어나고 있는지 파악할 수 있는 것입니다.

LG는 캡셔닝 AI에 '제로샷 이미지 캡셔닝' 기술을 활용했습니다. 제로샷(Zero-shot)은 말 그대로 '추가적인 데이터가 없다'는 뜻을 가지고 있습니다. 제로샷은 사람의 시각 인지 능력처럼 기존의 메타데이터를 기반으로 스스로 이해하고 유추한 결과를 텍스트로 이끌어내는 것입니다.

초거대 AI의 이미지 캡셔닝 과정. [사진=LG]

예를 들어, '껍질 깐 바나나', '얇게 자른 바나나', '변색된 바나나', '바다에서 서핑하는 사람'이라는 기존 이미지가 있다면 이들을 비슷한 형태의 이미지끼리 분류해 이미지 코드북이라는 데이터 모음집에 넣습니다. 동시에 '바나나'와 '껍질', '사람', '서핑' 등의 텍스트는 다시 별도의 텍스트 코드북에 포함시킵니다. 이 때 각각의 텍스트를 'Code 22', 'Code 23' 등으로 숫자를 붙여 코드화합니다. 이를 AI 사전 학습 단계라고 부릅니다.

그 후 사용자가 '바다에서 바나나보드로 서핑하는 사람'의 의미지를 입력하면 캡셔닝 AI가 각각의 이미지·텍스트 코드북에서 '바나나'와 '사람'이라는 이미지의 특성과 텍스트(코드)를 연결시켜 이미지 설명을 담은 캡션을 생성합니다.

앞으로 이 캡셔닝 AI는 다양한 분야에서 활용될 전망입니다. LG는 캡셔닝 AI를 통해 평균 문장 5개와 키워드 10개를 10초 안에 생성할 수 있도록 했습니다. 이미지 범위를 1만 장으로 넓히면 2일 이내에 이미지 캡셔닝 작업을 끝낼 수 있을 정도로 빠릅니다. 많은 기업들은 캡셔닝 AI를 활용해 이미지 관련 처리 효율성 및 생산성을 높일 수 있을 것입니다.

교육 분야에서는 영상 학습을 요약해 학생들이 어려운 교과 내용을 쉽게 이해할 수 있도록 도울 수 있습니다. 

캡셔닝 AI가 시각장애인들에게는 눈 앞의 보도 상황을 음성화한 '길 안내 서비스'가 될 수 있습니다. 이와 함께 자율주행자동차 주행 시, 도로 위의 물체가 사람인지, 동물인지 판단해 자율주행 사고 발생률을 크게 줄일 수 있을 것이라는 전망도 나오고 있습니다. 캡셔닝 AI로 우리 삶의 모습이 크게 바뀔 수 있는 것입니다.

김승환 LG AI 연구원 비전랩장은 "생성형 AI뿐 아니라 인간 수준으로 환경까지 인식하는 AI로 퀀텀 점프할 수 있는 가능성을 확인했다"고 말했습니다. 이어 "영상 이해의 핵심 기술이자 기반 기술인 이미지 캡셔닝에 대해 전 세계 AI 연구자들과 함께 논의해 기술 개발에 총력을 다할 것"이라고 강조했습니다.

 

leeiy5222@newspim.com

[뉴스핌 베스트 기사]

사진
靑, 김승룡 소방청장 감찰 착수 [서울=뉴스핌] 김미경 기자 = 이재명 대통령이 22일 김승룡 소방청장에 대한 즉각적인 진상 확인을 지시해 감찰에 착수했다고 청와대가 밝혔다. 강유정 청와대 수석대변인은 이날 저녁 언론 공지를 통해 이같이 밝혔으며 현재로선 개인 비위로 인한 사유로 전해졌다. [남양주=뉴스핌] 김현우 기자 = 김승룡 소방청장 직무대행이 24일 오후 경기도 남양주 수도권119특수구조대에서 열린 현대자동차그룹-소방청 무인소방로봇 기증식에서 인사말을 하고 있다. 2026.02.24 khwphoto@newspim.com 김 청장은 허석곤 전 청장이 12·3 비상계엄 가담 의혹으로 직위 해제된 지난해 9월부터 소방청장 직무대행을 맡아왔다. 올해 3월 새 청장에 정식 임명됐다. 청와대는 어떤 사유로 김 청장에 대한 감찰에 착수했는지에 대해서는 공개하지 않았다.  일각에서는 업무 추진비와 갑질 의혹이 거론되고 있다. 관용차를 이용하는 과정에서 규정에 어긋난 부적절한 행동을 한 것 아니냐는 얘기도 흘러나온다. 청와대는 감찰 사유에 대해 '개인 비위'라고 설명했지만 구체적인 내용에 대해서는 공개하지 않고 있다. the13ook@newspim.com 2026-05-22 22:45
사진
대전 허태정 51.4% 이장우 37.0% [서울=뉴스핌] 박서영 기자 = 6·3 지방선거 대전시장 선거에 출마한 집권 여당인 더불어민주당 허태정 후보가 제1야당인 국민의힘 이장우 후보를 14.4%p(포인트)차로 크게 앞서는 것으로 나타났다.  종합뉴스통신사 뉴스핌이 리얼미터에 의뢰해 지난 19~20일 대전 18살 이상 남녀 802명을 대상으로 실시한 여론조사 후보 지지도 조사에서 22일 이같은 결과가 나왔다.   ◆ 허태정 51.4% vs 이장우 37.0%...오차범위 밖 14.4%p 대전시장 후보자 지지도 조사에서 허 후보는 51.4%로 과반을 넘었다. 이 후보 37.0%, 강희린 개혁신당 후보 2.5% 순이다. '없음' 응답자는 3.8%, '잘 모름'은 5.4%로 유보층은 9.2%다. 지역별로 살펴보면 허 후보가 이 후보를 5개 선거구에서 모두 앞섰다. 동구 허 후보 57.3%·이 후보 33.4%, 중구 허 후보 57.8%·이 후보 34.3%, 서구 허 후보 48.2%·이 후보 37.6%, 유성구 허 후보 44.8%·이 후보 42.0%, 대덕구 허 후보 57.8%·이 후보 32.9%다. 연령별로는 70살 이상을 뺀 모든 연령대에서 허 후보가 우위를 보였다. 특히 허 후보는 40대·50대·60대에서 큰 격차로 이 후보를 앞섰다. 18~29살 허 후보 45.7%·이 후보 31.8%, 30대 허 후보 42.9%·이 후보 40.1%, 40대 허 후보  58.0%·이 후보 28.6%, 50대 허 후보 63.6%·이 후보 32.0%, 60대 허 후보 52.5%·이 후보 43.5%, 70살 이상 허 후보 42.5%·이 후보 48.6%였다. 성별로는 남성 허 후보 48.4%·이 후보 40.7%, 여성 허 후보 54.4%·이 후보 33.3%로 모두 허 후보가 높은 지지율을 보였다. 지지 정당별로는 민주당 지지층 허 후보 89.3%·이 후보 5.5%, 국민의힘 지지층 허 후보 6.5%이 후보  90.9%였다. 조국혁신당 지지층에서는 허 후보 58.9%·이 후보 21.8%, 진보당 지지층 허 후보 50.6%·이 후보 30.0%, 개혁신당 지지층 허 후보 30.2%·이 후보 28.3%, 강 후보 28.4%였다. 적극 투표층은 허 후보 58.2%로 이 후보 36.7%를 크게 앞질렀다. ◆ 지방선거 '투표할 것' 85.9%... 적극 투표층 67.2%로 선거 '고관여 양상' 이번 지방선거 투표 의향과 관련해 대전시민 85.9%가 '투표하겠다'고 했다. '반드시 투표' 67.2%, '가급적 투표' 18.7%였다. 반면 '별로 투표할 생각 없음' 3.7%, '전혀 투표할 생각 없음' 9.6%였다. 권역별 투표 의향은 동구 83.5%, 중구 82.8%, 서구 88.3%, 유성구 84.5%, 대덕구 90.0%였다. 모든 권역에서 고르게 투표 의향층은 80%를 넘었다. 연령별로는 60대가 95.4%로 가장 높았다. 이어 70살 이상은 91.6%, 50대 90.4%, 40대 89.5% 순이었다. 30대 79.3%, 18~29살 69.3%였다. 이번 여론조사는 휴대전화 가상(안심)번호를 무작위로 추출해 자동응답조사(ARS) 방식으로 진행됐다. 표본오차는 95% 신뢰수준에 ±3.5%p, 응답률은 8.2%다. 2026년 4월 말 행정안전부 주민등록 인구를 기준으로 성별, 연령별, 지역별 가중치(림 가중)를 적용했다. 자세한 사항은 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. seo00@newspim.com 2026-05-22 05:00
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동