전체기사 최신뉴스 GAM
KYD 디데이
산업 전기·전자

속보

더보기

[Tech 스토리] "사람처럼 사진을 본다"...LG '캡셔닝 AI' 기술

기사입력 : 2023년06월25일 07:17

최종수정 : 2023년06월25일 07:17

처음 접한 이미지도 자연어로 설명
자료 처리 및 영상 학습 등 다양한 분야 활용 기대

기업들의 신기술 개발은 지속가능한 경영의 핵심입니다. 이 순간에도 수많은 기업들은 신기술 개발에 여념이 없습니다. 기술 진화는 결국 인간 삶을 바꿀 혁신적인 제품 탄생을 의미합니다. 기술을 알면 우리 일상의 미래를 점쳐볼 수 있습니다. 각종 미디어에 등장하지만 독자들에게 아직은 낯선 기술 용어들. 그래서 뉴스핌에서는 'Tech 스토리'라는 고정 꼭지를 만들었습니다. 산업부 기자들이 매주 일요일마다 기업들의 '힙(hip)' 한 기술 이야기를 술술~ 풀어 독자들에게 전달합니다.

[서울=뉴스핌] 이지용 기자 = "아이가 그물로 물고기를 잡으려고 하고 있네요".

이제 인공지능(AI)이 텍스트뿐만 아니라 사진과 그림 등의 이미지까지 스스로 설명할 수 있는 시대가 왔습니다. AI는 처음 접하는 이미지도 사람처럼 이해하고 설명할 수 있습니다.

이미지 상의 다양한 요소와 특징을 인식해 설명 글과 키워드를 생성하는 캡셔닝 AI. [사진=LG]

LG가 최근 세계 최대 컴퓨터 비전학회 'CVPR 2023'에서 생성형 AI 상용화 서비스인 '캡셔닝 AI'를 선보였습니다. 이 캡셔닝 AI는 처음 보는 이미지를 자연어로 설명할 수 있는 AI로 이미지와 텍스트를 기반으로 배경과 인물, 행동 등 이미지의 다양한 요소를 인식해 설명하는 기술입니다. 어떤 이미지든 입력만 하면 그 이미지에 어떤 의미가 담겨 있는지, 어떤 상황이 일어나고 있는지 파악할 수 있는 것입니다.

LG는 캡셔닝 AI에 '제로샷 이미지 캡셔닝' 기술을 활용했습니다. 제로샷(Zero-shot)은 말 그대로 '추가적인 데이터가 없다'는 뜻을 가지고 있습니다. 제로샷은 사람의 시각 인지 능력처럼 기존의 메타데이터를 기반으로 스스로 이해하고 유추한 결과를 텍스트로 이끌어내는 것입니다.

초거대 AI의 이미지 캡셔닝 과정. [사진=LG]

예를 들어, '껍질 깐 바나나', '얇게 자른 바나나', '변색된 바나나', '바다에서 서핑하는 사람'이라는 기존 이미지가 있다면 이들을 비슷한 형태의 이미지끼리 분류해 이미지 코드북이라는 데이터 모음집에 넣습니다. 동시에 '바나나'와 '껍질', '사람', '서핑' 등의 텍스트는 다시 별도의 텍스트 코드북에 포함시킵니다. 이 때 각각의 텍스트를 'Code 22', 'Code 23' 등으로 숫자를 붙여 코드화합니다. 이를 AI 사전 학습 단계라고 부릅니다.

그 후 사용자가 '바다에서 바나나보드로 서핑하는 사람'의 의미지를 입력하면 캡셔닝 AI가 각각의 이미지·텍스트 코드북에서 '바나나'와 '사람'이라는 이미지의 특성과 텍스트(코드)를 연결시켜 이미지 설명을 담은 캡션을 생성합니다.

앞으로 이 캡셔닝 AI는 다양한 분야에서 활용될 전망입니다. LG는 캡셔닝 AI를 통해 평균 문장 5개와 키워드 10개를 10초 안에 생성할 수 있도록 했습니다. 이미지 범위를 1만 장으로 넓히면 2일 이내에 이미지 캡셔닝 작업을 끝낼 수 있을 정도로 빠릅니다. 많은 기업들은 캡셔닝 AI를 활용해 이미지 관련 처리 효율성 및 생산성을 높일 수 있을 것입니다.

교육 분야에서는 영상 학습을 요약해 학생들이 어려운 교과 내용을 쉽게 이해할 수 있도록 도울 수 있습니다. 

캡셔닝 AI가 시각장애인들에게는 눈 앞의 보도 상황을 음성화한 '길 안내 서비스'가 될 수 있습니다. 이와 함께 자율주행자동차 주행 시, 도로 위의 물체가 사람인지, 동물인지 판단해 자율주행 사고 발생률을 크게 줄일 수 있을 것이라는 전망도 나오고 있습니다. 캡셔닝 AI로 우리 삶의 모습이 크게 바뀔 수 있는 것입니다.

김승환 LG AI 연구원 비전랩장은 "생성형 AI뿐 아니라 인간 수준으로 환경까지 인식하는 AI로 퀀텀 점프할 수 있는 가능성을 확인했다"고 말했습니다. 이어 "영상 이해의 핵심 기술이자 기반 기술인 이미지 캡셔닝에 대해 전 세계 AI 연구자들과 함께 논의해 기술 개발에 총력을 다할 것"이라고 강조했습니다.

 

leeiy5222@newspim.com

[뉴스핌 베스트 기사]

사진
李대통령, 오광수 민정수석 사의 수용 [서울=뉴스핌] 이영태 선임기자 = 이재명 대통령은 13일 전날 밤 사의를 표명한 오광수 대통령실 민정수석비서관의 사의를 수용했다. 강유정 대통령실 대변인은 이날 오전 브리핑에서 "오광수 민정수석이 어젯밤 이재명 대통령께 사의를 표했다"며 이같이 말했다. 오광수 대통령실 민정수석비서관 [사진=대통령실] 강 대변인은 "이 대통령은 공직기강 확립과 인사 검증을 담당하는 민정수석의 중요성을 두루 감안해 오 수석의 사의를 받아들였다"고 전했다. 이어 "대통령실은 이재명 대통령의 사법개혁 의지와 국정 철학을 깊이 이해하고 이에 발맞춰 가는 인사로 조속한 시일 내에 차기 민정수석을 임명할 예정"이라고 부연했다. 대통령실 관계자는 차명 부동산과 차명 계좌 의혹으로 오 수석이 물러난 만큼 차기 민정수석 검증 기준에 청렴함 등이 포함될 것이야는 질문에 "일단 저희가 가지고 있는 국정철학을 가장 잘 이해하고 이를 시행할 수 있는 분이 가장 우선적인 이재명 정부의 인사검증 원칙이라고 할 수 있겠다"며 "새 정부에 대한 국민들의 기대감이 워낙 크기 때문에 그 기대에 부응하는 게 첫 번째 사명"이라고 답했다. 이 관계자는 오 수석 건을 계기로 인사 검증 기준이라 원칙이 마련될 수 있느냐는 질의에는 "이 대통령이 여러 번 표방했던 것처럼 우리 정부에 대한 기대감, 그리고 실용적이면서 능력 위주의 인사가 첫 번째 가장 먼저 포방될 원칙"이라며 "그리고 여러 가지 우리 국민들이 요청하고 있는 바에 대한 다방면적인 검토는 있을 예정"이라고 언급했다. medialyt@newspim.com 2025-06-13 09:43
사진
조은석 내란특검 "사초 쓰는 자세로" [서울=뉴스핌] 김현구 기자 = 이른바 '3대 특검(특별검사)' 중 내란 특검을 맡게 된 조은석(60·사법연수원 19기) 전 감사원장 권한대행이 13일 "수사에 진력해 온 경찰 국가수사본부, 고위공직자범죄수사처, 검찰의 노고가 헛되지 않도록 최선을 다해 사초를 쓰는 자세로 세심하게 살펴 가며 오로지 수사 논리에 따라 특검직을 수행하겠다"고 밝혔다. 조 특검은 이날 "수사팀 구성과 업무공간이 준비되면 설명해 드릴 기회를 갖도록 할 것"이라며 이같이 전했다. 조 특검은 현재 퇴직 후 별도 근무 중인 변호사 사무실이 없고 재택근무 중이다. 조은석 내란 특별검사. [사진=뉴스핌DB] 전남 장성 출신인 조 특검은 광주 광덕고와 고려대 법학과를 졸업한 뒤 1993년 수원지검 성남지청에서 검사 생활을 시작했다. 그는 대검찰청 중앙수사부 검찰연구관, 대검 공판송무과장, 대검 범죄정보1·2담당관, 서울중앙지검 형사3부장검사, 서울북부지검 차장검사, 광주지검 순천지청장, 서울고검 형사부장 등을 거쳤다. 이후 2014년 대검 형사부장 시절 세월호 참사 검경 합동 수사를 지휘했고, 청주지검장, 사법연수원 부원장을 지낸 뒤 문재인정부에서 서울고검장과 법무연수원장을 역임한 뒤 검찰을 떠났다. 2011~2025년 감사원 감사위원을 지낸 조 특검은 임기 중 전현희 전 국민권익위원회 위원장에 대한 감사가 '표적 감사'라며 제동을 거는 등 윤석열정부와 대립하기도 했다. 한편 이재명 대통령은 전날 저녁 내란 특검에 조 특검, 김건희 특검에 민중기 전 서울중앙지법원장, 채해병 특검에 이명현 전 국방부 검찰단 고등검찰부장을 각각 지명했다. 조 특검과 민 특검은 더불어민주당 추천, 이 특검은 조국혁신당 추천이다. 각 특검은 최장 20일간 준비기간을 거치게 되며, 내달 초 본격적인 수사가 이뤄질 것으로 예상된다. 내란 특검은 최대 60명, 김건희 특검은 40명, 채해병 특검은 20명의 검사를 파견받을 예정이다. hyun9@newspim.com 2025-06-13 07:42
안다쇼핑
Top으로 이동