전체기사 최신뉴스 GAM 라씨로
KYD 디데이
산업 생활경제

속보

더보기

[김정호의 4차혁명 오딧세이] 인공지능은 강아지와 고양이를 어떻게 구분할까?

기사입력 : 2019년01월14일 07:55

최종수정 : 2019년01월14일 08:04

알고보면 흥미로운 선형대수(linear algebra. 線型代數)

보통 고등학교 때 처음 수학 ‘행렬’을 배운다. 행렬은 다차원적인 숫자의 나열로 2차원인 경우 '(x,y)'로 표현된다. 대부분의 고등학교 수학처럼 왜 배워야 하는지, 어디 쓰는지 그때 알기 어렵다. 그런데 이 행렬 수학이 ‘인공지능 컴퓨터 계산’의 핵심 방법이다.

김정호 카이스트 교수

필자는 대학 2학년때 ‘선형 대수학’이라는 수학과목을 수강했다. 행렬의 수학적 의미와 원리를 배운다. 이 과목은 필자가 대학 때 공부한 과목 중에 가장 감동적이고 재미가 있었다. 수학 논리 전개의 아름다움을 깊이 느끼는 계기가 됐기 때문이다. 전기공학이나, 전자 공학, 전산 과목 또는 물리학 과목이 아니라 ‘수학과목’이었던 기억이 흥미롭고 그 중에서도 선형대수학이라는 과목이라는 점도 지금도 신기하다.

선형대수학에서는 벡터에서 출발해서 행렬의 정의하고 행렬의 기본이 되는 원리들을 순서대로 제시하고 증명한다. 행렬 속의 각 열 벡터가 서로 상호 의존적인가 독립적인가 논의한다. 서로 선형적이면 종속적이고 비선형적이면 독립적이다. 각 열 벡터가 독립적 벡터로 이루어진 행렬은 역행렬이 존재하고 구할 수 있다. 역행렬이 존재하는 행렬은 그 벡터들을 더하고 곱해서 변형하면 대각행렬(Diagonal Matrix, 대각선 부분 숫자만 있고 나머지는 모두 ‘0’인 행렬)가 될 수 있다.

선형대수 과목에서는 이러한 이론들을 처음부터 끝까지 200 여 페이지 책에서 순서대로 빈틈없이 증명한다. 처음부터 끝까지 한 개의 논리적 오점 없이 전체를 증명하고 전개해 간다. 이러한 논리의 완결성이 눈부시기까지 하다. 완벽하게 논리적이다.

행렬의 구성과 곱셈 공식. [출처: 정보통신 기술용어해설]
대각행렬의 구성과 조건. [출처: 정보통신 기술용어해설]

 

강아지와 고양이를 구분하게 해주는 'CNN 알고리즘'


요즈음 행렬 계산이 공학적으로 더욱 중요해 지고 있다. 모든 빅데이터가 디지털로 기록되기 때문이다.

그 중에서도 데이터의 깊이가 크고 정보량이 많은 데이터가 영상 이미지이다. 카메라에서 얻은 이미지는 카메라 센서가 2차원 평면 배열로 되어 있다. 이 배열 자체가 (x,y) 2차원이다. 여기에 색깔 정보, 밝기 정보, 빛의 세기 정보가 더해지면 N 차원 정보가 되고 이를 수학적으로 표시하면 N 차원 행렬이 된다. 그래서 유튜브의 사용이 더욱 확대되면 행렬 계산양도 늘어난다.

인공지능 딥러닝 알고리즘 중에서 영상 이미지 판독에 가장 유효하게 쓰이는 방법이 CNN(Convolution Neural Network) 이라는 알고리즘이다. CNN 에는 여러 개의 신경망 층으로 이루어져 있다. 쉽게 이야기해서 CNN 입력으로 사진이 들어가면 CNN이 강아지인지, 고양이 인지, 곰인지, 사슴인지 찾아 낸다.

그런데 이 CNN 에서 여러 개의 신경망 층(Layer)을 지나면서 각 층의 출력이 단순화되고 추상화 되어 나간다. 이러한 과정을 거치면서 입력이 수천 다차원 행렬이라 하더라도 최종 출력은 ‘동물의 이름’이 되기 때문이다. 이렇게 크기가 큰 행렬을 줄여나가는 과정을 수학적으로 함수 합성곱(Convolution) 이라고 한다. 이 과정은 수식적으로 볼 때 크기가 큰 행렬에 작은 크기의 행렬을 계속 곱해서 얻는다.

이 곱하는 작은 행렬을 필터 행렬이라고 한다. 이렇게 되면 각 신경망 층이 추상화(Abstraction) 과정을 하게 된다. 첫 층의 입력이 사진이라면 2층은 윤곽을 표현하고, 3층은 코, 입, 귀를 판단하고, 뒷 부분 층은 남녀 인종 등을 파악하고 최종적으로 누구인지 파악하는 과정을 거친다. 이처럼 CNN 에서도 학습과정에서 계속해서 행렬 연산이 이루어져 있다.

사진과 영상 분석에 유용한 인공지능 알고리즘인 CNN의 구성도. [출처: Intel]

행렬과 텐서

그러니 인공지능을 위한 프로그램을 만들기 위해 소프트웨어 코딩을 한다는 것은 수많은 행렬연산을 계획된 순서대로 짜는 것과 같다. 특히 인공지능의 학습과정과 ‘판단(Decision)’ 혹은 ‘추론(Inference)’을 내릴 때 수 많은 행렬 연산을 한다. 그래서 인공지능을 연구하고 개발한다는 의미는 행렬 연산에 묻혀 사는 것과 같다.

이처럼 다차원 행렬을 수학에서 텐서(Tensor)라고 부른다. 그러므로 스칼라(Scalar)는 ‘0 텐서’, 벡터(Vector)는 ‘1 텐서’, 행렬은 ‘2 텐서’라고 부르기도 한다. 구글에서 제공하는 인공지능 계산 플랫폼을 텐서 플로우(Tensor Flow) 라고 부르는 것이 이런 배경이 된다. 인공지능에서 다 차원 행렬인 텐서 계산이 딥러닝 층을 지나가면서 쭉 흘러간다. 이 수학적인 과정이 학습과 판단 과정이다.

재미있는 드라마에는 ‘암시’를 주고 되살아나는 과정이 있으며, 이 과정이 드라마의 재미를 더해 준다. 암시는 장면, 만남, 표정, 대사에서 다양하게 나타난다. 특히 드라마 초반에 나타나 미래 전개 과정을 암시한다. 필자가 대학 2학년 때 선형대수 과목에 푹 빠졌던 것은 40년 후 다가올 4차 산업혁명 시대와 인공지능 시대를 암시했는지도 모른다.

구글의 오픈소스 인공지능 플랫폼 텐서 플로우, [출처: Data Flair]

 

 

joungho@kaist.ac.kr


[김정호 카이스트 전기 및 전자공학과 교수]

CES 2025 참관단 모집

[뉴스핌 베스트 기사]

사진
모델 문가비 아들 친부는 정우성 [서울=뉴스핌] 양진영 기자 = 모델 문가비(35)가 출산한 아들의 친부가 배우 정우성(51)인 것으로 드러났다. 정우성 소속사 아티스트컴퍼니는 24일 "문가비가 소셜미디어를 통해 공개한 아이는 정우성의 친자가 맞다"며 "아이의 양육 방식에 대해서 최선의 방향으로 논의 중이다. 아버지로서 아이에 대해 끝까지 책임을 다할 것"이라고 밝혔다. 다만 "출산 시점과 두 사람의 교제 여부, 결혼 계획 등 사생활 관련 내용은 확인해 줄 수 없다"고 알렸다. 배우 정우성 [사진=에이스메이커무비웍스] 앞서 두 사람 사이의 득남 소식이 알려졌다. 두 사람은 2022년 한 모임에서의 만남 가까이 지냈으나 교제한 사이는 아니었고 결혼 계획도 없는 것으로 전해졌다. 작년 6월 문가비가 임신 사실을 알렸고 정우성은 양육의 책임을 약속했다고 한다. 문가비는 뷰티 예능 프로그램 '겟잇뷰티' 등으로 얼굴을 알린 한동안 활동을 중단했다가 지난 22일 인스타그램을 통해 아들 출산 사실을 고백했다. 그러나 결혼 여부나 아이 아버지에 관한 언급은 없어 궁금증을 샀다. 당시 문가비는 "너무 갑작스럽게 찾아온 소식에 아무 준비가 돼 있지 않았던 저는 임신의 기쁨이나 축하를 마음껏 누리기보다는 가족들의 축복 속에 조용히 임신 기간 대부분을 보냈다"며 "그렇게 하기로 선택한 건 오로지 태어날 아이를 위함이었다. 마음 한편에 늘 소중한 무언가를 지키기 위해서는 꽁꽁 숨겨야 한다고 생각했다"고 했다. [사진=문가비 인스타그램] 이어 "세상에 나온 아이를 앞에 두고 여전히 완벽한 준비가 되지 않은 엄마지만 그런 내 부족함과는 상관없이 존재 자체만으로 나의 마음을 사랑으로 채워주는 아이를 보며, 완벽함보다는 사랑과 행복으로 가득 찬 건강한 엄마가 돼야겠다고 다짐했다"며 "그러기 위해서는 용기를 내야 한다고 생각했다"고 말했다. 문가비는 1989년생으로 2017년 온스타일 예능 '매력티비'와 '겟잇뷰티'로 얼굴을 알렸다. 이후 SBS '정글의 법칙'과 KBS '볼빨간 당신' 등 각종 예능에 출연했다. 여러 광고와 헤라서울패션위크 등 패션쇼 무대에도 섰다. jyyang@newspim.com 2024-11-25 09:48
사진
이재명 '위증교사' 1심 김동현 판사 누구 [서울=뉴스핌] 배정원 기자 = 이재명 더불어민주당 대표의 위증교사 혐의 1심 선고를 맡은 서울중앙지법 형사합의33부 재판장에 대한 관심이 집중되고 있다. 서울중앙지법 형사합의33부(김동현 부장판사)는 25일 오후 2시 위증교사 혐의로 기소된 이 대표의 1심 선고공판을 진행한다.  전라남도 장성 출신의 김동현 부장판사는 고려대학교 법학과를 졸업하고 2001년 사법연수원을 30기로 수료했다. 김 부장판사는 2004년 광주지법 판사를 시작으로 인천지법, 서울동부지법, 서울고법 등을 거쳐 지난해부터 선거·부패 사건을 전담하는 서울중앙지법 형사합의33부 부장판사로 재직하고 있다. [서울=뉴스핌] 이형석 기자 = 이재명 더불어민주당 대표가 25일 오전 서울 여의도 국회에서 열린 최고위원회의에 자리하고 있다. 2024.11.25 leehs@newspim.com 김 부장판사는 이 대표의 위증교사 사건 외에도 '대장동·위례신도시·성남FC·백현동 의혹' 사건을 함께 심리하고 있는데, 해당 사건은 기록의 양이 방대하고 쟁점이 복잡해 1심 선고를 하기까지 몇 년이 더 걸릴 수 있다는 전망이 나온다. 당초 이 대표 측은 두 사건을 분리해서 진행할 경우 방어권 보장에 어려움을 겪게 된다며 병합 심리를 요구했으나, 김 부장판사는 두 사건을 병합하지 않고 별도로 진행하기로 결정했다. 또 김 부장판사는 이른바 '가짜 수산업자'에게 금품을 받은 혐의로 기소된 박영수 전 특별검사(특검)의 1심 사건을 맡으며 징역 4개월에 집행유예 1년을 선고하기도 했다. 당시 김 부장판사는 "이 사건 범행으로 공직자의 공정한 직무수행과 공공기관에 대한 국민의 신뢰가 크게 훼손됐다"며 "특히 박영수 피고인은 국정농단 규명을 위해 임명된 특별검사로 어느 공직자보다 공정성과 청렴성에서 모범을 보여야함에도 금품을 수수했다"고 질책했다. 박 전 특검 등에게 금품을 제공한 혐의로 기소된 가짜 수산업자 김모 씨에 대해서는 "다수의 공직자에게 긴 시간 금품을 제공한 점, 이종범죄로 처벌받은 전력이 있는 점 등을 고려했다"며 징역 6개월의 실형을 선고했다. 또 김 부장판사는 이명박 정부 시절 이른바 '스파르타팀'을 꾸려 정부에 우호적인 방향으로 온라인 여론을 조작한 혐의 등으로 기소된 전직 청와대 비서관들에게도 징역형 집행유예를 선고한 바 있다.  이런 가운데, 위증교사 혐의는 이 대표의 형사 사건 중 가장 불리한 판결이 나올 가능성이 높은 사건으로 꼽히고 있다. 검찰에 따르면 최근 6년간 유죄가 확정된 위증교사 사범 195명 중 실형(69명)이나 징역형 집행유예(114명)가 선고된 사례는 94.8%에 이르며 벌금형(12명) 선고 비율은 6.2%에 그쳤다. 이 대표가 만약 위증교사 혐의로 대법원에서 금고 이상의 형(집행유예 포함)을 확정받으면 공직선거법 제19조에 따라 피선거권이 박탈돼 형이 실효될 때까지 선거에 출마할 수 없게 된다.  jeongwon1026@newspim.com 2024-11-25 11:19
안다쇼핑
Top으로 이동