전체기사 최신뉴스 GAM
KYD 디데이
글로벌·중국 미국·북미

속보

더보기

AI 최강자 등극 구글 '제미나이', GPT-4와 비교해 보니

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

[서울=뉴스핌] 최원진 기자= 구글이 오픈AI의 최신 생성형 인공지능(AI) 거대언어모델(LLM) 'GPT-4'를 능가하는 자체 모델 '제미나이(Gemini) 1.0'을 6일(현지시간) 공개해 화제다.

지난해 11월 챗GPT로 생성형 AI의 미래를 제시한 오픈AI가 기술 최강 자리를 굳건히 지킬 것이란 예상이 GPT-4 출시 후 불과 약 9개월 만에 깨진 것이다. 구글 제미나이가 AI 업계의 치열한 개발 경쟁에 다시 한번 불을 지폈다.

◆ 제미나이의 강점은 '멀티 플레이어'

제미나이는 3가지 버전으로 나온다. 구글이 지금까지 내놓은 것 중 가장 강력한 LLM이자 데이터센터와 기업용 모델인 '제미나이 울트라', 구글의 AI 챗봇 '바드'의 모델인 '제미나이 프로', 스마트폰 등 모바일 기기에서 사용 가능한 컴팩트한 사이즈의 '나노'다.

제미나이 프로는 제품 공개한 이날 바로 바드에 탑재됐다. 제미나이 프로가 적용된 바드는 170개 이상 국가 및 지역에서 영어로 제공되며, 향후 서비스 확장 및 새로운 지역과 언어도 지원될 예정이다. 

'제미나이 울트라'는 내년 초 '바드 어드밴스드'라는 이름으로 바드에 장착되며, '제미나이 나노'는 구글이 지난 10월 공개한 최신 스마트폰인 '픽셀8 프로'에 탑재된다.

구글은 제미나이가 "선천적"(natively)으로 멀티모달(Multi-Modal·다중모드) AI 모델이라고 소개한다. 멀티모달은 말그대로 텍스트뿐만 아니라 이미지, 동영상 등 비언어 입력값도 이해해 응용할 수 있는 '멀티 플레이어'다.

오픈AI가 이미지 생성 AI '달리'(DALL-E), 음성 인식 AI '위스퍼'(Whisper)를 각각 개발한 방식과 달리 구글은 애초부터 텍스트·이미지·오디오 등 다양한 데이터로 제미나이를 훈련해왔다는 것이다.

제미나이가 학생의 물리학 문제를 풀이해주는 예시. [사진=구글 딥마인드 제공]

특히 제미나이는 이미지와 동영상을 이해한 데이터를 응용하고 상호 작용하는 데 강점을 보인다.

예컨대 한 학생이 물리학 문제를 풀이하는 과정을 펜으로 쓴 이미지를 교사가 제미나이 프롬프트에 넣어 문제 풀이 과정에 어떤 부분이 틀렸는지 질문하면 제미나이는 정확히 문제의 정답과 학생의 손 글씨를 이해해 잘못된 문제 풀이 과정을 수정해 준다.

구글 딥마인드는 "제미나이가 이미지 속 텍스트를 이해하는 것을 넘어 교사가 어떻게 문제를 다르게 설정했는지 등을 이해해야 가능하다"고 설명했다. 제미나이는 오답 풀이 뿐만 아니라 학생이 틀린 유형의 다른 연습 문제도 제공해 교육 환경에서의 활용도가 높다는 게 자체 평가다.

이 밖에 제미나이는 동영상 속 언어를 감지해 번역 자막을 달아주고, 동영상 속 상황을 이해해 질문에 답할 수 있다.

◆ 32개 벤치마크 테스트 중 30개, 최고 성적

이미지와 영상의 이해부터 수학적 추론까지 가능한 제미나이 울트라가 업계에서 LLM 연구개발 평가 시 널리 사용되는 학술 벤치마크 기준 32개 가운데 30개 항목에서 GPT-4를 뛰어넘는 성적을 기록했다.

구체적으로 제미나이 울트라는 텍스트와 추론 벤치마크 부문 12개 중 10개, 이미지 이해 부문 9개 중 9개, 동영상 이해 벤치마크 6개 중 6개, 음성 인식 부문 5개 중 5개에서 GPT-4보다 높은 신기록을 썼다.

특히 대규모 다중작업 언어 이해(MMLU) 벤치마크에서 제미나이 울트라는 90% 이상의 정답률을 기록했다.

MMLU는 수학, 물리학, 역사, 법률, 의학, 윤리 등 57개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 대표 격 LLM 벤치마크다.

구글 딥마인드는 제미나이 울트라의 MMLU 점수가 GPT-4의 86.4%를 앞선 것에서 나아가 AI 모델로는 최초로 인간 전문가 점수인 89.8%를 뛰어넘었다고 밝혔다. 

이 밖에 여러 단계의 추론을 요구하는 여러 문제 해결 능력을 평가하는 빅 벤치 하드(BIG-Bench-Hard)와 독해력 벤치마크인 DROP에서 각각 80%가 넘는 점수로 GPT-4를 능가했다. 

WMT23 벤치마크는 LLM의 번역 능력을 평가한다. 제미나이 울트라는 74.40%로 GPT-4보다 번역 능력이 우수했다.

다만 일상에 필요한 상식 추론 능력을 보는 헬라스웨그(HellaSwag) 벤치마크에서는 제미나이 울트라가 GPT-4에 못미쳤다. 

제미나이 울트라의 이미지 이해 능력은 GPT-4 보다 뛰어났다.

과학, 기술, 인문 과학, 음악 등 6개 핵심 부문 대학교 시험과 교과서에서 수집된 차트, 표, 악보 이미지를 이해하는 능력을 평가하는 다소 새로운 벤치마크인 MMMU에서 제미나이 울트라는 59.4%를 기록, GPT-4를 앞섰다.

이미지를 보고 이해해 관련 질문에 답할 수 있는 능력을 확인하는 VQAv2 벤치마크와 서류상 이미지를 이해하는 능력을 보는 DocVQA, 그래프 등을 보고 수학적 추론 능력을 보는 매스 비스타(MathVista) 벤치마크에서도 GPT-4 보다 좋은 성적을 거뒀다.

AI 모델의 동영상 이해를 평가하는 벤치마크들에서도 제미나이 울트라는 두각을 보였다. 

영상 속 상황을 텍스트로 옮기는 능력을 평가하는 VATEX 벤치마크와 영상과 관련된 질문에 답해 전반적인 영상 이해도를 평가하는 인식 테스트 MCQA 벤치마크 모두 GPT-4를 뛰어넘었다. 

이밖에 중국어 텍스트로 영상 속 상황을 옮기는 능력을 평가하는 VATEX ZH, 영어로 복잡한 요리 과정이 담긴 영상을 텍스트로 옮기는 YouCook2 등 여러 벤치마크에서도 높은 성적을 거뒀다.

제미나이 프로의 음성 인식 이해도도 우수했다. 21개 언어의 음성을 인식해 텍스트로 변환하는 능력을 평가하는 CoVoST 2 벤치마크에서 제미나이 프로는 40.1을 기록, 오픈AI의 음성 인식 AI 모델 '위스퍼' 버전 2(v2) 보다 10 이상 높았다.

62개 언어로 음성 인식 여부를 확인하는 FLEURS 벤치마크에서도 제미나이 프로는 7.6%를 기록, 위스퍼 v3 보다 월등했다. FLEURS는 AI 모델이 음성 인식 정확도를 측정하는 테스트로 점수가 낮을 수록 인식 오류가 적다는 의미다. 

이밖에 제미나이는 파이선(Python), 자바(JAVA), C++, Go 등 세계에서 널리 사용되는 프로그래밍 언어로 코드를 이해하고 생성할 수 있다. 

코딩 작업 성능을 평가하는 업계 표준인 휴먼이발(HumanEval) 벤치마크에서 제미나이 울트라는 74.4%를 기록해 GPT-4(67.0%)를 능가했다. 파이썬 코드 생성 능력을 평가하는 내추럴2코드(Natural2Code) 벤치마크에서도 GPT-4 보다 1%포인트(p) 높은 74.9%를 기록했다. 

[사진= 구글 홈페이지]

wonjc6@newspim.com

 

[뉴스핌 베스트 기사]

사진
Z폴드8 '300만원 시대' 여나 [서울=뉴스핌] 서영욱 기자 = 삼성전자 스마트폰 평균 판매가격(ASP)이 올해 1분기 전년 대비 23% 상승한 것으로 나타났다. 인공지능(AI) 반도체 수요 급증으로 모바일 메모리와 애플리케이션프로세서(AP), 카메라모듈 등 핵심 부품 가격이 급등하면서 제조 원가 부담이 커진 영향이다. 오는 7월 공개 예정인 갤럭시 Z폴드8·Z플립8 역시 가격 인상 압력이 거세 새 폴더블폰은 300만원 시대에 진입할 것이란 전망이 나온다. 18일 삼성전자 분기보고서에 따르면 올해 1분기 스마트폰 평균 판매가격은 지난해 연간 평균 대비 약 23% 상승했다. 지난해 사업보고서에서 연간 평균 판매가격이 전년 대비 3% 하락했던 것과는 대조적인 흐름이다. [AI 인포그래픽=서영욱 기자] 가격 상승 배경으로는 AI 서버용 반도체 수요 급증에 따른 메모리 공급 부족과 첨단 공정 전환에 따른 부품 원가 상승이 꼽힌다. 삼성전자는 디바이스경험(DX)부문 주요 원재료 가격 변동 현황에서 모바일AP 솔루션 가격이 전년 대비 약 12% 상승했고 카메라모듈 가격은 약 15% 올랐다고 밝혔다. 특히 모바일용 메모리 가격은 107% 급등했다. 2배 이상 오른 셈이다. 글로벌 시장조사업체 트렌드포스에 따르면 지난 1분기 스마트폰 부품 원가(BOM)에서 메모리가 차지하는 비중은 10~15% 수준에서 30~40%까지 올랐다. 스마트폰에 들어가는 저전력 모바일 D램인 LPDDR4X와 LPDDR5X는 지난 1분기 가격이 전 분기 대비 58~63% 올랐다. 메모리 가격 급등으로 제조 원가 부담이 커지면서 삼성전자는 올해 초 출시한 갤럭시 S26 시리즈 가격을 전작 대비 약 6~16% 인상했다. 여기에 지난달에는 갤럭시 S25 엣지와 갤럭시 Z플립7·폴드7 가격도 9만~19만원 가량 올리며 기존 출시 모델까지 가격 인상에 나섰다. 업계에서는 오는 7월 공개 예정인 갤럭시 Z폴드8·Z플립8 역시 가격 인상 압력을 피하기 어려울 것으로 보고 있다. 현재 시장에서는 기본형 가격은 전작 수준을 유지하되 512GB·1TB 등 고용량 모델 중심으로 가격이 오를 가능성이 큰 것으로 보고 있다. 특히 모바일 메모리 가격 상승세가 2분기 들어 더 가팔라질 것으로 예상되면서 폴더블 원가 부담도 커지고 있다. 서울 강남구 삼성 강남 매장을 찾아 새롭게 출시된 '갤럭시 S26' 시리즈 [사진=뉴스핌DB] 시장조사업체 트렌드포스는 올해 2분기 스마트폰용 LPDDR4X 가격이 전분기 대비 70~75%, LPDDR5X는 78~83% 급등할 것으로 전망했다. 1분기 상승 폭 보다 더 가팔라질 것이란 전망이다. AI 기능 강화로 스마트폰 한 대에 들어가는 메모리 용량 자체가 늘어나고 있는 데다 메모리 업체들이 AI 서버용 고대역폭메모리(HBM) 생산 확대에 집중하면서 모바일용 LPDDR 공급까지 빠듯해지고 있다는 분석이다. 전작인 갤럭시 Z폴드7의 경우 지난달 가격 인상으로 1TB 용량 제품이 이미 300만원(312만7300원) 넘어선 바 있고 512GB 제품도 263만원까지 올랐다. 출시를 앞두고 있는 Z폴드8은 512GB 제품이 300만원에 육박할 것이라는 전망이다. 모바일업계에서는 삼성전자가 AI 기능과 고용량 메모리를 앞세운 프리미엄 전략을 강화하면서 수익성 중심의 사업 구조 전환에 속도를 낼 것으로 보고 있다. syu@newspim.com 2026-05-18 14:13
사진
박찬욱, 佛 최고 문화예술공로훈장 [서울=뉴스핌] 김용석 선임기자 = 박찬욱(63) 감독이 프랑스 정부로부터 문화예술공로훈장 최고 등급인 '코망되르'를 수훈한 가운데, 최휘영 문화체육관광부 장관이 공식 축전을 통해 그 의미를 높이 평가했다. 박찬욱 감독이 17일(현지시간) 프랑스 칸 팔레드페스티벌에서 프랑스 정부로부터 최고 등급의 문화예술 공로 훈장을 받은 후 소감을 밝히고 있다. [사진= 로이터 뉴스핌] 박찬욱 감독은 17일(현지시간) 제79회 칸 국제영화제가 열리고 있는 프랑스 칸 팔레 드 페스티발 대사 접견실에서 카트린 페가르 프랑스 문화부 장관으로부터 직접 메달을 받았다. 올해 칸 영화제 경쟁 부문 심사위원장을 맡아 현지에 머물던 중 수훈이 이뤄져 더욱 각별한 의미를 더했다. 한국인 코망되르 수훈자는 2002년 김정옥 전 한국문화예술진흥원장, 2011년 지휘자 정명훈, 2025년 소프라노 조수미에 이어 박 감독이 네 번째다. 영화감독으로서 이 등급을 받은 것은 한국인 최초다. 박찬욱 감독은 2004년 제57회 칸 영화제에서 '올드보이'로 심사위원대상을 수상하며 세계적 거장 반열에 올랐고, 2009년 '박쥐'로 심사위원상, 2022년 '헤어질 결심'으로 감독상을 받으며 칸 3관왕을 달성했다. 이 같은 이력 위에 올해 한국인 최초로 칸 경쟁 부문 심사위원장에 위촉됐다. 박 감독은 "프랑스와 제 인연의 정점은 2004년 칸 영화제"라며 "그 사건은 제 인생을 완전히 바꿔놨다"며 "남은 마지막 소원은 언젠가 프랑스에서, 프랑스 배우들과 함께 영화를 찍어보는 것"이라고 밝혔다. 최휘영 장관은 축전에서 "이번 수훈은 대한민국 영화계의 세계적 위상을 확고히 증명하고, 우리 문화예술계의 자긍심을 드높이는 계기가 됐다"고 밝혔다. 또한 "올해 한·프랑스 수교 140주년을 맞아 양국의 문화적 연대를 더욱 공고히 하는 가교가 돼 주시기를 바란다"며 "앞으로도 감독님의 위대한 여정을 응원하겠다"고 전했다. fineview@newspim.com 2026-05-18 15:16
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동