이 기사는 1월 27일 오후 2시48분 '해외 주식 투자의 도우미' GAM(Global Asset Management)에 출고된 프리미엄 기사입니다. GAM에서 회원 가입을 하면 9000여 해외 종목의 프리미엄 기사를 보실 수 있습니다.
이 기사는 AI 번역에 기반해 생산된 콘텐츠로 중국 관영 증권시보(證券時報)의 1월 27일자 기사를 인용하였습니다.
[서울=뉴스핌] 배상희 기자 = 27일 중국 알리바바(9988.HK/BABA.US) 그룹 산하의 클라우드 사업 전담 자회사인 알리 클라우드(阿裏雲∙알리윈)은 공식 위챗 계정을 통해 자체 개발한 개인용 AI 어시스턴트 첸원(千問∙Qwen∙큐원)의 새로운 플래그십 추론 모델 '큐원3-맥스-싱킹(Qwen3-Max-Thinking)'을 공식 발표했다.
해당 모델은 트릴리언(1조)급 파라미터, 36조개의 사전학습 토큰을 보유해 현재 알리바바가 보유한 큐원 계열 가운데 규모가 가장 크고 성능이 가장 강한 추론 모델로 소개됐다.
알려진 바에 따르면 큐원 신모델은 총 파라미터 수, 강화학습, 추론 연산 규모 확장을 통해 과학 지식(GPQA Diamond), 수학 추론(IMO-AnswerBench), 코드 프로그래밍(LiveCodeBench) 등 여러 핵심 성능 벤치마크에서 세계 최고 기록을 새로 썼다.
사실 지식, 복잡 추론, 지시 준수, 인간 선호 정렬, 에이전트 능력 등 19개로 알려진 대형 모델 벤치마크에서 해당 신모델은 여러 항목의 최고 성능(SOTA)을 경신했으며, 종합 성능은 GPT-5.2-Thinking-xhigh, Claude Opus 4.5, Gemini 3 Pro와 견줄 만한 수준이라고 밝혔다.
또한 다가오는 에이전트 시대를 겨냥해 큐원3-맥스-싱킹은 도구를 자율적으로 호출하는 네이티브 에이전트 능력도 강화했다. 구체적으로는 1차 도구 사용 미세조정을 마친 뒤, 알리바바 퉁이(通義) 팀이 규칙 기반 보상과 모델 기반 보상을 결합한 강화학습을 다양한 대규모 과제에 추가 적용해, 모델이 도구를 더 지능적으로 결합해 사고하도록 훈련했다는 설명이다.
이 같은 적응형 도구 호출 능력은 큐원 챗(Chat)에서 체험할 수 있으며 모델은 검색, 개인화 메모리, 코드 인터프리터 등 3가지 핵심 에이전트 도구 기능을 자율적으로 선택해 사용하고, 모델의 환각도 일부 감소했다고 전했다.

pxx17@newspim.com













