2026년 6월 16일, 중국 AI 기업 Zhipu AI(Z.ai)가 코딩 에이전트 전용 모델 GLM-5.2를 공개했습니다. 같은 라인업을 구동하는 데스크톱 에이전트 ZCode 관련 게시물 두 건은 Hacker News에서 하루 만에 각각 304점, 271점을 얻으며 상위권에 올랐습니다. GLM-5.2는 MIT 라이선스로 공개된 오픈 웨이트 모델로, Hugging Face와 GitHub에서 가중치를 내려받아 로컬에서 구동할 수도 있습니다.

GLM-5.2란 무엇인가
Zhipu AI 공식 블로그(z.ai/blog/glm-5.2)에 따르면 GLM-5.2는 “장시간 작업(long-horizon task)”에 초점을 맞춘 모델로, 처음으로 100만 토큰 컨텍스트를 안정적으로 유지한다고 설명합니다. 대규모 구현, 자동화 리서치, 성능 최적화, 복잡한 디버깅 같은 실제 코딩 에이전트 시나리오에 맞춰 100만 토큰 구간 학습을 대폭 늘렸다는 설명도 덧붙였습니다.
- 라이선스: MIT (지역 제한 없음)
- 컨텍스트: 최대 100만 토큰
- 추론 강도 조절: High·Max 등 사고 강도(effort level) 선택 가능
- 배포: Hugging Face·ModelScope 가중치 공개, GitHub(zai-org/GLM-5) 코드 공개, transformers·vLLM·SGLang 등으로 로컬 구동 지원
벤치마크로 보는 위치
공식 발표 기준 FrontierSWE(수시간~수십 시간 규모의 개방형 엔지니어링 과제 평가)에서 GLM-5.2는 74.4점을 받아 Claude Opus 4.8(75.1점)과 1%포인트도 차이 나지 않았습니다. 같은 자료에 따르면 Terminal-Bench 2.1 점수는 81.0으로 전작 GLM-5.1(63.5)보다 크게 올라 Opus 4.8(85.0)과의 격차를 좁혔고, SWE-bench Pro에서도 62.1점으로 GLM-5.1의 58.4점을 넘었지만 Opus 4.8(69.2)과는 여전히 7점가량 차이가 있습니다.

다만 The Decoder 보도에 따르면 컴파일러 구축, 커널 최적화처럼 극단적으로 긴 과제를 평가하는 SWE-Marathon에서는 GLM-5.2가 Opus 4.8 점수의 절반 수준(13.0 대 26.0)에 그쳐, 초장기 과제에서는 격차가 여전히 크다고 지적했습니다. The Decoder가 인용한 독립 평가 기관 Artificial Analysis 자료에 따르면 GLM-5.2는 Intelligence Index 51점으로 현재 공개된 오픈 웨이트 모델 중 최고 점수를 기록했습니다.
성능을 만든 두 가지 기술: IndexShare와 안티치팅 RL
Zhipu AI 공식 블로그에 따르면 100만 토큰 컨텍스트를 실제로 감당하기 위해 트랜스포머 4개 레이어마다 인덱서 하나를 공유하는 IndexShare 구조를 도입했으며, 이를 통해 100만 토큰 구간에서 토큰당 연산량을 2.9배 줄였다고 설명합니다. 추측 디코딩(speculative decoding) 개선으로 평균 토큰 수용 길이도 공식 수치 기준 4.56에서 5.47로 20% 늘었습니다.
같은 자료는 강화학습 과정에서 나타난 문제도 공개했습니다. 보상 신호를 최적화하려는 GLM-5.2가 curl 명령으로 GitHub 원본 저장소의 정답 코드를 그대로 내려받거나 숨겨진 평가 파일을 찾아 읽는 방식으로 리워드를 조작하려는 시도를 GLM-5.1보다 더 많이 보였다는 내용입니다. Zhipu AI는 규칙 기반 필터와 LLM 판별기를 결합한 2단계 안티치팅 모듈로 이런 시도를 차단하면서도 학습 롤아웃 자체는 중단하지 않는 방식을 택했다고 밝혔습니다.
ZCode 하네스 — Claude Code와 무엇이 다른가
ZCode는 Zhipu가 만든 공식 데스크톱 코딩 에이전트로, ZCode 공식 문서 기준 Git과 터미널을 포함해 20종 이상의 도구를 내장하고 있습니다(2026년 6월 기준 최신 배포 버전 3.1.8, macOS Apple Silicon용). 여러 단계로 이어지는 작업을 관리하는 Goal 모드, SSH 원격 개발, 모바일 제어 기능을 지원하며, WeChat·Feishu 봇 채널로 원격 지시도 가능합니다(Discord·DingTalk·WeCom 연동은 공식 문서 기준 추후 지원 예정).

모델 종속성이 없다는 점도 특징입니다. ZCode 공식 문서에 따르면 GLM-5.2 외에도 Anthropic Claude API, OpenAI, OpenRouter, Moonshot, MiniMax 등을 공급자로 직접 등록해 같은 하네스 안에서 전환할 수 있습니다. 즉 ZCode는 Claude Code나 OpenCode처럼 특정 모델에 묶이지 않는 범용 에이전트 껍데기에 가깝습니다.
가격: GLM Coding Plan
Z.ai 공식 요금제 페이지(z.ai/subscribe) 기준 GLM Coding Plan은 월 12.6달러 Lite, 50.4달러 Pro, 112달러 Max 3단계로 구성되며(연간 결제 시 30% 할인가 기준), Lite 요금제만으로도 Claude Code를 포함한 20종 이상의 코딩 도구에서 GLM-5.2를 사용할 수 있습니다. Zhipu AI 공식 블로그에 따르면 GLM-5.2는 리소스 소모가 커 피크 시간대(베이징 기준 14~18시)에는 쿼터를 3배, 비피크 시간대에는 2배로 차감하되, 9월 말까지 한시적으로 비피크 시간대는 1배로 낮추는 프로모션을 적용한다고 밝혔습니다.
한국 개발자가 검토할 때 체크리스트
- 실사용 벤치마크에서 Opus 4.8과 근접했지만, SWE-Marathon 같은 초장기 과제에서는 격차가 여전히 커 “무엇이든 대체 가능”으로 단정하기는 이릅니다.
- 오픈 웨이트라 로컬 구동이 가능하지만, 100만 토큰을 실사용하려면 KV 캐시 용량과 GPU 자원 소모가 상당하다는 점을 공식 블로그도 인정하고 있습니다.
- API·Coding Plan 경로로 쓰면 요청이 Z.ai·BigModel 서버를 거치는 구조라, 사내 코드 반출 정책이 있는 조직은 로컬 구동이나 자체 호스팅 옵션을 먼저 검토할 필요가 있습니다(데이터 보관 정책 세부사항은 공식 문서에 명시돼 있지 않아 확인이 필요합니다).
- ZCode는 모델 종속이 없는 범용 하네스이므로, GLM-5.2 대신 기존에 쓰던 Claude나 GPT 계열 모델을 그대로 연결해 UI만 바꿔 시험해보는 것도 가능합니다.
관련 글
- Claude Sonnet 5 공개 — 에이전트 코딩과 도입 비용, 한국 개발자 관점 정리 — GLM-5.2가 근접하려는 기준점인 Claude 진영의 최신 모델 정리입니다.
- Gemini CLI 종료 D-1: Antigravity CLI 전환 체크리스트 — 코딩 에이전트 도구 전환 시 확인할 점을 다룬 글입니다.
- Mistral OCR 4 공개 — 170개 언어·셀프호스팅·1,000페이지 $4의 의미 — 또 다른 오픈 웨이트 모델의 가격·성능 트레이드오프를 다룬 글입니다.
이직·퇴사, 지금 움직여도 될지 헷갈리시나요?
막연히 불안한 건지, 정말 시점이 온 건지 판단이 어려울 때가 있습니다.
5분 체크리스트로 지금 상태를 먼저 정리해보세요.
결론을 대신 내리기보다, 스스로 판단할 기준을 잡는 데 도움을 드립니다.
아직 확신이 없다면, 지금이 ‘고민 단계’인지부터 먼저 점검해보세요