智譜AI推出開源大模型GLM-5.2,支援100萬上下文,挑戰頂級閉源模型



中國 AI 公司 Zhipu AI(智譜 AI / Z.ai) 於 2026 年 6 月中旬正式推出旗艦模型 GLM-5.2,定位為專攻「長時程(long-horizon)軟體工程任務」的開源大模型。該模型強調在大型程式碼庫中進行複雜、多步驟的代理式(agentic)開發工作,並以開放權重(open weights)與 MIT 授權釋出,成為目前開源陣營中在長上下文程式碼任務上最具競爭力的選擇之一。


GLM-5.2 的最大賣點在於其100 萬 Token(1M context) 的上下文窗口,以及高達 131,072 的輸出 Token 能力。這讓模型能夠一次處理整個大型專案的程式碼、文件與歷史紀錄,適合以下場景:

  • 大型程式碼庫分析與重構
  • 遺留系統現代化(Legacy Modernization)
  • 複雜多步驟的代理式開發流程
  • 長篇技術文件或合約審核
為了因應超長上下文帶來的運算成本,Zhipu AI 導入了 IndexShare 技術,可在 100 萬 Token 長度下將每 Token 運算量降低 2.9 倍。同時優化了多 Token 預測層(multi-token prediction layer),讓推測解碼(speculative decoding)的接受長度提升最高 20%,進一步降低長上下文代理任務的成本。

根據 Zhipu AI 公布的資料,GLM-5.2 在 FrontierSWE(長時程軟體工程基準測試)上表現亮眼:

  • 僅落後 Anthropic Claude Opus 4.8 約 1%
  • 領先 OpenAI GPT-5.5 約 1%
公司在官方部落格中強調,GLM-5.2 在「長時程代理式程式設計」任務上已達到與閉源前沿模型接近的水準,特別適合需要長時間連續推理與多步驟規劃的工程場景。

GLM-5.2 提供多種使用管道:

使用方式
說明
適合對象
官方平台
chat.z.ai 直接使用
一般開發者快速測試
API 服務
api.z.ai(GLM Coding Plan)
企業與團隊整合
開源權重
Hugging Face / ModelScope(MIT 授權)
需要本地部署或自建基礎設施的用戶
本地推理框架
支援 transformers、vLLM、SGLang
等追求資料隱私與成本控制的團隊

GLM Coding Plan 訂閱方案(分 Lite / Pro / Max / Team 等級)價格僅為 Anthropic 同級方案的約 1/10,對成本敏感的開發團隊具有吸引力。

GLM-5.2 釋出後迅速在開發者社群引起討論。Reddit 用戶普遍認為,這是中國開源模型在程式碼領域的一次重要突破,尤其在長上下文處理能力上已接近或達到閉源模型水準。不過也有開發者指出,模型在某些代理任務中仍偶有過度冗長(verbose)的問題,且目前尚未有大量獨立第三方基準測試結果。

GLM-5.2 的推出,顯示 Zhipu AI 在長上下文與代理式開發領域的持續投入。對企業與開發團隊而言,這款模型提供了成本較低、隱私可控、效能接近前沿閉源模型的選擇,尤其適合處理大型程式碼庫與長時程工程任務的場景。目前模型已可在官方平台使用,開源權重預計將在近期全面開放。隨著更多開發者實際測試與回饋,GLM-5.2 在開源程式碼模型生態中的定位將更加清晰。

核心參數

  • 總參數量:753B(7530 億參數)
  • 架構類型:MoE(Mixture of Experts,混合專家模型)
  • 上下文長度:1M tokens(100 萬 Token)
  • 授權:MIT License(開源,可商業使用)
其他技術特色
  • 採用 IndexShare 稀疏注意力優化技術,在 100 萬 Token 長度下可將運算量(FLOPs)降低約 2.9 倍。
  • 改進了 MTP(Multi-Token Prediction)層,讓推測解碼(speculative decoding)的接受長度提升最高 20%,有助於降低長上下文推理成本。
  • 支援多種推理框架:transformers、vLLM、SGLang、KTransformers 等。
  • 模型格式為 Safetensors,權重類型支援 BF16 / F32。
資源:
  • Z.ai 官方部落格:https://z.ai/blog/glm-5.2
  • Hugging Face 模型頁面:https://huggingface.co/zai-org/GLM-5.2
  • ModelScope:https://modelscope.cn/models/ZhipuAI/GLM-5.2
  • InfoWorld 報導:https://www.infoworld.com/article/4186136/z-ai-pitches-glm-5-2-for-long-running-software-engineering-tasks.html