GLM-4.7:把“能写代码”推进到“能当搭档”

Z.ai 发布 GLM-4.7,主打更强的工程落地能力:不仅写得对,还更擅长在真实工作流里(Agent、终端、工具调用)稳定推进任务。

这次重点提升了什么?

核心编码与代理式开发:相较 GLM-4.6,在多语言 Agent 编程与终端任务上有明显提升;例如 SWE-bench Verified 73.8%(+5.8)SWE-bench Multilingual 66.7%(+12.9)Terminal Bench 2.0 41.0%(+16.5)。并强调在 Claude Code、Cline、Roo Code 等主流框架中更“好用”。
Vibe Coding / UI 生成质量:更容易产出更现代、更干净的网页;做幻灯片时布局与尺寸更准确,整体观感更接近可直接交付的作品。
工具使用能力:工具调用与浏览任务的表现增强(文中提到 τ²-Bench、BrowseComp 等基准),更适合“边查边做”的复杂流程。
复杂推理与数学:推理能力提升,HLE(Humanity’s Last Exam)42.8%(+12.4,带工具),面向高难问题的稳健性更强。

一个很实用的新变化:更可控的“思考”机制

Interleaved Thinking:在回复/调用工具前先思考,提高指令遵循与产出质量。
Preserved Thinking:在多轮编码代理场景中保留推理块,减少长任务里的信息丢失与前后不一致。
Turn-level Thinking:按回合开关推理:简单问题更省时,复杂任务更稳。

如何开始使用

在线体验:Z.ai Chat 里选择 GLM-4.7
API:Z.ai 文档提供接入指南(也支持通过 OpenRouter 使用)
• 本地部署:权重已在 HuggingFace / ModelScope 提供,并支持 vLLM、SGLang 等推理框架
• 编码代理:可在 Claude Code、Cline、Roo Code、Kilo Code 等工具中使用(订阅用户可按文中指引升级模型名为 glm-4.7

原文链接:https://z.ai/blog/glm-4.7

#GLM47 #AI编程 #Agent #工具调用 #推理能力
 
 
Back to Top 1px