2. 智谱GLM-5.2把战场拉到长程Coding:国产开源开始争抢“无人值守Agent”

发生了什么开源模型Coding Agent

在Anthropic受限的同一天,智谱发布GLM-5.2,对外强调1M上下文、下周开放API和正式开源;而来自一线体验和测评的两篇文章都把焦点放在更实用的能力上:它是否能完成长程Coding、是否适合Agent、与Opus 4.8和Fable 5还有多远。实测文章认为,GLM-5.2在Coding与Agent能力上已接近Opus 4.8;另一篇长程任务测试则更克制,认为它在无人值守场景完成度不差,但在代码还原、Rust重写这类复杂任务上,与Fable 5仍有明显距离。

这很重要,因为模型竞争的标尺正在变化。过去大家更熟悉的是聊天体验、榜单分数、中文能力;现在更值钱的,是模型能不能在长时间、少监督、跨步骤的任务里持续交付。换句话说,行业已经从“回答得像不像人”转向“能不能像工程师一样把活做完”。如果前沿闭源模型因监管收缩供给,那么一个能在长任务里稳定工作的开源模型,哪怕在多模态审美或极限性能上稍弱,也会迅速获得开发者和企业青睐。

更值得注意的是,今天多篇文章其实在互相验证同一个趋势。关于Codex与Claude策略差异的分析指出,一条路线是服务器端压缩上下文保持主线程连贯,另一条路线是子代理并行;AI生成游戏案例则给出更直接的商业感受——用约200美元完成过去可能需要团队数月的工作。GLM-5.2的意义,不只是“国产又发了一个模型”,而是它正在争夺一个更现实的位置:当企业想部署一个能连跑数小时的Coding Agent时,是否终于有了不完全依赖美国闭源API的选择。

可得性
长任务
极限性能
追赶

上图为基于今日多篇报道整理的相对判断,用于帮助读者理解“开源可用性提升,但与顶级闭源仍有差距”的位置关系。

2. 智谱GLM-5.2把战场拉到长程Coding:国产开源开始争抢“无人值守Agent” | AI 趋势