2. 智谱GLM-5.2把战场拉到长程Coding：国产开源开始争抢“无人值守Agent”

2026年6月14日 · 728 字 · AI 趋势日报深度解读

发生了什么开源模型Coding Agent

在Anthropic受限的同一天，智谱发布GLM-5.2，对外强调1M上下文、下周开放API和正式开源；而来自一线体验和测评的两篇文章都把焦点放在更实用的能力上：它是否能完成长程Coding、是否适合Agent、与Opus 4.8和Fable 5还有多远。实测文章认为，GLM-5.2在Coding与Agent能力上已接近Opus 4.8；另一篇长程任务测试则更克制，认为它在无人值守场景完成度不差，但在代码还原、Rust重写这类复杂任务上，与Fable 5仍有明显距离。

这很重要，因为模型竞争的标尺正在变化。过去大家更熟悉的是聊天体验、榜单分数、中文能力；现在更值钱的，是模型能不能在长时间、少监督、跨步骤的任务里持续交付。换句话说，行业已经从“回答得像不像人”转向“能不能像工程师一样把活做完”。如果前沿闭源模型因监管收缩供给，那么一个能在长任务里稳定工作的开源模型，哪怕在多模态审美或极限性能上稍弱，也会迅速获得开发者和企业青睐。

更值得注意的是，今天多篇文章其实在互相验证同一个趋势。关于Codex与Claude策略差异的分析指出，一条路线是服务器端压缩上下文保持主线程连贯，另一条路线是子代理并行；AI生成游戏案例则给出更直接的商业感受——用约200美元完成过去可能需要团队数月的工作。GLM-5.2的意义，不只是“国产又发了一个模型”，而是它正在争夺一个更现实的位置：当企业想部署一个能连跑数小时的Coding Agent时，是否终于有了不完全依赖美国闭源API的选择。

可得性

高

长任务

强

极限性能

追赶

上图为基于今日多篇报道整理的相对判断，用于帮助读者理解“开源可用性提升，但与顶级闭源仍有差距”的位置关系。