三个Agent框架同日开源:自进化、桌面操控、持久记忆,谁在定义下一代AI工具?

3月1日是Agent赛道的"密集发布日"。三个来自不同团队的开源框架同时亮相,路径各异但指向同一个命题:Agent如何从聊天框走出来,真正替人干活?

复旦 GenericAgent:极简架构 + 自进化。仅3000多行代码实现了传统50多万行才能完成的功能。核心创新是"自组织记忆"和"自适应学习"——Agent不需要人工预定义技能树,能在微信等复杂环境中自主摸索出操作路径并记住。跨平台部署和技能复用是其设计亮点。

阿里 CoPaw:持久记忆 + 多平台接入。基于AgentScope框架,CoPaw的差异化在于ReMe记忆模块——它解决的不是"AI能做什么"而是"AI如何记住做过什么"。支持钉钉、飞书等多渠道连接,瞄准的是个人AI助理场景。

Open Cowork:GUI操控 + 文件产出。这个项目最激进——它让AI直接看懂屏幕、点击按钮、操作桌面应用,本质上是在构建"虚拟员工"。Skills系统专注于产出PPT、Word、Excel等文件,Remote功能支持通过飞书接入实现团队协作。

三条路径的分歧很有意思:GenericAgent赌"自进化"能降低开发门槛;CoPaw赌"记忆"是长期使用的关键;Open Cowork赌"桌面操控"才是真正的生产力释放。

这三个项目放在一起看,折射出Agent赛道的一个共识和一个未解之题。共识是:Agent必须能产出可交付的工作成果(文件、操作、流程),而不仅仅是对话。未解之题是:当Agent犯错时(而它们一定会犯错),谁来兜底?Open Cowork的Workspace隔离机制是目前最直接的回答,但离生产环境的可信度还有距离。

  • Anthropic × 斯坦福提出Token级安全过滤:在预训练阶段通过Token粒度(而非文档粒度)移除危险知识,模型规模越大效果越显著,攻击者恢复成本呈指数上升。原文链接
  • 审计提示词真实性研究碰壁:训练模型生成更逼真的用户提示词未能改善自动化审计的整体真实性,瓶颈在于审计场景本身的危害性和对话结构的自然性。原文链接
  • ASI风险反思录:一位研究者公开反思2022年未全力投入超级智能安全工作,称低估了技术发展速度和全球协调难度,视为"人生最大遗憾"。原文链接
  • 用交互式动画偿还"认知债务":Simon Willison指出开发者对AI生成代码失去理解时会积累认知债务,通过可交互的算法动画可以有效修复这一问题。原文链接
  • 傅盛14天AI龙虾实验:春节期间投入1157条消息、22万字,从零构建了8个AI Agent团队,验证了Agent作为"工具的AGI形态"的可行性。原文链接
  • Kimi Code免费升舱:改为按Token计费后,限时3倍额度活动反响良好,现已将3倍额度设为所有订阅用户标配。原文链接
📝 编辑手记

今天的三条主线看似无关,其实共享一个底层逻辑:AI正在从"能力展示"过渡到"角色承担",而每个角色都有它的现实成本。

Anthropic的故事告诉我们,承担"负责任的AI供应商"这个角色,代价是五角大楼的合同;CoreWeave的财报说明,承担"算力基础设施"这个角色,代价是7.2%的毛利率和滚雪球般的债务;而三个同日发布的Agent框架,则让我们看到承担"虚拟员工"这个角色的技术探索——GenericAgent的3000行代码 vs 传统50万行的对比尤其惊人,但"能跑"和"能信任"之间的鸿沟,才是接下来真正要填的。

三个Agent框架同日开源:自进化、桌面操控、持久记忆,谁在定义下一代AI工具? | AI 趋势