企业 Agent 隐私违规率最高达 51%,提醒所有公司:把 Agent 接进内网,比把模型接进网页危险得多
发生了什么:一项针对企业级大型语言模型 Agent 的研究显示,当前前沿模型在模拟企业任务中存在 16% 到 51% 的隐私违规率。问题不只出在恶意攻击,连“彻底一点”“优先找特定来源”这类普通指令,都可能诱发系统泄露敏感信息。
为什么重要:因为行业正在快速把 Agent 从外部助手升级成内部员工。它们要访问文档、财报、客户记录、知识库和工作流,这与普通聊天机器人完全不是一个风险等级。只要 Agent 无法稳定区分“完成任务所需信息”和“绝不能暴露的信息”,它越能干,风险越大。今天金融 Agent 的发布、CopilotKit 的嵌入式交互层、医疗行业 WiseClaw 2.0 的 Agent OS 实践,都说明企业已经不满足于试验性质部署,而是希望 Agent 长时间、跨系统地运行。在这种环境下,安全和治理不再是附加模块,而是产品定义的一部分。
具体细节:这项研究建议从设计之初引入最小权限访问控制、上下文感知隐私机制和角色条件过滤。医疗场景的 WiseClaw 2.0 之所以值得关注,也正因为它强调健康档案驱动、三层流水线、心跳引擎和全链路可观测,说明高风险行业已经在按“可追溯、可执行、可治理”的标准重做 Agent 架构。未来企业采购 Agent,问的第一句很可能不是“你能做什么”,而是“出了问题怎么审计、怎么回滚、怎么限权”。