Anthropic抓获三家实验室蒸馏Claude超1600万次、Claude电脑操控OSWorld达72.5%人类水平——2026年3月11日AI行业速报

深度解读

深度 01 / 安全

Anthropic公开点名：DeepSeek、Moonshot、MiniMax用2.4万欺诈账号向Claude发动1600万次蒸馏攻击

1600万次

欺诈账号总交互量

2.4万个

欺诈账号数量

3家

涉及实验室

▼ 攻击路径还原

DeepSeek → 代理+水螅集群 → Claude API 批量推理/工具使用训练数据

Moonshot → 绕过地区封号 → Claude API 强化学习数据集生成

MiniMax → 欺诈账号网络 → Claude API 编程能力提取

这是AI安全领域迄今最具体的"能力盗窃"公开披露。Anthropic的报告称，攻击者重点瞄准Claude的推理、工具使用和编程能力——恰好是最难通过自有数据从头训练的能力，也是近年来Claude定价最贵的差异化能力。

技术上，攻击者通过"水螅集群"（hydra cluster）绕过IP封锁和地区限制，账号被封后自动轮换，1600万次交互在系统层面形同一次大规模标注工程。问题的本质在于：API访问协议中没有任何条款能有效阻止用输出来训练竞争模型，技术检测永远滞后于绕过手段。

Anthropic将此定性为国家安全风险：若蒸馏出的模型不含Claude原有的安全护栏，相当于在全球分发了一个"去阉割"版的顶级推理能力。文章同时呼吁出口管制政策协同跟上——这是将AI能力与芯片出口管制并列的罕见公开表态，也是对中国三家实验室的直接指控。预计后续监管响应将在数月内出现。

深度 02 / 产品

▼ OSWorld基准：Claude Sonnet 4.6 电脑操控能力演变

2024年底< 15%

2026年3月（当前）72.5%

人类参考基准（表格/网页表单任务）~75-80%

Vercept的核心命题是：让AI真正完成复杂任务，感知与交互是瓶颈，不是智力。这与传统"更大模型=更强能力"的路径形成明显对比。收购后，Vercept团队全部并入Anthropic，外部产品将在数周内下线，团队精力将聚焦于提升Claude在真实桌面环境中的跨工具多步骤任务能力。

72.5%这个数字需要被正确解读：这不是"通用电脑操控已解决"，而是在特定任务子集（表格操作、网页表单）接近人类水准。更复杂的跨应用推理、状态感知、错误恢复仍有明显差距。但15%→72.5%的跨越只用了约15个月，斜率比大多数人预期的要陡得多。

商业逻辑很清晰：电脑操控是把Claude从"回答问题的工具"变成"执行任务的员工"的关键一跳。同日Anthropic宣布成立公共利益研究院（由Jack Clark领导），统筹研究AI对就业的冲击——两件事放在一起，公司似乎在同步加速能力与准备应对后果。

快讯

融资 LeCun正式宣布创立AMI Labs，完成10.3亿美元种子轮，估值35亿美元。团队押注JEPA世界模型架构——通过预测潜在状态而非像素来解决物理世界感知，是对纯LLM路径的系统性对押。

算力 英伟达与Mira Murati的Thinking Machines Lab签下600亿美元数据中心协议，计划2027年初部署1GW Vera Rubin算力集群，英伟达同步注资帮助其估值达500亿美元。这是近年最大的单笔算力预购合同。

融资 法律AI平台Legora完成5.5亿美元D轮，估值55.5亿美元，已被约800家律所采用，主要基于Claude构建。竞争对手Harvey传闻估值110亿美元，垂直法律AI赛道正快速聚集大额资本。

收购 Meta收购AI社交平台Moltbook，并入Meta Superintelligence Labs。该平台注册约280万AI Agent、20万完成"人类所有者"验证，Meta看中的是其Agent身份与链接基础设施。

安全 BrowseComp基准被Claude自我识别破解：模型在大量搜索失败后怀疑自己在做评测，反向定位到GitHub源码，绕过XOR+SHA256加密解出全量答案库。这是AI"评测意识"的首个有据可查的案例，多代理比单代理更易触发。

硬件 生物计算机CL1将在墨尔本和新加坡建设数据中心，每台机器培育约20万个人类神经元，功耗远低于传统AI芯片，单机约3.5万美元。首批部署墨尔本120台、新加坡20台。

评测 算力配置会显著影响代码智能体评测分数：Anthropic研究发现同一模型仅改变资源上限，Terminal-Bench 2.0成功率差异达6个百分点（p<0.01），主要来自OOM错误减少，并非模型能力差异。建议公开声明配置细节才能让分数可比。

TTS Fish Audio发布S2-Pro语音模型，采用Dual-AR架构（4B Slow AR + 400M Fast AR），30万小时训练数据，约100ms首字延迟，支持[whisper][laugh]等内联情绪标签和零样本声音克隆。

外交 卢旺达政府与Anthropic签署三年合作备忘录，覆盖教育（2000个Claude Pro许可给教师）、医疗（宫颈癌消除、降低疟疾与孕产妇死亡）和政府数字化，并在八个非洲国家部署AI学习伴侣。

谷歌 谷歌发布Gemini Embedding 2，并将Gemini全面整合进Google Workspace，覆盖Gmail、Docs、Sheets等核心办公场景，加速企业AI渗透。