2026 · 03 · 14 · Saturday

Claude 1M上下文全面开放、美芯片禁令草案撤回、Meta Avocado推迟且拟裁员20%

AI基础设施扩张 · 算力地缘博弈 · 大厂内部撕裂

今日导读
  • 深度一:Claude把整仓代码一次读完变成标配,六巨头光互连联盟重写带宽上限
  • 深度二:美撤芯片禁令草案背后:字节已绕道,HBM4争夺白热化
  • 深度三:Meta双重危机——Avocado落后Gemini 3.0数月,拟裁员20%以上
  • 快讯:DeepSeek V4/腾讯混元4月集结、陶哲轩创SAIR、NanoClaw接入Docker

Anthropic这次做了一件定价上的大事:Claude Opus 4.6和Sonnet 4.6的100万token上下文窗口全面开放,不再收取长上下文溢价,不再有200K以上的beta限制,速率也和普通请求拉齐。把一个大型代码仓库、完整合同集或几十万字的日志一次性塞进上下文,现在的成本和处理一封邮件没有本质区别。

Anthropic公布了两个关键基准数据:Opus在MRCR v2(长程多轮检索)达到78.3%,Sonnet在GraphWalks BFS(1M token图遍历)达68.4%。这两个测试考察模型在极长上下文中能否真正读到深处的信息,而不是靠位置偏见找答案。数字不完美,但足以说明1M不只是营销数字。

78.3%
Opus / MRCR v2 (1M)
68.4%
Sonnet / GraphWalks BFS
600张
单次多模态上限

同一天,NVIDIA、AMD、博通、OpenAI、Meta、微软联合成立OCI MSA光互连联盟,目标制定与协议无关的数据中心光互连开放规范,瞄准3.2Tb/s及以上的光PHY,支持可插拔光模块、板载光与共封装光学CPO。现有NVLink、UALink等不同协议将共用同一光学基础设施。

把这两件事放在一起:一边是AI模型可消费的上下文窗口在继续扩张,一边是GPU之间传输数据的物理管道也在往同一方向追。铜互连的瓶颈是带宽、功耗和距离——OCI MSA的逻辑是用光纤把这三个问题一起解决,让scale-up域从200Gbps往更大规模跨越。

核心逻辑:上下文窗口和互连带宽是同一条技术曲线的两端。前者决定AI能一次处理多少信息,后者决定多个GPU能以多快速度协同处理。Anthropic把1M上下文从高级用法变成开发者的默认选项;六家巨头联手推光互连标准,则是在为下一个量级的算力集群铺路。

美国商务部周五低调撤回了一份AI芯片出口管控草案。这份文件2月26日刚提交白宫OIRA审查,官员的解释是始终只是草案。真实背景是政府内部的拉锯:拜登政府留下的是按国家分三档限供/禁供的框架,而特朗普团队倾向于更简化的替代规则——把大额出口与外国安全承诺或在美投资直接挂钩。

问题在于,政策讨论还没结束,企业侧的应对已经跑了很远。报道显示字节跳动通过马来西亚云计算公司Aolani的数据中心,租用搭载英伟达Blackwell B200的算力资源。Aolani作为英伟达一级客户更容易获得新GPU供货,而中国大模型公司直接采购H100、A100已受限多年。东南亚数据中心的中间商生态——专门撮合GPU租赁——已经相当成熟。

另一个数据点:AMD CEO苏姿丰将首次访问韩国,会见三星与Naver,目的是锁定HBM4供应。三星和SK海力士都在加速HBM4出货与扩产,定制化HBM4E也提前开打。国内长鑫存储正推进HBM3送测与量产规划并筹备科创板上市。

SK海力士 HBM4供应紧迫度
三星 HBM4供应紧迫度中高
长鑫 HBM3进度早期
时间差问题:政策撤回不等于管控消失,新规还在设计中。但企业的应对逻辑早已不是等待政策确定再行动,而是在灰色地带建立供应链。字节的马来西亚路径、苏姿丰的首尔之行,都在说明同一件事——谁先锁定算力供应,谁就在下一轮模型竞赛里有选择权。

Meta今天有两条坏消息。第一条:新一代大模型Avocado因内部测试显示推理、代码生成与写作能力未达预期,发布时间从本月推迟到至少5月。知情人士称Avocado显著强于上一代,但仍落后于2025年11月发布的Gemini 3.0——意味着Meta的旗舰模型将带着半年的技术差距入场。

第二条:Meta正酝酿新一轮大规模裁员,可能影响20%以上员工,高层已要求制定方案。官方逻辑是以裁员抵消AI基础设施投入、强调AI辅助提升了人均效率。

这两件事放在一起,勾勒出一个矛盾的图景:Meta一面计划至2028年投入6000亿美元建数据中心,一面在最核心的模型进展上被竞争对手拉开差距;一面高薪组建超级智能团队,一面要裁掉可能是史上最大比例的员工。据报道Meta还存在开源/闭源路线之争,以及一度讨论临时授权Google Gemini来顶自家产品。

20%+
潜在裁员比例
5月+
Avocado推迟发布
6000亿
2028数据中心计划(美元)
更大的背景:今年大厂裁员潮叠加AI基础设施的超大规模支出,正在逼迫所有公司重新算账——每多雇一个人,是否必须有可量化的AI乘数效应?Meta是最极端的样本:同时做最激进的AI投入和最激进的人员精简,二者的张力将在未来数季度得到检验。
DeepSeek V4与腾讯混元新模型同瞄4月发布 模型竞争消息称DeepSeek V4将于4月发布,强化多模态、代码能力与长期记忆;腾讯混元新模型约30B参数,侧重长上下文与真实任务基准CL-bench;同期OpenRouter出现神秘模型Healer Alpha与Hunter Alpha。原文
陶哲轩发起SAIR Foundation 机构动态数学家陶哲轩以联合创始人身份成立非营利SAIR Foundation,连接学术界与产业界,聚焦科研专用AI工具与严格验证框架,探讨AI对高等教育培养方式的影响。原文
NanoClaw接入Docker沙箱,500行代码框架爆红后全职商业化 开源工具开源AI代理框架NanoClaw因Karpathy转发达2.2万GitHub星,作者Cohen与Docker合作将其改为支持Docker Sandboxes并全职推进,商业化模式仍在探索。原文
Garry Tan发布gstack:为Claude Code加8种标准化工作模式 开发工具开源工具gstack将软件交付拆成规划、审查、发版、QA等8个命令,核心是持久化无头Chromium守护进程,把浏览器调用从3-5秒冷启动降至约100-200ms。原文
DeepMind Aletheia数学研究AI代理:IMO-Proof Bench Advanced达95.1% AI研究Aletheia以Gemini Deep Think为核心,通过生成-验证-修订循环迭代改写自然语言证明,报告已部分解决Erdos开放题,展示推理时算力扩展的显著效益。原文
xAI核心创始人相继出走,马斯克称从根基重建 公司动态Zihang Dai、Guodong Zhang、Jimmy Ba、Tony Wu等多名联合创始人离职,2023年共创者仅剩两人;SpaceX与xAI完成约1.25万亿美元估值下的合并。原文
聊天机器人安全:律师警告存在大规模心理伤害风险 AI安全代理多起AI精神异常案件的律师公开警告,未成年人与脆弱用户长期使用某些聊天机器人后出现严重心理损伤,呼吁监管介入。原文
英特尔再警告CPU供应紧缺,CPO预期带动光模块估值修复 硬件供应英特尔警告CPU供应再次趋紧;CPO共封装光学商用预期提前,与OCI MSA联盟推进形成呼应,带动国内二线光模块厂商估值修复。原文
Claude 1M上下文全面开放、美芯片禁令草案撤回、Meta Avocado推迟且拟裁20%——2026年3月14日AI行业速报 | AI 趋势