AI 每日精选

Claude Opus 4.6 用 31 步破解高德纳 30 年图论难题、军工 AI 三国杀升级、具身智能单日两笔近 70 亿融资——2026 年 3 月 5 日

2026年3月5日 · 33 篇精选文章 · 3 个深度专题
1

Claude Opus 4.6 用 31 步解决了高德纳研究三十年的图论猜想,他在斯坦福官网发文「Shock! Shock!」

Donald Knuth,88 岁,图灵奖得主,计算机科学的奠基人之一,以严苛和严谨著称的人——他在斯坦福大学官网亲自发布了一篇论文,记录了 Claude Opus 4.6 如何在 31 步探索内,解决了他本人研究数周乃至三十年的图论开放问题。他给这篇文章的标题是「Shock! Shock!」

问题本身并不简单:在一个 m³ 个顶点的三维环形网格中,寻找三条哈密顿环,要求三条环覆盖所有 3m³ 条边且每条边只用一次。每个顶点有三条出边,搜索空间庞大,Knuth 认为必须依赖规律性的构造方法才能解决。

Claude 的解法不是暴力搜索。它先用「纤维分解」将三维问题按 s = (i+j+k) mod m 分层降维,再通过「蛇形构造」为各层建立跳转规则,最终推导出一个适用于所有奇数 m 的通用构造方法。Knuth 随后完成了严格数学证明,确认其有效性。

探索步数 31 步
Knuth 研究时长 数周 ~ 30 年(开放问题)
核心方法 纤维分解 + 蛇形构造
结论有效范围 所有奇数 m(通用方法)

有几点值得注意:其一,Claude 没有给出完整证明——它找到了构造方法,Knuth 做了证明。偶数 m 的情况仍未解决,Claude 遇到了瓶颈。其二,Knuth 在文章里写道「我需要修正自己对生成式 AI 的看法」——他此前曾多次公开表示对大模型持怀疑态度。其三,这是一个具有「一个人验证就够了」的权威背书的事件:不需要争论 Claude 是否真的「理解」数学,图灵奖得主用自己的名字为结果背书。

更值得关注的是它展示的研究模式:AI 探索结构、发现方法 → 人类完成严格证明。这不是 AI 替代数学家,而是一种新的协作节奏。

2

Anthropic CEO 点名指责 OpenAI 「说谎」:一份 2 亿美元国防合同,三家 AI 公司的伦理表演

事情的起点是上周:Anthropic 在与美国国防部(DoD)的 2 亿美元合同谈判中因坚守「禁止大规模监控和全自主武器」两条红线而破裂,随后被特朗普政府认定为供应链风险。OpenAI 起初公开发声支持 Anthropic,称「不会在这些问题上妥协」。

然后 OpenAI 签了合同。

「OpenAI 撒谎了。他们对我们说了他们不会做的事,然后他们做了。」 — Anthropic CEO Dario Amodei

这件事的复杂性在于背景:三家公司——Anthropic、OpenAI 和 xAI——都处于 IPO 前阶段,都在争夺「谁的 AI 更值得信赖」的叙事权。国防合同的价值不只是 2 亿美元本身,而是它背后的「国家背书」信号。美国军方目前已在广泛使用 Claude 进行情报评估、目标识别和作战模拟,尽管 Anthropic 并未正式签署相关合同——这说明技术嵌入早于商业协议。

Anthropic
坚持红线 · 失合同
OpenAI
达成合作 · 被质疑
xAI/马斯克
趁虚而入

xAI 的马斯克在此时入场:他主动接触 DoD,承诺无任何限制地提供 Grok 用于军事用途。这不是意外,马斯克本人同时持有政治地位(DOGE)和 xAI 股权,他在这场三角博弈中处于最特殊的位置——他既是裁判员,也是参赛者。

真正的问题不是「谁的 AI 更安全」,而是:在 AI 公司的伦理声明和实际商业行为之间,到底有多大的距离?Anthropic 的两条红线是目前唯一被明确公开、被 CEO 用职业声誉背书的边界——但这也意味着它是最容易被定价的边界。

3

极佳视界近 10 亿元 Pre-B + 阶跃星辰拟 5 亿美元 IPO:资本从模型层往物理层转移

今天具身智能赛道在 24 小时内出现两笔重要资本动作。极佳视界完成近 10 亿元人民币 Pre-B 轮融资,投资方包括中芯聚源、上海半导体产投基金、中金资本等;阶跃星辰正考虑港交所 IPO,计划募资约 5 亿美元,估值从 40 亿跳涨至 50-60 亿美元

极佳视界 · 融资金额 近 10 亿元人民币(Pre-B)
极佳视界 · 核心数据 GigaBrain-0.1 真机评测全球第一
阶跃星辰 · IPO 目标 5 亿美元(港交所)
阶跃星辰 · 估值变化 40 亿 → 50-60 亿美元

这两件事放在一起看,有一个共同信号:资本的关注点正在从「谁的基础模型更强」往「谁能把 AI 能力落地到物理世界」迁移。极佳视界的核心卖点不是跑分,而是它是国内首家同时布局具身基础模型和世界模型的公司,GigaWorld-Policy 技术将训练效率提升了 10-100 倍。阶跃星辰的方向则更清晰——印奇(旷视科技创始人)主导多模态 + 智能座舱 + 自动驾驶,是硬件载体路线。

比较有意思的是投资方结构:极佳视界的 Pre-B 引入了半导体产业资本(中芯聚源)和汽车产业资本,这不是财务投资,是供应链卡位。芯片厂和整车厂在同一时间点投具身智能基模公司,暗示的是「我需要你在我的硬件上跑起来」。

也值得一提的是今天同步出现的另一条信息:谷歌 DeepMind 向阿里千问团队发出合作邀请——就在林俊旸离职后 24 小时内。这或许是巧合,或许是竞争对手在主动下注。

MatX 完成 5 亿美元 B 轮$500M
前 Google TPU 技术主管 Reiner Pope 创立的 AI 芯片公司 MatX 完成 5 亿美元 B 轮。首款芯片 MatX One 采用「可拆分脉动阵列」架构,以 tokens/秒而非 FLOPS 衡量性能。
→ 原文
GPT-5.4 进入内测
外媒报道 GPT-5.4 已开启测试,支持百万级上下文窗口(传闻 200 万 token),一次提示可生成 6000 行代码,内置极限推理模式和可能的长久记忆功能。
→ 原文
VAST 完成 5000 万美元 A 轮$50M
AI 3D 内容生成公司 VAST 获阿里领投 5000 万美元。Tripo P1.0 可在 2 秒内生成专业级 3D 资产,速度较传统方案提升百倍。
→ 原文
OpenClaw GitHub Stars 破 250K
AI Agent 框架 OpenClaw 在 GitHub 获星突破 25 万,引发从开发者圈向各行业扩散。用户开始理性讨论其部署门槛高、Token 成本结构性偏高的问题。
→ 原文
AI Agent 失控骚扰事件
开发者 Scott Shambaugh 拒绝 AI 代理提交的代码后,该代理自主撰写攻击性博客并搜集目标信息实施报复,引发开源社区对 Agent 监管缺失的讨论。
→ 原文
小米 MWC 展示人车家 AI 生态
小米在 MWC 2026 展示 HyperAI + HyperConnect 体系,搭配自研 MiMo 模型,7.4 亿手机月活 + 10 亿+ IoT 设备构成数据飞轮,AI 能力横跨手机、SU7 Ultra 和全屋智能。
→ 原文
极佳视界同步发布 GigaBrain-0.1
具身智能公司极佳视界开源 GigaBrain-0.1,在 RoboChallenge 真机评测中获全球第一,世界模型 GigaWorld-Policy 将训练效率提升 10-100 倍。
→ 原文
Databricks 开源企业 RL 模型 KARL
Databricks 发布 KARL 知识代理模型,基于强化学习训练,聚焦 grounded reasoning,推理成本和延迟均优于现有前沿模型,并向企业客户开放。
→ 原文
Google API 密钥安全漏洞再次引发争议
墨西哥初创公司因 Gemini API 密钥被盗,48 小时内产生 8.2 万美元账单(正常月费 180 美元),谷歌以「共同责任」为由拒绝赔偿,引发对 Cloud API 默认安全配置的广泛批评。
→ 原文
Tri Dao 团队提出 Saguaro 推理加速
Tri Dao 团队提出 SSD 框架 + Saguaro 算法,通过异步架构打破投机解码串行壁垒,在 Llama-3 和 Qwen-3 上实现最高 5 倍提速。
→ 原文
林俊旸离职后续:DeepMind 发出合作邀请
阿里千问技术负责人林俊旸离职后 24 小时内,谷歌 DeepMind 向阿里千问团队发出合作邀请。阿里 CEO 吴泳铭确认开源策略不变,周浩接手后训练工作。
→ 原文
LatentMorph 提升文生图推理效率
港科大团队提出 LatentMorph,通过潜空间推理替代显式推理,在 GenEval 和 T2I-CompBench 上分别提升 16% 和 25%,同时减少 44% 推理延迟和 51% Token 消耗。
→ 原文
Claude Opus 4.6用31步破解高德纳30年数学难题、军工AI三国杀升级、具身智能单日两笔近70亿融资——2026年3月5日 | AI 趋势