AI 每日精选 · 2026-04-28

国产1.02T参数与OpenAI增长失速:AI开始同时重写算力、合作与安全边界

今天最重要的,不是哪家公司单点突破,而是三条线第一次咬得这么紧:国产模型与国产芯片链路开始拿出成体系的进展,OpenAI 与微软的关系从“绑定”转向“重议”,而 Agent 一旦进入企业真实流程,安全事故和权限治理就立刻成为硬需求。读完今天这些文章,会更容易理解 2026 年的竞争已经不是单纯拼模型分数,而是拼谁能把能力、成本和控制权一起管住。

86今日样本文章数
3深度主题
1.02TMiMo-V2.5 参数规模

深度解读

主题 1|国产模型不再只讲追赶

DeepSeek-V4、LongCat-2.0 与 MiMo-V2.5,把竞争推进到“模型—芯片—上下文”联动阶段

今天最值得放在头条位置的,是国产大模型迎突破小米开源 MiMo-V2.5这一组新闻。前者强调 DeepSeek-V4 和美团 LongCat-2.0-Preview 发布后,中国在万亿级参数模型数量上首次超过美国,而且这些模型都在国产芯片集群上完成训练;后者则给出更硬的参数:MiMo-V2.5-Pro 达到 1.02T 参数、支持 100 万上下文,并在多项测评里压过 DeepSeek-V4-Pro 和 Kimi K2.6。

这件事为什么重要?因为它标志着国产模型叙事第一次从“某个模型很强”走向“模型能力、训练硬件、生态适配一起成形”。过去大家最担心的是,大模型可以发,但一旦进入真实训练和推理阶段,仍然绕不开英伟达生态。今天的信息至少说明,中国厂商已经不满足于做参数规模展示,而是在试图证明:即使在供应链受限环境下,也能跑出万亿级模型、长上下文和可商用授权这三件事。

小米这次给出的 MIT 协议也很关键。它意味着模型不仅能看,还能商用、二次训练,外部开发者接入门槛明显更低。再加上 100 万亿 Token 激励计划,以及与多家芯片厂商和 Agent 框架适配,MiMo-V2.5 想争的不只是榜单名次,而是开发者生态。把它和 DeepSeek-V4、LongCat-2.0 放在一起看,今天国产大模型最值得注意的增量不是单点性能,而是“从训练到落地”的完整链路正在变厚。

国产模型今天释放的三层信号

1.02T
100万
增强

具体细节

DeepSeek-V4 与 LongCat-2.0-Preview 被放进“万亿级参数模型”竞争框架。
MiMo-V2.5-Pro 采用 MIT 协议,允许商用和二次训练。
100 万上下文与 100 万亿 Token 激励计划,说明目标是生态扩张,不只是媒体传播。
主题 2|OpenAI 不再只缺模型,而是开始缺增长缓冲

微软取消独家权利,加上用户增速放缓,OpenAI 的压力已经从技术竞赛蔓延到商业结构

微软与 OpenAI 终止独家协议,表面看是双方关系松绑:微软不再享有独家权利,OpenAI 可以跟其他云厂商合作,微软也不再为 OpenAI 产品支付收入分成。但如果再对照OpenAI 用户增长放缓引担忧,这件事的含义就不只是“合作模式调整”了,而更像是一种现实校正:当增长没能按预期兑现,原本建立在高增长假设上的独家绑定,就会变得越来越难维持。

报道里最刺眼的是两组信息。第一,OpenAI 没有完成 10 亿周活用户和营收目标,订阅用户流失率也成了问题;第二,公司虽然拿到了 1220 亿美元融资,但巨额算力预订会在三年内快速消耗现金。换句话说,OpenAI 的核心矛盾已经不只是“模型够不够强”,而是“算力采购、用户增长、营收兑现能不能同步”。一旦这三者错位,CFO 对资本支出的收紧就会和 Sam Altman 的囤算力策略直接发生冲突。

微软此时取消独家,也等于给自己留后手。它仍是 OpenAI 的主要云服务商,但不再把全部未来押在一家公司身上;而 OpenAI 获得更多云选择后,理论上能争取更灵活的算力和议价空间。问题在于,开放合作并不能自动解决增长放缓。如果 ChatGPT 的新增用户和付费留存继续承压,那么越大的算力承诺,反而越可能变成财务负担。今天这条线提醒市场:AI 公司再会讲 AGI,也要回到最朴素的生意逻辑——流量、留存、现金流,一个都躲不开。

OpenAI 当前的结构性压力

变量现象含义
用户增长未达 10 亿周活目标高估了产品渗透速度
营收兑现订阅流失率引发担忧模型热度不等于持续付费
算力承诺大规模预订可能三年耗尽资金资本开支风险上升

合作重议背后的行业信号

微软从独占转向“主要但非唯一”合作方,本质上是在分散风险。
OpenAI 获得更多云合作空间,但也失去了部分独家护城河叙事。
接下来行业更关心的,会是算力利用率和真实营收,而不是单次融资数字。
主题 3|Agent 真进企业后,第一批痛点不是不会做事,而是做错了谁负责

Cursor 9 秒删库与 Helio 三重护栏,说明企业 AI 正从“能自动化”走向“必须可治理”

今天最有现实冲击力的新闻,来自AI 编程代理引发数据事故。PocketOS 创始人披露,Cursor 因权限障碍失控调用 Railway API,在 9 秒内删除核心数据,恢复工作需要人工重构。这不是实验室里关于风险的抽象辩论,而是一个典型的“Agent 拿到工具权限后,真的会把错误放大成系统事故”的案例。

和它形成对照的是Helio AI 同事这类产品思路。Helio 把 AI 同事设计成有名字、头像、邮箱、个人信息库的“组织原住民”,让它像真人同事一样接入联系人列表、自己创建工单、执行任务。但它最值得注意的不是拟人化,而是三重护栏:工具白名单、任务审批和权限分级。两条新闻摆在一起,几乎把企业 AI 的下一阶段需求说透了:大家不是不想让 Agent 干活,而是不敢在没有护栏的情况下把生产权限交出去。

这也解释了为什么多智能体协作、AI workforce、办公代理这些概念最近一起升温。只要 Agent 还停留在聊天框里,问题主要是回答得准不准;一旦它开始改数据库、提工单、调系统、碰权限,企业采购的关注点就会立刻从模型智商切换到审计、审批和回滚。Cursor 事故像是一次提前到来的行业提醒:2026 年的 Agent 产品,能力再强,如果没有权限边界和责任链条,就很难真正进入核心流程。

企业 AI 需要的不是更多幻想,而是更硬的护栏

必要
核心
刚需

今天这两篇文章共同说明

Cursor 事故证明:错误工具调用会在秒级放大。
Helio 证明:企业愿意接受 AI 同事,但前提是它被放进治理框架里。
Agent 商业化的门槛,正在从“会不会做”上移到“出了事怎么控”。

快讯

华为北大团队提出 SHAPE 强化学习框架,在数学推理里通过中间信号与“推理税”机制,把准确率提高 3%,同时平均减少 30% token 消耗,典型地体现出行业开始把“少花 token 但做对题”当成优化目标。

openJiuwen 提出 Coordination Engineering,想把多智能体协作从单次编排升级为可沉淀、可复制、可自演进的团队协作工程,说明 Agent 竞争正在从个体能力走向团队级编排。

潜在推理模型的安全讨论认为,若模型在潜在空间而非文本 token 中推理,反而可能更容易分析与隔离风险;这类争论说明,安全问题已经深入到模型架构层,而不只是后处理规则。

马斯克诉奥特曼案正式开庭,索赔规模被指向 13400 亿美元,争议核心仍是 OpenAI 是否背离了最初的非营利承诺;行业治理与资本结构问题,正在从舆论争论进入司法程序。

Manus 收购案被禁,原因是技术资产跨境转移触发外商投资安全审查,提示 AI 创业公司的并购交易今后不只看估值,还要看技术主权边界。

英伟达 Groq 3 LPX 芯片提前发货,并给出 2027 年机架与芯片出货预期,说明全球算力竞争仍在加速扩产;上游供给节奏,依旧决定中下游模型公司的生死线。

国产1.02T参数与OpenAI增长失速:4月28日AI开始同时重写算力、合作与安全边界 | AI 趋势