AI 每日精选 · 2026-04-29

6000亿美元算力、9B全双工与0.9元/秒视频：AI竞争开始同时改写三件事

今天真正的主线，不是“谁又发了一个模型”，而是基础设施投入、终端交互形态和软件生产入口三件事同时发生偏转。大厂继续把钱砸向训练与推理底座，小模型开始把自然交互搬到本地设备，开发工具则把“写代码”逐步改成“管理智能体”。这三条线一旦合流，AI行业比的就不再只是能力上限，而是谁能先形成可持续的使用闭环。

$6000亿+谷歌、Meta、微软、亚马逊年内合计AI基础设施资本支出计划

9BMiniCPM-o 4.5 参数量，目标是全双工全模态且可端侧运行

0.9元/秒HappyHorse 1.0 视频生成灰测定价，视频模型开始明码标价抢场景

深度解读

挑出 3 个最有认知增量的主题，讲清今天发生了什么，以及它为什么重要。

资本投入

6000亿+

交互下沉

9B本地

工具改写

Agent入口

今天的判断

如果把今天的新闻放在一起看，AI行业已经不再沿着单一主线前进。最上游是云厂商和平台公司继续押注算力与数据中心，中间层是模型形态从“云上回答器”变成“可实时交互的环境代理”，最下游则是开发、办公和内容生产软件把智能体直接嵌进原有工作流。换句话说，行业开始从“模型发布节奏”转向“系统渗透速度”。

这也是为什么同一天里，既能看到资本开支与商业化焦虑并存，也能看到端侧模型、本地Copilot、云端开发智能体和视频生成定价一起出现：厂商都在试图抢同一个位置——成为用户真正打开工作的第一入口。

主题一｜钱先花出去，回报还在路上

四家巨头一年要投超6000亿美元，AI商业化第一次被迫接受“重资产长回收”

发生了什么：36氪援引市场信息称，谷歌、Meta、微软、亚马逊今年计划在 AI 基础设施上合计投入超过 6000 亿美元。与此同时，OpenAI 也在回应增长与营收质疑，一边否认失速，一边考虑广告和更低价套餐来扩大覆盖面。

为什么重要：这说明行业已经从“模型值不值得投”切换到“投了之后多久能回本”。过去两年大家默认大模型会很贵，但今天的问题变得更具体：如果云厂商和模型公司一起把资本开支、训练成本、推理补贴、价格战全往前压，那么商业化就不能只讲未来想象力，必须尽快给出可验证的收入结构。广告、SaaS、API、Agent订阅、按量计费都会被重新审视。

具体看，AI编程工具从订阅制转向按量计费，就是这一压力向下游传导的直接表现。GitHub Copilot 和 Claude Code 一旦更强调 token 消耗而不是统一月费，开发者感受到的就不再是“AI免费提效”，而是“每一次高频调用都对应明确成本”。同样，阿里 HappyHorse 1.0 给出 0.9 元/秒的视频生成价格，也是在把过去模糊的模型能力翻译成可采购、可比较的商品单位。

这会带来一个很现实的后果：未来半年，模型公司比拼的不只是“能不能做出来”，而是谁能把成本结构讲明白。资本市场允许先烧钱，但不会无限期容忍“高开支、低可见收入”的状态。今天这条线最值得关注的，不是 6000 亿这个数字本身，而是它逼着整个行业进入精算阶段。

主题二｜交互开始从云端回到设备

MiniCPM-o 4.5 用 9B 参数做全双工全模态，本地实时 AI 正在变成新的产品门槛

发生了什么：MiniCPM-o 4.5 发布，主打端到端、全双工、全模态，只用 9B 参数就支持实时感知环境、同步理解意图并主动提醒，还强调可在个人电脑上运行、无需联网。另一侧，小米开源 MiMo-V2.5 和 V2.5-Pro，突出多模态推理、长周期一致性和 agentic 任务能力。

为什么重要：过去很多“多模态助手”更像是把语音输入接到云端大模型上，真正的瓶颈是延迟、打断能力、上下文连续性和隐私边界。全双工意味着机器不再等你说完才响应，而是像人一样边听边理解边插话；端侧运行则意味着这类交互开始脱离持续联网和高额推理成本。两者叠加后，AI产品的竞争维度会从回答质量，延伸到“陪伴感”“现场感”和“可嵌入性”。

这条线和今天关于AI生图越来越真假难辨的讨论其实也有关联。模型一旦更擅长实时理解环境、生成视觉内容、模拟细节噪点，就不只是提升体验，也会同步抬高真实性治理难度。能力下沉到设备端，带来的是更自然的交互和更广的应用边界，但也意味着审核、追踪和责任认定会更复杂。

从产品角度看，9B 这个数字本身也有象征意义：它说明“足够自然的多模态体验”未必只能靠超大参数模型完成。谁能在参数、延迟、功耗和体验之间找到平衡，谁就更可能占据下一代终端入口。

模型/产品	今天释放的关键信号	对应行业意义
MiniCPM-o 4.5	9B、全双工、全模态、可本地运行	自然交互开始从云服务转向设备能力
MiMo-V2.5-Pro	多模态推理、长周期一致性、面向 agentic 任务	终端模型不再只追求轻量，也追求持续执行
HappyHorse 1.0	视频生成灰测并直接定价 0.9 元/秒	多模态能力开始用商品化方式进入广告、电商流程

主题三｜开发入口正在被智能体改写

Visual Studio 2026、腾讯 ima Copilot 与 QCon 同时给出答案：软件工程不再只围着代码编辑器转

发生了什么：Visual Studio 2026 四月更新加入云端智能体集成和 Debugger Agent，可直接启动云执行会话并做基于运行时行为的验证；腾讯 ima Copilot 则把知识助手做成浮窗形态，支持记忆用户背景、调用知识库与官方技能包；QCon 北京上的共识更直接：软件工程正从“代码生产”转向“目标、上下文与约束管理”。

为什么重要：这几条新闻共同说明，AI 对开发者的改造已经越过“自动补全”阶段。新一代工具不只是帮你写函数，而是在接管任务拆解、跨文件导航、调试验证、知识检索和上下文记忆。开发者的核心能力会越来越像产品经理、系统设计者和审阅者——告诉智能体目标是什么、边界在哪、结果如何验收。

具体细节也很关键。Visual Studio 2026 把“云执行会话”和“Debugger Agent 验证”放进 IDE，本质上是让智能体离真实运行环境更近，而不是只停留在静态代码层；ima Copilot 强调个性化记忆和知识库浮窗，说明办公与研发工具都在争抢“常驻侧边栏”的位置；QCon 则从方法论上确认，未来的软件工程资产不只是代码仓库，还包括上下文、约束、工作流和可复用智能体。

这也解释了为什么 AI 编程工具的收费会开始波动。因为工具一旦从“建议生成器”升级成“持续调用模型、工具和执行环境的代理”，成本结构自然会更像云服务，而不是普通插件。对开发者来说，真正的变化不是编辑器里多了一个聊天框，而是整个开发入口正慢慢从键盘转向任务编排。

IDE 正在从代码容器，变成智能体的调度台。
知识助手从“搜索框”升级成带记忆的常驻协作者。
研发管理的重点，正在从写得更快，变成验得更稳、控得更清楚。

快讯

GPT Image 2 在文生图评测中超越谷歌 Nano Banana2，汉字生成得分达到 93.07，说明图像模型的竞争已不只是美观度，也包括文字准确性和长提示词理解。

POET 因违规披露订单细节遭 Marvell 砍单，股价单日近乎腰斩，AI 光模块产业链的高波动与客户集中风险再次暴露。

SimOne 4.0 在北京车展上主打把路测数据转成虚拟资产，并与英伟达及国产算力适配，智驾仿真平台开始向“物理 AI 工厂”叙事升级。

斑陌易行发布模块化无人配送平台与 SmartVLA，6m³ 空间、1000kg 载重等参数表明，无人配送正试图用标准化软硬件架构推进商业落地。

机器人产业加速从 Demo 走向量产，嘉立创强调从设计、打样到量产的一站式制造链路，说明机器人行业眼下最缺的不是想象力，而是工程交付能力。

SecureMaxx 试图用 agent-native 方式筛查 DNA 序列，对高风险序列的拒绝率可达 70% 到 100%，生物安全开始补齐大模型时代的防火墙。

Meta FAIR 发布 NeuralSet，把神经科学数据预处理做成统一框架，说明 NeuroAI 正在从概念讨论走向更可复用的研究基础设施。

ParseBench 教程展示如何系统评估文档解析质量，文档理解这类看似基础的能力，仍是很多企业工作流自动化的前置门槛。