AI 每日精选 · 2026-04-29

6000亿美元算力、9B全双工与0.9元/秒视频:AI竞争开始同时改写三件事

今天真正的主线,不是“谁又发了一个模型”,而是基础设施投入、终端交互形态和软件生产入口三件事同时发生偏转。大厂继续把钱砸向训练与推理底座,小模型开始把自然交互搬到本地设备,开发工具则把“写代码”逐步改成“管理智能体”。这三条线一旦合流,AI行业比的就不再只是能力上限,而是谁能先形成可持续的使用闭环。

$6000亿+谷歌、Meta、微软、亚马逊年内合计AI基础设施资本支出计划
9BMiniCPM-o 4.5 参数量,目标是全双工全模态且可端侧运行
0.9元/秒HappyHorse 1.0 视频生成灰测定价,视频模型开始明码标价抢场景
主题一|钱先花出去,回报还在路上

四家巨头一年要投超6000亿美元,AI商业化第一次被迫接受“重资产长回收”

发生了什么:36氪援引市场信息称,谷歌、Meta、微软、亚马逊今年计划在 AI 基础设施上合计投入超过 6000 亿美元。与此同时,OpenAI 也在回应增长与营收质疑,一边否认失速,一边考虑广告和更低价套餐来扩大覆盖面。

为什么重要:这说明行业已经从“模型值不值得投”切换到“投了之后多久能回本”。过去两年大家默认大模型会很贵,但今天的问题变得更具体:如果云厂商和模型公司一起把资本开支、训练成本、推理补贴、价格战全往前压,那么商业化就不能只讲未来想象力,必须尽快给出可验证的收入结构。广告、SaaS、API、Agent订阅、按量计费都会被重新审视。

具体看,AI编程工具从订阅制转向按量计费,就是这一压力向下游传导的直接表现。GitHub Copilot 和 Claude Code 一旦更强调 token 消耗而不是统一月费,开发者感受到的就不再是“AI免费提效”,而是“每一次高频调用都对应明确成本”。同样,阿里 HappyHorse 1.0 给出 0.9 元/秒的视频生成价格,也是在把过去模糊的模型能力翻译成可采购、可比较的商品单位。

这会带来一个很现实的后果:未来半年,模型公司比拼的不只是“能不能做出来”,而是谁能把成本结构讲明白。资本市场允许先烧钱,但不会无限期容忍“高开支、低可见收入”的状态。今天这条线最值得关注的,不是 6000 亿这个数字本身,而是它逼着整个行业进入精算阶段。

主题二|交互开始从云端回到设备

MiniCPM-o 4.5 用 9B 参数做全双工全模态,本地实时 AI 正在变成新的产品门槛

发生了什么:MiniCPM-o 4.5 发布,主打端到端、全双工、全模态,只用 9B 参数就支持实时感知环境、同步理解意图并主动提醒,还强调可在个人电脑上运行、无需联网。另一侧,小米开源 MiMo-V2.5 和 V2.5-Pro,突出多模态推理、长周期一致性和 agentic 任务能力。

为什么重要:过去很多“多模态助手”更像是把语音输入接到云端大模型上,真正的瓶颈是延迟、打断能力、上下文连续性和隐私边界。全双工意味着机器不再等你说完才响应,而是像人一样边听边理解边插话;端侧运行则意味着这类交互开始脱离持续联网和高额推理成本。两者叠加后,AI产品的竞争维度会从回答质量,延伸到“陪伴感”“现场感”和“可嵌入性”。

这条线和今天关于AI生图越来越真假难辨的讨论其实也有关联。模型一旦更擅长实时理解环境、生成视觉内容、模拟细节噪点,就不只是提升体验,也会同步抬高真实性治理难度。能力下沉到设备端,带来的是更自然的交互和更广的应用边界,但也意味着审核、追踪和责任认定会更复杂。

从产品角度看,9B 这个数字本身也有象征意义:它说明“足够自然的多模态体验”未必只能靠超大参数模型完成。谁能在参数、延迟、功耗和体验之间找到平衡,谁就更可能占据下一代终端入口。

模型/产品今天释放的关键信号对应行业意义
MiniCPM-o 4.59B、全双工、全模态、可本地运行自然交互开始从云服务转向设备能力
MiMo-V2.5-Pro多模态推理、长周期一致性、面向 agentic 任务终端模型不再只追求轻量,也追求持续执行
HappyHorse 1.0视频生成灰测并直接定价 0.9 元/秒多模态能力开始用商品化方式进入广告、电商流程
主题三|开发入口正在被智能体改写

Visual Studio 2026、腾讯 ima Copilot 与 QCon 同时给出答案:软件工程不再只围着代码编辑器转

发生了什么:Visual Studio 2026 四月更新加入云端智能体集成和 Debugger Agent,可直接启动云执行会话并做基于运行时行为的验证;腾讯 ima Copilot 则把知识助手做成浮窗形态,支持记忆用户背景、调用知识库与官方技能包;QCon 北京上的共识更直接:软件工程正从“代码生产”转向“目标、上下文与约束管理”。

为什么重要:这几条新闻共同说明,AI 对开发者的改造已经越过“自动补全”阶段。新一代工具不只是帮你写函数,而是在接管任务拆解、跨文件导航、调试验证、知识检索和上下文记忆。开发者的核心能力会越来越像产品经理、系统设计者和审阅者——告诉智能体目标是什么、边界在哪、结果如何验收。

具体细节也很关键。Visual Studio 2026 把“云执行会话”和“Debugger Agent 验证”放进 IDE,本质上是让智能体离真实运行环境更近,而不是只停留在静态代码层;ima Copilot 强调个性化记忆和知识库浮窗,说明办公与研发工具都在争抢“常驻侧边栏”的位置;QCon 则从方法论上确认,未来的软件工程资产不只是代码仓库,还包括上下文、约束、工作流和可复用智能体。

这也解释了为什么 AI 编程工具的收费会开始波动。因为工具一旦从“建议生成器”升级成“持续调用模型、工具和执行环境的代理”,成本结构自然会更像云服务,而不是普通插件。对开发者来说,真正的变化不是编辑器里多了一个聊天框,而是整个开发入口正慢慢从键盘转向任务编排。

  • IDE 正在从代码容器,变成智能体的调度台。
  • 知识助手从“搜索框”升级成带记忆的常驻协作者。
  • 研发管理的重点,正在从写得更快,变成验得更稳、控得更清楚。

快讯

GPT Image 2 在文生图评测中超越谷歌 Nano Banana2,汉字生成得分达到 93.07,说明图像模型的竞争已不只是美观度,也包括文字准确性和长提示词理解。

POET 因违规披露订单细节遭 Marvell 砍单,股价单日近乎腰斩,AI 光模块产业链的高波动与客户集中风险再次暴露。

SimOne 4.0 在北京车展上主打把路测数据转成虚拟资产,并与英伟达及国产算力适配,智驾仿真平台开始向“物理 AI 工厂”叙事升级。

斑陌易行发布模块化无人配送平台与 SmartVLA,6m³ 空间、1000kg 载重等参数表明,无人配送正试图用标准化软硬件架构推进商业落地。

机器人产业加速从 Demo 走向量产,嘉立创强调从设计、打样到量产的一站式制造链路,说明机器人行业眼下最缺的不是想象力,而是工程交付能力。

SecureMaxx 试图用 agent-native 方式筛查 DNA 序列,对高风险序列的拒绝率可达 70% 到 100%,生物安全开始补齐大模型时代的防火墙。

Meta FAIR 发布 NeuralSet,把神经科学数据预处理做成统一框架,说明 NeuroAI 正在从概念讨论走向更可复用的研究基础设施。

ParseBench 教程 展示如何系统评估文档解析质量,文档理解这类看似基础的能力,仍是很多企业工作流自动化的前置门槛。

6000亿美元算力、9B全双工与0.9元/秒视频:4月29日AI开始同时重写成本、交互和开发入口 | AI 趋势