MiniCPM-o 4.5 用 9B 参数做全双工全模态,本地实时 AI 正在变成新的产品门槛

发生了什么:MiniCPM-o 4.5 发布,主打端到端、全双工、全模态,只用 9B 参数就支持实时感知环境、同步理解意图并主动提醒,还强调可在个人电脑上运行、无需联网。另一侧,小米开源 MiMo-V2.5 和 V2.5-Pro,突出多模态推理、长周期一致性和 agentic 任务能力。

为什么重要:过去很多“多模态助手”更像是把语音输入接到云端大模型上,真正的瓶颈是延迟、打断能力、上下文连续性和隐私边界。全双工意味着机器不再等你说完才响应,而是像人一样边听边理解边插话;端侧运行则意味着这类交互开始脱离持续联网和高额推理成本。两者叠加后,AI产品的竞争维度会从回答质量,延伸到“陪伴感”“现场感”和“可嵌入性”。

这条线和今天关于AI生图越来越真假难辨的讨论其实也有关联。模型一旦更擅长实时理解环境、生成视觉内容、模拟细节噪点,就不只是提升体验,也会同步抬高真实性治理难度。能力下沉到设备端,带来的是更自然的交互和更广的应用边界,但也意味着审核、追踪和责任认定会更复杂。

从产品角度看,9B 这个数字本身也有象征意义:它说明“足够自然的多模态体验”未必只能靠超大参数模型完成。谁能在参数、延迟、功耗和体验之间找到平衡,谁就更可能占据下一代终端入口。

模型/产品今天释放的关键信号对应行业意义
MiniCPM-o 4.59B、全双工、全模态、可本地运行自然交互开始从云服务转向设备能力
MiMo-V2.5-Pro多模态推理、长周期一致性、面向 agentic 任务终端模型不再只追求轻量,也追求持续执行
HappyHorse 1.0视频生成灰测并直接定价 0.9 元/秒多模态能力开始用商品化方式进入广告、电商流程
主题三|开发入口正在被智能体改写
MiniCPM-o 4.5 用 9B 参数做全双工全模态,本地实时 AI 正在变成新的产品门槛 | AI 趋势