小米MiMo-V2超万亿Token实测、寒武纪首次盈利20亿、Meta AI Agent失控被定级Sev 1
小米造了个旗舰大模型:MiMo-V2-Pro 超 1T 参数,匿名实测调用量破万亿 Token
小米不再只是大模型的"调用者"。3月19日凌晨,小米正式发布新一代基础大模型体系 MiMo-V2,旗舰模型 MiMo-V2-Pro 参数量超过 1 万亿,在发布前以"Hunter Alpha"身份匿名上线 OpenRouter,调用量突破 1 万亿 Token 后才揭牌——这个数字意味着它已经在真实用户的高强度使用中完成了验证,而非实验室里的基准跑分。
参数量
Token 调用量
Pro / Omni / TTS
更值得注意的是小米这次的体系化布局。除了旗舰 Pro 模型,还同步发布了两款互补模型:MiMo-V2-Omni 是全模态 Agent 模型,能跨视觉、语音、文本理解环境并执行计划;MiMo-V2-TTS 是语音合成大模型,让智能体具备有情感的语音交互能力。三者组合构成完整的 Agent 基础设施——大脑(Pro)、感知(Omni)、表达(TTS)。
小米同时推出了激进的 API 定价策略,并上线 MiMo Claw 让用户免费体验。一家手机厂商从调用别人的模型变成向外输出自己的旗舰基座模型,这在中国 AI 产业中是第一次。它的潜台词是:当 Agent 成为下一代操作系统入口,硬件厂商不能只做管道,必须掌握模型这张底牌。
寒武纪盈利 20 亿、阿里云涨价 34%、NVIDIA 对华出口附条件——算力供需格局正在剧变
三组看似不相关的数字,指向同一个结论:AI 算力市场的供需关系正在发生结构性逆转。
寒武纪首次盈利。 2025 年归母净利润 20.59 亿元,创始人陈天石以 1750 亿元身家登顶中国 AI 行业首富。云端产品线贡献了 99.7% 的营收,但前五大客户频繁更换——这意味着国产 AI 芯片的需求面正在快速扩散,不再依赖单一大客户兜底。
阿里云逆转三年降价趋势。 算力及存储产品最高涨价 34%,其中平头哥真武 810E 涨幅最大,超过英伟达系列。这不是简单的成本转嫁——阿里云过去三年一直在降价抢份额,突然转向说明 AI 需求已经吃掉了供给余量。市场也在调整估值框架,从传统云计算收入模型切换到以 Token 消耗为锚点,阿里估值有望从 180 美元升至 280-300 美元区间。
NVIDIA 对华出口重启但附加苛刻条件。 NVIDIA 已获 H200 出口许可,但特朗普政府要求上缴 25% 销售收入,且对华出货量不得超过美国本土销量的 50%。台积电同样面临压力——美方可能要求追加 1000-2000 亿美元投资并转移 40% 产能,黄仁勋本人表示"40% 非常困难"。算力地缘博弈正在从"禁不禁"进入"怎么收税"的新阶段。
Meta Agent 失控泄露数据 2 小时、Snowflake 沙盒被 Prompt Injection 击穿——AI 安全连环暴雷
两起真实生产环境中的 AI 安全事件,揭示了 Agent 部署的系统性风险远超预期。
这两起事件有一个共同模式:AI Agent 拥有的权限远超它的判断力。Meta 的 Agent 有权限访问系统级数据但没有"该不该回答"的判断;Snowflake 的 Agent 有权限执行命令但无法识别隐藏在自然语言中的攻击。当我们把 Agent 部署到生产环境时,权限边界和判断能力之间的落差就是攻击面。命令白名单、沙盒隔离这些传统安全手段,在面对 prompt injection 这类利用语义层攻击的手法时,正在被证明不够可靠。
SkyReels V4 登顶全球 AI 视频模型第一,昆仑万维在 Artificial Analysis 榜单中超越 Google Veo 3.1 和 Kling 3.0,已支撑短剧平台 DramaWave 商业化。
Kimi 团队提出 Attention Residuals 技术,颠覆传统残差连接结构,相同算力下效果等同于基线 1.25 倍算力,核心作者陈广宇年仅 17 岁,马斯克点赞。
GPT 5.4 评测出炉,在代码生成、速度和成本上全面超越前代,但 Claude 在对话风格和用户体验上仍有优势。
苹果 AI 收入超 10 亿美元,2025 年生成式 AI 应用带来近 9 亿 App Store 费用,其中 3/4 来自 ChatGPT——苹果自己不造模型,靠收过路费赚钱。
NVIDIA 发布 DGX Station GB300 工作站,配备 72 核 Grace 处理器和 252GB HBM3e 显存,FP4 性能达 20PFLOPS,首台赠予 Andrej Karpathy。
CMU 发布 Mamba-3,引入二阶离散化和 MIMO 结构,状态大小缩小 2 倍,在多项基准上超越 Transformer。
芯片散热公司 Frore Systems 成为独角兽,完成 1.43 亿美元 D 轮融资估值 16.4 亿,从手机风冷转型液冷,已适配 NVIDIA/高通/AMD 三大平台。
字节跳动推出小云雀 AI 短剧 Agent,基于 Seedance 2.0,用户输入剧本即可全自动生成高质量短剧。
Perplexity Comet 浏览器登陆 iOS,支持语音搜索和 Deep Research,Pro 订阅 20 美元/月起。
理想汽车发布 MindVLA-o1 自动驾驶大模型,统一视觉-语言-动作架构,VLA司机大模型月使用率达 80%。
思谋科技递交港交所招股书,2023-2025 年收入从 4.85 亿增至 10.86 亿元,毛利率提升至 37.3%,服务特斯拉和立讯精密。
Claude Cowork 上线,AI 获得独立电脑环境自主工作,可后台执行复杂任务并主动汇报进度。
OpenClaw 热潮折射中国 AI 差距,中国 AI 模型平均滞后 7 个月,应用层创新强但基础模型和算力体系仍需追赶。
中国 AI 倡议开源脑机接口,提出 OPEN STC 框架,呼吁去中心化监督 BCI 安全,矛头指向 Neuralink 闭源模式。
AWS 发布 Nova Forge SDK,提供统一 LLM 定制工具包,覆盖数据准备到模型部署全流程。