3. 算力工厂和3D世界模型一起升温,AI基础设施正在变重

发生了什么算力世界模型

今天有两组新闻放在一起看,特别有意思。一边是九章云极发布AI工厂战略,提出10万P智能算力集群、单日10万亿Token流转承载力和千倍级综合降本;另一边是影溯完成Pre-A轮融资极佳视界拿到10亿元B2轮,都在押注动态3D世界模型和物理AGI。

这说明AI基础设施正在同时向两个方向变重。第一个方向是算力工业化:不是买几张卡跑个Demo,而是把训练、推理、调度、能效、计费和交付变成工厂体系。第二个方向是数据与表示工业化:世界模型不再满足于“生成看起来像的视频”,而是要构建带几何、尺度、材质、运动和交互关系的动态3D状态。前者解决“算得起”,后者解决“学得会”,两边都不是轻公司的路子。

细节上,九章云极把DCU作为度量衡、把专业Token作为产出单元,本质是在试图复制电力工业那种标准化交付逻辑;影溯则强调真实采集、3D重建、生成增强和模型训练迭代的数据飞轮,意味着世界模型竞争的护城河会越来越偏向数据资产和场景闭环。Radical AI在材料科学里六个月测试1200种合金、找出10种有商业潜力的新材料,也印证了同一种趋势:AI一旦进入物理世界,胜负手往往不在模型名称,而在实验系统、数据回流和基础设施密度。

快讯

  • 微软重新校准AI能耗叙事微软研究称大规模AI查询单次耗电约0.16至0.60瓦时,且通过模型、服务和硬件优化可实现8到20倍能效提升。
  • Databricks和NVIDIA把代理时代的全栈拼得更完整双方合作覆盖Blackwell、Agent Toolkit、AIR和行业方案,重点不再是单一模型,而是整套生产环境。
  • RAG系统开始更重视“引用是否真对”这篇方法论文章提出把Faithfulness和Citation Accuracy拆开评估,说明企业问答正在从“能答”走向“能审计”。
  • SQL版轻量多跳检索值得关注SAG方案在5亿数据规模下仍保持秒级检索,Recall@5达到80.04%,对私有化知识库很有现实吸引力。
  • 谷歌A2A协议继续外溢A2A解析显示,多智能体协作正在补标准层,HTTP、JSON-RPC和SSE这类传统协议又被重新拉回中心。
  • NVIDIA开始把Skill安全检查产品化SkillSpector支持静态分析、SARIF报告和自定义分析器,代理时代的“供应链安全”会越来越像软件安全。
  • 合成数据的对齐风险又被敲了一次警钟这篇讨论认为高能力模型可能识别人造痕迹并反向不信任训练者,提醒对齐方法也会有规模副作用。
  • 小模型后训练还在抬高性价比天花板VibeThinker-3B证明,在验证信号清晰的任务里,小模型依然有机会逼近前沿能力。
  • 无人机具身控制继续突破浙大团队让无人机仅靠单目相机极限侧身穿缝,成功率达到96%,具身智能的进展开始越来越像工程落地而非实验室演示。
3. 算力工厂和3D世界模型一起升温,AI基础设施正在变重 | AI 趋势