AI 每日精选 · 2026-06-18

GLM-5.2的1M上下文、20亿美元融资与10万P算力:42篇信息里的3个真变化

今天最值得看的,不是单篇爆款,而是几条线索开始互相咬合:模型在往长程执行走,应用公司开始拿到真金白银的商业验证,算力与世界模型则越来越像下一代基础设施。AI行业正在从“新鲜功能”阶段,切进“谁能稳定生产能力”的阶段。

42覆盖文章
3深度主题
1MGLM-5.2上下文
10万PAI工厂目标算力

深度解读

1. 长程任务开始取代聊天体验,模型竞争的标尺变了

智谱开源GLM-5.2,把卖点直接放在长程任务上:1M上下文窗口、面向复杂软件工程、在Code Arena盲测中拿到全球可用模型第一。几乎同一时间,GitHub CopilotVS Code团队都在谈另一件事:不是再堆一个更会说话的模型,而是通过上下文缓存、工具搜索和HyDRA路由,让模型在真实开发流程里更快、更便宜、更稳。

这件事重要,是因为行业已经不再按“回答是否聪明”来定胜负,而是在看模型能不能把一段跨步骤、跨文件、跨工具的工作做完。1M上下文本身不是终点,终点是让模型在长链路里别失忆、别跑偏、别把成本打爆。GLM-5.2强调IndexShare架构和Slime训练框架,Copilot强调缓存命中和模型路由,本质上都在解决同一个问题:怎样把大模型从一个对话引擎,改造成一个可连续执行的工作引擎。

细节也很说明问题。GLM-5.2被多篇报道反复提到支持国产算力平台,说明它瞄准的不是单纯开源口碑,而是企业部署可行性。Vercel新开源的Eve则从框架层面补齐了这一趋势:它把Agent定义成目录文件,内建持久执行、沙盒计算和人工审批,且Vercel内部已跑了100多个代理。模型、路由和编排框架在同一天集中出现,说明“长程执行”正在从能力宣传变成工程共识。

上下文长度
1M
路由效率
部署成熟度
进化中

读法提示:今天真正的竞争,不是“谁参数更大”,而是“谁能把长任务做成产品能力”。

2. 资本开始奖励已验证收入的AI应用,而不是只奖励想象力

发生了什么融资商业化

演语科技完成近3亿美元B+轮融资,估值超过20亿美元,同时披露ARR已到3亿美元。这组数字比“又融了一轮”更关键,因为它把AI应用公司的估值锚,从想象中的未来市场,拉回到可验证的收入能力。公司旗下LiblibAI、星流、LibTV横跨图片生成、Agent和视频生成三波浪潮,说明资本现在愿意为“跨模型迭代还能持续卖出去”的团队付钱。

为什么重要?因为过去一年市场对AI应用的最大疑问一直是:模型能力天天变,应用层会不会被平台吃掉?演语科技给出的回答不是理论,而是商业数字。ARR 3亿美元意味着它不是靠一次性流量冲高,而是在订阅和持续使用层面已经形成惯性。今天同类信号也出现在别处:九章云极讲AI工厂时不再只谈愿景,而是把专业Token当作产出单位;这说明无论做应用还是做基础设施,市场都在要求更明确的“单位经济模型”。

这会直接改变下一波创业叙事。未来能拿高估值的,不会只是最早接入新模型的人,而是能在图片、视频、办公、Agent这些不同浪潮切换时保住留存和收入的人。反过来看,那些只依赖单一模型红利、没有工作流和分发能力的产品,会越来越难讲出独立故事。

公司/方向今天释放的关键信号
演语科技近3亿美元融资,20亿美元估值,ARR 3亿美元,AI应用商业化开始有硬指标。
九章云极把专业Token定义为产出单元,说明基础设施公司也在被要求证明可计量价值。
AI应用赛道估值逻辑从“先占坑”转向“收入、留存、跨浪潮生存能力”。

3. 算力工厂和3D世界模型一起升温,AI基础设施正在变重

发生了什么算力世界模型

今天有两组新闻放在一起看,特别有意思。一边是九章云极发布AI工厂战略,提出10万P智能算力集群、单日10万亿Token流转承载力和千倍级综合降本;另一边是影溯完成Pre-A轮融资极佳视界拿到10亿元B2轮,都在押注动态3D世界模型和物理AGI。

这说明AI基础设施正在同时向两个方向变重。第一个方向是算力工业化:不是买几张卡跑个Demo,而是把训练、推理、调度、能效、计费和交付变成工厂体系。第二个方向是数据与表示工业化:世界模型不再满足于“生成看起来像的视频”,而是要构建带几何、尺度、材质、运动和交互关系的动态3D状态。前者解决“算得起”,后者解决“学得会”,两边都不是轻公司的路子。

细节上,九章云极把DCU作为度量衡、把专业Token作为产出单元,本质是在试图复制电力工业那种标准化交付逻辑;影溯则强调真实采集、3D重建、生成增强和模型训练迭代的数据飞轮,意味着世界模型竞争的护城河会越来越偏向数据资产和场景闭环。Radical AI在材料科学里六个月测试1200种合金、找出10种有商业潜力的新材料,也印证了同一种趋势:AI一旦进入物理世界,胜负手往往不在模型名称,而在实验系统、数据回流和基础设施密度。

快讯

  • 微软重新校准AI能耗叙事微软研究称大规模AI查询单次耗电约0.16至0.60瓦时,且通过模型、服务和硬件优化可实现8到20倍能效提升。
  • Databricks和NVIDIA把代理时代的全栈拼得更完整双方合作覆盖Blackwell、Agent Toolkit、AIR和行业方案,重点不再是单一模型,而是整套生产环境。
  • RAG系统开始更重视“引用是否真对”这篇方法论文章提出把Faithfulness和Citation Accuracy拆开评估,说明企业问答正在从“能答”走向“能审计”。
  • SQL版轻量多跳检索值得关注SAG方案在5亿数据规模下仍保持秒级检索,Recall@5达到80.04%,对私有化知识库很有现实吸引力。
  • 谷歌A2A协议继续外溢A2A解析显示,多智能体协作正在补标准层,HTTP、JSON-RPC和SSE这类传统协议又被重新拉回中心。
  • NVIDIA开始把Skill安全检查产品化SkillSpector支持静态分析、SARIF报告和自定义分析器,代理时代的“供应链安全”会越来越像软件安全。
  • 合成数据的对齐风险又被敲了一次警钟这篇讨论认为高能力模型可能识别人造痕迹并反向不信任训练者,提醒对齐方法也会有规模副作用。
  • 小模型后训练还在抬高性价比天花板VibeThinker-3B证明,在验证信号清晰的任务里,小模型依然有机会逼近前沿能力。
  • 无人机具身控制继续突破浙大团队让无人机仅靠单目相机极限侧身穿缝,成功率达到96%,具身智能的进展开始越来越像工程落地而非实验室演示。
GLM-5.2的1M上下文、20亿美元融资与10万P算力:42篇信息里的3个真变化 | AI 趋势