GTC 2026：黄仁勋五层蛋糕定义Token工厂时代，AI安全攻防成本差距扩大100倍

深度解读

DEEP DIVE 01

黄仁勋「五层蛋糕」与Token工厂：GTC 2026的核心叙事

黄仁勋在GTC 2026的署名长文里，把AI应用的价值层级切成「五层蛋糕」：从基础算力到感知、推理、规划，最终到自主行动。他的核心论断是模型能力已跨过一个关键门槛——性能提升、推理增强、幻觉减少，三者叠加让AI首次能创造真实经济价值。

与此同时，Token正在成为Agent时代的统一度量衡。黄仁勋提出数据中心向「Token工厂」转型，并给出按吞吐量与交互响应速度两个维度分层定价的框架——这和传统云计算按CPU时/GB计费的逻辑是根本性的断裂。

Token工厂：两种服务模式的性能取向

批量推理

高吞吐 ↑

批量推理

低时延

交互推理

中吞吐

交互推理

低时延 ↑

联想与英伟达在GTC现场联合发布混合AI推理方案，强调缩短「首Token时间（TTFT）」，这正是交互推理层的核心竞争指标——黄仁勋框架下，联想选择了后半段的落地战场。

值得关注的是，两股浪潮之间存在时间差：智能体驱动的企业算力需求已在落地，而黄仁勋预言的下一波——面向真实世界的物理AI（通过世界模型理解「恒常性」）——仍处于早期。Token工厂的定价模型更多服务于第一波；物理AI能否复用这套框架，还是个开放问题。

DEEP DIVE 02

这篇文章拆解了一个令人不安的非对称：AI与Agent的组合让侦察、漏洞利用、钓鱼、横向移动全链路实现7×24自动化，综合攻击成本降低100至1000倍。传统安全团队的低频红队评估和周期性漏洞扫描，根本覆盖不了这种持续演进的攻击路径。

传统攻击（人工）

× 1

→

Agent驱动攻击

÷ 100–1000

Armadin的解法是以攻对攻：部署「agent swarm」，在大规模生产环境中持续模拟国家级APT攻击路径，而不是等周期性红队检测。这背后的逻辑是：防御的频率必须至少匹配攻击的频率，否则漏洞窗口会在下一次扫描之前被利用并清除痕迹。

这里有个行业结构性问题值得注意：攻击者天然比防御者更早享受到自动化红利——他们只需要找到一个漏洞，而防守方需要堵上所有漏洞。Agent让这种不对称被放大了一个数量级。安全行业如果没有类似的agent-native防御产品，现有的安全态势评估框架实际上已经失效。

快讯

基础设施 Niv-AI获1200万美元种子轮，部署机架级传感器精确测量GPU毫秒级功耗脉冲，计划用预测模型帮数据中心找回被调度浪费的约30%算力利用率。TechCrunch

数据库 向量数据库走向AI Lakebase：Milvus深度集成英伟达cuVS CAGRA（支持Hybrid GPU-CPU检索），通过DataStax等生态让向量存储从独立组件演变为AI数据基础设施的统一入口。原文

苹果 苹果发布LiTo，仅凭单张平面图像重建完整3D对象，通过统一的3D潜在表示将表面光场编码为紧凑向量集，多视角下保持光影一致。cnBeta

Agent框架 OpenClaw清华黑客松：清北社区AttraX发起"Outlier"黑客松，300+报名、25队入围、500+人涌入现场，OpenClaw作为开源Agent框架成为热门技术选型。36Kr · 百度、阿里、腾讯也在同期围绕"零门槛使用"加速布局国内方案。

监管 参议员要求暂停Seedance 2.0：美国参议员布莱克本与韦尔奇致信字节跳动CEO梁汝波，称该AI视频应用可能生成汤姆·克鲁斯等真人影像，引发版权、肖像权风险。cnBeta

对齐 通义P-GenRM获ICLR 2026 Oral：提出个性化生成式奖励模型，不再输出黑箱分数，而是生成可读「评分链」（persona画像→rubric→逐条打分），训练采用SFT+RL组合，面向开放域个性化对齐。原文

工程 子代理管理大任务上下文：Simon Willison总结LLM工程模式——主代理把探索类耗Token工作交给带全新上下文的子代理执行，Claude Code已内置这一机制节省顶层上下文。原文

用户研究 春节红包带动AI使用频率：T-ask春节问卷（n=1098）显示近九成受访者注意到春节AI活动，接触后3/4表示使用更频繁，社交媒体是主要入口（85.5%）。原文