黄仁勋「五层蛋糕」与Token工厂：GTC 2026的核心叙事

2026年3月17日 · 938 字 · AI 趋势日报深度解读

黄仁勋在GTC 2026的署名长文里，把AI应用的价值层级切成「五层蛋糕」：从基础算力到感知、推理、规划，最终到自主行动。他的核心论断是模型能力已跨过一个关键门槛——性能提升、推理增强、幻觉减少，三者叠加让AI首次能创造真实经济价值。

与此同时，Token正在成为Agent时代的统一度量衡。黄仁勋提出数据中心向「Token工厂」转型，并给出按吞吐量与交互响应速度两个维度分层定价的框架——这和传统云计算按CPU时/GB计费的逻辑是根本性的断裂。

Token工厂：两种服务模式的性能取向

批量推理

高吞吐 ↑

批量推理

低时延

交互推理

中吞吐

交互推理

低时延 ↑

联想与英伟达在GTC现场联合发布混合AI推理方案，强调缩短「首Token时间（TTFT）」，这正是交互推理层的核心竞争指标——黄仁勋框架下，联想选择了后半段的落地战场。

值得关注的是，两股浪潮之间存在时间差：智能体驱动的企业算力需求已在落地，而黄仁勋预言的下一波——面向真实世界的物理AI（通过世界模型理解「恒常性」）——仍处于早期。Token工厂的定价模型更多服务于第一波；物理AI能否复用这套框架，还是个开放问题。

DEEP DIVE 02

Agent让网络攻击成本暴跌100–1000倍：安全行业的窗口正在关闭

这篇文章拆解了一个令人不安的非对称：AI与Agent的组合让侦察、漏洞利用、钓鱼、横向移动全链路实现7×24自动化，综合攻击成本降低100至1000倍。传统安全团队的低频红队评估和周期性漏洞扫描，根本覆盖不了这种持续演进的攻击路径。

传统攻击（人工）

× 1

→

Agent驱动攻击

÷ 100–1000

Armadin的解法是以攻对攻：部署「agent swarm」，在大规模生产环境中持续模拟国家级APT攻击路径，而不是等周期性红队检测。这背后的逻辑是：防御的频率必须至少匹配攻击的频率，否则漏洞窗口会在下一次扫描之前被利用并清除痕迹。

这里有个行业结构性问题值得注意：攻击者天然比防御者更早享受到自动化红利——他们只需要找到一个漏洞，而防守方需要堵上所有漏洞。Agent让这种不对称被放大了一个数量级。安全行业如果没有类似的agent-native防御产品，现有的安全态势评估框架实际上已经失效。