黄仁勋「五层蛋糕」与Token工厂:GTC 2026的核心叙事

黄仁勋在GTC 2026的署名长文里,把AI应用的价值层级切成「五层蛋糕」:从基础算力到感知、推理、规划,最终到自主行动。他的核心论断是模型能力已跨过一个关键门槛——性能提升、推理增强、幻觉减少,三者叠加让AI首次能创造真实经济价值。

与此同时,Token正在成为Agent时代的统一度量衡。黄仁勋提出数据中心向「Token工厂」转型,并给出按吞吐量交互响应速度两个维度分层定价的框架——这和传统云计算按CPU时/GB计费的逻辑是根本性的断裂。

Token工厂:两种服务模式的性能取向
批量推理
高吞吐 ↑
批量推理
低时延
交互推理
中吞吐
交互推理
低时延 ↑

联想与英伟达在GTC现场联合发布混合AI推理方案,强调缩短「首Token时间(TTFT)」,这正是交互推理层的核心竞争指标——黄仁勋框架下,联想选择了后半段的落地战场。

值得关注的是,两股浪潮之间存在时间差:智能体驱动的企业算力需求已在落地,而黄仁勋预言的下一波——面向真实世界的物理AI(通过世界模型理解「恒常性」)——仍处于早期。Token工厂的定价模型更多服务于第一波;物理AI能否复用这套框架,还是个开放问题。

DEEP DIVE 02

Agent让网络攻击成本暴跌100–1000倍:安全行业的窗口正在关闭

这篇文章拆解了一个令人不安的非对称:AI与Agent的组合让侦察、漏洞利用、钓鱼、横向移动全链路实现7×24自动化,综合攻击成本降低100至1000倍。传统安全团队的低频红队评估和周期性漏洞扫描,根本覆盖不了这种持续演进的攻击路径。

传统攻击(人工)
× 1
Agent驱动攻击
÷ 100–1000

Armadin的解法是以攻对攻:部署「agent swarm」,在大规模生产环境中持续模拟国家级APT攻击路径,而不是等周期性红队检测。这背后的逻辑是:防御的频率必须至少匹配攻击的频率,否则漏洞窗口会在下一次扫描之前被利用并清除痕迹。

这里有个行业结构性问题值得注意:攻击者天然比防御者更早享受到自动化红利——他们只需要找到一个漏洞,而防守方需要堵上所有漏洞。Agent让这种不对称被放大了一个数量级。安全行业如果没有类似的agent-native防御产品,现有的安全态势评估框架实际上已经失效。

黄仁勋「五层蛋糕」与Token工厂:GTC 2026的核心叙事 | AI 趋势