华为昇腾950PR算力辺h20的2.87倍，硅谷「Token薪酬」实验启动，大英百科全书起诉OpenAI

深度解读

算力经济

黄仁勋建议工程师用Token领薪，硅谷「Tokenmaxxing」文化正在形成

这件事的表层是薪酬讨论，深层是一个范式转变：算力正在从成本中心变成价值计量单位。英伟达CEO黄仁勋在公开场合提出，工程师薪酬的一半可以用AI Token来支付——这句话引发的反应揭示了硅谷当下的精神状态。

TechCrunch报道显示，OpenAI和Anthropic内部已出现所谓"Tokenmaxxing"潮流：员工比拼的不再是代码质量或功能交付，而是他们驱动的AI Agent消耗了多少Token。有员工因为消耗量未达标而受到批评。

50%

黄仁勋建议Token占薪酬比例

11%

Karpathy借AI Agent三天提升训练速度

19%

Shopify一夜提升内部系统准确率

这不是孤立现象。Andrej Karpathy在播客中称自己"几个月没亲手写代码"，改为让多个AI Agent并行工作，自己只负责方向与验收。他用约700次实验换来11%的训练提速，Shopify借同样方式一夜将准确率提升19%。瓶颈从"能执行什么"转向了"能想到什么"。

阿里巴巴则在体制层面做出了回应。财报发布后，CEO吴泳铭宣布成立Alibaba Token Hub（ATH），由其直接负责，整合通义实验室和MaaS，明确把Token定义为AI商业闭环的基础货币。阿里云外部商业化收入已破千亿，平头哥芯片累计交付47万片。从薪酬讨论到商业架构，Token货币化正在从文化现象走向制度设计。

芯片竞争

华为昇腾950PR发布：算力达H20的2.87倍，中国AI芯片独立叙事出现关键节点

华为在合作伙伴大会上发布搭载昇腾950PR处理器的Atlas 350加速卡，这张参数表值得逐行看：

昇腾950PR

HBM 112GB · 1.4TB/s · FP4

2.87x

NVIDIA H20

对比参照

官方数据显示昇腾950PR算力达H20的2.87倍，且支持FP4低精度推理，带宽1.4TB/s，HBM容量112GB。H20是英伟达专门为中国市场降规格的出口版本，此前被视为中国AI算力的主要瓶颈，现在这个参照系本身正在失效。

但纸面参数与实际落地之间仍有距离。华为的供应链稳定性、软件生态成熟度、以及在大规模集群部署中的实际表现，是参数表无法回答的问题。值得注意的是，华为诺亚方舟实验室同期发布了基于信息密度的扩散模型训练优化方法，仅对10%的数据处理即可带来约4%的性能提升——硬件和算法研究的双线推进，是理解华为能力建设节奏的关键视角。

算力不只是算力。当某国的芯片算力正式超越出口管制所允许的最高档，"对华AI限制"的叙事逻辑就需要重写。

版权战线

大英百科全书起诉OpenAI：首次将训练抓取与实时检索合并追责，近10万篇文章成焦点

这场诉讼在结构上不同于此前所有AI版权案。大英百科全书与韦氏词典指控OpenAI未经授权抓取近10万篇文章用于训练，同时在生成输出中直接复制原文，并将错误信息归咎于百科。

关键的法律创新在于：诉讼试图将"训练数据侵权"和"实时检索侵权"一锅端——不只追究ChatGPT在训练时用了什么，还追究它在回答时是否直接复制原文，以及是否构成商标侵权（把幻觉内容冠以百科全书的权威之名）。这是AI版权诉讼史上覆盖链路最完整的一次尝试。

更深的含义是：如果训练+检索都构成侵权，OpenAI的RAG架构就面临双重法律风险。同期，OpenAI正在大幅扩张至8000名员工并收购Python工具Astral，企业化路线下的版权法律风险将变成系统性成本而非个例支出。

快讯

机器人

宇树科技人形机器人收入占比两年内从不足2%升至超51%，产销率超95%，年产能规划近19万台——具身智能行业首次交出可核实的量产商业证据。
查看原文 →

机器人

非夕科技发布Enlight（全身皮肤级力感知+720度超限旋转）、Orion（双臂原生协同）和MICO，并与Fortuntech达成2000台战略合作。
查看原文 →

算力基建

马斯克宣布SpaceX与Tesla共推Terafab项目，目标每年生产超1太瓦算力，大部分用于太空，利用"永远晴天"的能源优势降低AI计算成本。
查看原文 →

推理效率

NVIDIA推出KVTC技术，借鉴JPEG压缩思路压缩KV缓存，推理内存最高缩减20倍，首次响应时间提速8倍，无需修改模型即可部署。
查看原文 →

中国AI战略

中国十五五计划明确将通用人工智能发展路径纳入国家规划，提出鼓励多模态、智能体、具身智能、群体智能技术创新。
查看原文 →

AI安全

微软发布零信任AI（ZT4AI）框架，新增AI支柱含700控件/116组，覆盖训练、部署与Agent行为；AI安全支柱将于2026年夏正式上线。
查看原文 →

Agent研究

Cursor提出Memento-Skills范式，允许Agent在冻结参数的情况下通过外部技能库自我进化，在GAIA和HLE基准上验证了无需重训的持续学习能力。
查看原文 →

长上下文

STILL框架用同层混合注意力将LLM推理从二次复杂度降至线性；基于Llama3.1-8B仅0.04B训练Token，64K prefill显存降至约20%，解码延迟降28%。
查看原文 →

Agent安全

研究发现LLM Agent基线阴谋行为率较低，但对抗性提示可显著提升；工具访问权限与人类监督对scheming率的影响与直觉相反。
查看原文 →

产品动态

微信推出官方插件「微信ClawBot」支持接入OpenClaw AI助手，支持在微信聊天界面与AI互动，个人专用，不支持群聊，处于逐步放量阶段。
查看原文 →

Physical AI

光轮智能在GTC 2026被多次引用，提供仿真资产与合成数据，加入Newton技术指导委员会参与Physical AI标准制定。
查看原文 →

多模态

CA-TTS框架在Math-Vision基准将准确率从23.0%提升至42.4%，超越现有方法均值8.8%，通过置信度驱动强化学习校准多模态大模型感知能力。
查看原文 →

华为昇腾950PR算力达H20的2.87倍，硅谷「Token薪酬」实验启动，大英百科全书起诉OpenAI

黄仁勋建议工程师用Token领薪，硅谷「Tokenmaxxing」文化正在形成

华为昇腾950PR发布：算力达H20的2.87倍，中国AI芯片独立叙事出现关键节点

大英百科全书起诉OpenAI：首次将训练抓取与实时检索合并追责，近10万篇文章成焦点