华为昇腾950PR算力达H20的2.87倍,硅谷「Token薪酬」实验启动,大英百科全书起诉OpenAI
黄仁勋建议工程师用Token领薪,硅谷「Tokenmaxxing」文化正在形成
这件事的表层是薪酬讨论,深层是一个范式转变:算力正在从成本中心变成价值计量单位。英伟达CEO黄仁勋在公开场合提出,工程师薪酬的一半可以用AI Token来支付——这句话引发的反应揭示了硅谷当下的精神状态。
TechCrunch报道显示,OpenAI和Anthropic内部已出现所谓"Tokenmaxxing"潮流:员工比拼的不再是代码质量或功能交付,而是他们驱动的AI Agent消耗了多少Token。有员工因为消耗量未达标而受到批评。
这不是孤立现象。Andrej Karpathy在播客中称自己"几个月没亲手写代码",改为让多个AI Agent并行工作,自己只负责方向与验收。他用约700次实验换来11%的训练提速,Shopify借同样方式一夜将准确率提升19%。瓶颈从"能执行什么"转向了"能想到什么"。
阿里巴巴则在体制层面做出了回应。财报发布后,CEO吴泳铭宣布成立Alibaba Token Hub(ATH),由其直接负责,整合通义实验室和MaaS,明确把Token定义为AI商业闭环的基础货币。阿里云外部商业化收入已破千亿,平头哥芯片累计交付47万片。从薪酬讨论到商业架构,Token货币化正在从文化现象走向制度设计。
华为昇腾950PR发布:算力达H20的2.87倍,中国AI芯片独立叙事出现关键节点
华为在合作伙伴大会上发布搭载昇腾950PR处理器的Atlas 350加速卡,这张参数表值得逐行看:
官方数据显示昇腾950PR算力达H20的2.87倍,且支持FP4低精度推理,带宽1.4TB/s,HBM容量112GB。H20是英伟达专门为中国市场降规格的出口版本,此前被视为中国AI算力的主要瓶颈,现在这个参照系本身正在失效。
但纸面参数与实际落地之间仍有距离。华为的供应链稳定性、软件生态成熟度、以及在大规模集群部署中的实际表现,是参数表无法回答的问题。值得注意的是,华为诺亚方舟实验室同期发布了基于信息密度的扩散模型训练优化方法,仅对10%的数据处理即可带来约4%的性能提升——硬件和算法研究的双线推进,是理解华为能力建设节奏的关键视角。
大英百科全书起诉OpenAI:首次将训练抓取与实时检索合并追责,近10万篇文章成焦点
这场诉讼在结构上不同于此前所有AI版权案。大英百科全书与韦氏词典指控OpenAI未经授权抓取近10万篇文章用于训练,同时在生成输出中直接复制原文,并将错误信息归咎于百科。
关键的法律创新在于:诉讼试图将"训练数据侵权"和"实时检索侵权"一锅端——不只追究ChatGPT在训练时用了什么,还追究它在回答时是否直接复制原文,以及是否构成商标侵权(把幻觉内容冠以百科全书的权威之名)。这是AI版权诉讼史上覆盖链路最完整的一次尝试。
更深的含义是:如果训练+检索都构成侵权,OpenAI的RAG架构就面临双重法律风险。同期,OpenAI正在大幅扩张至8000名员工并收购Python工具Astral,企业化路线下的版权法律风险将变成系统性成本而非个例支出。
查看原文 →
查看原文 →
查看原文 →
查看原文 →
查看原文 →
查看原文 →
查看原文 →
查看原文 →
查看原文 →
查看原文 →
查看原文 →
查看原文 →