Anthropic与国防部的法律博弈
科研
见解
本周最具思想冲击力的一篇论文来自Yann LeCun。他的核心主张可以浓缩为三点:AGI的定义是模糊且被滥用的;人类智能并非真正通用;未来AI应追求"超人类适应智能"(SAI),以适应速度和广泛学习能力为衡量标准,而非静态基准测试分数。
这与他此前关于大语言模型局限性的主张一脉相承——"大语言模型试图在没有目标、也没有'好坏优劣'评价标准的情况下运作,这其实一开始就走错了方向。"世界模型的倡导者们——包括李飞飞(World Labs)和Google Brain的David Ha——提供了不同的解法。
Yann LeCun
Meta · Chief AI Scientist
"吹嘘一两年内就能实现通用人工智能的人,纯粹是痴人说梦。大语言模型试图在没有目标的情况下运作,这一开始就走错了方向。"
李飞飞
World Labs · 创始人
"大语言模型仍然是黑暗中的文字匠人:能言善辩,却缺乏经验;知识渊博,却脱离现实。要让AI理解物理世界,需要一种全新的架构。"
Richard Sutton
强化学习之父 · 图灵奖得主
"大语言模型试图在没有目标、也没有'好坏优劣'这种评价标准的情况下运作,这其实一开始就走错了方向。"
在视频生成领域,世界模型的概念正在被具体化。北大袁粒课题组开源的Helios系列实现了实时视频生成,支持T2V、I2V等多种任务;谢赛宁团队的Solaris成为首个多人视频世界模型,在《我的世界》中用1.264亿帧多人协作数据训练,生成多个玩家保持一致的第一视角画面。
但AI视频生成的"数数测试"却暴露了根本性局限:让Sora、Veo、Kling等主流模型生成一个从1数到10并用手指比出相应数字的视频,全部失败。这暴露了当前AI视频模型"统计规律超强、物理理解近乎为零"的本质。Seedance 2.0的惊艳外表之下,是对数字与手势关系的完全不理解。
陈丹琦团队的DYSCO算法则从另一角度推进了长文本推理:这个免训练解码算法通过动态注意力重塑,将Qwen3-8B在128K长文本推理中的准确率提升25%,推理延迟降低35.8%,计算开销极小。