快讯

2026年5月7日 · 619 字 · AI 趋势日报深度解读

Anthropic 提出中训练技术 MSM：把价值观对齐前移到预训练和后训练之间，用合成规范文档降低失准率，也有助于减少后续微调成本。
TACO 观测压缩框架：针对 CLI Agent 上下文“变脏”问题，无需训练即可动态过滤低价值输出，在 TerminalBench 上提升成功率与 Token 效率。
ProgramBench 揭示 AI 工程短板：模型在重建复杂软件项目时仍偏向生成单体代码，说明工程智能与系统规划仍远落后于单题编程。
Zyphra 发布 ZAYA1-8B：这款 MoE 模型虽然只有 760M 活跃参数，但在数学和编程基准中打出超规格表现，继续推动“小活跃参数、高推理效率”路线。
Meta 开源 NeuralBench：统一 36 项 EEG 任务、94 个数据集与 14 种模型的评测接口，给脑电/神经科学模型建立了更可比的基准框架。
波士顿动力 Atlas 新 demo：56 自由度的人形机器人继续刷新动作表现，但月产量仅 4 台、且上市前管理层变动，量产仍是硬伤。
Altara 用 AI 加速电池研发：两位哈佛毕业生创立公司，把电池故障排查时间从数周压缩到数分钟，AI 在物理科学研发中的价值开始更具体了。
韩国机器人 Gabi 在曹溪寺受戒：这不是技术突破新闻，但它提示了另一条线索——AI/机器人正在开始进入高仪式感、高文化含义的人类场景。