快讯

  • Anthropic 提出中训练技术 MSM:把价值观对齐前移到预训练和后训练之间,用合成规范文档降低失准率,也有助于减少后续微调成本。
  • TACO 观测压缩框架:针对 CLI Agent 上下文“变脏”问题,无需训练即可动态过滤低价值输出,在 TerminalBench 上提升成功率与 Token 效率。
  • ProgramBench 揭示 AI 工程短板:模型在重建复杂软件项目时仍偏向生成单体代码,说明工程智能与系统规划仍远落后于单题编程。
  • Zyphra 发布 ZAYA1-8B:这款 MoE 模型虽然只有 760M 活跃参数,但在数学和编程基准中打出超规格表现,继续推动“小活跃参数、高推理效率”路线。
  • Meta 开源 NeuralBench:统一 36 项 EEG 任务、94 个数据集与 14 种模型的评测接口,给脑电/神经科学模型建立了更可比的基准框架。
  • 波士顿动力 Atlas 新 demo:56 自由度的人形机器人继续刷新动作表现,但月产量仅 4 台、且上市前管理层变动,量产仍是硬伤。
  • Altara 用 AI 加速电池研发:两位哈佛毕业生创立公司,把电池故障排查时间从数周压缩到数分钟,AI 在物理科学研发中的价值开始更具体了。
  • 韩国机器人 Gabi 在曹溪寺受戒:这不是技术突破新闻,但它提示了另一条线索——AI/机器人正在开始进入高仪式感、高文化含义的人类场景。
快讯 | AI 趋势