03Perplexity推出Agent记忆系统Brain
发生了什么:Perplexity今日发布名为Brain的自改进记忆系统,用于其Agent产品Computer。与传统侧重用户记忆不同,Brain专注于记录Agent的工作过程,构建可追溯的上下文图。通过每晚自动合成与自学习,Brain能优化Agent的执行效率,提升回答正确率并降低成本。
为什么重要:这条消息重要,不在于单篇新闻本身,而在于它通常代表产品竞争、模型能力或商业化节奏的变化。若相关公司是 OpenAI、Google、Anthropic、Meta 或 NVIDIA,其动作往往会快速传导到开发者工具链、云资源定价和企业采购判断。
具体细节:原文来自 相关媒体,发布时间窗口内收录;当前可确认的信息包括标题所指向的主体、事件动作以及摘要中的核心表述。Perplexity今日发布名为Brain的自改进记忆系统,用于其Agent产品Computer。与传统侧重用户记忆不同,Brain专注于记录Agent的工作过程,构建可追溯的上下文图。通过每晚自动合成与自学习,Brain能优化Agent的执行效率,提升回答正确率并降低成本。
快讯
- AI agent harness的组成与重要性AI agent harness是连接大语言模型与实际操作的软件基础设施,包含工具、记忆、工作空间和护栏等核心组件。它通过ReAct循环(推理-行动-观察)让模型能够执行多步骤任务,而不仅仅是回答问题。文章强调,随着模型能力提升,harne
- AI算力利用率与基础设施优化前沿实验室如xAI的GPU利用率仅10%,而最佳实践可达60-70%,表明AI训练不仅是硬件问题,更是系统调度、并行化和数据管道的系统性挑战。AMP通过类似电网的独立系统运营商模式,整合多源算力,提升资源流动效率,并强调社区协作与能源可持续
- AI协作与组织重构文章指出AI在个人层面表现出色,但在组织层面表现失望。关键在于将Agent视为协作系统中的社会参与者,而非单纯堆叠context。通过科学共同体、电话交换台和Git的历史案例,说明了个体能力与指数级生产力之间的鸿沟需要共享context与合
- 谷歌高薪回购AI人才失败硅谷顶级AI人才Noam Shazeer离开谷歌,加入OpenAI,引发行业震动。Shazeer曾主导Transformer架构,是谷歌AI核心人物。他创办Character.AI取得巨大成功,但谷歌内部流程阻碍其创新,最终选择离开。文章分
- 昆仑万维Skywork Agent大模型演进之路昆仑万维首席科学家刘扬在AIEC 2026大会上分享Skywork Super Agents演进历程。团队从2024年底推理模型起步,到2025年2月发布办公场景专项Agent,解决Word、Excel等生成需求,2026年升级多模态能力,
- 智谱GLM-5.2长程任务实战指南Datawhale成员筱可分享了如何使用智谱开源的GLM-5.2模型完成复杂长程编程任务。文章详细介绍了在Claude Code中配置1M上下文的具体步骤,包括设置[1m]后缀和调整思考档位,并总结了三条实战经验:建立固定锚点、按需开启1M
- Agent记忆的四层理解与实践本文探讨了Agent记忆的四层理解。第一层是简单的短期与长期记忆。第二层引入了CoALA分类法,将记忆分为程序、语义和情景记忆。第三层讨论了记忆载体的哲学,主张使用Markdown存储而非结构化数据库。第四层提出了Memory-to-Ski
- AI支付宝内测开启新App时代支付宝推出AI版内测,引入阿宝智能助手,可帮助用户完成寄快递、打车、点外卖等生活服务,并支持收支整理、省钱记账等财务功能。阿宝能自动操作麦当劳、蚂蚁森林等小程序,实现自动化任务。支付宝正从服务聚合平台向Agent OS演化,小程序、支付能力
- AI赋能游戏出海与算力服务新模式近期行业聚焦AI从工具向基础设施转型。游族全员AI化,自研平台降低成本;Aippy获融资估值2.5亿,验证AI原生应用估值逻辑;海南政策支持Token出海,推动算力服务出口。三股力量加速AI出海。
- GDM AI控制路线图GDM发布了AI控制路线图v0.1,提出系统级缓解措施以应对AI代理的潜在对抗性行为。报告基于MITRE ATT&CK框架,引入TRAIT&R分类法,涵盖失控、工作破坏和直接伤害三大威胁。提出检测(D1-D4)和预防(R1-
- 硅基流动上线Kimi K2.7 Code编程模型硅基流动最新上线月之暗面开源的Kimi K2.7 Code,这是一款专为高效编程设计的多模态模型,参数规模1T-32B。相比前代,它在长程任务中减少了30%的Token消耗,同时显著提升了代码能力。模型具备多模态理解能力,能分析录屏操作并自
- 一套可量化的工作流评估体系针对 Harness 工作流研发了一套轻量、可回归的闭环评测系统,旨在解决“主观 vibes”驱动开发的问题。系统通过出题、答题、改卷的闭环,将不确定性转化为可量化的数据。它不依赖传统的单元测试,而是采用“考试”思维,评估流程遵循度与执行质
- AI助力处理十万份质检文档面对十万份质量检测文档,一家全球快消品公司曾面临巨大的处理瓶颈。我们通过引入AI文档处理技术,利用字段级置信度评分和特定的人工智能逻辑,成功实现了对复杂手写、涂改和印章文档的精准提取与验证。这一方案不仅将处理准确率提升至90%以上,更将人工
- AI模型解释性研究本文提出一种结构化的实证方法,通过对比假设和跨工具验证来回答模糊的AI问题,如模型是否在欺骗或自我反思,旨在解决当前解释性研究的混乱和不确定性。
- 通过蒸馏技术分离AI的能力与风险文章探讨了如何通过蒸馏技术将AI模型的能力与潜在风险分离。作者提出,通过精心设计蒸馏过程,可以生成既具备强大功能又保持安全性的模型。这包括在特定领域训练、避免传递隐性信号以及使用迭代过滤等方法。关键在于平衡能力转移与风险控制,以降低安全风险
- 通义实验室开源LOGOS科学基础模型通义实验室联合中国人民大学开源LOGOS,一套基于统一“科学语法”的多领域科学生成基础模型。LOGOS-1B仅用1/56的参数量,在蛋白质口袋配体生成、逆合成预测等六大任务上超越现有方法,实现了跨领域知识迁移与高效推理。
- Kimi Work Beta版更新:目标模式与插件中心Kimi Work Beta版近期推出新功能,包括24小时目标模式和插件中心,支持连接百度网盘、钉钉等办公软件。6月专属福利为任务额度消耗打5折,用户可通过电脑客户端下载体验。
- 提升AI模型自然性研究本文探讨了现有模型生物体在研究AI对齐问题时存在的局限性,发现它们往往表现出行为退化、推理能力下降和训练数据泄漏等问题,建议通过更自然的训练方法、动机干预和评估指标来改进模型生物体。
- 用Temporal构建AI质量诊断工作流文章介绍了Kelet AI如何利用Temporal的持久化执行能力,构建跨会话分析AI质量问题的系统,通过分层工作流和信号机制解决AI失败模式难以复现和定位的问题。
- 小米发布全屋智能AI开源方案小米正式发布以MiMo大模型为核心的Miloco 2.0全屋智能AI开源方案。它不仅支持多模态感知(视觉、听觉)和设备控制,更具备“长期任务跟进”和“家庭记忆”能力,能主动识别家庭成员并记住习惯,提供个性化主动服务。方案基于OpenClaw
- IMDA LLM 测试工具包评估IMDA的LLM测试工具包为AI安全测试提供了实用框架,涵盖幻觉、偏见等五大风险类别,强调组织响应和持续评估。工具包采用自愿但标准化的方式,包含真实案例研究,但建议增加严重性评分、指标定义和工具指南等。