发生了什么:3月29日,Chroma发布了Context-1,一个20B参数、采用Mixture of Experts架构的专用Agentic搜索模型。与此同时,OpenResearcher团队发布了开源离线深度研究流水线,训练出的30B模型在BrowseComp-Plus基准上达到54.8%准确率,超越了GPT-4.1。
为什么重要:这两个消息合在一起,指向同一个趋势——“一个通用大模型搞定一切”的范式正在承压。Context-1的核心创新是“自我编辑上下文”(Self-Editing Context),能在32k窗口内动态修剪无关信息,解决多跳检索中的“上下文腐烂”问题;OpenResearcher则证明:用9.7万条离线合成轨迹训练,30B模型就能超过闭源旗舰,不需要连接在线搜索。
深层逻辑:专用MoE架构让Context-1只激活必要的专家网络,本质上是在用“稀疏激活”换取任务专注度。如果这个路线成立,未来企业AI基础设施的采购逻辑将从“买最大的模型”转向“为每条任务链匹配最小有效模型”,对成本结构影响深远。
发生了什么:Anthropic发布Claude Mythos 5.0 Beta,内部员工表示“已经完全不再手写代码”,模型甚至能主动发现Linux内核等系统漏洞。同日,营销人Jacob Bank披露,他用40个AI代理取代了原本需要4人的营销团队,月成本从5万美元降至500美元,降幅99%。
为什么重要:Mythos 5.0代表模型能力的新高水位,Jacob Bank的案例则是这种能力在实际工作流中的变现路径。关键不是“AI会不会替代人”的讨论,而是已经有人做到了,数字在那里。
结构性含义:AI代理替代的不是“员工的所有工作”,而是“任务链”——内容分发、数据分析、文案生成、投放优化,每一段都可以拆出来交给专门的代理。Jacob Bank的另一个洞察更值得注意:AI更是“能给出个性化反馈的成长教练”,意味着AI的价值已开始渗透管理层职能。至于Mythos 5.0,能主动挖出Linux内核漏洞,意味着模型开始具备了真正的“主动侦察”能力。
-
Sid Sijbrandij在骨肉瘤复发、标准疗法失效后,借助单细胞测序和AI工具并行测试多条治疗路径,最终通过放射性配体疗法与免疫细胞激活组合使肿瘤缩小清除——AI辅助精准医疗最极端也最真实的案例之一。
-
国内大模型调用量持续激增,CPU价格普涨、交货周期拉长,预计2026年算力产业链将进入“全链通胀”,先进制程产能扩张是主要供给保障。
-
人才流动加剧:华为盘古核心负责人出走,xAI创始团队已几乎全员离开。另据Hugging Face报告,中国模型下载量首次超过美国,DeepSeek-R1成全球最热门模型。
-
林俊旸提出,模型能力已非AI落地的核心瓶颈,关键在于Harness——任务调度、工具编排与环境交互层,它决定了模型在真实世界中的闭环表现。
-
Anthropic内部实践揭示了Harness的核心架构:三角循环迭代,证明“工程脚手架”比模型本身的权重更大。
-
OpenClaw在企业级部署中暴露五大痛点,ClawManager以K8s架构和AI Gateway审计层填补了这一空白,是Agent工程化走向企业规模的缩影。
-
OpenClaw的争议根源是“为开发者设计的功能被普通用户使用”——心跳保活、全屏识别、单模型全场景处理叠加,导致Token消耗远超预期。
-
Agent Skills通过结构化文件夹封装任务指令实现模块化加载,配合OpenClaw的分层记忆系统,定义了一套可复制的Agent工程化范式。
-
飞书开放CLI接口后,Claude Code等Agent可通过一行命令处理飞书生态内的数据,标志着软件交互从GUI向CLI转变在国内企业软件中落地。
-
Meta等机构研究者通过约束模型在潜在空间中的时间轨迹曲率,使欧氏距离能准确反映到达目标的真实成本,在复杂环境规划任务中取得显著提升。
-
传统点拖拽式图像编辑常因意图模糊产生伪影,DragNeXt改为区域级操作单元,显著提升编辑精度和用户体验。
-
斯坦伯格谈及中美AI工具使用差异:中国企业鼓励AI使用并纳入绩效考核,美国部分公司仍有限制。他计划将OpenClaw托付基金会开源运营。
-
LessWrong文章呼吁AI安全社区去中心化协作,面对复杂系统性风险时需诚实评估自身能力边界,避免“英雄主义陷阱”导致系统性建设被忽视。