3. 从Codex到365 Copilot:模型正在争夺电脑桌面,而不是聊天框

Agent工作流办公入口生态争夺

发生了什么:OpenAI最新Codex升级显示,它已经从代码助手走向通用电脑操控Agent,可接管音频修复、封面设计、视频生成、邮件处理、数据分析和文档编辑等跨应用任务;与此同时,微软宣布把Anthropic模型引入Microsoft 365 Copilot,允许用户在Word等场景中直接选择不同模型进行润色和整理。

为什么重要:这两件事放在一起看,说明模型厂商争夺的重点已经不是单一模型跑分,而是“谁能成为电脑上的默认执行层”。OpenAI试图把Codex扩展成操作Mac和办公套件的总代理,微软则利用365已有的文档、权限、合规和企业关系,把多模型能力纳入自己的工作流框架。未来的护城河,很可能不是参数规模本身,而是谁离用户文件、日历、邮件、审批和桌面操作更近。

具体细节:Codex新增Slack和Google Workspace集成,意味着它开始接入团队协作和知识工作主干;微软则强调Anthropic模型仍运行在既有安全、合规和治理框架下,且管理员可开关,说明企业客户现在最在意的不是“多一个模型”,而是“多一个模型会不会破坏既有控制面”。如果再加上Gemini现已支持生成PDF、docx、xlsx、LaTeX等多种文件格式,我们看到的是同一件事:AI正在从回答器变成文件流、应用流和任务流之间的调度层。

快讯

Qwen-Scope 开源14组稀疏自编码器权重,试图把Qwen3/3.5内部特征变成可直接用于可解释性分析、毒性数据合成和训练干预的开发工具,开源模型的“可解释工程化”开始提速。
莫奈AI眼镜 在硅谷发布,标准版仅14.9克、Pro版19.9克,配备6麦克风和2K摄像头;轻量化和“主动无感AI”说明AI硬件正从炫技回到可日常佩戴的产品逻辑。
商汤SenseNova U1 Lite 试图解决AI生图中文字渲染和高密度信息排版难题,这类原生统一架构如果稳定,将直接影响海报、信息图和连续图文内容生产效率。
一项黑盒估算参数规模研究 认为GPT-5.5约9万亿参数、Claude Opus 4.7约4万亿参数,但方法本身已引发大量质疑;它至少说明行业对“闭源模型真实规模”仍高度好奇。
一篇强化学习综述 系统梳理了GRPO、RLOO、DAPO、CISPO、MaxRL等2024-2026年LLM推理强化学习方法,显示后训练优化正在从PPO单一路线转向多种去价值模型和归一化改进框架。
马斯克在OpenAI案中出庭作证,焦点仍是OpenAI由非营利走向营利结构的转变;这场诉讼虽然未直接改变产品能力,却持续影响OpenAI的治理叙事与行业信任。
Anthropic估值被报道升至9000亿美元,同时OpenAI面临用户流失和项目缩水压力;资本市场的重估正在强化“OpenAI不再一骑绝尘”的竞争认知。
一篇Agentic UI技术文章 展示了如何用AG-UI事件流和A2UI声明式层生成智能界面,说明“让模型自己搭界面”正在从概念进入可实现的工程实践。
数据库专家Mike Stonebraker 对AI写SQL的真实可用性泼了冷水,称真实场景准确率接近0%;这提醒企业级AI落地仍有大量结构化系统接口问题没被解决。
来源均来自 2026-05-01 指定上下文窗口;本期聚焦商业兑现、视觉推理方法和桌面Agent三条主线。
3. 从Codex到365 Copilot:模型正在争夺电脑桌面,而不是聊天框 | AI 趋势