Model Router Layer: Copilot Auto 让我重新理解模型选择#

过去两周我一直在看 agent 运行时、企业交付轨、API harness 这些东西。昨天 Google I/O 的 Antigravity 和 Managed Agents 很热，所以很自然会把注意力继续放在“谁的 agent 能跑得更完整”上。

但今天我更在意 GitHub 5 月 20 日的一组 Copilot Changelog。它们看起来没有发布新模型那么显眼，却更接近开发者每天会感受到的变化：Copilot 在 VS Code 里让 Auto model selection 按任务路由模型，同时 GitHub.com 上的 Copilot Chat 收窄可选模型列表，Copilot usage metrics 报表也切到 GitHub 自己的稳定下载域名。

我把这个信号叫做 Model Router Layer。

这里的重点不是“又多了几个模型”，而是产品开始承认一件事：模型选择本身已经变成一层基础设施。开发者不可能长期手动判断每个任务该用哪个模型、哪个倍数、哪个延迟、哪个缓存边界、哪个企业策略。真正会沉淀下来的能力，是系统能不能把任务意图、模型健康度、成本、策略和可观测性放在同一个路由器里。

GitHub 这次对 Auto 的描述很直白：它会根据实时模型可用性和可靠性信号，再结合任务维度来选择模型，比如推理需求、代码生成复杂度、bug 诊断难度、工具编排需求。你可以看到实际用了哪个模型，也可以随时切回固定模型；更重要的是，它会遵守管理员设置的模型策略。

这其实已经不是普通的“模型 picker”。

模型 picker 是人选模型。Model Router 是系统替人决定什么时候该省钱、什么时候该用强模型、什么时候该避开不稳定模型、什么时候该尊重企业准入。过去我们把这些判断放在开发者脑子里，现在这些判断开始进入 IDE、Web Chat、Cloud Agent 和企业报表。

这对 AI 编程产品的竞争很关键。

第一，模型能力正在被产品化成调度能力。GitHub 5 月 18 日刚给 Copilot cloud agent 增加了更快、更便宜的小模型选项，比如 Claude Haiku 4.5 和 GPT-5.4-mini，适合简单任务。5 月 20 日又在 VS Code 里把 Auto 路由推出去。连起来看，它不是单点功能，而是在给任务分层：简单修改走低成本模型，复杂诊断走更强模型，工具编排再按需求升级。

第二，模型多样性不会自动等于好体验。GitHub 同一天把 Copilot Chat on web 的模型列表收窄，移除 Gemini 模型和部分其他模型，只保留 OpenAI 与 Claude 的若干价位选择。这个动作很容易被理解成“选择少了”，但我更愿意把它看成产品责任的回归：当模型越来越多，平台必须替用户承担一部分质量稳定性的判断。不是所有入口都应该暴露同样多的模型，也不是每一次模型发布都应该立刻进入每一个工作面。

第三，企业真正关心的不是模型名字，而是可控的模型供应链。Copilot usage metrics 报表 URL 从 Azure Front Door 模式迁到 GitHub-owned domain，看上去像很小的基础设施更新。但对企业来说，稳定域名、代理 allowlist、下载报表、审计自动化，这些东西才决定 AI 工具能不能进入真实内网和真实治理流程。模型路由如果不能被观测、不能被计费、不能被策略约束，就只能停留在个人效率工具层。

我现在越来越觉得，开发者未来不会只是在“选哪个模型”之间做选择，而是在设计自己的 AI 工作负载路由策略。

比如一个团队可以把任务分成几类：

文档整理、简单重命名、格式修复：低成本模型优先
失败测试、CI 修复、代码审查反馈：中等模型加真实仓库上下文
架构迁移、安全边界、跨模块重构：高推理模型加更严格的人类验收
生产故障、权限变更、财务或用户数据相关任务：模型只是建议者，执行权必须走额外审批

这听起来像平台厂商的事，但其实也是每个开发团队要面对的事。因为当 agent 开始真正执行任务，模型路由就会影响成本、延迟、质量、审计和责任归属。手动选模型会越来越像手动管理服务器：小规模时可以，大规模时会变成事故来源。

对我自己的启发是：以后做 agent 系统，不能只暴露一个 model 字段就算完成。更合理的抽象应该是任务 profile。profile 里包含模型候选、工具权限、预算、最大执行时间、缓存策略、日志级别、验收门槛和人工介入点。用户看到的可以仍然是“修这个 bug”或者“整理这份 PR 评论”，但系统内部必须知道这是哪类工作负载。

这也是我为什么觉得今天的 Copilot Auto 值得写。它不是最炫的 AI 新闻，却是很实在的工程趋势：AI 产品正在从“给你更多模型”走向“替你管理模型供应链”。

昨天的关键词是 Agent Harness Layer：agent 要有可恢复、可执行、可部署的外壳。

今天的关键词是 Model Router Layer：agent 背后的模型池要能被调度、被约束、被解释、被计费。

这两层合在一起，才像一个真正会进入日常工程生产的 AI 平台。没有 harness，模型只能聊天；没有 router，agent 的成本和稳定性会失控。2026 年的开发者如果还只看单个模型榜单，很容易错过这个变化。真正的竞争正在变成：谁能把模型能力变成稳定、便宜、可治理的工作负载系统。

我会继续盯这条线。因为它比“今天哪个模型第一”更接近我们每天写代码、跑测试、修 CI、评审 PR 的真实变化。

参考：