AI Model Supply Contract: Copilot 默认模型权比新模型发布更重要#

今天我原本想写 Google I/O 前夜的 Gemini 入口层，后来侧线调研提醒我：过去 24 小时里更贴近开发者的一手信号，其实是 GitHub Changelog 在 5 月 17 日发布的那条 Copilot Business 和 Enterprise 变更。

GitHub 把 GPT-5.3-Codex 设为 Copilot Business 和 Copilot Enterprise 的 base model，替代 GPT-4.1。更关键的是，GitHub 明确说这个 base model 用在组织还没有通过内部审查批准其他模型的时候；GPT-5.3-Codex 还是和 OpenAI 合作的第一个 LTS 模型，从 2026 年 2 月 5 日发布起保证 12 个月可用，到 2027 年 2 月 4 日。同时它的 premium request multiplier 是 1x，GPT-4.1 暂时 force-enabled 且 0x，但会随 6 月 1 日 usage-based billing 一起进入退场路径。

这不像一次普通的“模型升级”。它更像企业 AI 编程工具开始形成 model supply contract：默认值、稳定窗口、审查节奏、计费倍率和弃用日期，被打包成一个实际影响开发团队日常工作的合同。

我觉得这件事比“某个模型又强了多少”更值得写。因为在企业场景里，真正改变行为的往往不是模型榜单，而是谁拥有默认模型权。

个人开发者可以今天切 Claude、明天切 Codex、后天试 Gemini，失败成本就是几个小时。但企业 Copilot 不是这样。它挂在 IDE、代码库、权限系统、审计要求、采购合同和安全评审后面。一个模型能不能用，通常不是工程师觉得好不好，而是组织能不能接受它的输出边界、数据处理方式、可用期限、成本模型和回滚路径。

所以 base model 这个词很重。它不是“推荐模型”，而是企业没有完成额外审批时自动进入工作流的模型。谁站在这里，谁就决定了大量代码补全、代码解释、PR 辅助、测试生成和云端 agent 任务的默认体验。开发者未必每天手动选模型，但默认值每天都在替他们选。

LTS 也很重。过去 AI 编程工具最大的问题之一，是能力变化太快：今天的 prompt、评测、内部 policy 和安全说明，过几周可能就不完全适用了。企业很难围着一个随时替换的模型做严肃审查。GitHub 把 GPT-5.3-Codex 绑定到 12 个月可用窗口，本质上是在说：你可以把它当成一个可被采购、可被评估、可被纳入变更管理的工程依赖。

这会改变开发团队选 AI 工具的方式。

以前我们问的是：哪个模型写代码更聪明？下一步会变成：哪个模型供应合同更适合我的团队？它有没有稳定期？有没有明确弃用日期？默认路由能不能被组织治理？请求成本是否可预测？模型变更时，已有 prompt、评测集、代码审查规则和安全说明要不要重新跑？

我自己现在看 coding agent，也越来越少只看单次效果。单次效果当然重要，但长期使用里真正伤人的，是模型漂移和组织不可控。今天补全风格变了，明天审查策略变了，后天成本口径变了，团队内部就很难建立可复用的工程习惯。一个稳定的 LTS 模型不一定永远最强，但它给了团队做内部标准化的地面。

这也是为什么我把这件事叫 AI Model Supply Contract。模型不再只是 API 后面的能力单元，而是企业软件供应链的一部分。它像数据库版本、Node LTS、浏览器兼容矩阵一样，开始拥有默认版本、支持期限、升级窗口、成本系数和退役计划。

对开发者来说，这里有三个很实际的动作。

第一，把 coding agent 的评测从“哪个答案最好”扩展到“默认模型变更后系统是否仍然稳定”。如果团队已经依赖 Copilot 或其他企业 AI 编程工具，就应该有一组自己的代码任务、PR 审查样本、测试修复样本，专门用来观察默认模型切换后的行为差异。

第二，不要把 prompt 和规则写死在某个模型的脾气上。LTS 能提供稳定窗口，但不会消除升级。好的 agent workflow 应该把模型配置、工具权限、上下文策略、验证命令和成本预算拆开，而不是把一切都塞进一段神秘提示词。

第三，开始记录模型供应链决策。我们会记录依赖升级、CI 镜像、数据库迁移，却经常不记录“为什么这个月把默认 coding 模型换了”。AI 进入代码生产后，这种记录会变成事故复盘的一部分：是哪次模型默认值变化影响了代码审查？是哪次计费变化让 agent 任务被限制？是哪次弃用窗口逼迫团队重跑评测？

Google I/O 明天当然还值得看，Gemini Intelligence 把 Android 往 proactive AI 方向推，也说明 AI 正在进入系统交互层。但就今天这个 24 小时窗口来说，GitHub 的 Copilot 默认模型变更更像一个开发者应该马上消化的信号：AI 编程已经从“选一个聪明模型”进入“管理一条模型供应链”。

这对个人开发者也不是遥远的企业话题。因为今天企业里的默认模型权，明天会变成工具生态的默认接口；今天企业要求的 LTS、审查和成本可预测，明天会变成每个成熟 agent 产品的基本合同。

参考：