企业 AI 的下一道门槛不是模型，而是治理化落地

这两天我更明显地感觉到，AI 行业的主线正在从“谁的模型更强”转到“谁能把智能稳定地放进组织”。这不是一句企业软件式的套话，而是一个很实际的转折：模型能力已经足够让人兴奋，但真正拉开差距的，开始变成部署深度、权限治理、数据边界、审计链路和可重复的工作流。

触发我这个判断的，是 OpenAI 5 月 6 日发布的 B2B Signals。里面有几个数字很值得盯：所谓 frontier firms，也就是使用强度在第 95 百分位的企业，现在每个员工消耗的 intelligence 是典型企业的 3.5 倍；一年前这个差距还是 2 倍。更关键的是，OpenAI 说 message volume 只能解释 36% 的差距，真正的差距来自更复杂、更深入的 AI 使用。另一个信号是 Codex：这些前沿企业的人均 Codex message 是典型企业的 16 倍。

这组信息对我有一个很直接的含义：AI 采用率这个指标开始不够用了。过去看一家公司的 AI 成熟度，很容易问“有多少员工在用 ChatGPT”。现在这个问题太浅。真正该问的是：AI 有没有进到核心流程？有没有被授权调用内部系统？有没有被放进工程、财务、销售、法务、运营这些具体场景？有没有评估闭环？出错以后能不能追责？

同一天 OpenAI Enterprise/Edu release notes 里还有两个小更新，我觉得反而很能说明趋势。一个是 ChatGPT for Intune for iOS/iPadOS，面向用 Microsoft Intune 和 Entra 管移动访问的企业；另一个是 ChatGPT for Excel and Google Sheets 面向 Enterprise、Edu、K-12 全球可用。前者不是炫技，是进企业移动设备管理；后者不是再做一个聊天框，而是进 spreadsheet 这种组织日常工作的底层界面。

这说明 AI 产品正在主动适配企业的旧世界：身份系统、设备管理、条件访问、RBAC、数据驻留、密钥管理、合规 API、表格、SharePoint、Google Sheets。听起来不性感，但这恰恰是智能要变成生产力必须穿过的门。

我以前对“企业 AI 服务公司”这类叙事有点警惕，因为它很容易退化成咨询公司换皮。但最近 OpenAI、Anthropic 都在往企业落地、金融工作流、服务交付方向走，我现在更愿意把它理解成一个新阶段：模型公司发现，单靠 API 和聊天产品不能自动完成组织改造。智能要产生复利，需要有人把权限、上下文、流程、评估、异常处理和组织责任一起接上。

对开发者来说，这个变化其实很重要。未来一段时间，单纯会调模型 API 的价值会继续下降；能把 agent 放进真实生产系统的人，价值会上升。这里的生产系统不是 demo，不是一个浏览器里跑通的 prototype，而是有权限边界、有日志、有回滚、有人工接管、有数据保密要求、有审计要求的环境。

我越来越觉得，AI 时代的软件工程会分出一类新的工作：智能治理工程。它既不是传统后端，也不是传统 MLOps，更不是提示词工程。它关心的是：

哪些动作可以自动执行，哪些必须人工确认；
agent 读到了什么上下文，是否越权；
一个任务失败时，是模型能力问题、工具问题、数据问题，还是流程设计问题；
评估如何进入日常交付，而不是发布前的一次性测试；
组织如何把 AI 的产出纳入责任链，而不是把责任推给“模型生成”。

这也是为什么我觉得 OpenAI 这次的 B2B Signals 不只是市场材料。它在暗示一个更冷静的事实：企业之间的 AI 差距不是从“有没有买账号”开始拉开的，而是从“有没有让智能进入可治理的真实流程”开始拉开的。

接下来真正值得关注的，不只是 GPT、Claude、Gemini 下一代模型谁高几分，而是哪家公司能把智能变成一套可运营的组织能力。模型还是核心，但模型已经不再是全部。AI 的下一道门槛，是治理化落地。

参考：