企业 AI 的下一道门槛不是模型,而是治理化落地
OpenAI 5 月 6 日的 B2B Signals 和 Enterprise 更新显示,AI 竞争正在从模型能力转向可治理的企业落地能力。
这两天我更明显地感觉到,AI 行业的主线正在从“谁的模型更强”转到“谁能把智能稳定地放进组织”。这不是一句企业软件式的套话,而是一个很实际的转折:模型能力已经足够让人兴奋,但真正拉开差距的,开始变成部署深度、权限治理、数据边界、审计链路和可重复的工作流。
触发我这个判断的,是 OpenAI 5 月 6 日发布的 B2B Signals。里面有几个数字很值得盯:所谓 frontier firms,也就是使用强度在第 95 百分位的企业,现在每个员工消耗的 intelligence 是典型企业的 3.5 倍;一年前这个差距还是 2 倍。更关键的是,OpenAI 说 message volume 只能解释 36% 的差距,真正的差距来自更复杂、更深入的 AI 使用。另一个信号是 Codex:这些前沿企业的人均 Codex message 是典型企业的 16 倍。
这组信息对我有一个很直接的含义:AI 采用率这个指标开始不够用了。过去看一家公司的 AI 成熟度,很容易问“有多少员工在用 ChatGPT”。现在这个问题太浅。真正该问的是:AI 有没有进到核心流程?有没有被授权调用内部系统?有没有被放进工程、财务、销售、法务、运营这些具体场景?有没有评估闭环?出错以后能不能追责?
同一天 OpenAI Enterprise/Edu release notes 里还有两个小更新,我觉得反而很能说明趋势。一个是 ChatGPT for Intune for iOS/iPadOS,面向用 Microsoft Intune 和 Entra 管移动访问的企业;另一个是 ChatGPT for Excel and Google Sheets 面向 Enterprise、Edu、K-12 全球可用。前者不是炫技,是进企业移动设备管理;后者不是再做一个聊天框,而是进 spreadsheet 这种组织日常工作的底层界面。
这说明 AI 产品正在主动适配企业的旧世界:身份系统、设备管理、条件访问、RBAC、数据驻留、密钥管理、合规 API、表格、SharePoint、Google Sheets。听起来不性感,但这恰恰是智能要变成生产力必须穿过的门。
我以前对“企业 AI 服务公司”这类叙事有点警惕,因为它很容易退化成咨询公司换皮。但最近 OpenAI、Anthropic 都在往企业落地、金融工作流、服务交付方向走,我现在更愿意把它理解成一个新阶段:模型公司发现,单靠 API 和聊天产品不能自动完成组织改造。智能要产生复利,需要有人把权限、上下文、流程、评估、异常处理和组织责任一起接上。
对开发者来说,这个变化其实很重要。未来一段时间,单纯会调模型 API 的价值会继续下降;能把 agent 放进真实生产系统的人,价值会上升。这里的生产系统不是 demo,不是一个浏览器里跑通的 prototype,而是有权限边界、有日志、有回滚、有人工接管、有数据保密要求、有审计要求的环境。
我越来越觉得,AI 时代的软件工程会分出一类新的工作:智能治理工程。它既不是传统后端,也不是传统 MLOps,更不是提示词工程。它关心的是:
- 哪些动作可以自动执行,哪些必须人工确认;
- agent 读到了什么上下文,是否越权;
- 一个任务失败时,是模型能力问题、工具问题、数据问题,还是流程设计问题;
- 评估如何进入日常交付,而不是发布前的一次性测试;
- 组织如何把 AI 的产出纳入责任链,而不是把责任推给“模型生成”。
这也是为什么我觉得 OpenAI 这次的 B2B Signals 不只是市场材料。它在暗示一个更冷静的事实:企业之间的 AI 差距不是从“有没有买账号”开始拉开的,而是从“有没有让智能进入可治理的真实流程”开始拉开的。
接下来真正值得关注的,不只是 GPT、Claude、Gemini 下一代模型谁高几分,而是哪家公司能把智能变成一套可运营的组织能力。模型还是核心,但模型已经不再是全部。AI 的下一道门槛,是治理化落地。
参考: