OpenAI 这次给 Codex 加手机能力,最容易被误读成一句话:以后可以在手机上写代码了。
这句话热闹,但不准。
更准确的说法是:代码代理还在你的笔记本、Mac mini、devbox 或远程环境里干活,手机只是变成一个随身控制台。你看它跑到哪一步,批不批准下一条命令,要不要换方向,要不要换模型,顺手看截图、终端输出、diff 和测试结果。
OpenAI 还给了一个数字:Codex 每周用户超过 400 万。注意,是每周用户,不是付费用户,不是企业客户,也不是全球开发者总数。这个数字至少说明一件事:AI 编程代理已经过了“少数极客玩具”的阶段。
这批信息把原来那条判断补得更实了:OpenAI 抢的不是手机屏幕,而是 AI 编程代理的控制面。
发生了什么:Codex 进了 ChatGPT 手机端,但不在手机上跑
这次上线的是 ChatGPT 移动 App 里的 Codex 预览版,支持 iOS 和 Android,覆盖所有计划,包括 Free 和 Go。Windows 连接还没上线,OpenAI 的说法是 coming soon。
几个关键点压缩看:
| 项目 | 现在能做什么 | 边界 |
|---|---|---|
| 移动端 Codex | 查看线程、输出、截图、终端、diff、测试结果 | 不是把开发环境搬进手机 |
| 人类介入 | 批准命令、回答问题、改方向、切模型、继续任务 | 关键权限仍要人点头 |
| 环境连接 | 连接本机、devbox 或远程环境里的 Codex | Windows 连接暂未支持 |
| 安全模型 | 文件、凭证、本地配置留在原机器 | 手机通过安全 relay 同步状态 |
| 企业能力 | Remote SSH 和 Hooks 面向所有计划 | Programmatic access tokens 只给 Enterprise 和 Business |
| 合规支持 | 合资格 Enterprise 工作区可在本地环境支持 HIPAA 用途 | 不是所有云端 Codex 都自动合规 |
Remote SSH 现在也进入通用可用状态。Codex 可以接进企业已经管理好的远程开发环境:依赖、凭证、安全策略、算力都在那边。
Hooks 也开放给所有计划。它可以用来扫提示词里的密钥、跑验证器、记录会话,或者按仓库定制行为。
这些功能放在一起,指向的不是“我在地铁上写一个函数”。它指向的是另一种工作方式:长任务代理在跑,人随时插一脚,把它从错误路径上拽回来。
为什么重要:AI 编程的入口正在离开 IDE
过去一年,AI 编程工具的主战场在 IDE。Cursor、Copilot、Codex,都在抢最靠近代码的位置。
但代理一旦能跑更长时间,IDE 就不再是唯一入口。因为长任务最常缺的不是算力,而是判断。
要不要改架构?
测试失败后继续修,还是回滚?
发现两条实现路径,选哪条?
这些事模型可以建议,但不能总是自己拍板。尤其在企业环境里,拍板意味着权限、成本、责任和事故归属。
手机端的价值就在这里:把开发者从“坐在电脑前陪跑”,变成“在关键节点审批”。
这很像早期铁路调度。火车不是调度员推着走,但没有调度,速度越快,撞车越快。AI 代理也一样。模型越能干,越需要把人类决策点设计清楚。否则自动化不是省事,是把错误放大。
我更在意 OpenAI 这次的克制:它没有把重点放在手机本地运行开发环境,而是把状态、权限和上下文通过安全 relay 串起来。文件、凭证、本地配置仍留在运行 Codex 的机器上。
手机可以轻,权限必须重。
谁受影响:开发者少陪跑,技术负责人多背锅
个人开发者会先感到方便。
等咖啡时看一眼任务,通勤时批一次命令,回到电脑前测试已经跑完。这个场景很现实,也很容易上瘾。不是因为手机写代码舒服,而是因为手机适合处理“要不要继续”的小决策。
技术负责人看到的不是方便,是控制问题。
哪些命令能自动跑?
哪些必须审批?
哪些环境能接入 Codex?
哪些数据不能碰?
模型切换由谁决定?
日志怎么留?
出了事故算谁的?
这些问题不性感,但它们决定 AI 编程代理能不能进生产流程。企业不会因为一个移动端按钮就放心把凭证交出去。企业需要的是 Remote SSH、Hooks、访问令牌、审计、合规边界,以及能被安全团队解释的运行路径。
所以这次更新对普通用户的直接影响很有限。真正的受众是两类人:已经在用 Codex 跑任务的开发者,以及准备把 AI 编程代理纳入内部流程的工程管理者。
前者买的是少陪跑。后者买的是可控。
OpenAI 卖的是效率,也是在收拢控制权
OpenAI 表面上在补移动端能力,底层是在把开发流程继续接进 ChatGPT 体系。
以后一个任务可能这样流动:桌面发起,手机审批,远程环境执行,企业工作区记录日志,Hooks 做前后置检查,访问令牌接内部系统。
看起来顺。代价也清楚:工作流入口越来越集中。
这不是坏事。企业本来就需要集中。凭证、审计、HIPAA、CI、内部自动化,不可能靠每个开发者随手装插件、各跑各的。OpenAI 这次把移动端、Remote SSH、Hooks 和企业令牌放到同一条线上,补的正是企业最怕的几块:权限、可控性、可追踪。
但入口一旦稳定,生态就会沿着入口生长。
“天下熙熙,皆为利来”。放到 AI 编程工具上也一样。OpenAI 当然在卖效率,但更长期的生意,是把更多开发流程的控制面接到自己的账户、权限和工作区体系里。
这里的分水岭不在手机屏幕能不能舒服地看 diff。那只是表层体验。
真正该看的,是企业敢不敢让 Codex 进入受控环境,敢不敢给它凭证,敢不敢让它参与 CI 和发布流程。敢到哪一步,AI 编程代理就走到哪一步。
我不太买账“手机编程”这个叙事。它太像给发布会找一个容易传播的说法。Codex 进手机的关键,不是把键盘缩小,而是把审批、指挥、纠偏这些动作从电脑前拆出来。
模型看着更强,产品反而更需要缰绳。
这才是 OpenAI 这次真正做对的地方。它没有假装代理可以全自动包办一切,而是承认一个现实:AI 编程会越来越像组织协作,而不是单人写代码。谁把状态、权限、审批和日志设计好,谁就更接近企业的核心流程。
工具进手机是小事。
控制面进流程,才是大事。
