文章作者、来源:0x9999in1,ME News
400 万。
这是 OpenAI 在 2026 年 4 月底公布的 Codex 周活跃开发者数量。两周前还是 300 万。再往前推,2026 年 1 月到 4 月之间,ChatGPT Business 和 Enterprise 里的 Codex 用户量增长了 6 倍。
速度快到什么程度?Codex 桌面应用上线第一周,下载量就突破了 100 万。到了 5 月中旬的 Codex App 发布时刻,OpenAI 甚至对所有 ChatGPT Free 和 Go 用户限时开放了访问权限,Plus 和 Pro 用户的速率限制直接翻倍。
这不是一个「程序员圈子里的小工具」的增长曲线。这是一个正在吞噬工作本身的产品的增长曲线。
问题来了:400 万人涌进来,他们到底在用 Codex 做什么?
答案可能出乎很多人意料——50% 的用户使用场景已经不是写代码。
Jason Liu 是 OpenAI Codex 团队的工程师。5 月 17 日,他在个人博客发布了一篇名为「Codex-maxxing」的使用手记,记录了他如何将 Codex 从编程工具推向全面的知识工作平台。
这篇文章在 X 上发布 24 小时内获得 8800 次浏览、225 次收藏,评论区情绪 100% 正面。这不是一篇营销稿,而是一个深度用户的真实工作日志。
他的用法让我意识到一件事:大多数人还在用 Codex「问问题」,而真正从中获得杠杆的人,已经在用它「运行工作」。
区别在哪?
问问题是:我给你一个 prompt,你给我一个答案,对话结束,任务中断。
运行工作是:我给你一个空间,你在里面持续推进,我随时可以回来检查、引导、修正,任务永远不需要从零开始。
这才是 Codex 2026 年真正在卖的东西。不是更好的代码生成能力,而是工作的连续性。
第一个改变一切的功能,叫上下文压缩。
传统的 AI 对话有一个致命弱点:上下文窗口是有限的。对话越长,信息丢失越多,最终变成一个失忆的助手。Codex 的解法是上下文压缩——允许线程在保留核心信息的前提下无限延伸。
Jason Liu 的做法是:为每一个重要工作流保留一个置顶线程。
他有一个「Chief of Staff」线程,专门负责收件箱和 Slack 的分拣。有一个「Agents SDK」线程,跟踪开源项目进展。有一个「Open Source」线程,管理社区贡献。还有一个专门监控 Twitter 的线程。
这些不是短对话。它们是运行了几个月的巨型线程,积累了大量历史、偏好和过去的决策。
快捷键 Command-1 到 Command-9,直接跳转。
你可能会问:这不就是把聊天记录变长了吗?
不。长度不是重点。重点是这些线程开始像「工位」一样运作——每一个线程都有自己的领域、自己的记忆、自己的运行节奏。你不再是在「和 AI 聊天」,你是在「回到某个正在进行中的工作」。
当然,代价是存在的。长线程脱离缓存后,再次加载的成本更高。但对于真正重要的工作流来说,连续性的价值远远超过成本。
语音输入在 Codex 中不是一个「方便打字」的功能。它的真正价值是让 Agent 拿到你未经编辑的思考原貌。
Jason Liu 举了一个例子。如果他在规划工作时说:「我记得 Slack 里有个叫 Ben 的人提过这事,我不太记得具体是什么,你去找一下。」这句话如果打出来,会显得模糊又烦人。但说出来却非常自然。而 Agent 完全能处理这种模糊指令。
更有意思的是 Steering 功能。它允许你在 Agent 工作时持续追加意图。比如你在审阅一个网站,一边看一边说:
你不需要等每一步完成后再决定下一步。你可以在 Agent 还在执行时,把接下来要做的事全部排好队,然后离开。
这改变了什么?改变了人与 Agent 之间的关系。你不再是一个「每次只能发一条消息然后等回复」的用户。你变成了一个可以持续输入意图、然后让系统自己排队执行的指挥者。
一旦线程开始长期存在,一个新问题浮出水面:跨线程的知识怎么共享?
Codex 有第一方记忆功能(Settings > Personalization > Memories),但 Jason Liu 的做法更进一步。他用一个 Obsidian vault 作为 Agent 的「居住地」:
vault/ ├── TODO.md ├── people/ ├── projects/ ├── agent/ └── notes/
在最上层的 AGENTS.md 指令里写明:当你对某个人有更多了解、推进了某个项目,或者关闭了一个待办循环时,请更新 vault 里对应的页面。
然后把这个 vault 作为 GitHub 仓库维护。
为什么?两个理由。
第一,它可以在云端运行,不绑定本地环境。
第二——这是关键——diff 成为审阅记忆的界面。
当 Agent 更新 vault 时,你可以阅读 Git diff,看看它认为哪些信息重要到值得被记住。这个审阅步骤至关重要。你不希望一个长期线程悄悄在对话历史里积累一种模糊的「感觉」。你希望它把真正发生变化的事情写下来:某人的偏好、某个项目在等什么、某个决定已经做出、某个循环已经关闭。
记忆系统的意义不在于「记住更多」。在于把经验压缩成一种能够脱离线程继续存在的形式。如果线程消失了、压缩得很糟糕,有用的知识仍然在文件里。
Chronicle 是 OpenAI 在 4 月 20 日推出的另一种记忆方案——通过后台截取屏幕内容来构建上下文记忆。Sam Altman 说使用体验「像心灵感应」。但它也有真实取舍:截图经过 OpenAI 服务器处理后本地存储为未加密的 Markdown 文件,增加了提示注入攻击面。目前是需要主动开启的研究预览功能。
方向是对的,但还不够成熟。文件系统仍然是最可靠的记忆基础设施。
这可能是 Codex 最有颠覆性的功能。
Heartbeat 是一种线程本地的定时自动化。你可以对一个线程说:「每隔几个小时帮我看一下这个。」然后它就会按照这个节奏自动运行。
Jason Liu 的 Chief of Staff 线程每 30 分钟运行一次:
当他回到 Slack 时,很多回复已经在草稿里了。最费力的上下文收集已经完成。他只需要决定哪些要发送。
另一个例子更生动。他在做一个动画项目,把视频发到 Slack 让同事审阅,然后让 Codex 每 15 分钟检查一次线程。如果有评论,就重新渲染新版本并回复。因为 Slack MCP 服务器不支持文件上传,Agent 就用 @computer 能力去点击「Add file」按钮,把文件传了上去。
注意这里发生了什么:一个反馈循环横跨了 Slack(收集反馈)、Remotion(渲染动画)和 @computer(上传文件)三个工具边界。Agent 在人离开后自己维持了这个循环。
还有一个更极端的例子。他的包裹被偷了,Amazon 说要等 25 分钟才能接通人工客服。他创建了一个带 @computer 的线程:每 5 分钟检查客服是否加入,如果加入就争取退款,并把频率提高到每分钟一次。然后他去洗澡了。洗完澡出来,退款处理完毕。
这不是科幻。这是 2026 年 5 月正在发生的真实使用场景。
5 月 14 日,OpenAI 正式将 Codex 推送到 ChatGPT 移动应用。iOS 和 Android 均可用。所有 ChatGPT 计划都支持,包括 Free 和 Go。
TechCrunch 的报道引用了 OpenAI 的声明:「这不只是远程控制单个任务或分派新任务。从手机端,你可以跨所有线程工作、审阅产物、批准命令、切换模型或启动新任务。」
执行和凭据留在桌面机器上。手机端只负责审阅、批准和引导。
这和 Heartbeats、置顶线程形成了一套完整的链路:
工作不再因为你换了地点而暂停。这是真正的异步工作流。
Goals 是 Codex CLI 0.128.0 引入的 /goal 命令。它让 Agent 进入一个自主循环:plan → act → test → review,直到满足你定义的成功条件或额度耗尽。
一个弱目标是:「执行这个 Markdown 文件里的计划。」
一个强目标是:「把 Python Rich 库迁移到 Rust,必须通过原 Python 库的所有单元测试。」
后者有真正的验证标准。Agent 可以自己判断是否完成、哪里失败、需要怎么修复。
有人用 /goal 让 Codex 在一个设备驱动项目上连续运行了 14 小时。还有人用它在一小时内完成了一个完整游戏的构建。
关键区别在哪?
如果你只给 Agent 一个模糊的计划,它最多是一个努力的实习生。如果你给它一个带有清晰验证标准的目标,它就变成了一个可以自我修正的执行者。
没有验证的野心,只是愿望。这句话适用于 Agent,也适用于人。
很多人把侧边面板理解为「预览窗口」。这大大低估了它。
侧边面板做三件事:
检查产物。 Markdown 可评论,电子表格可渲染公式并支持单元格编辑,CSV 显示为表格,PDF 直接渲染(LaTeX 用户的福音),幻灯片可在应用内审阅。关键不只是 Codex 能生成这些东西,而是你可以在不打断循环的情况下检查和标注它们。
操作网页界面。 Agent 可以通过 $browser 用 JavaScript 控制应用内浏览器,你可以直接在浏览器渲染的内容上留标注。最小且最持久的版本是一个带 JS 和 CSS 的单文件 index.html——不需要服务器,打开即用。Storybook 审阅组件,Remotion Studio 做动画,Slidev 做演示文稿,Streamlit 做数据应用,都可以在这个空间内完成。
审阅变更。 diff、PR 评论、代码修改——全部可以在同一个界面内完成。
当侧边面板上的内容和 Agent 操作的对象是同一个东西时,你们之间的协作效率会质变。你不再需要在聊天窗口和实际产物之间来回切换。产物本身就是对话的一部分。
2026 年 4 月 2 日,OpenAI 将 Codex 的定价从按消息计费改为按 API token 用量计费。
目前的结构是:
新用户团队注册时还能获得最高 500 美元的信用额度。
这个定价策略很清晰:先让人用起来,再通过用量收费。一旦你的工作流跑在 Codex 上——线程积累了记忆,Heartbeats 在后台运行,vault 里沉淀了上下文——迁移成本就变得极高。
这不是 SaaS 的逻辑。这是基础设施的逻辑。
2026 年 AI 编程工具市场已经分裂成三个范式:
它们不是在同一个维度上竞争。
Cursor 赢在手感。你写一行代码,它立刻给你补全,速度快到让人上瘾。360K+ 付费用户证明了这一点。
Claude Code 赢在深度。一个需要跨 50 个文件重构的大型任务,它的上下文理解可能是最好的。
Codex 赢在什么?赢在连续性。
它不是「此刻帮你写代码最快的工具」。它是「你离开之后工作仍然在推进的工具」。Heartbeats、远程控制、Goals、记忆系统、Connectors——这些功能加在一起,构成的不是一个更好的编辑器,而是一个可以持续运行的工作操作系统。
这是一个完全不同的产品定位。
让我把这些碎片拼起来。
过去的 AI 使用模式是这样的:
用户提需求 → 模型给结果 → 对话结束 → 任务中断 → 下次重新开始。
Codex 正在构建的模式是这样的:
用户设定目标 → 线程持续运行 → 记忆沉淀为文件 → Heartbeats 周期执行 → 用户随时介入审阅 → 工作永不归零。
从「一问一答」到「运行循环」。从「能力」到「连续性」。从「聊天窗口」到「工作操作系统」。
这个转变的意义不在于 Agent 变得多聪明。而在于工作本身的组织方式变了。
过去,一个想法死在 prompt 之后是常态。你有了灵感,打开 ChatGPT,问了一个问题,拿到一个答案,然后关掉窗口。三天后你已经忘了这件事。
现在,一个想法可以被放进一个线程、配上记忆、设定心跳、挂上验证标准,然后持续推进。你不需要一直盯着它。你只需要偶尔回来看一眼 diff,确认方向没有跑偏。
这不是替代人的工作。这是让更多工作不再死在中途。
对于知识工作者来说,这可能是 AI 工具真正进入日常生产流程的关键一步。不是因为它变得更强了,而是因为它终于学会了「不下班」。


