OpenAI Codex 中文教程

Codex App 功能

你可以在 Codex App 中做什么

Codex App 是一个高度聚焦的桌面体验,适合并行处理多个 Codex 线程,并内置了工作树支持、自动化和 Git 功能。

大多数 Codex App 功能都可在 macOS 和 Windows 上使用。下文会标出平台特有的例外。


跨项目多任务处理

你可以在一个 Codex App 窗口中跨多个项目运行任务。为每个代码库添加一个项目,并在需要时随时切换。

如果你用过 Codex CLI,这里的“项目”大致相当于“在某个特定目录里启动一次会话”。

如果你在一个仓库里同时维护两个或更多应用或包,建议把它们拆成多个独立项目,这样沙箱只会覆盖该项目相关文件。

Codex App 侧边栏中显示多个项目,主面板中显示多个线程

Codex App 侧边栏中显示多个项目,主面板中显示多个线程

技能支持

Codex App 支持与 CLI 和 IDE 扩展相同的智能体技能。你还可以通过点击侧边栏中的 Skills(技能),查看并探索团队在不同项目中创建的新技能。

Codex App 中可用技能的选择器

Codex App 中可用技能的选择器

自动化

你还可以把技能和自动化结合起来,处理那些例行任务,例如评估遥测中的错误并提交修复,或为最近的代码库改动生成报告。对于需要持续留在同一线程里的工作,请使用线程自动化

包含计划和提示词字段的自动化创建表单

包含计划和提示词字段的自动化创建表单

运行模式

每个线程都会运行在某个选定模式中。创建线程时,你可以选择:

  • Local(本地模式):直接在你当前项目目录中工作。
  • Worktree(工作树):在 Git worktree(工作树)中隔离改动。参见了解更多
  • Cloud(云端模式):在已配置好的云端环境中远程运行。

其中 Local(本地)Worktree(工作树) 线程都会在你的电脑上运行。

完整术语和概念可参见概念章节

新线程 composer,显示 Local、Worktree 和 Cloud 模式选项

新线程 composer,显示 Local、Worktree 和 Cloud 模式选项

内置 Git 工具

Codex App 直接在应用内提供了常见的 Git 功能。

差异面板会展示你在本地项目或工作树检出中的 Git 差异。你还可以给 Codex 添加行内评论,并对特定块或整份文件做暂存或还原。

对于 Local(本地)和 Worktree(工作树)任务,你也可以直接在 Codex App 中提交、推送并创建 pull request。

对于更高级的 Git 操作,请使用集成终端

带有提交信息输入框的 Git 差异与提交面板

带有提交信息输入框的 Git 差异与提交面板

工作树支持

创建新线程时,可以选择 Local(本地)Worktree(工作树)Local(本地) 会直接在当前项目中工作;Worktree(工作树) 则会创建一个新的 Git worktree(工作树),让改动与日常项目状态隔离。

当你想在不碰当前工作的前提下尝试新思路,或者希望 Codex 在同一个项目中并行运行多个独立任务时,就使用 Worktree(工作树)

对于 Git 仓库中的自动化,Codex 会在专用后台工作树中运行;对于不受版本控制的项目,则直接在项目目录中运行。

了解如何在 Codex App 中使用工作树。

展示分支动作和工作树详情的线程视图

展示分支动作和工作树详情的线程视图

集成终端

每个线程都带有一个作用于当前项目或工作树的内置终端。你可以点击应用右上角的终端图标,或按 Cmd+J 来切换它。

使用终端可以在不离开应用的情况下验证改动、运行脚本和执行 Git 操作。Codex 也可以读取当前终端输出,因此它能在与你协作时检查正在运行的开发服务器状态,或引用失败构建的输出。

常见任务包括:

  • git status
  • git pull --rebase
  • pnpm testnpm test
  • pnpm run lint 或类似的项目命令

如果你会反复运行某个任务,可以在本地环境中定义一个 动作(action),把它作为快捷按钮放到 Codex App 窗口顶部。

注意,Cmd+K 会打开 Codex App 的命令面板,并不会清空终端。清空终端应使用 Ctrl+L

Codex 线程下方展开的内置终端抽屉

Codex 线程下方展开的内置终端抽屉

原生 Windows 沙箱

在 Windows 上,Codex 可以直接在 PowerShell 中以原生 Windows 沙箱运行,而不必依赖 WSL 或虚拟机。这让你可以留在原生 Windows 工作流中,同时仍然保持受限权限边界。

了解更多 Windows 设置与沙箱信息

消息输入框上方的 Codex App Windows 沙箱设置提示

语音输入

你可以直接用语音向 Codex 下指令。当输入框可见时,按住 Ctrl+M 并开始说话,你的语音会被转写。你可以先编辑转写后的提示词,或直接发送让 Codex 开始工作。

输入框中的语音输入指示器与转写后的提示词

输入框中的语音输入指示器与转写后的提示词

浮动弹出窗口

你可以把一个活动会话线程弹出成独立窗口,并移动到你当前工作的区域。这对于前端工作尤其理想,因为你可以把线程放在浏览器、编辑器或设计预览附近,快速迭代。

如果你希望它始终可见,还可以把弹出窗口切换为置顶。

浅色模式下的弹出窗口预览

深色模式下的弹出窗口预览

内置浏览器

使用内置浏览器预览、审查并评论本地开发服务器、基于文件的预览,以及不需要登录的公开页面,从而在迭代 Web 应用时保持你和 Codex 看到同一个渲染结果。

内置浏览器不支持认证流程、已登录页面、你的常规浏览器配置档案、cookies、扩展或已有标签页。

你可以使用浏览器评论标记页面上的特定元素或区域,然后要求 Codex 处理这些反馈。

如果你希望 Codex 直接操作页面,可改用浏览器操作,处理本地开发服务器和基于文件的页面。Browser 插件、允许网站和阻止网站都可以在设置中管理。

Codex App 在本地 Web 应用预览中显示浏览器评论

Codex App 在本地 Web 应用预览中显示浏览器评论

计算机操作

计算机操作可以帮助 Codex 通过查看、点击和输入来操作 macOS 应用。这适合测试桌面应用、检查浏览器或模拟器流程、处理插件尚未覆盖的数据源、修改应用设置,以及复现只出现在 GUI 中的 bug。

由于计算机操作可能影响项目工作区之外的应用和系统状态,请保持任务范围收敛,并在继续前审查权限提示。

该功能发布初期不在欧洲经济区、英国和瑞士提供。

Codex App 请求使用 Calculator 进行计算机操作的权限

Codex App 请求使用 Calculator 进行计算机操作的权限

处理非代码 artifact

当任务生成非代码 artifact 时,侧边栏可以预览 PDF 文件、电子表格、文档和演示文稿。请告诉 Codex 源数据、期望的文件类型、结构,以及你关心的审查标准。

对于电子表格和演示文稿,请说明重要的工作表、列、图表、幻灯片章节和检查项。要求 Codex 说明它把输出保存在哪里,以及如何检查结果。

线程运行时,可以用任务侧边栏跟踪 Codex 正在做什么。它可以显示智能体计划、来源、生成的 artifact 和任务摘要,便于你引导工作、检查生成文件,并决定是否需要再迭代一轮。

Codex App 在 artifact 查看器中显示生成的演示文稿

Codex App 在 artifact 查看器中显示生成的演示文稿


与 IDE 扩展同步

如果你在编辑器中安装了Codex IDE 扩展,当应用和 IDE 指向同一个项目时,它们会自动同步。

同步后,你会在 Codex App 的输入框中看到 IDE context(IDE 上下文) 选项。开启 “Auto context(自动上下文)” 后,Codex App 会跟踪你正在查看的文件,因此你可以间接引用它们,例如“这个文件是做什么的?”。你也可以在 IDE 扩展中看到 Codex App 里正在运行的线程,反之亦然。

如果你不确定应用是否带上了这些上下文,可以先关闭它,再问一次相同问题,对比结果。

线程自动化

自动化也可以附加到单个线程上。这类线程自动化是一种会按计划反复唤醒当前线程的机制,会保留线程上下文,让 Codex 可以检查长时间运行的工作、轮询某个来源的新信息,或继续跟进循环。它适合那些需要按固定节奏回到同一段对话中的 heartbeat 式自动化。

如果下一次运行依赖当前对话,请使用线程自动化。如果你希望 Codex 为一个或多个项目启动全新的重复任务,请使用独立或项目级自动化

审批与沙箱

你的审批策略和沙箱设置,决定了 Codex 可以在多大范围内自行操作:

  • 审批策略控制 Codex 在运行命令前何时需要停下来征求你的许可。
  • 沙箱则规定它可以访问哪些目录,以及是否允许网络访问。

当你看到 “approve once(本次批准)” 或 “approve for this session(本次会话期间批准)” 这类提示时,实际上是在授予不同范围的工具执行权限。如果你不确定,应优先批准范围最小的那个选项,再继续迭代。

默认情况下,Codex 只在当前项目范围内工作。大多数情况下,这正是合适的约束。

如果任务确实需要跨多个仓库或目录工作,优先考虑打开多个项目,或使用工作树,而不是直接让 Codex 越过项目根目录随意游走。

如果你的工作区已经开放自动审批评审,也可以在权限选择器里选用它。它会保持同样的沙箱边界,但把符合条件的审批请求交给当前配置的评审策略,而不是等待你逐条批准。

高层说明参见沙箱机制,配置细节参见 智能体审批与安全文档

MCP 支持

Codex App、CLI 和 IDE 扩展共用模型上下文协议(MCP)设置。如果你已经在其中一个入口配置过 MCP server,其他入口会自动采用这些设置。若要新增 MCP server,请在应用设置中的 MCP 部分启用推荐 MCP servers,或手动把新的 MCP server 加入配置。

Web 搜索

Codex 自带第一方 Web 搜索工具。对于 Codex App 中的本地任务,默认会启用 Web 搜索,并从 Web 搜索缓存提供结果。如果你把沙箱配置成完全访问,Web 搜索默认会切到实时结果。要关闭 Web 搜索,或切换到获取最新数据的实时结果,请参见基础配置

图片生成

你可以要求 Codex 直接在线程中生成或编辑图片。这适合 UI 资产、banner、背景、插图、sprite sheet,以及想和代码一起创建的占位图。如果你希望 Codex 转换或扩展现有素材,请加入参考图。

你可以用自然语言提出请求,也可以在提示词中包含 $imagegen 来显式调用图片生成技能。

内置图片生成使用 gpt-image-2,计入你的通用 Codex 使用限制;根据图片质量和尺寸不同,平均会以不含图片生成的类似 turn 的 3-5 倍的速度消耗套餐包含额度。详情见定价。提示词技巧和模型细节见图片生成指南

如果要大批量生成图片,请在环境变量中设置 OPENAI_API_KEY,并要求 Codex 通过 API 生成图片,这样会按 API 价格计费。

图片输入

你可以把图片拖放进提示词输入框,把它们作为上下文。拖放图片时按住 Shift,可以把图片加入上下文。

你也可以让 Codex 查看系统中的图片。通过提供截图工具,让 Codex 能对你正在处理的应用截图,它就可以验证自己正在完成的工作。

聊天

聊天是不需要特定项目文件夹或 Git 仓库时可以启动的线程。它们适合研究、分诊、规划、大量使用插件的工作流,以及其它应由 Codex 使用连接工具而不是编辑代码库的对话。

聊天会使用 Codex 管理的 threads 目录作为工作位置;该目录位于你的 Codex 主目录下。默认位置是 ~/.codex/threads

记忆

在可用地区,记忆让 Codex 可以把过往任务中的有用上下文带入未来线程。它最适合存放稳定偏好、项目约定、重复工作模式和已知陷阱,否则这些内容通常需要反复说明。

通知

默认情况下,当应用在后台运行时,如果任务完成或需要审批,Codex App 会发送通知。

在应用设置中,你可以选择永不发送通知,或即便应用正处于焦点状态也始终发送通知。

保持电脑唤醒

由于任务可能需要一段时间才能完成,你可以在应用设置中启用 “Prevent sleep while running(运行期间阻止休眠)”,让 Codex App 在运行任务时阻止电脑休眠。

另请参见