Codex for almost everything
OpenAI Codex 大更新:助力开发者加速软件开发全生命周期
OpenAI 发布了 Codex 的重大更新,旨在提升其作为开发者强大助手的能力,加速超过 300 万每周使用者的工作流程。本次更新的核心在于使 Codex 能够更深入地融入开发者工作环境,提供更广泛的功能和更智能的自动化支持。
主要更新内容:
- 计算机操作能力: Codex 现在可以像人类一样在电脑上操作,包括点击、输入等,能使用电脑上的所有应用程序。可以运行多个 Codex 代理,互不干扰,方便迭代前端修改、测试应用程序或使用不支持 API 的应用程序。
- 原生网页支持: 集成了一个内置浏览器,允许开发者直接在页面上添加注释,提供精确的指令给代理。未来计划扩展此功能,使 Codex 能够完全控制浏览器,超越本地主机上的 Web 应用程序。
- 图像生成能力: 集成了
gpt-image-1.5模型,可生成和迭代图像,配合截图和代码,方便创建产品概念、前端设计、Mockup 和游戏中的视觉元素。 - 插件扩展: 发布了 90 多个新的插件,结合技能、应用集成和 MCP 服务器,为 Codex 提供更多收集上下文和在工具之间执行操作的方式。 开发者可以利用如 Atlassian Rovo (JIRA)、CircleCI、CodeRabbit、GitLab Issues、Microsoft Suite、Neon by Databricks、Remotion、Render 和 Superpowers 等插件。
- 深度开发者工作流程支持:
- 支持处理 GitHub 代码审查评论。
- 支持运行多个终端标签页。
- 支持通过 SSH 连接远程开发环境。
- 可以直接在侧边栏中打开文件,提供 PDF、电子表格、幻灯片和文档的预览。
- 新增摘要面板,跟踪代理计划、来源和工件。
- 自动化增强:
- 允许重用现有的对话线程,保留之前建立的上下文。
- 支持为 Codex 安排未来的工作,并自动唤醒以继续长期任务,可能持续几天或几周。
- 团队可以使用自动化来处理诸如合并未解决的拉取请求、跟进任务和及时了解 Slack、Gmail 和 Notion 等工具中的快速对话。
- 记忆功能 (预览版): Codex 能够记住以往的经验,包括个人偏好、修正和需要花费时间收集的信息,从而加快未来任务的完成速度,并提升质量。
- 主动工作建议: 基于项目、连接的插件和记忆,Codex 可以主动建议如何开始工作或继续之前的项目,例如识别 Google Docs 中需要关注的评论,提取 Slack、Notion 和代码库中的相关上下文,并提供优先行动列表。
发布与计划:
- 这些更新正在向已使用 ChatGPT 登录的 Codex 桌面应用用户推出。
- 个性化功能(如上下文感知的建议和记忆)将很快推出到企业、教育和欧盟及英国用户。
- 计算机使用功能最初在 macOS 上可用,并将很快推出到欧盟和英国用户。
总结与展望:
自 Codex 推出以来,开发者使用 Codex 的方式不断扩展,从编写代码到理解系统、收集上下文、审查工作、调试问题、协调团队合作和推进长期工作。 OpenAI 的目标是确保 AGI 惠及全人类,本次更新使 Codex 更接近于软件构建过程中涉及的工具、工作流程和决策,并承诺未来将推出更多功能。 鼓励用户尝试 Codex 在整个工作流程中的应用。