💡 核心摘要 (TL;DR)
本文深入讲解了 Codex 桌面 APP 的使用方法,它不仅能辅助编写代码,还能直接操作电脑文件和浏览器。通过 15 个实战案例,手把手教你玩转 Codex 的各项功能,包括文件操作、AI Agent 编程、插件系统等。掌握 Codex,能有效提升编程开发和办公效率。
大家好,我是程序员鱼皮。
AI 编程工具这东西吧,真的是风水轮流转。最开始大家在吹 Cursor,后来 Claude Code 大火,而这次轮到了 Codex。
Codex 桌面 APP 不仅能帮你写代码,还能直接操作你电脑上的文件、浏览器、甚至是桌面应用,用好之后甚至能顶一个团队!
![图片[1]-Codex 零基础实战终极指南:15 种 AI 编程玩法深度解析-🎉数字奇遇🎉](https://www.freeyong.com/wp-content/uploads/2026/05/5a873183fc20260527112749.webp)
本期我会从 Codex 安装到项目实战,从基础功能到核心特性,用 10 多个实战案例,手把手教你玩转 Codex。
不管你是想用它来编程开发、办公提效、还是搞一些好玩的创作,看完这篇都能直接上手。
https://bilibili.com/video/BV1eNGR6rETx
(文章有图片数量限制,建议观看视频体验更佳)
干货密集,建议先收藏,找个安静的地方慢慢食用~
![图片[2]-Codex 零基础实战终极指南:15 种 AI 编程玩法深度解析-🎉数字奇遇🎉](https://www.freeyong.com/wp-content/uploads/2026/05/bc79019a1020260527112756.webp)
安装和上手
想要使用 Codex APP,你只需要准备一个 ChatGPT 账号。可以免费体验,但是有条件的话最好开个 Plus 会员(每月 20 刀,约 150 元),额度更充裕,足够日常使用了。
有了账号,直接去官网下载安装 Codex APP 就好:
目前支持 macOS 和 Windows(Linux 用户可以使用命令行版本的 Codex CLI)。
下载并安装后,登录你的 ChatGPT 账号,打开之后的界面长这样:
![图片[3]-Codex 零基础实战终极指南:15 种 AI 编程玩法深度解析-🎉数字奇遇🎉](https://www.freeyong.com/wp-content/uploads/2026/05/6d61f59da620260527112759.webp)
左侧是各种面板入口,包括对话管理、插件、自动化等功能。中间就是对话框,你跟 AI 所有的交互都在这里完成。
跟平时用的 AI 聊天工具差不多,还挺清爽的,不像传统 IDE 那么复杂,上手零门槛。
接下来我们直接开始用。
安装好之后,跟你用过的其他 AI 工具一样,在对话框里输入内容发送就能开始聊天了。
适合处理一些简单的日常工作,比如帮你查资料、总结内容、规划方案。
我让它帮我查一下今天有什么 AI 编程方面的热点:
Codex 会自动联网搜索最新信息,然后帮忙整理总结,这下不怕错过新资讯了。
![图片[4]-Codex 零基础实战终极指南:15 种 AI 编程玩法深度解析-🎉数字奇遇🎉](https://www.freeyong.com/wp-content/uploads/2026/05/c89fef3a6020260527112804.webp)
这只是开胃菜,Codex 真正强大的能力是操作你本地的文件和电脑,下面我们试试。
文件操作实战 – 分析磁盘空间
点击左侧的项目入口,选择一个本地文件夹。你可以把它理解为给 AI 划定了一个工作空间,AI 能在这个范围内读取和操作文件。
比如我选择了我的下载文件夹,里面有一堆不知道什么时候存下来的大文件。
在对话框底部,你可以看到权限模式的选项。这里有 3 个选择:
-
默认权限:AI 可以读取和编辑工作区的文件,需要额外权限时会问你
-
自动审查:AI 自动帮你审查操作
-
完全访问:AI 想干啥干啥,不会弹确认框
新手建议直接选「自动审查」,既省时又省心。
选好权限后,在对话框里输入提示词:
然后你就能看到 AI 开始工作了。它会自动执行终端命令来扫描文件,分析每个文件的名称和大小。
最后给你一份清晰的报告,列出哪些大文件占了多少空间,并给出清理建议。
![图片[5]-Codex 零基础实战终极指南:15 种 AI 编程玩法深度解析-🎉数字奇遇🎉](https://www.freeyong.com/wp-content/uploads/2026/05/313872545920260527112808.webp)
我主打一个听话,让 AI 帮我删除没用的预览文件:
成功帮我节省了 6.8G 的空间,效果不错吧~
但如果我让 AI 删除一个工作区外的文件呢?会发生什么?
试试看,在当前工作空间,开启一个新对话,比如我让 AI:
可以直接把这个目录拖拽到对话框中,然后执行任务:
如果你选择的权限模式是「默认模式」,AI 想删除文件的时候会弹出一个确认框,问你同不同意,防止 AI 搞乱你的电脑。
![图片[6]-Codex 零基础实战终极指南:15 种 AI 编程玩法深度解析-🎉数字奇遇🎉](https://www.freeyong.com/wp-content/uploads/2026/05/31fb1132bc20260527112811.webp)
但由于我选的是「自动审核」,AI 自己完成了审核并批准,省去了人工操作的麻烦。
这样一来,你完全可以把 Codex 当成你的私人文件管理助手,分析空间、清理垃圾、批量重命名,以前要手动折腾半天的事情,现在一句话就搞定了,是不是挺方便的?
做完第一个任务,大家肯定很关心消耗了多少 tokens 吧?
来,一起看看用了多少额度。
点击左下角的「设置」,点击「剩余额度」,就能看到你 5 小时内还剩多少配额、本周还剩多少比例,什么时候刷新。
Codex 的额度按 5 小时和 1 周来限制,Plus 用户的额度还是比较大方的,日常使用完全够。
![图片[7]-Codex 零基础实战终极指南:15 种 AI 编程玩法深度解析-🎉数字奇遇🎉](https://www.freeyong.com/wp-content/uploads/2026/05/a47804221020260527112815.webp)
你也可以在对话框里输入 `/状态`,这种以 `/` 开头的快捷输入叫做「斜杠命令」,是 Codex 内置的快捷操作方式:
输入之后,Codex 会直接在对话中显示当前的上下文余量和额度信息。
![图片[8]-Codex 零基础实战终极指南:15 种 AI 编程玩法深度解析-🎉数字奇遇🎉](https://www.freeyong.com/wp-content/uploads/2026/05/2f11f7693d20260527112820.webp)
OK,到这里你已经体验了 Codex 最基础的能力:对话 + 操作本地文件。恭喜,已经超过了 60% 的同学!
接下来我们提升一下难度,用 Codex 做一个完整的网站项目。过程中你会接触到不少 Codex 的核心用法,包括计划模式、AI 生图、浏览器预览、批注修改等等。
AI Agent 编程实战
在开始之前,先进入设置,把工作模式从「适用于日常工作」切换为「适用于编程」,这样 AI 的回复会更专业、更适合开发场景。
我要用 Codex 来为自己定制一个专属的「电子名片」。
把信息告诉 AI,它帮忙生成一个精美的网站。
还能用 AI 生图能力生成个性化的头像插画,不用自己去找素材。
做完之后发给别人,他们打开链接就能看到你的信息了。
第一步、计划模式,先讨论再动手
新建一个项目文件夹(比如叫 `namecard`),在 Codex 中打开。
模型选择目前最新的 GPT-5.5,速度选「标准」就够了,智能程度选「高」。
权限我直接给了完全访问,省得它每次操作都来找我确认,反正大部分情况下我都是无脑点同意的。
最关键的是,点击对话框左下角的 + 号,把「计划模式」打开。计划模式下,AI 不会直接开始写代码,而是先帮你规划方案、问你细节,确认没问题了再动手。
输入下面这段提示词,启动!
AI 会先自己思考,然后可能会追问你一些细节,在弹出的问题面板中选择就好。
最后会生成一份实现计划文档,包括简介、核心要求、测试计划等信息。你做的网站越复杂,越要仔细阅读这个文档。
第二步、观察 Agent 自主执行
如果没有问题,就确认方案,然后 AI 就开始自主干活了。
它先是使用内置的 Image Gen 技能生成了卡通头像文件。
然后编写代码,一次性生成了多个文件。
写好代码后还会检查代码、自主打开浏览器测试验证,还考虑到了一些容错。
过了 7 分多钟,AI 完成了整个任务,全程不需要你手动操作~
![图片[9]-Codex 零基础实战终极指南:15 种 AI 编程玩法深度解析-🎉数字奇遇🎉](https://www.freeyong.com/wp-content/uploads/2026/05/edabec147820260527112823.webp)
我们可以看到所有生成的文件,点击可以查看文件里的代码。
还可以点击「审核」,打开侧边栏的审查面板,查看本次变更的所有文件。
Codex 底层用的是 Git(一种记录代码变更历史的工具)来管理所有文件的改动。你能看到每个文件新增了什么、删除了什么,还可以灵活地应用和撤销代码,后面进阶功能部分我会详细给大家讲解。
第三步、查看效果 + 迭代修改
我们做的是纯前端静态网站,找到生成的 `index.html` 文件,右键在浏览器中打开,就能直接看到效果了。
PC 端的效果我觉得还不错,布局清晰、主题切换也很丝滑。
当然,你也可以直接让 AI 帮你运行网站。AI 会执行终端命令,启动开发服务器来运行网站。
点击访问地址后,Codex 会在右侧面板打开内置浏览器,便于你来预览效果。
如果某个地方不满意,你可以点击浏览器右上角的「批注」按钮,然后直接在页面上选中要修改的元素,写上你的修改意见,发送给 AI。
AI 会自动定位到对应的代码并精准修改,不用你自己去翻代码找位置。改完之后,刷新页面就能看到效果了:
![图片[10]-Codex 零基础实战终极指南:15 种 AI 编程玩法深度解析-🎉数字奇遇🎉](https://www.freeyong.com/wp-content/uploads/2026/05/cbf0cb88c720260527112830.webp)
方便是方便,不过这个速度真不敢恭维。。。
总结一下,要用 AI 开发一个网站,我们只要把需求告诉 AI、确认方案、等它自己写完并测试就好,中间几乎不用手动操作。
恭喜,看到这里你已经超过了 70% 的同学!
到这里你已经能用 Codex 从零开发一个网站、预览效果、按需修改了。接下来带大家看看它还有哪些核心功能,学完之后你不仅能做网站,还能让 AI 帮你操控浏览器抓数据、定时自动执行任务、甚至操控整台电脑。
核心功能详解 – 常用功能
接下来我把 Codex 的功能分成「常用功能」和「进阶功能」两大块来讲。
常用功能是日常会高频使用的,进阶功能则是有点儿门槛、但掌握后能让你效率翻倍的。
4.1 插件系统
在左侧的「插件」面板里,你能看到 Codex 的插件市场。
Codex 内置了不少精选插件,比如 Computer Use 操控电脑、Chrome 操控浏览器、Spreadsheets 表格处理、Presentations 演示文稿,这些是 OpenAI 官方提供的核心能力。此外还有大量编程类和工具类插件,涵盖网站部署、游戏开发、对接 GitHub 等各种场景,你可以在插件市场里按需搜索和安装。
比如我们来安装 Netlify 插件。Netlify 是一个免费的网站托管服务,装好插件之后,一句话就能把你做的网站部署上线,让别人都能访问。
点击安装 Netlify 插件,同意后会自动弹出浏览器,使用 GitHub 等方式登录 Netlify,一步步完成授权,最后 Codex 成功安装并连接了 Netlify。
然后我们用 Netlify 来部署之前开发完成的电子名片网站,在对话中通过 `
执行过程中,AI 会找我们确认,并自动创建一个新的 Netlify 项目来部署网站:
![图片[11]-Codex 零基础实战终极指南:15 种 AI 编程玩法深度解析-🎉数字奇遇🎉](https://www.freeyong.com/wp-content/uploads/2026/05/d29155d4f620260527112833.webp)
搞定!以后我想展示自己的信息,直接甩这个链接就行了。
还可以打开 Netlify 后台对项目进行管理。
你可以在 Codex 右上方的侧边栏中整体查看当前项目的概览信息,包括后台任务、打开的浏览器、使用的插件等:
![图片[12]-Codex 零基础实战终极指南:15 种 AI 编程玩法深度解析-🎉数字奇遇🎉](https://www.freeyong.com/wp-content/uploads/2026/05/0b7f6dab3b20260527112836.webp)
点击后台任务,还能看到具体的终端日志,记录了网站服务器什么时候收到了请求、请求了什么资源等信息。
同样的,如果你要处理 Excel 表格、做 PPT,使用对应的插件让 AI 帮你就好,生成的文件还能在侧边栏直接预览。
4.2 Browser Use
前面我们用的内置浏览器可以预览页面、做批注和修改,但如果想让 AI 真正去操控浏览器、自动点击、填表单、翻页,就需要 Browser Use 浏览器操作功能了。
使用 Browser Use
进入设置 → 浏览器,确保 Browser Use 功能已开启。你还可以在这里设置权限规则和禁止打开的域名。
在对话中通过 `@浏览器` 来调用这个能力。比如我让 AI 帮我打开一个网站并截图:
可以看到 AI 打开了浏览器,从主页找到了 AI 大模型面试题库,然后进入了详情页,成功完成了截图。不过有时候操作不太稳定,多试几次就好。
![图片[13]-Codex 零基础实战终极指南:15 种 AI 编程玩法深度解析-🎉数字奇遇🎉](https://www.freeyong.com/wp-content/uploads/2026/05/d6487ddf8220260527112840.webp)
使用 Chrome 扩展
此外,你还可以安装 Codex 的 Chrome 扩展插件,它可以操控你电脑上已经登录的 Chrome 浏览器。好处是能保留你的登录状态,而且可以在后台执行不占屏幕。适合需要登录网站才能进行的操作,比如帮我在自己的后台批量分析和管理数据。
使用前需要先在你的 Chrome 浏览器中安装 Codex 扩展程序,跟着 Codex 的指引操作就好。
安装好之后,我让 AI 帮忙从我已经登录的面试鸭网站上抓取一些数据:
可以看到 AI 不仅连接了我电脑上的 Chrome 浏览器,而且还识别到了我已经打开的标签页,会控制这些标签页,跳转到我的个人主页并抓取最新的 5 条数据。
最终抓取到的数据表格非常清晰,链接前面甚至还有图标~
![图片[14]-Codex 零基础实战终极指南:15 种 AI 编程玩法深度解析-🎉数字奇遇🎉](https://www.freeyong.com/wp-content/uploads/2026/05/b187aeb2d720260527112844.webp)
4.3 Computer Use
如果说 Browser Use 只能操控浏览器,那 Computer Use 就是让 AI 操控你的整个电脑。AI 能看到你的屏幕内容、移动鼠标、点击按钮、打字,还能操作微信、飞书等任何桌面应用。
进入设置 → 电脑操控,安装 Computer Use 插件。
你可以在这里看到所有已连接的应用,比如前面装的 Chrome 扩展,其实也属于 Computer Use 体系的一部分。
我们来体验一下。用 `@电脑` 来调用,让 AI 帮我看看当前的桌面壁纸,然后生成一张类似风格的新壁纸:
首次使用时系统会弹出权限申请框,你需要授权 Codex 访问屏幕、截图等权限,否则 AI 看不到你的屏幕、也没法帮你点击操作。
效果不错吧,生成了一张非常精美的新壁纸,我觉得比原图还好看。。。今晚可以做个好梦了~
![图片[15]-Codex 零基础实战终极指南:15 种 AI 编程玩法深度解析-🎉数字奇遇🎉](https://www.freeyong.com/wp-content/uploads/2026/05/c53155c85a20260527112848.webp)
再来一个更实用的例子。让 AI 帮我打开备忘录,记录一条笔记,并从音乐软件下载我最喜欢的一首歌,添加到笔记中。
可以看到 AI 会打开音乐 APP,有个小鼠标点击了下载按钮,成功下载了音乐文件「只因你太美」。
然后 AI 打开了备忘录,写入内容,并添加了音乐文件,能够顺利播放。
![图片[16]-Codex 零基础实战终极指南:15 种 AI 编程玩法深度解析-🎉数字奇遇🎉](https://www.freeyong.com/wp-content/uploads/2026/05/037e0513bf20260527112851.webp)
虽然过程有些曲折,但还是完成了任务,而且全程由 AI 自己操作,以后我可以直接让 AI 帮我写有图有文有音乐的笔记了。
但 Computer Use 目前只支持 macOS,而且缺点一大堆。不仅操作效率偏低,还很烧 tokens,刚才那个任务就用了近 8 万的上下文空间!此外,有些软件对 Agent 的支持度不高,AI 无法成功操控。
所以建议能用终端命令行和浏览器完成的操作,就不要用 Computer Use。
4.4 Skills 技能包
Skills 你可以理解为给 AI 提供的技能包,装了某个技能后,AI 在遇到相关任务时就能自动按照这套方法来干活,不用你每次都写一大堆提示词。而且技能是按需加载的,只有任务匹配时才会调用,不会浪费上下文空间。
进入左侧的「插件」面板,切换到「技能」Tab 页,在这里能够可视化安装和管理技能。
Codex 自带了几个内置的技能,比如 Image Gen 图片生成、OpenAI Docs 查官方文档、Skill Installer 安装社区技能、Skill Creator 创建新技能、Plugin Creator 创建插件等。
下面我先带大家用用内置的图片生成技能,然后安装社区里别人做的技能,最后再来自己创建一个技能。
使用图像生成技能
先来看内置的 Image Gen 图像生成技能。
前面做电子名片的时候我们已经用它生成了卡通头像。除了头像之外,你还可以用它来做 UI 素材、海报、横幅、表情包等等。
这里我想生成一个有趣的图片,让鱼皮直播卖鱼皮,可以先到
上找到 AI 生图的提示词模板,然后复制提示词模板。
![图片[17]-Codex 零基础实战终极指南:15 种 AI 编程玩法深度解析-🎉数字奇遇🎉](https://www.freeyong.com/wp-content/uploads/2026/05/ca8563d7a520260527112855.webp)
然后在 Codex 对话框中输入 `$` 符号 + 技能名称,可以快速调用技能。并且把提示词模板、鱼皮的照片都提供给 AI:
看看 AI 生成的图片,你觉得怎么样?是不是夯爆了?
![图片[18]-Codex 零基础实战终极指南:15 种 AI 编程玩法深度解析-🎉数字奇遇🎉](https://www.freeyong.com/wp-content/uploads/2026/05/2dbf0a881520260527112859.webp)
不过图片生成比普通对话消耗的额度更多,用的时候留意一下剩余配额。
使用社区技能
内置的技能数量有限,还有很多宝藏在社区里。
比如我自己经常用的几个技能:用于联网搜索的 Firecrawl、用于获取最新技术文档的 Context7、用于美化前端页面的 UI UX Pro Max 等等。
另外,我之前写过一篇优质 AI 编程扩展大全,推荐了几十个好用的技能和 MCP,可以到我免费开源的
《AI 编程零基础教程》
![图片[19]-Codex 零基础实战终极指南:15 种 AI 编程玩法深度解析-🎉数字奇遇🎉](https://www.freeyong.com/wp-content/uploads/2026/05/5294f2c8af20260527112903.webp)
接下来我带大家实际安装一个社区技能,顺便整个活儿,让 AI 制作一个苹果风格的快闪动画视频。
首先,要安装动画制作技能 remotion-best-practices。可以使用 `skill-installer` 技能,它能帮我们快速安装其他技能。
,由于我这里安装的是知名技能,就直接输入技能名称让 Codex 帮我安装了。如果你想安装不太知名的技能,更稳妥的方式是把技能的 GitHub 链接发给 Codex,让它帮你检查后再精准安装。
安装完成后,在技能管理面板里就能看到新增的技能了。
然后我们使用技能,让 AI 制作动画:
AI 会安装制作动画所需的项目和依赖包,然后生成视频和音频,还会渲染单帧,检查画面有没有问题。
最后 AI 生成了可直接播放的视频,来看看效果:
![图片[20]-Codex 零基础实战终极指南:15 种 AI 编程玩法深度解析-🎉数字奇遇🎉](https://www.freeyong.com/wp-content/uploads/2026/05/83dc57a56d20260527112906.webp)
额,他好像理解错了我文案的意思哈哈,翻车了翻车了。。。
我感觉这种方式更适合做产品发布宣传片、知识点快闪卡、节日祝福视频这类节奏紧凑的短片。
而且我根本没认真写提示词好吧!
你可以指定时长、指定文案、利用生图技能搭配素材,增加更多交互动画等等,感兴趣的同学自己玩一玩。
创建自己的技能
除了用别人的技能,你还可以把自己常用的工作流程封装成技能,以后遇到类似任务一键复用。
技能的本质就是一个 `SKILL.md` 描述文件,加上一些配套的脚本和参考资料。`SKILL.md` 里要写清楚这个技能是做什么的、什么时候触发、具体执行步骤,AI 读取后就知道该怎么干活。
创建技能的最佳方式是,先把一个任务流程跑通一遍,觉得满意之后,使用内置的 `$skill-creator` 技能,告诉 Codex 你的技能要做什么、什么时候触发、有什么细节需要注意,它就会帮你自动生成完整的技能文件。
常见问题 (FAQ)
Q: Codex 需要付费才能使用吗?
A: 可以免费体验 Codex,但开通 Plus 会员(每月 20 刀)能获得更充裕的额度,适合日常使用。
Q: Codex 支持哪些操作系统?
A: 目前支持 macOS 和 Windows,Linux 用户可以使用命令行版本的 Codex CLI。
Q: Computer Use 功能支持所有应用吗?
A: Computer Use 目前只支持 macOS,且部分软件对 Agent 的支持度不高,AI 无法成功操控。









暂无评论内容