Skip to content

初级二:认识 AI IDE 工具

本章导读

🎯本章学习目标
本地开发环境搭建IDE 与 AI IDE高效开发技巧

本章将围绕本地开发环境展开讲解:你将学会从 z.ai 过渡到本地的开发环境,学会在自己的电脑上搭建完整的开发环境,理解什么是 IDE、什么是 AI IDE,以及如何在日常开发中高效地使用它们。

⏱️
预计耗时
1 天,可分多次完成
📦
预期产出
1 个自创小游戏
使用 Trae 产出

1. 写代码需要什么环境和工具

1.1 思维转变:遇到问题,先问 AI

在开始介绍各种环境和工具之前,首先提示你需要转变你的思维习惯

在传统的编程学习中,如果你要安装 Python、配置 Conda、或者解决 npm 安装失败的问题,你通常会打开搜索引擎,找到一篇教程,然后按照步骤一步步操作。如果中间报错了,你可能需要再搜报错信息,反复尝试。

错!❌

在 AI 时代,特别是在使用 AI IDE 时,请记住一个核心原则:任何操作,都可以先问一遍 AI,甚至让它直接帮你做。

  • 不知道怎么安装环境? 直接在侧边栏问 AI:“我想写 Python,帮我检查一下有没有安装 Python,如果没有请帮我安装。”
  • 网络卡住了? 如果安装依赖包时一直转圈或报错,直接把错误丢给 AI:“下载失败了,是不是网络问题?能不能帮我换个国内的镜像源?”
  • 命令记不住? 不需要死记硬背 Git 命令或 Conda 命令,直接告诉 AI:“帮我创建一个新的虚拟环境,名字叫 demo。”

1.2 为什么需要环境和工具

从“能不能写代码”,到“能不能把一个项目长期、稳定地维护下去”,对环境和工具的要求是完全不同的。

理论上,只用系统自带的记事本或者 Word 文档也能写代码——它们本质上都是能输入纯文本的工具。对于刚刚试着写几行代码、完成一次性的小实验来说,这样做勉强可行。

但一旦进入持续开发,问题就会立刻暴露出来:看不到语法高亮,错误位置只能靠肉眼去找;没有自动补全,每个标识符都要从头敲到尾;缺少项目结构视图,文件一多就很难迅速定位;代码运行出错时,也缺乏调试工具协助排查。这些“缺失”,会让开发变得既低效又容易出错。

这里提到的几个概念简单解释一下,方便还不熟悉计算机术语的同学理解:

语法高亮: 编辑器会根据代码的语法,把不同类型的内容用不同颜色显示,比如关键字是蓝色、字符串是绿色,这样更容易看清代码结构,也更容易发现拼写或语法错误。

自动补全: 当你只敲出代码的一部分单词或函数名时,编辑器会自动联想后面的内容,帮你补全,或者列出候选项,让你点一下就行,既省力也能减少输错。

标识符: 给代码里的各种“东西”起的名字,比如变量名、函数名、类名等,就像给不同文件夹贴上“图片”“作业”“账单”这样的标签,方便后面找到和使用。

项目结构视图: 用树状或列表的方式,把一个项目里的所有文件和文件夹展示出来,你不用在电脑里一层层点路径,只要在侧边栏点一下文件名,就能快速打开对应代码。

调试工具: 专门用来帮你查错的工具。它可以让代码一行一行地执行、在中途暂停、查看每个变量当前的值,从而找到“到底是哪一步出了问题”,而不是只能反复打印日志、到处猜。

因此,当目标从“试着写几行代码”升级为“做一个可以长期维护、持续迭代的项目”时,仅有一个能高亮语法的代码编辑器还不够,你通常需要选择并熟悉至少一款 IDE,把它作为自己的主要开发环境。我们会在接下来详细介绍什么是 IDE。

2. 什么是 IDE,为什么需要 IDE

在早期编程时代,我们只需要简单文本编辑器和语言处理器即可。但随着项目复杂度增加,开发者迫切需要一种能高效管理文件、支持语法高亮和调试的工具,于是集成开发环境(IDE)应运而生。

你可以把 IDE 理解成专门用来“编辑、管理、运行和调试”代码的程序。早期的 IDE 外观非常“原始”,几乎完全通过键盘操作。

终端界面(Terminal) 图片来源:https://en.wikipedia.org/wiki/File:Emacs-screenshot.png

知名且功能成熟的“内置 IDE”如 Vim,常用于服务器远程操作。

为了更高效,我们需要支持鼠标操作的现代 IDE,通常包含:

  • 源代码编辑器:语法高亮、自动补全。
  • 构建与运行工具:内置编译器/解释器。
  • 调试器:断点调试、变量查看。

现代 IDE 往往还内置 Git 等工具。最流行的是微软的 Visual Studio Code (VS Code),它轻量且可扩展。虽然也有 JetBrains 全家桶等专业 IDE,但 VS Code 对初学者最友好。

VS Code 的核心理念是“一切皆插件”。它通过插件机制支持各种语言,安装 Python 插件就是 Python IDE,安装 C++ 插件就是 C++ IDE。不装插件时,它只是个高级文本编辑器。

甚至可以用来编辑 Markdown 文档。

总之,IDE 是一套帮助开发者高效写代码和运行程序的工具集。

更具体的详细内容解释,请查看附录中的 虚拟 IDE 可视化 IDE 原理部分

3. AI IDE 和普通 IDE 有什么不同

普通 IDE(比如原版 VS Code)本质上是一套“工具箱”:
可以打开项目、写代码、运行和调试,也能装插件,但前提是你需要自己知道要做什么、怎么做:

  • 报错时,自己读提示、自己查哪一行有问题;
  • 想加新页面或新接口,自己找对应文件、自己写代码;
  • 想配置环境或打包,自己查文档、按步骤操作。

但在 AI IDE 里,你可以直接使用大语言模型帮助你进行编码和修改文件:

  • 直接说“做一个登录页”,它先生成基础代码结构;
  • 把报错信息和相关代码丢给它,让它先分析原因并给出修改建议;
  • 在你确认后,让它自动新建文件、批量改代码,处理跨文件的体力活。

例如,你可以选中一段代码,让它“重构一下”或“加注释”;也可以在侧栏里问“这个项目是怎么设计的?”,通过 @文件名@整个项目 指定参考范围,用一句话自动完成新建文件、写代码和运行的繁琐操作。

在最新版 VS Code 中,已经内置了一个大语言模型助手。你可以直接针对整个代码仓库、某个文件,甚至某个函数与模型对话。你也可以像之前在 Web 端使用自动写代码工具一样,将需求以提示词的形式发给内置的编码 Agent,让它自动帮你实现所需功能、创建文件、修改代码、配置环境等。

你可以下载安装 VS Code,在点击右上角的侧边栏入口,打开 AI 功能区域,体验这些能力。

不过,VS Code 并不是 AI 能力最强的 IDE。对于需要大量 AI 辅助编码的场景,我们往往希望使用“更聪明、效率更高”的工具——好的 AI IDE 能显著节省写代码和改 Bug 的时间。下面我们会介绍几款目前比较流行的 AI IDE,你可以根据个人喜好选择任意一款 AI IDE 使用。

由于 VS Code 是开源的(任何人都可以下载源码并自行编译),目前市面上绝大多数 AI IDE 都是在 VS Code 基础上二次开发而来。所以你不必担心要“学习很多种 IDE”——只要你熟悉了 VS Code 的基本用法,迁移到这些 AI IDE 并不需要重新学习。

一般而言,对于不同 AI IDE 之间的差异,主要集中在四个方面:价格;可使用的模型种类(部分高级模型在某些地区可能受限);Agent 的能力(在协助写代码时的智能程度和执行能力);以及运行速度与性能。你可以根据实际测试效果进行选用,适合自己的才是最好的。

典型的 AI IDE 一般具备以下核心能力:

  • 智能代码生成与补全:在传统 IDE 中,我们通常是输入几个字符来补全变量名或函数名;在现代 AI IDE 中,你可以写几行伪代码或者简单说明需求,让 IDE 自动补全完整的逻辑,甚至根据指令直接生成一大段甚至整块代码。
  • 代码理解与问答:IDE 能够理解并回答关于某段代码、某个文件,甚至整个工程目录结构的问题。
  • 代码重构与优化:IDE 可以根据你的意图,重写或优化指定代码片段的实现逻辑。
  • 自动生成测试:IDE 可以自动生成针对不同函数和模块的测试代码,方便你进行有针对性的测试。
  • Agent 式任务执行:智能 Agent 可以自动生成、打包、安装、运行和修改代码,在很多任务上可以部分替代初级软件工程师的工作。

Trae

Trae 是字节跳动推出的一款 AI 编程助手,支持 100 多种编程语言,并能集成到主流 IDE 中。它的功能包括:用自然语言生成代码、自动调试、把设计稿转换为 React/Vue 组件等。在 2025 年 8 月的更新之后,Trae 新增了智能依赖导入、重命名建议、任务清单管理等功能;SOLO 模式也开始支持后端代码生成和技术架构文档编辑。

Cursor

Cursor 是 Anysphere 开发的一款 AI 代码编辑器,基于 VS Code 定制,重点优化了大规模代码仓库和多文件协同的场景。它支持 GPT-4o、Claude 3.7 等模型;2025 年推出的 Claude Max 模式可以处理数百万行代码级别的项目。专业版取消了请求次数限制,非常适合复杂的企业级项目。

目前,Cursor 可以说是“带前端界面的 AI IDE”中综合体验最好的一款之一,用户数量庞大,功能迭代频率也很高。它最大的缺点是价格较高——专业版大约需要每月 20 美元。

Qoder

Qoder 是阿里巴巴推出的一款强调“透明协作”和“增强上下文工程能力”的 AI IDE。它通过 Action Flow 支持把任务拆解成多个步骤,并实时跟踪 AI 的执行过程;还支持多模型动态路由和任务状态机管理,非常适合在中大型项目中做架构治理和对遗留系统进行“反向工程”分析。

CodeBuddy

CodeBuddy 是腾讯云推出的一款 AI 编程工具,强调对中文指令的支持以及企业级合规能力。它提供代码补全、批量代码审查和多模型切换等功能;其中的 Craft 智能体可以实现多文件代码生成和 API 集成。企业版支持私有化部署,并通过了三级等保认证,适合金融、医疗等对数据安全要求较高的行业。

VS Code + Cline

Cline 是 VS Code(Visual Studio Code)的一款 AI 编程 Agent 插件,可以通过配置不同的 API 端点来灵活切换所使用的大模型。Cline 支持多模态输入、MCP 工具扩展以及成本监控,所有操作都需要用户确认后才会执行。它非常适合用于快速验证想法,或与现有开发流程集成。基础功能是免费的,企业版则支持在私有环境中部署模型。

4. 实战:用 AI IDE 在本地生成贪吃蛇游戏

前面讲的主要是“概念”和“差异”。这一小节,我们通过一次完整的实战,把抽象概念落到具体操作上:新建一个空文件夹 → 用 AI IDE 打开 → 在侧边栏聊天,让它用 React 帮你从零生成一个贪吃蛇游戏。 这里以上面介绍的 Trae 为例,首先需要安装和简单理解什么是 Trae。

4.1 准备工作:安装并了解 Trae

4.1.1 什么是 Trae

Trae 的全称可以理解为 “The Real AI Engineer”,是一款由字节跳动开发的自适应 AI 集成开发环境(IDE)。它是在流行的 VS Code 基础之上构建的,这意味着,如果你之前已经习惯了 VS Code,那么在使用 Trae 时,无论是界面布局还是基础操作都会感到非常熟悉、舒适。

Trae 的核心目标是成为开发者的“智能编程伙伴”。通过深度集成 AI 能力,它可以自动处理大量重复性工作,为你提供更直观、更高效的开发体验。它并不仅仅是一个“代码补全工具”,而是希望贯穿整个开发工作流,从创建项目、编写代码、调试、测试到部署都提供帮助。

4.1.2 安装 Trae

Trae 分为国际版和中国版。国际版需要能够访问海外网络,但可以使用 GPT-5 等最新的海外模型;中国版则主要支持国内最新的大模型,例如 GLM、Qwen、Kimi 等。

国际版下载地址:https://www.trae.ai/ 中国版下载地址:https://www.trae.cn/

4.1.3 Trae 界面简介

从界面形态上看,Trae 与我们日常使用的 VS Code 高度相似:同样是左侧资源管理器、中间编辑区、右侧扩展面板的经典三栏布局。

右侧的侧边栏就是 Copilot 交互窗口,也可以理解为 Agent 窗口。如果你暂时看不到它,可以点击 Trae 右上角的侧边栏图标将其打开。

打开侧边栏之后,你会看到一个 Builder 选项,这就是 Agent 模式。简单理解,它相当于 z.ai 的“本地版”,可以帮你操作本机环境,安装运行环境、打开网页等。

点击 “Builder” 后,你会看到 “Chat” 模式和 “Builder with MCP” 模式:

  • Chat 模式:主要用于和当前文件夹里的代码对话,或者当作普通聊天模型来使用。(你可以通过左上角的 “File” 菜单打开一个文件夹,在这个文件夹中进行编辑操作。在这种情况下,Builder 创建或修改的文件都只会发生在这个文件夹内部。)
  • Builder with MCP 模式:为 Agent 提供了更多可用工具(例如把语言模型和其他软件联通起来、查询天气等)。你可以简单理解为:MCP 能让语言模型更方便地调用各种外部工具。

在下面的区域,你还会看到模型选择选项,点击即可修改当前使用的大模型。在中国版中,你可以选择使用 Kimi k2 或 GLM 等国内模型;如果你使用的是国际版 Trae,还可以选择 ChatGPT 或 Claude 等海外模型。不过,由于国内大模型发展非常快,Kimi、Qwen、GLM 等在很多任务上的实际体验已经接近 Claude 3.5 或 3.7,对日常开发来说已经完全够用,这里不强制要求使用国际版或者国内版进行操作。

需要注意的是,这里不推荐使用 Auto 模式(自动选择模型),如果是国际版,我们推荐使用 Gemini 或者 GPT 模型, 如果是国内版,我们推荐你尝试 Kimi k2 或 Minimax、GLM 等国内模型, 不同模型有不同的使用场景,没有教条式的一定谁比谁好在哪,你可以在不同任务遇到困难无法解决时换一个模型,通过多次测试得到属于自己的最佳实验结果。

以上就是对 Trae 的一个简单介绍。接下来,我们可以回顾一下之前在 z.ai 中做过的操作,并尝试在 Trae 中做同样的事情。

4.2 第一步:新建空文件夹并用 AI IDE 打开

在正式动手之前,我们首先需要准备一个干净的项目工作目录。 以本小节示例为例,可以在本地新建一个名为 snake-game-react 的空文件夹。

随后,打开已安装好的 AI IDE,在启动界面选择打开文件夹或Open Folder,将该空文件夹作为项目根目录导入;也可以直接将文件夹拖入 IDE 窗口完成打开。此时,左侧资源管理器中不会出现任何代码文件,表示我们正从一个完全空白的项目状态开始。

4.3 第二步:在侧边栏聊天,让 AI 用 React 设计贪吃蛇游戏

接下来,打开 AI 聊天侧边栏:一般是按 Ctrl+L 或点击右侧聊天图标。然后在聊天里输入一个足够清晰的提示:

请你用 React 架构实现贪吃蛇游戏,包含键盘控制、吃到食物变长加分、撞墙或撞到自己时显示“游戏结束”并支持重新开始。实现后帮我启动这个项目。如果遇到没安装的程序环境就自动安装没安装的环境。

在这个过程中,你需要意识到 AI 不只是聊天模型,它能够帮助你操作本机环境:创建文件、安装依赖、执行启动命令等。你可以直接用自然语言描述想要达成的目标,由 AI 来决定具体执行哪些命令、如何组织代码。

如果执行过程中遇到问题,AI 会在对话里展示报错和处理方案,你可以继续通过对话让它调整,而不必自己记住所有命令细节。

⚠️ 需要注意

例如下图所示,有时候 AI Agent 会在执行的过程中暂停,这是因为它需要等待你输入一些信息进行交互,比如输入创建的名字,或者回车确认指令执行。或者点击指令进行执行。一般情况我们直接回车即可,如果你不确定这步需要做什么,你可以截图当前界面询问大模型应该如何操作。

如图所示,这里我们需要点击 Run 进行确认:

如图所示,这里我们只需要输入 y 即可确认:

如图所示,这里我们正在创建模板,但不知道如何操作,我们可以截图该部分对大模型进行询问:

AI Agent 在执行过程中暂停的还有一部分原因是因为此时启动了一个“服务”,我们的贪吃蛇本身属于一种“服务”,如果你看到如下命令的网址,则表示 Agent 帮我们执行了一个本地的电脑服务,我们可以访问对应的网址访问我们的贪吃蛇,由于服务需要持续启动,这里会陷入暂停。我们只需要点击 Skip 按钮即可。

在这个过程中,如果你遇到一些术语和看不懂的内容,不用担心,你可以查阅附录中的“计算机术语解释”部分,或者直接向 AI 咨询,或者及时提问!

如果你在过程中遇到不符预期的现象,例如贪吃蛇撞墙后不会结束游戏,贪吃蛇点击开始后不会移动,这时你只需要把现象描述给侧边栏 Agent 即可。如果遇到报错问题,记得截图或者复制错误到侧边栏 Agent,如果多次仍然不能解决问题,请你尝试更换模型操作。

稍作片刻,我们即可得到类似 z.ai 一样的结果:

我们可以点击右下角的打勾进行确定代码的变更,也可以点击 Cancel 按钮取消变更。或者点击 2 files need review 的地方展开查看变动后的代码。

这里还值得注意的是,由于修改代码并不一定正确,我们还需要知道所有的 IDE 的 Agent 都支持代码回退,例如,假设我这里不小心做了个错误的修改操作,或者这次操作的结果让你感到不满意,在修改结束后我们可以返回输入框的部分,点击 Revert 按钮将操作回退到修改前的状态,你可以修改输入的文字进行再一次操作:

4.4 第三步(可选):向 AI 追问代码实现细节

当贪吃蛇游戏已经可以正常运行时,如果你对前端或 React 还不熟,可以继续在同一个聊天窗口里,请 AI 用尽量口语化的方式帮你导览代码。你不需要切换工具,也不必刻意去翻文档,只要围绕当前项目持续发问即可。

一个比较实用的做法是,让 AI 先整体讲一遍“游戏是怎么动起来的”,再拆到具体细节。比如你可以直接提问:

“请从上到下讲一遍,这个贪吃蛇游戏每一步是怎么动起来的?尽量少用专业术语。”

然后再顺着它的回答继续追问关键点,例如:

“蛇在屏幕上的每一节身体,是用什么数据结构来记的?能打个比方吗?”
“你是怎么控制‘隔一段时间动一下’的?这在代码里是哪一段?”
“蛇吃到食物时,你做了哪几步操作?在哪一段逻辑里判断吃到了?”
“撞墙和撞到自己,分别是在哪些代码里判断出来的?”

如果你看到某个文件(比如 SnakeGame.tsx)但完全不知道它在干什么,也可以直接请 AI 分块说明:

“请把 SnakeGame.tsx 按功能分几块讲一下:每一块大概负责什么,用通俗一点的说法。”

在这一轮对话中,你可以把不懂的词一律当成追问入口,比如:

“你刚才说的‘状态’具体指什么?能用一个生活中的例子解释吗?”
“你说的‘定时器’在这里主要是干嘛的?如果把它去掉,会发生什么?”

通过这种方式,你的目标不是一下子记住所有概念,而是先搞清三件事:这款游戏里有哪些核心数据(蛇、食物、分数、游戏状态等),这些数据在什么时机会发生变化(移动、吃到食物、游戏结束等),以及每一种变化对应的是哪一小段代码。只要这三点理顺了,你就基本可以看懂这份代码的主干逻辑。

4.5 第四步:让 AI 把画面变好看一点

这里先提醒一件对小白很重要的事情:不要只对 AI 说一句“我要把这个画面变好看”。这种说法对人类设计师都太模糊,更别说对模型了——“好看”是什么风格、哪些地方需要调整、是排版问题还是配色问题,AI 都无法从你这一句里读出来。为了让 AI 真正做出接近你心里预期的效果,你需要学会把“我想要好看”这种模糊目标拆成一串具体、可执行的小要求。

比如,很多人一开始会这样说:

“我要把这个画面变好看一点。”

例如,你可以先给出一组整体需求:

“请帮我把游戏界面整体美化一下:

  • 游戏区域居中显示,不要贴在左上角;
  • 换成较浅的背景色,让蛇和食物更醒目;
  • 把分数放大,放在明显的位置;
  • 以蓝色为主色调,美化一下整体配色和按钮。”

如果你希望在“游戏结束”时有更清晰的反馈,可以进一步补充:

“当游戏结束时,请在画面中央显示‘游戏结束’,下面有一个‘重新开始’按钮,可以重置游戏。”

AI 会根据你的描述,直接修改 React 组件和样式。保存后刷新浏览器,你就能看到新的界面。如果效果和你想象的还有差距,可以继续做小步调整,例如:

“分数再大一点,颜色更醒目一些。”
“游戏区域再紧凑一点,四周预留一点留白。”
“重新开始按钮改成蓝色圆角风格,放在提示下方居中。”

在这个阶段,如果某次修改导致报错,也不需要自己硬查。直接把错误信息复制到聊天窗口,或者配合一段简要描述,比如“这是我刚才美化界面后出现的错误”,让 AI 在当前项目上下文里帮你定位和修复。这样你就可以在“不断对话、不断刷新”的循环中,把一个能跑的 Demo 逐步打磨成界面清晰、交互顺畅的小型成品。

4.6 (可选)参考 z.ai 架构修改贪吃蛇结果

对于 vibe coding 小白来说,最难的事情反而是不知道什么才算是“最佳实践“,不知道怎么样的架构才是最适合的;因为不知道计算机基础,所以没办法很好的引导 AI,解决这个难题的方法是”直接参考“;还记得我们之前说过的 z.ai 中可以查看代码吗?其实对应 README(项目中用于介绍功能和技术架构的部分)中已经给出了一个最佳架构参考:

我们想要让本地的结果尽量符合 z.ai 的结果,我们可以复制这个 README 的全部内容,粘贴到 Trae 的侧边栏中,让他根据 README 的架构,修改本地的代码。

最后我们能得到与 z.ai 高度相似的页面设计风格:

5. 界面上每个按钮是干什么的

在上述操作中,我们已经快速跑通了最小程序生成闭环,但我们仍然对 IDE 不能说得上熟悉。为了彻底熟悉这个之后与我们长期相处的工具。我们会在这一节中对 IDE 的每个细节环节进行深入解释,首先从界面开始,不同 AI IDE 的界面略有差异,但大部分都延续了 VS Code 的布局

其中每个部分的具体作用为:

  • Title Bar(标题栏):显示文件名和窗口控制按钮。
  • Activity Bar(活动栏):切换文件、搜索等功能视图。
  • Side Bar(侧边栏):展示文件列表等具体内容。
  • Editor Groups(编辑区):编写代码的核心区域。
  • Breadcrumbs(路径导航):显示文件路径,支持跳转。
  • Minimap(代码缩略图):快速预览和定位代码。
  • Panel(底部面板):包含终端和输出窗口。
  • Status Bar(状态栏):显示当前环境状态。

更具体的详细内容解释,请查看附录中的 虚拟 IDE 可视化 IDE 原理部分

6. 怎么跟 AI 说话才有效

随着 AI 能力越来越强,我们已经可以把很多“让程序员写代码”的工作交给 AI 来完成。
但是,在实际使用中你会发现:同样是用同一个 AI,有的人几句话就能要到能跑起来的小项目,有的人聊了半天,结果却完全不是自己想要的,其差别往往不在于“谁更聪明”,而在于——你跟 AI 说话的方式,是不是足够具体、足够有步骤。
本节我们从几个常见场景出发,介绍一些适合完全小白的提问方式,帮助你更稳定地让 AI 给出可用的结果。

6.1 说清楚你的需求:从“模糊想法”到“具体说明”

很多人第一次用 AI 时,习惯只说一句非常笼统的话,比如:

“帮我做个网页。”
“帮我写个小程序。”

在这种情况下,AI 只能自己“脑补”你想要什么,于是它会随便给你一个看上去挺完整的东西,但往往和你真正想做的差很多。
要让 AI 更听得懂你的意思,需要把“脑子里的想法”拆开,用几句话一步步说清楚。

可以从这几个方面来补充:

  1. 告诉它,你拿这个东西来干嘛
    比如,不要只说“个人网站”,而是说:

    • “我想做一个只包含一页内容的个人简介网页,用来发给招聘的人看。”
  2. 告诉它,大概需要哪几块内容
    不用说专业词,只要描述你希望页面上出现什么,比如:

    • “页面要有三个部分:最上面是名字和一句自我介绍,中间列出几条工作经历,最下面放邮箱和微信号。”
  3. 告诉它,你的水平和限制
    让 AI 按照小白能接受的方式来做,比如:

    • “我完全不会写代码,请只用最简单的写法,让我可以直接复制到一个文件里,在浏览器里打开。”
  4. 告诉它,你希望怎么拿到结果
    例如:

    • “请给我一份可以直接保存为 index.html 并在浏览器里打开的完整代码。”

综合起来,可以让你对 AI 这样说:

“我完全不会写代码,想做一个只包含一页内容的个人简介网页,用来发给招聘的人看。
页面需要三个部分:上面一行是名字和一句自我介绍,中间是几条工作经历,下面是邮箱和微信号。

当你把这些信息说清楚之后,AI 就能更接近你真正的需求,而不是随便给你一个“看起来很厉害但用不上的东西”。

6.2 用对节奏:先“能跑起来”,再一点点变复杂

对完全小白来说,最常见的坑是:一上来就想做一个“非常完整”“功能很多”的东西。
比如:

“帮我做一个像淘宝那样的网站。”
“帮我做一个可以注册、登录、下单的系统。”

结果往往是:AI 给你一大团代码,你复制之后不是打不开,就是到处报错;你也看不懂哪里出了问题,最后只能放弃。

更适合的做法,是主动控制节奏,让 AI 跟着你一步一步来,而不是一次性把所有东西都砸给你。可以按下面这个顺序提要求:

  1. 第一步:先要一个“最小的例子”
    只检查一件事:能不能在浏览器里看到东西。
    例如:

    “请先给我一个最简单的示例,只要在浏览器里能看到一行‘这是我的主页’就行。
    再一步步告诉我:文件名该叫什么,应该怎么保存,怎么打开。”

  2. 第二步:在这个基础上,慢慢把内容加完整
    当你确认“确实能看到那一行字”之后,再说:

    “在刚才的基础上,帮我增加一个‘工作经历’区域,把完整代码重新发给我。不要只发改动的部分。”

  3. 第三步:结构差不多之后,再考虑好不好看
    例如:

    “现在页面已经能正常显示内容了。接下来请帮我稍微美化一下:整体居中,标题大一点,用一个比较舒服的字体。请给出更新后的完整代码。”

每加一步,你都先运行一次,确认真的有变化,再让 AI 往下加。这样就算哪一步出问题,你也可以很快回到“上一版还正常”的状态,而不用完全推倒重来。

6.3 善用截图和复制:不会说就“把画面扔给 AI”

很多完全小白遇到的难点,不在于“不会改代码”,而是在于不知道怎么把问题说出来
比如:

  • 浏览器里突然弹出一大堆英文报错,你完全看不懂。
  • 网页的排版和你想的不一样,但你也不知道该用什么词来形容。

在这些情况下,不需要硬挤专业术语,最简单的方式就是——把你看到的东西原样丢给 AI

可以这样做:

  1. 复制报错文字
    当你看到一串红色错误消息时,可以直接复制出来,然后说:

    “这是我运行后出现的完整错误信息。我看不懂这些英文,请先用普通人能听懂的话解释一下,这大概是什么意思。
    然后告诉我,我现在最简单应该怎么改。”

  2. 给 AI 看截图
    如果你觉得“这个页面看着就是不对”,但又不会描述,可以:

    • 截一张当前页面的图;
    • 把你正在用的那份代码,一整段复制给 AI;
    • 然后说明:

      “这是现在页面的样子,这是我现在的完整代码。
      我原本希望它是三列排版,现在变成一列了。请你帮我看一下原因,并给我一份改好后的完整代码。”

  3. 遇到喜欢的网页,想做个类似的
    不需要说“这个布局叫什么”,直接:

    • 截图或复制那页的主要标题、段落;
    • 再说:

      “我想做一个结构和这个差不多的页面,不需要一模一样。
      请帮我用简单一点的代码,搭一个类似的框架出来,然后我再自己把文字换成我的。”

简单来说:你负责“把看到的东西搬给 AI”,再用最朴素的话说“我希望它变成什么样”;剩下的“翻译成代码、解释名词、找问题”,交给 AI 来做。

6.4 当 AI 生成的代码不工作时:一套通用应对方法

在实际练习中,你一定会遇到这种情况:
AI 很认真地给了你一段代码,你也老老实实地复制进去了,但结果要么是浏览器一片空白,要么完全不是它说的那个效果。
这并不代表你“学不会”,也不代表 AI 完全错了,而是你们之间还缺少几轮“来回确认”。

当代码“不工作”时,可以按下面这套固定流程来跟 AI 说:

  1. 先把“你做了什么 + 现在什么样”说清楚
    避免只说“打不开”“不行”。可以这样描述:

    打开之后,页面是完全空白的,没有显示你说的那句欢迎文字。 我打开了 xxxx 页面,其中没有刚才我说的部分啊,这不能用

  2. 把你现在的完整代码发给 AI
    很多时候问题出在:复制少了一行、或者上一次和这一次的内容混在一起了。
    你可以说:

    “下面是我现在这个文件里的全部代码。
    请你对比一下有没有哪里少了、写错了,或者顺序不对。
    请直接给我一份修正后的完整代码,不要只发一小段。”

  3. 如果有错误提示,一并给出
    比如浏览器右上角弹出的错误,或者底部的一些红字。你可以:

    • 把错误文字复制出来;
    • 或者截一张图;
    • 然后说:

      “这是我看到的错误提示。我完全看不懂,请先用简单的方式说明这大概是什么问题,再告诉我现在最需要改哪几行。”

  4. 要求对方用“小白模式”一步一步讲
    你可以直接把自己的情况说清楚,让它别省略中间步骤:

    “我完全不会写代码,请你一步一步告诉我:
    第 1 步要改哪一行,
    第 2 步要怎么保存,
    第 3 步要怎么重新打开或者刷新页面。
    每一步都请用完整的句子写出来。”

  5. 最后,请它帮你做“应该看到什么”的对照
    例如:

    请先说一下,按照你改好的代码,正常情况下我打开网页应该看到什么内容。

只要你按照这套流程来和 AI 交互,大部分“代码不工作”的情况,都可以在几轮来回中解决掉。
同时,你也会逐渐熟悉常见的问题类型,下次再遇到类似情况就能直接解决。

7. 小结与下一步

这一章里,你完成了一次从“能在网页里玩一个 AI 生成的贪吃蛇”,到“能在本地用 AI IDE 自己搭出一个小游戏”的升级。你大致搞清了三件事:写代码为什么离不开一个像 VS Code 这样的 IDE;在这个基础上,再加上 AI(Trae、Cursor 等)之后,IDE 不再只是工具箱,而是多了一个能听懂自然语言、帮你新建文件、装环境、改代码的“实习工程师”;以及 IDE 界面上每一块区域(左侧文件、底部终端、中间编辑区、右侧 AI 面板)分别管什么,用起来就不再一头雾水。

更重要的是,你已经实际跑通了一次完整流程:在本地新建空文件夹 → 用 AI IDE 打开 → 在侧边栏对话里描述需求 → 让 AI 生成项目并启动开发服务器 → 出现问题时,把“现象 + 全部代码 + 报错截图”一起丢给 AI,请它用“小白模式”一步步修。这个过程中,你也练习了如何写更有效的提示词:说清目标、内容结构和自己的水平,控制好节奏,从“先能跑起来”到“再变好看、变好玩”。

下一章,我们会把重点从“会用工具”转向“做一个真正有人愿意用的原型”:从用户视角出发,设计规则、交互和反馈,然后再让 AI 帮你把这些想法落成产品雏形。

8. 📚 作业:用本地 AI IDE 做一个更复杂的游戏

🚀 挑战任务:打造你的专属游戏

你已经用本地 AI IDE 做过一个贪吃蛇。现在请你再挑战一个更复杂一点的小游戏,完整走一遍“描述需求 → 生成项目 → 本地运行 → 调试迭代”的流程。

  1. 选择一个比贪吃蛇更复杂的游戏
    • 可以是“俄罗斯方块”“打地鼠”“扫雷”“2048”“飞机大战”之类
    • 或者你自己想象的一个简单原创游戏
  2. 必须用本地 AI IDE 来完成整个过程
    • 新建一个空文件夹,用 AI IDE 打开
    • 在侧边栏聊天里描述清楚你的游戏需求
    • 让 AI 负责创建文件、搭建项目结构和实现主要逻辑
    • 在本地启动开发服务器,确保游戏可以正常运行
  3. 有基本的“可玩性”和反馈
    • 至少包含开始、进行中、结束三种状态
    • 玩家有明确的操作方式(键盘或鼠标)
    • 屏幕上有清晰的得分或进度反馈
  4. 至少进行 2 轮以上的迭代
    • 第一轮让 AI 做出“能玩”的版本
    • 第二轮以后,逐步提出具体改进(样式、难度、交互优化等)

附录

附录导航
这里是“随查随用”的补充资料:遇到术语看不懂、界面找不到入口时再回来。
附录一:常见计算机术语速查表
看到不懂的计算机名词时,来这里快速查含义,推荐通读一遍。
附录二:Visual Studio Code 菜单栏解析
不知道 AI IDE 的界面有什么用的时候,拿以下内容和 AI 对话进行查阅,或者直接查看。
支持:按 Ctrl/⌘+F 搜索关键词;遇到新词可复制报错让 AI 用“小白模式”解释。

附录一:常见计算机术语速查表

🗺️ 术语地图:你将在这里遇到...
🖥️ 工具界面
IDE / 终端 / 面板
🌐 网络服务
URL / 端口 / 本地
⚙️ 前后端
API / JSON / 接口
📝 代码基础
变量 / 函数 / 组件
🐞 调试查错
Bug / 断点 / 日志
📂 项目管理
Git / 仓库 / 提交
🤖 AI 工具
Agent / 模型 / Key
🛠️ 浏览器
DevTools / 控制台

这一部分不需要刻意背诵,更重要的是先在脑子里建立一个印象。

一、和“工具界面”有关的词

1. IDE、编辑器、终端

IDE(集成开发环境)
可以把 IDE 想象成“程序员的工作台”:

  • 一边是写字的桌面(编辑器),
  • 一边有电源插座和按钮(运行、调试),
  • 抽屉里有各种小工具(搜索、版本管理)。
    VS Code、Trae、Cursor 都属于 IDE 或基于 IDE 改的工具。

代码编辑器(Editor)
更像是“高级记事本”,只负责:

  • 让你打字写代码;
  • 用颜色区分不同内容(语法高亮);
  • 给你自动补全。
    IDE 里那块写代码的区域,就是代码编辑器。

终端 / 命令行(Terminal / 命令行窗口)
一个黑底白字的窗口,你在里面输入命令让电脑干活:

  • 比如:npm run dev 表示“帮我启动开发服务器”;
  • python main.py 表示“运行这个 Python 文件”。
    可以把它想象成:“你给电脑发一条条短信命令,它用文字回复执行结果”。

2. IDE 中几个常见区域

活动栏(Activity Bar)
最左边一排竖着的小图标,像“功能选项卡”:

  • 点文件图标 → 左边显示文件列表;
  • 点放大镜图标 → 左边变成搜索;
  • 点 Git 图标 → 左边显示版本管理。

侧边栏(Side Bar)
活动栏右边那一大块区域,专门显示当前模式下的内容:

  • 文件模式:展示项目里的文件和文件夹;
  • 搜索模式:展示搜索结果列表;
  • 源代码管理模式:展示有哪些文件被改动。

编辑区(Editor)
中间最大的区域,就是你打开文件后实际看到和修改内容的地方;
上方的标签页(Tab)是“当前打开了哪些文件”。

底部面板(Panel)
一般在最下方,常见几种:

  • Terminal(终端):输入命令跑项目;
  • Problems(问题):列出出错的文件和行号;
  • Output(输出):一些工具打印出来的运行信息;
  • Debug Console(调试控制台):调试时的输出。

状态栏(Status Bar)
最下面那条细细的栏:

  • 显示当前文件是什么语言(JS、HTML、Python 等);
  • 显示缩进是“2 个空格”还是“4 个空格”;
  • 显示有没有错误、当前 Git 分支是什么。
    可以把它当作“当前编辑环境的一张小体检单”。

二、和“网页 / 网络 / 服务”有关的词

1. URL、http、端口、本地服务

URL(网址)
就是浏览器地址栏那一串东西,比如:

  • https://www.trae.cn/
  • http://localhost:3000/
    它就像“互联网世界里某个房间的完整地址”。

HTTP / HTTPS
在 URL 开头看到的 http://https://

  • HTTP:普通传输方式;
  • HTTPS:多了一层加密,更安全。
    你可以先记成:“写网页地址时,通常以 httphttps 开头”。

端口(Port)
可以把一台电脑想象成一栋大楼,端口就是每个房间的门牌号

  • :3000 表示 3000 号房间;
  • 同一台电脑上,可以同时开多个服务,各占一个端口。
    http://localhost:3000 就是“访问我自己电脑上 3000 号房间里跑着的那个服务”。

本地(Local / localhost)
指的就是你自己的电脑。

  • localhost 可以理解为“这台机器自己”。
    当你访问 http://localhost:3000,其实是在跟自己电脑上运行的程序打交道,而不是上网访问别人家的服务器。

服务(Service / Server)
“服务”就是一个一直在后台运行、随时听你指令的程序:

  • 网页服务:浏览器访问一个地址时,它返回网页内容;
  • 游戏服务:负责管理对局、存档、排行榜等。
    在终端里执行 npm run dev 启动项目,本质上就是“在本地开了一个网页服务”。

三、和“前端 / 后端 / 数据”有关的词

1. 前端、后端

前端(Frontend)
用户看得见、点得到的部分:

  • 网页上的按钮、文字、图片、动画;
  • React / Vue 写出来的页面。
    负责展示界面和响应用户操作(点击、输入、拖拽等)。

后端(Backend)
用户看不见、在服务器上跑的那部分:

  • 存和读数据(用户信息、订单、分数等);
  • 执行业务规则(登录验证、权限判断)。
    你可以把前端比作“店面和店员”,后端比作“仓库和账本系统”。

2. 接口、请求、响应、JSON

接口 / API
前端和后端事先约定好的一套“问问题 + 回答案”的规则。

  • 前端说:“我用这个地址、这个格式来问你”;
  • 后端说:“我用这个格式把结果回给你”。

请求(Request)
前端发给后端的一次“提问”:

  • 请求去哪(URL);
  • 用什么方式(GET、POST 等);
  • 带了什么参数(比如用户 ID)。

响应(Response)
后端给前端的“答复”:

  • 状态码(200 成功,404 找不到,500 服务器出错);
  • 实际数据(多半是 JSON)。

JSON
一种用很像 JavaScript 代码的写法来表示数据的格式,比如:

json
{
  "name": "Alice",
  "score": 120
}

可以理解成“机器版的键值对记事本”,前后端经常用它来交换数据。

四、和“写代码本身”有关的词

1. 变量、标识符、状态

变量(Variable)
“给一块数据贴上的标签”。

  • 例如把分数这件事记作 score
  • 以后用 score 这个名字,就能读写这块数据:
js
let score = 0
score = score + 10

标识符(Identifier)
“你自己起的各种名字”的统称:

  • 变量名:score
  • 函数名:moveSnake
  • 组件名:SnakeGame
    就像给文件夹起名“照片”“工作”“账单”,方便在代码里区分不同“东西”。

状态(State)
程序当前的“关键情况记录”:

  • 游戏是不是已经结束;
  • 蛇现在在第几格;
  • 当前分数是多少。
    在 React 里,一般会这么理解:状态一改,界面就要跟着更新

2. 函数、组件、模块

函数(Function)
把一件“可以反复做的事”打包起来,起个名字:

js
function sayHello(name) {
  console.log('Hello, ' + name)
}

以后只要写 sayHello('Bob'),就等于把里面那几行再次执行一遍。

组件(Component)
前端里的“可以重复用的一块小界面 + 小逻辑”:

  • 一个按钮可以是组件;
  • 一个顶部导航可以是组件;
  • 整个游戏区域也可以是一个组件。
    组件之间可以拼装,就像搭乐高。

模块(Module)
“一组相关代码组成的文件”:

  • snakeLogic.ts 专门放和“蛇怎么动”相关的代码;
  • score.ts 专门放算分数的代码。
    模块之间可以互相“导入 / 导出”,像不同抽屉里的工具。

3. 语法、编程语言、框架

语法(Syntax)
某门编程语言的“语法规则”和“标点习惯”:

  • 字符串要加引号;
  • 每条语句末尾要不要写分号;
  • 代码块要用 {} 包起来。
    写错语法,编译器 / 解释器会直接报“语法错误”。

编程语言(Programming Language)
和计算机沟通的一整套规则和词汇,比如:

  • JavaScript、Python、Java、C++、Go……
    不同语言适合做的事情、写法和工具生态不同。

框架(Framework)
别人帮你“先搭好骨架”的一大套代码和套路:

  • 前端:React、Vue(帮你处理界面更新、状态管理等);
  • 后端:Django、Spring Boot 等。
    你等于是在“现成的骨架上填内容”,比从头造轮子轻松很多。

五、和“调试 / 查错”有关的词

1. Bug、报错、日志 / console.log

Bug
程序表现和你想的不一样,就是 bug:

  • 本来应该出现按钮,结果没有;
  • 本来应该加 10 分,结果多加了一堆;
  • 页面一打开就白屏。

报错信息(Error Message)
程序崩了之后,屏幕上 / 终端里那段“看起来很吓人”的英文。
虽然难看,但通常会告诉你:

  • 大致是哪里错了;
  • 哪个文件、第几行附近需要检查。
    你可以直接复制它,丢给 AI 让它翻译和分析。

日志(Log)
程序在运行过程中自己“说的话”。
最常见的就是前端里的:

js
console.log('当前分数', score)

你可以把它理解成:在关键步骤主动报个数,方便你确认程序是不是按你想的在走

console.log 是什么?

  • console 可以理解为“调试用的小黑板”;
  • .log 是“在小黑板上写一行字”;
  • 浏览器按 F12 打开开发者工具里的 Console 面板,就能看到这些输出。

2. 调试、断点、单步执行、快照

调试(Debug / 调试程序)
当程序出问题时,不是上来就乱改,而是:

  • 让程序在某一行停一下(断点);
  • 看一看当前每个变量的值;
  • 一步一步往下走,观察“从哪里开始不对劲”。

断点(Breakpoint)
可以把断点想成“在这行插了一个暂停按钮”:

  • 程序平时是一路往下跑;
  • 跑到你插断点的那一行,会暂时停住,等你检查。

单步执行(Step)
从断点停下来之后,你可以选择:

  • 一行一行往下执行(step over);
  • 进入某个函数内部详细看(step into)。
    就像看一段舞蹈分解动作一样,而不是直接看快放视频。

快照(Snapshot)——简化理解
这里的“快照”可以理解为:

在某个时间点,把“当前状态”拍一张照片,方便以后对比。
在实际工具里,“快照”可能指:

  • 一次提交时刻项目的完整状态;
  • 调试时某个时间点内存 / 变量的整体情况。
    你先记住这个比喻就够用:快照 ≈ 某一刻状态的留影

六、和“项目管理”有关的词

1. 项目、工作区、文件夹

项目(Project)
为实现一个应用而放在同一个文件夹里的:

  • 源代码文件
  • 配置文件
  • 素材(图片、音频等)

工作区(Workspace)
VS Code / Trae 用来描述“当前这一次打开了一组什么东西”的概念:

  • 打开一个文件夹 → 一个简单工作区;
  • 有时也会把多个文件夹合并成一个多项目工作区。

2. Git、仓库、提交(Commit)

Git(版本控制工具)
可以理解成项目的“时光机”:

  • 每次改完一批内容,可以“拍一张版本合照”;
  • 以后需要时,可以回到某个历史状态。

仓库(Repository / Repo)
开启 Git 之后,那个带“版本记录”的项目文件夹,就叫“仓库”。

提交(Commit)
每次你觉得“这波改动算一个阶段性成果”,就可以:

  • 写一条说明(比如:Add score panel);
  • 把当前全部修改打包成一个版本;
  • Git 会把这一刻的状态存下来。
    这一次动作就叫“做了一次 commit”。

七、和“AI 开发工具”有关的词

1. AI IDE、Agent、SOLO 模式

AI IDE
在普通 IDE 的基础上,多了一层“能听懂人话、能自己动手”的 AI:

  • 你说“做个贪吃蛇”,它能帮你搭项目、写代码;
  • 你把报错截图给它,它能先解释再尝试修复;
  • 它能跨多个文件一起改,而不仅仅是一行一行补全。

Agent(智能体)
可以把 Agent 想象成一个长期待命的 AI 小工程师

  • 会读你的项目结构;
  • 会拆解任务(先装依赖、再生成代码、再跑项目);
  • 跑出错之后,会根据错误信息自己调整方案。

SOLO 模式(以 Trae 为例)
表示:

你只需要把“终点”说清楚,
它自己规划“路线”,
在本地一步步执行,
中途才在关键节点问你要不要继续。

2. 模型、密钥(API Key)

模型(Model,这里特指大语言模型)
这个词可以简单理解为“背后那一大坨 AI 大脑”:

  • 比如 GPT、Claude、Kimi、GLM 等;
  • 不同模型在“理解中文”“写代码”“推理”上水平不一样;
  • AI IDE 里通常可以在下拉菜单里换不同模型使用。

密钥 / API Key
你可以把 API Key 理解为一个很长的“高级密码 + 身份证号”
它的作用只有一个:

告诉别人的服务器:“我是哪个用户,请允许我使用你们的 AI 服务,并帮我记账。”

几个要点:

  • 这串东西通常是一长串随机字母数字;
  • 不能发到公开的地方(仓库、截图、群聊),别人拿到就可以冒用你的账号;
  • 在工具里填 API Key,就等于“把钥匙插进锁里”,之后工具就能帮你调用对应的 AI 服务。

八、和“浏览器 / 开发者工具”有关的词

Chrome(谷歌浏览器)
现在前端开发最常用的浏览器之一:

  • 打开网页快;
  • 自带比较强的“开发者工具”,方便查问题。

刷新(Refresh / Reload)
重新加载当前网页:

  • 修改前端代码后,如果没有自动刷新工具,手动按刷新才能看到效果。

开发者工具(DevTools)
浏览器里专门给开发者用的一组工具面板:

  • 查看网页结构(Elements);
  • 查看样式(Styles);
  • 查错误和日志(Console);
  • 查网络请求(Network)。
    在 Chrome 里通常按 F12Ctrl+Shift+I 打开。

Console(控制台)
开发者工具里的一个标签页,专门展示:

  • 你写的 console.log(...) 输出;
  • 运行过程中发生的错误(红字)。
    你可以当它是“程序的聊天框”:
  • 程序有话要说,就写在这里;
  • 你调试时最常看的就是这一块。

如果后面你在学习过程中又遇到新的词,也可以按这个风格让 AI 协助你补充全部内容:

  • 先写一句“它是干嘛的”;
  • 再写一句“可以把它想象成什么”;
  • 最后给一个特别简单的小例子。
    这样你的“个人术语表”会越长越实用,逐渐能够更好的与计算机进行沟通。