AI 工程与自动化参考库
讲 Prompt、RAG、Agent、工作流、向量数据库这些 AI 世界的高频词。
本参考库定位
帮助普通人看懂 AI 产品和 AI 工程。
核心词(节选)
全部词条
29 个词条,读得完
点进任一词条查看通俗解释、类比、使用场景与对 AI 的提问模板。
工作流
把一串步骤固定下来自动跑。每天 8 点抓新闻 → 让 AI 总结 → 发到微信群 —— 就是一个工作流。
Prompt
你丢给 AI 的那段话。同样一个 AI,不同人写的 prompt 差 10 倍效果。
系统提示词
放在对话最前面、用户看不到的那段“设定”。定 AI 的角色、语气、能做什么不能做什么。
上下文
AI 这一刻“看得到”的全部信息:系统提示 + 你当前问的 + 之前聊过的 + 你塞给它的资料。
Token
AI 给文字打的“小票”。费用按 token 算、能装多少也按 token 算。中文 1 个字 ≈ 1-2 token。
上下文窗口
模型一次能“看”的最大 token 数。GPT-4o 是 128K,Claude 是 200K,Gemini 可达 2M。
Embedding
把文字/图片变成一串数字(向量)。相似意思的两段文字,它们的数字也挨得近。
向量数据库
专门存 embedding 向量、按语义相似度找东西的数据库。做 RAG 必备。
检索增强生成
AI 回答前“先查书再答”。给 AI 搜一下你的资料、把相关段落塞进去、它才不会瞎编。
Agent
会自己拆目标、调工具、一步步把事做完的 AI。不只是聊天 —— 是真去做事。
工具调用
AI 除了说话,还能“按按钮”:查数据库、发邮件、下单、搜网页,都是工具调用。
微调
在现成模型上用自己的数据再训练一下。让 AI 学会你的风格、术语、专属答题方式。
推理
模型“真正干活”的那一刻:接输入、吐输出。训练是学习,推理是考试。
幻觉
AI 一本正经地编假话。编不存在的函数名、编假论文、编假法条,还讲得头头是道。
流式输出
AI 一个字一个字地吐出来。ChatGPT 那种打字机效果 = 流式。体验好 10 倍。
多模态
AI 同时能处理文字、图片、音频、视频。GPT-4o / Gemini / Claude 现在都是多模态的。
AI 记忆
AI 跨多次对话还能“记得”你。ChatGPT 的记忆、Cursor 记得项目架构,都是这个。
Prompt 注入
用户偷偷塞一段话让 AI “忽略原来指令听我的”。AI 版的 SQL 注入。
Few-shot
给 AI 看 2-5 个范例再让它做事。效果比光讲规则好 10 倍。
思维链
让 AI 先写“推理过程”再给答案。一句“让我们一步步想”能让复杂题准确率翻倍。
编程代理
能读取项目、修改文件、运行命令并根据结果继续工作的 AI 开发助手。
项目上下文
AI 需要知道的项目背景,包括技术栈、目录结构、当前目标、已有规则和限制。
代码上下文
和当前问题直接相关的代码片段、文件路径、调用关系和报错位置。
上下文文件
专门写给 AI 看的项目说明文件,记录目标、规则、命令、架构和注意事项。
任务拆分提示词
让 AI 把一个大需求拆成小任务的提示词,避免一口气生成混乱的大改动。
验收提示词
让 AI 根据需求检查功能是否完成的提示词,重点是结果是否符合用户目标。
调试提示词
把报错、复现步骤、环境和最近改动一起交给 AI,让它按证据排查问题。
代码审查提示词
让 AI 站在审查者角度检查代码风险,而不是继续盲目添加功能。
Cursor
带 AI 能力的代码编辑器,可以围绕项目文件提问、生成代码和修改代码。