这个系列写到现在,我聊了Fine-tuning、Function Calling、MCP、AI Agent,基本上把AI的「底层技术栈」给过了一遍。
但我一直觉得少了一块。
这几篇文章讲的都是「AI系统怎么搭建」的问题,是工程师和技术团队关心的事情。但对于大多数人来说,你不需要自己去搭RAG系统,不需要自己去做Fine-tuning,不需要自己去部署MCP Server。你跟AI打交道的方式,就是打开一个对话框,打字。
而这个「打字」的质量,很大程度上决定了你能从AI那里拿到什么。
今天聊Prompt Engineering。
我知道,一说这个词很多人就要翻白眼了。「提示词工程」这个概念从2023年ChatGPT火了之后就被炒烂了,各种课程、各种教程、各种「万能提示词模板」满天飞。搞得好像学会几个固定句式就能让AI给你打工了。
坦率的讲,那些东西99%是垃圾。
但Prompt Engineering本身,作为一种跟AI有效沟通的能力,我觉得是真的重要。而且它在2025到2026年已经进化成了一个跟两年前很不一样的东西。
让我先把一个核心认知讲清楚。
你跟AI说的每一句话,都是在编程。
这句话听着有点夸张,但你仔细想想。传统编程是什么?是用代码告诉计算机该做什么。Prompt是什么?是用自然语言告诉AI该做什么。形式不同,但本质一样,你在给一个强大的系统下达指令。
区别在于,代码是精确的、确定性的,你写什么它就执行什么。自然语言是模糊的、多义的,同一句话在不同语境下可能有完全不同的意思。所以用自然语言「编程」的难度,某种程度上比用代码编程更高。因为你不仅要说清楚你想要什么,还要确保AI不会误解你的意思。
这就是为什么同一个模型,不同人用出来的效果天差地别。不是模型一会聪明一会笨,是你给的指令有时清楚有时模糊。
我跟你说一个我自己的经历。
有一段时间我让AI帮我写文章摘要,我就说「帮我总结一下这篇文章」。结果每次出来的东西长短不一、角度不同、有时候还掺杂AI自己的评价。我很烦,觉得这AI不靠谱。
后来我把prompt改成了「用3-5个要点总结这篇文章的核心论点,每个要点不超过30个字,只陈述事实不加评价」。出来的东西立刻稳定了,每次都是我想要的格式和风格。
模型没变,变的是我跟它说话的方式。

这个事情看起来很简单,但背后其实有一个更深的道理。大语言模型的工作方式是「根据上文预测下文」。你给它的上文越精确、越具体、越有结构,它预测出来的下文就越符合你的期望。你给它一句模糊的话,它就有无数种方向可以预测,你觉得不满意是必然的。
好了,具体到操作层面,2026年写好prompt有几个我觉得真正管用的原则。
第一个,明确你要什么格式。 这个听着简单但太多人忽略了。你想要列表就说要列表,想要表格就说要表格,想要JSON就说要JSON。你想要多少字、分几段、用什么语气,全部提前说好。AI非常擅长遵循格式要求,但你不说,它就自己发挥了。
第二个,给身份。 告诉AI它是谁。「你是一个有10年经验的产品经理」「你是一个严谨的学术论文审稿人」「你是一个毒舌但专业的代码审查者」。这不是玄学,这是在帮模型锁定一个输出分布。当你说「你是审稿人」的时候,模型生成内容的倾向就会向「严谨、挑剔、注重证据」的方向偏移。
第三个,给例子。 这在业内叫Few-shot prompting。你想让AI写一种特定风格的东西,最有效的方式不是用一大段话描述那个风格,而是直接给它两三个例子。「像这样写」比「用简洁、有力、口语化、偶尔带点幽默的方式写」有效十倍。模型看到例子之后能瞬间理解你要的模式,比看一堆形容词强太多了。
第四个,让它想一步再答。 这就是著名的Chain-of-Thought。你遇到一个需要推理的问题,不要让AI直接给答案,让它先把思考过程写出来。「请一步一步分析这个问题,然后给出你的结论」。这个简单的指令能让模型的准确率提升10%到30%,在数学、逻辑、复杂分析这些任务上效果尤其明显。
为什么有效?因为大语言模型是一个token一个token往外吐的。如果你让它直接给答案,它第一个token就要做出最终判断,相当于还没想就开始说。但如果你让它先把分析写出来,它在写分析的过程中,后面的token可以基于前面已经写出来的分析来推进。其实就是给它一个「草稿纸」。
第五个,也是我觉得2026年最重要的一个,说清楚约束和边界。 告诉AI什么不该做,跟告诉它什么该做一样重要。「不要编造事实」「如果你不确定就说你不确定」「不要超出我提供的材料范围」「回答中不要包含免责声明」。很多人只说了想要什么,没说不想要什么,然后AI输出里夹了一堆你不要的东西,你还得手动删。
这五个原则说到底,其实就一件事,降低模型输出的随机性。

模型本身是一个概率机器,它有无数种可能的输出。你的每一条指令,都是在收窄那个可能性空间。你给的约束越多、越具体,输出就越确定、越可控。你啥也不说让它自由发挥,那结果就是开盲盒。
说到这里,我想聊一个2025年开始在业内非常火的概念。
Context Engineering,上下文工程。
2025年年中,Andrej Karpathy在推特上发了一段话,大意是说,「Prompt Engineering」这个词已经不够用了。大家一听这个词,想到的就是「怎么措辞一个问题」,太窄了。真正决定AI系统表现的,是整个上下文窗口里装了什么。
他的原话是,「context engineering是精妙的艺术和科学,在于把恰好正确的信息填入上下文窗口,为下一步做好准备」。
Shopify的CEO Tobi Lütke也站出来说,这是「一项核心技能」,是「提供所有让任务可被LLM合理完成的上下文的艺术」。
这两个人一前一后把「Context Engineering」这个概念推到了台面上。
那Context Engineering跟Prompt Engineering有什么区别?
我自己的理解是这样的。Prompt Engineering关注的是「你怎么措辞你的问题」,是用户这一句话本身。Context Engineering关注的是「在你问问题之前,AI的上下文窗口里已经装了什么」。
你想想看,一个生产级的AI应用,用户输入只是整个上下文里很小的一部分。剩下的是什么?是系统提示词(告诉AI它是谁、该怎么表现)、是RAG检索回来的相关文档、是之前几轮对话的历史、是可用工具的描述、是各种约束和规则。
Karpathy用了一个很好的类比。他说LLM就像一个CPU,上下文窗口就像RAM。你的工作就是当这个操作系统,把正确的代码和数据加载到内存里,让CPU能正确执行。 你不会把硬盘里所有文件都塞进内存吧?那电脑就死机了。你也不会什么都不加载吧?那CPU就没活干了。关键在于,在恰当的时机,加载恰当的信息。

这个视角的转变对我自己的触动还挺大的。
以前我想的是「怎么把这句prompt写得更好」。现在我想的是「在AI回答之前,它需要看到哪些信息,这些信息应该以什么顺序、什么结构呈现」。
这两个问题的复杂度完全不是一个量级的。
第一个问题是措辞问题,是遣词造句。第二个问题是信息架构问题,是设计一个系统。
我举一个具体的例子。你让AI帮你写一份产品需求文档。
低级玩法是,「帮我写一份需求文档」。AI会给你一个泛泛的模板,跟你的业务八竿子打不着。
中级玩法是,「你是一个资深产品经理,帮我写一份关于XX功能的需求文档,要包含背景、目标用户、核心功能点、验收标准」。好了一些,但内容还是AI自己编的。
高级玩法是什么?你先把相关的用户调研数据、竞品分析、技术约束、之前的产品规划文档全部整理好,喂给AI。然后给它明确的角色、格式要求、输出约束。这时候AI输出的东西就不是凭空编的了,是基于你给的真实材料组织的。
从「帮我写」到「基于这些材料帮我写」,这个差距就是Prompt Engineering和Context Engineering的差距。前者是问一个好问题,后者是准备一整个好的工作环境。
但说真的,对于大多数人来说,你不需要焦虑什么Context Engineering。那更多是给构建AI产品的工程师看的。对于日常使用AI的人来说,把前面那五个原则做好,你就已经超过90%的用户了。
因为我看到的现实是,绝大多数人跟AI交互的方式还是2023年那一套,丢一句话过去就等着AI给答案。稍微不满意就说「AI还是不行啊」。很少有人会去想,是不是我的问题本身就不够好?是不是我应该给更多信息?是不是我应该换一种方式表达我的需求?
AI的能力上限是由模型决定的,但你能用到多少是由你的prompt决定的。

最后把Prompt Engineering放到整个系列的大图里看一看。
前面几篇我分别聊了Fine-tuning(让AI有专业能力)、Function Calling(让AI能动手)、MCP(让AI能连接万物)、Agent(把这些串成自主系统)。这些都是技术栈的事情,是「AI能做什么」的问题。
Prompt Engineering / Context Engineering解决的是「你怎么让AI做到」的问题。
再厉害的Agent,如果你给它的目标描述不清楚、约束不明确,它也会跑偏。再强大的模型,如果你的上下文里塞了一堆无关信息,它也会迷失。
技术栈决定了AI的能力天花板。而你跟它沟通的方式,决定了你能把它发挥到什么程度。
我自己觉得,这可能是未来几年每个人都需要学的一项基础能力。不是因为它多难,恰恰因为它不难,门槛很低,但回报很高。你花十分钟想清楚怎么跟AI表达你的需求,可能比你花两小时跟它来回拉扯强十倍。
大时代啊,朋友们。工具已经摆在桌上了,就看你怎么用。
永远对世界保持好奇。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~
谢谢你看我的文章,我们,下次再见。
延伸阅读
- AI Agent,当AI学会自己搞定一整件事:AI Agent是Fine-tuning、Function Calling、MCP三大技术的集大成者。这篇文章从聊天机器人和Agent的本质区别讲起,拆解Agentic Loop的工作机制,坦诚讨论复合错误率的现实挑战,最终回答一个问题:当AI学会独立完成任务,什么能力变得更重要了?
- MCP,给AI一个通用的万能接口:MCP(Model Context Protocol)是AI世界的USB-C,解决了模型和工具之间N×M碎片化问题。这篇文章从USB-C类比讲起,带你理解这个正在重塑AI生态的开放协议。
- Function Calling,让AI学会动手干活的技术:AI什么都知道却什么都做不了?Function Calling让大模型从只会说话变成能动手干活。这篇文章用大白话聊透这个让AI Agent成为可能的核心技术。
- Fine-tuning,让AI学会「成为某个人」的技术:微调到底是什么?跟RAG和prompt有什么区别?LoRA和QLoRA又是什么?这篇文章用大白话聊透Fine-tuning,从概念到成本到实际应用场景。

评论区
欢迎留下你的看法,支持匿名评论。
你的评论会公开展示,建议填写便于交流的昵称,并尽量提供有信息量的反馈。