提示工程——编写更好的输入以从AI模型获得更好输出的实践——自GPT-3时代以来已经显著演变。以下是在2026年使用当前模型实际上有效的内容。
自2022年以来发生了什么变化
在2022到2023年,提示工程涉及许多绕过模型限制的技巧:多次重复指令,因为模型”忘记”了早期部分;使用特定的魔法短语(”让我们一步一步思考”);精心的角色扮演设置,因为它们显著改变了模型行为;避免触发拒绝的特定表述;以及使用越狱提示。在2026年,使用Claude 3.5+、GPT-4o和Gemini Pro,这些技巧中的许多已经过时。现代模型在以下方面更好:遵循长、复杂的指令;在长对话中维持上下文;处理模糊指令;以及生成一致结构化的输出。仍然有效的技巧:思维链提示、结构化输出格式化和少量示例仍然真正有效。大多数已经停止有效的技巧:精心的角色扮演设置、”魔法”短语,以及不再以相同形式存在的限制的变通方案。
现在实际上有效的是什么
对输出格式具体说明:不要说”写一个摘要”,而是指定”写一个3段摘要,每段不超过75个词;关键要点部分使用项目符号”。现代模型可靠地遵循精确的格式指令。提供示例(少量示例提示):如果你想要特定的输出风格,给模型展示两三个示例。少量示例提示仍然是最可靠的技术之一。示例结构:”这里有三个我想要的格式示例:[示例]。现在为以下内容生成相同格式:[你的输入]”。复杂推理的思维链:对于需要多步推理的问题,要求模型”在给出最终答案之前一步一步地思考这个问题”。这对于数学和逻辑问题仍然有效。对于Claude特别:明确的权限声明减少了不必要的拒绝。如果你在做安全研究,说出来。如果你在写涉及困难主题的小说,解释背景。上下文对Claude比对某些其他模型更重要。角色规定:”你是一名高级Python开发者,正在审查用于生产部署的代码。专注于安全漏洞和性能问题。”角色规定通过激活相关知识领域来工作,而不是从根本上改变模型的能力。
提示工程的限制
提示工程无法修复的内容:基本的模型限制(如果模型不知道某事,更好的提示不会凭空创造知识);幻觉(提示可以减少它们但不能消除它们——对于事实声明需要用来源进行验证);以及高风险应用程序的一致输出质量(其中微调或RAG是适当的解决方案)。随着以下情况,提示工程的投资回报率降低:模型改进(需要更少的技巧来获得好的输出);你的任务变得更复杂(工程变成了架构);以及你的规模增加(为每个查询手工制作的提示不能扩展——RAG和微调等系统方法变得必要)。2026年的诚实立场:提示工程是一项具有真正价值的技能,但它不是理解底层技术能做什么和不能做什么的替代品。2026年最好的提示工程师对模型能力的理解足以知道提示是正确的工具的时候,以及不是的时候。




