提示词工程:让大型语言模型输出你真正想要的结果

大型语言模型(LLM)的能力极大地依赖于输入提示词(Prompt)的质量。同样的模型,精心设计的提示词可以产生精准有用的输出,而模糊的提示则可能产生冗长、偏题或错误的结果。提示词工程(Prompt Engineering)是系统性地设计和优化与 LLM 交互的输入,以获得最佳输出的技术和方法集合。

## 基础提示技术

**零样本(Zero-shot)**:直接描述任务,不提供示例。适合 LLM 已充分训练的常见任务。

**少样本(Few-shot)**:在提示中提供 2-5 个输入-输出示例,引导模型理解期望的输出格式和风格。对于格式特殊或风格要求明确的任务效果显著。

**角色扮演(Role Prompting)**:设定 AI 扮演特定角色(”你是一位资深律师”/”你是一名量子物理学教授”),利用角色知识和表达风格改善输出质量。

**系统提示(System Prompt)**:在对话开始前设定 AI 的行为规则、知识边界和输出格式要求,是构建 AI 应用时的核心配置。

## 思维链与推理提示

**思维链(Chain-of-Thought,CoT)**:在提示中要求或展示逐步推理过程,显著提升复杂推理任务(数学、逻辑、多步骤决策)的准确率。经典提示:”让我们一步一步地思考这个问题。”

**自我一致性(Self-Consistency)**:生成多个推理路径,选择最高频的答案,减少单次推理错误的影响。适合数学和逻辑推理任务。

**Tree of Thoughts(ToT)**:让模型同时探索多个解题路径,评估各路径的可行性,选择最优路径继续。对高度复杂的问题效果显著,但计算成本较高。

**ReAct(Reasoning + Acting)**:交替进行推理(”我需要搜索 X 来回答这个问题”)和行动(实际调用搜索工具),是 Agent 场景中的核心提示模式。

## 结构化输出提示

要求 LLM 输出特定格式(JSON、表格、特定结构的文档)时,提示设计至关重要:

– 在提示中明确指定期望的 JSON 结构或示例
– 要求 AI 在输出之前先解释其理解(减少格式错误)
– 使用 XML 标签分隔不同部分(Anthropic 的 Claude 特别适合这种方式)
– 结合工具调用(Tool Use)强制结构化输出(更可靠)

## 提示词优化策略

**具体化**:模糊的描述(”写一篇文章”)不如具体的描述(”写一篇 800 字的中文文章,针对有 3 年 Python 经验的开发者,解释量子计算的基本概念,包含代码示例”)。

**约束条件**:明确说明不想要什么(”不要使用营销语言”/”避免过于技术性的术语”)与说明想要什么同样重要。

**分步骤任务拆解**:复杂任务拆分为多个子任务,分别提示,然后整合结果,比一次性提示效果更好。

**提供上下文**:相关背景信息可以显著提升输出质量,特别是领域特定知识。

## 高级技巧:提示词元优化

一些研究者使用 LLM 来优化提示词本身(”Prompt Optimization”):给 LLM 看当前提示词和输出质量,要求它建议改进。DSPy(Stanford)是将这一思路系统化的框架,通过程序化方式优化 LLM 工作流的每个提示词。参见 [DSPy 框架](https://github.com/stanfordnlp/dspy)。

Anthropic 的提示词工程指南是目前最全面的官方资源之一,参见[Anthropic 提示词工程文档](https://docs.anthropic.com/claude/docs/prompt-engineering)。更多实际案例参见[AI工具实战技巧](https://sunqi.org/ai-tools-practical-tips-zh/)。

上一篇 发育神经科学:儿童大脑发育的关键期、语言习得与双语对大脑的影响
下一篇 医疗器械法规事务(RA):医学背景进入器械行业的核心入口