提示词工程：让大型语言模型输出你真正想要的结果

2025年12月7日 AI工具与工作流 sunqi.org

大型语言模型（LLM）的能力极大地依赖于输入提示词（Prompt）的质量。同样的模型，精心设计的提示词可以产生精准有用的输出，而模糊的提示则可能产生冗长、偏题或错误的结果。提示词工程（Prompt Engineering）是系统性地设计和优化与 LLM 交互的输入，以获得最佳输出的技术和方法集合。

## 基础提示技术

**零样本（Zero-shot）**：直接描述任务，不提供示例。适合 LLM 已充分训练的常见任务。

**少样本（Few-shot）**：在提示中提供 2-5 个输入-输出示例，引导模型理解期望的输出格式和风格。对于格式特殊或风格要求明确的任务效果显著。

**角色扮演（Role Prompting）**：设定 AI 扮演特定角色（”你是一位资深律师”/”你是一名量子物理学教授”），利用角色知识和表达风格改善输出质量。

**系统提示（System Prompt）**：在对话开始前设定 AI 的行为规则、知识边界和输出格式要求，是构建 AI 应用时的核心配置。

## 思维链与推理提示

**思维链（Chain-of-Thought，CoT）**：在提示中要求或展示逐步推理过程，显著提升复杂推理任务（数学、逻辑、多步骤决策）的准确率。经典提示：”让我们一步一步地思考这个问题。”

**自我一致性（Self-Consistency）**：生成多个推理路径，选择最高频的答案，减少单次推理错误的影响。适合数学和逻辑推理任务。

**Tree of Thoughts（ToT）**：让模型同时探索多个解题路径，评估各路径的可行性，选择最优路径继续。对高度复杂的问题效果显著，但计算成本较高。

**ReAct（Reasoning + Acting）**：交替进行推理（”我需要搜索 X 来回答这个问题”）和行动（实际调用搜索工具），是 Agent 场景中的核心提示模式。

## 结构化输出提示

要求 LLM 输出特定格式（JSON、表格、特定结构的文档）时，提示设计至关重要：

– 在提示中明确指定期望的 JSON 结构或示例
– 要求 AI 在输出之前先解释其理解（减少格式错误）
– 使用 XML 标签分隔不同部分（Anthropic 的 Claude 特别适合这种方式）
– 结合工具调用（Tool Use）强制结构化输出（更可靠）

## 提示词优化策略

**具体化**：模糊的描述（”写一篇文章”）不如具体的描述（”写一篇 800 字的中文文章，针对有 3 年 Python 经验的开发者，解释量子计算的基本概念，包含代码示例”）。

**约束条件**：明确说明不想要什么（”不要使用营销语言”/”避免过于技术性的术语”）与说明想要什么同样重要。

**分步骤任务拆解**：复杂任务拆分为多个子任务，分别提示，然后整合结果，比一次性提示效果更好。

**提供上下文**：相关背景信息可以显著提升输出质量，特别是领域特定知识。

## 高级技巧：提示词元优化

一些研究者使用 LLM 来优化提示词本身（”Prompt Optimization”）：给 LLM 看当前提示词和输出质量，要求它建议改进。DSPy（Stanford）是将这一思路系统化的框架，通过程序化方式优化 LLM 工作流的每个提示词。参见 [DSPy 框架](https://github.com/stanfordnlp/dspy)。

Anthropic 的提示词工程指南是目前最全面的官方资源之一，参见[Anthropic 提示词工程文档](https://docs.anthropic.com/claude/docs/prompt-engineering)。更多实际案例参见[AI工具实战技巧](https://sunqi.org/ai-tools-practical-tips-zh/)。

—

作者：sunqi.org

链接：https://www.sunqi.org/llm-prompt-engineering-zh.html

文章版权归作者所有，未经允许请勿转载。

提示词工程：让大型语言模型输出你真正想要的结果

探索站点内容