提示词工程技巧入门教程

编辑部发布 2026-06-25 更新 2026-06-27 13 分钟阅读 2,597 字

本文围绕提示词工程的核心理念，整理操作要点、适用场景和常见问题，帮助你在开始前判断是否适合继续，再按步骤完成配置。提示词工程并非玄学，而是一套可系统掌握与验证的沟通方法。

提示词工程：入门指南

提示词工程（Prompt Engineering）是设计、优化和验证输入指令的系统性方法，旨在使大语言模型稳定输出符合预期的结果。本教程将直接揭示：构建优质提示词所需的步骤、最稳健的结构模板，以及新手常犯的错误。内容以 Claude 为参考环境，但核心技巧广泛适用于大多数对话式大语言模型。

开始之前：确认两个关键前提

下笔之前，请确保以下两项准备工作已完成。

1. 确认模型版本

不同模型版本对指令的敏感度差异显著。例如，Claude 3.5 Sonnet 在角色扮演和分步指令上的表现优于早期版本；而使用较旧模型时，同一提示词可能产生截然不同的结果。建议查阅官方产品文档或发行说明，确认当前模型支持的提示词特性，避免因版本不兼容导致输出偏差。

2. 明确输出格式

许多新手陷入循环：多次调整提示词，却仍得不到预期格式。预先明确你需要的是表格、列表、JSON 还是自然段落，将直接决定提示词的整体结构。格式问题往往是最初的瓶颈，解决后其他问题会更容易处理。

核心步骤：结构化你的提示词

提示词工程的核心原则是“明确、结构化、设定边界”。以下步骤按基础到进阶顺序排列，帮助你逐步提升提示词质量。

第一步：清晰定义任务目标与约束

用一句话向模型说明任务内容与限制条件。关键在于：目标、受众、字数、风格、格式均已明确。

不佳示例：

帮我写一个关于气候变化的文章大纲。

改进示例：

写一篇面向高中生的科普文章大纲，主题是全球变暖对沿海城市的影响。要求：文章不超过 1500 字，使用比喻和类比解释科学概念，避免不解释专业术语。输出格式为编号列表。

改进的关键在于：任务目标（科普文章大纲）、受众（高中生）、字数限制、风格要求、输出格式均已明确。

第二步：使用结构化提示词模板

对于复杂任务，将提示词划分为清晰模块。已验证的通用模板如下：

# 角色
你是 [具体角色描述]

# 任务
你需要完成的具体工作

# 要求
- 具体约束1
- 具体约束2

# 输出格式
[期望的格式，例如：Markdown 表格、JSON 数组、编号列表]

# 示例（可选）
如果输入是 [示例输入]，期望输出是 [示例输出]

完整工作示例：

假设你要分析客服对话质量。

# 角色
你是一名具备 10 年呼叫中心经验的客服质量分析师。

# 任务
分析以下客服对话，输出三个关键指标：客服回应时效、问题解决率、情绪管理评分。

# 要求
- 每个指标给出 1-10 的评分和一句简短理由
- 仅对客服方的行为进行评分，不评价客户方
- 若存在无法判断的指标（如无法确定问题是否解决），标注为“N/A”

# 输出格式
JSON 对象，包含字段：response_time, resolution_rate, emotion_score

# 对话内容（实际输入）
[粘贴对话内容]

此模板确保模型始终遵循统一规则，而非依赖推测。

第三步：定义明确的输出边界

大语言模型的常见问题是过度生成或杜撰不存在的信息。通过以下方式控制：

否定清单：明确告知模型禁止行为。例如：“不要使用第一人称”、“不要添加原文未包含的信息”、“不要提前给出结论”。
引用要求：若需基于给定材料回答，要求模型引用原文。例如：“每个观点必须引用对话原文中的具体语句，并在括号内标注时间戳”。
不确定性处理：让模型在不确定时主动声明，而非强行作答。例如：“若无法从给定材料中找到答案，直接输出‘无法根据提供的信息回答’”。

第四步：迭代优化，而非一蹴而就

新手的常见误区是期望首次提示词即完美无瑕。实际上，提示词工程是迭代改进的过程：

第一轮：写出基础版本，检查输出是否符合预期格式。
第二轮：评估内容质量。过长？增加字数限制。过于泛泛？加入具体要求或示例。
第三轮：测试边界情况。模型在模糊输入下是否稳定？是否输出了明确禁止的内容？

每次仅调整一个变量（如角色描述或输出格式），以便准确评估哪条指令有效。

检查清单：发布前的最后核验

发布或交付提示词前，逐一核对以下项目：

任务目标是否用一句话清晰表述？
输出格式是否指定（表格、JSON、列表等）？
是否包含至少一条否定指令？
若提供示例，示例格式是否与目标一致？
角色描述是否与任务匹配？例如，让“客服分析员”写代码可能产生混乱。
是否处理了不确定性？模型在未知答案时该如何回应？
是否一次仅调整一个变量进行测试？多变量同时更改难以定位问题。

不同提示词结构的适用场景

结构类型	适用场景	典型效果
简短指令	单次简单查询，如翻译、缩写扩展	速度最快，但输出不可控，易跑偏
角色+任务模板	需特定风格或专业知识输出	一致性中等，适合日常文案
分块指令（如本文模板）	复杂任务、多步骤流程	一致性高，便于调试与复用
带示例的 Few-shot	需严格模仿格式或风格	格式控制最强，但消耗更多上下文
链式提示（Chain-of-Thought）	逻辑推理、数学计算、多步判断	显著改善复杂任务准确率，但输出较长

边界说明：Few-shot 示例虽效果稳定，但若示例与最终输入差异过大（如示例为英文对话，而实际输入为中文），模型可能混淆两种语言结构。因此，示例必须与预期输入高度一致。

故障排查：常见问题与解决策略

提示词失效时，按以下顺序排查。

问题1：输出格式不正确

检查：指令中是否明确指定格式，如“输出为 JSON 格式”或“使用 Markdown 表格”？
操作：重写格式要求，删除模糊描述。必要时加入简短示例。

问题2：输出过长或过短

检查：是否设定了明确的字数范围？例如，“不超过 200 字”比“大约 200 字”更严格。
操作：将“大约”替换为“不超过”或“在 150-200 字之间”。

问题3：模型添加了原文未包含的信息

检查：提示词中是否含有鼓励创造性的描述，如“发挥你的创造力”、“补充相关细节”？
操作：增加引用要求，并加入否定指令：“仅基于给定材料回答，不要添加外部知识”。

问题4：模型拒绝执行某指令

检查：指令是否违反模型的安全边界，如要求模拟危险行为？
操作：确认指令在官方文档允许范围内。查阅发行说明，了解已知指令限制。

回滚步骤：当某次修改导致输出质量显著下降时，立即返回上一个可用版本。保持提示词版本日志（通过注释或文件副本），记录每次修改的目的与效果。

常见问题解析

问：什么是提示词工程？

答：提示词工程是系统性设计、优化和验证输入指令的方法，旨在使大语言模型稳定输出符合预期的结果。它非玄学，而是基于反馈迭代的结构化写作过程。本教程涵盖角色设定、结构模板、边界控制和迭代测试等技巧，适用于从日常问答到复杂业务场景的各类任务。

问：如何操作？

答：核心流程可简化为六步：

确定模型版本及其能力边界（查阅官方文档）。
用一句话明确任务目标。
选择与任务复杂度匹配的结构模板（角色+任务+输出格式）。
加入至少一条否定指令和不确定性处理。
输出第一轮结果，仅评估格式是否符合预期。
迭代修改——每次仅改一个变量，直至内容质量达标。

问：常见错误有哪些？

答：

跳过前提检查：直接复制网络模板，未确认模型版本是否支持模板特性（如旧模型不支持角色定义）。
一次改太多变量：同时修改角色描述、输出格式和示例，导致无法判断哪项改动真正有效。
缺少否定指令：未设定边界，导致模型输出大量无关或不必要内容。
顺序错误：先让模型执行一项任务，中途突然改变指令，引发混乱。提示词逻辑应保持线性、无矛盾。
忽视版本差异：Claude 3 与之前版本对指令敏感度差异明显。如用 2.x 版本模型套用 3.5 的提示词模板，结果可能大相径庭。

若以上排查无效，建议回归最基础格式：仅用一行明确的、无角色的指令，