系统提示词设计入门教程

编辑部发布 2026-06-25 更新 2026-06-27 14 分钟阅读 2,628 字

系统提示词（System Prompt）是你与大模型对话前，预先设定的一套行为规则、身份约束和输出格式说明。本教程将引导你从零开始设计可用的系统提示词：先明确需求类型，再用五步框架撰写初稿，最后通过检查清单与调试技巧验证效果。新手最常犯的三个错误——在未确定任务边界前直接写提示词、直接复制他人内容而不适配当前版本、以及从不验证输出是否符合预期。读完本文，你不仅能写出第一条系统提示词，还能掌握判断其正确性的方法。

开始之前

你需要准备什么

一个支持设置 System Prompt 的 AI 平台（例如 OpenAI Playground、Claude Console 或任何支持 API 调用的 LLM 界面）
一份清晰的用例描述——明确 AI 扮演的角色、完成的任务、输出的格式
一定数量的测试时间：最差情况下，设计阶段至少需要 5–8 轮迭代测试，无法一蹴而就

系统提示词的边界

许多人误以为系统提示词万能。实际上，它无法改变模型的知识截止日期，也无法克服模型的偏见或幻觉。若你的用例要求模型回答 2026 年的具体事件，系统提示词即使写明“你只基于 2026 年数据回答”也无效——模型根本不具备该知识。系统提示词的作用域是行为控制，而非知识注入。

核心操作步骤

第一步：定义任务边界与角色

开始前，请先回答三个问题，并写下来：

这个 AI 对谁说话？（新手用户？中级分析师？内部研发人员？）
它永远不能做什么？（拒绝回答非技术问题？不提供医疗建议？）
输出必须包含什么结构？（必须有表格？必须用 Markdown？必须有总结性段落？）

示例： 假设你正在开发一个客户支持初筛机器人。角色说明书可写成：“你是某电商平台的一线支持助手，只回答订单、退款和物流问题。对于售后维权或法律纠纷，直接回复‘你的问题已转交高级专员处理’，并拒绝任何后续跟进。”

第二步：写一条精准的身份声明

身份声明是系统提示词的骨架，格式简洁明了：

你是一个[角色]，专精于[领域]。你的受众是[用户画像]。你的回答必须遵循[核心约束]。

新手常犯的错误是身份声明过长，塞入五六条相互矛盾的要求。一个有效测试是：去掉第二条后，核心行为是否依然成立？若成立，说明第一条已足够。

第三步：列出行为规则清单

行为规则应用编号或列表列出，避免使用段落。每条规则只做一件事。规则间若优先级不明确，模型通常会优先执行最后一条。

示例规则清单：

如果用户输入的问题超出你的知识范围，必须直接回答“抱歉，我无法回答这个问题”，不得编造答案。
所有输出必须使用简体中文，且数字采用千分位逗号格式。
对于任何涉及个人敏感信息的请求，一律拒绝，并建议用户联系客服。
回答长度控制在 200 字以内，除非用户明确要求“详细解释”。

第四步：定义输出格式范例

仅描述规则不够，模型需要看到示例。在系统提示词末尾加入输出范例，是提升一致性的最有效方法。范例展示的是“好”的输出，而非“不能输出什么”。负面示例（如“不要这样做”）的效果远不及正面示例。

输出格式范例：

—— 订单状态 ——
订单号：123456789
当前状态：已发货
预计到达时间：2026-05-12
—— 下一步建议 ——
如果 2026-05-15 后仍未收到，请回复“催单”。

此格式固定，每段都有明确标记。模型看到此类结构后，遇到同类问题会按此框架组织回答。

第五步：用检查清单验证初稿

不要直接进入调试。先手动过一遍检查清单。

初稿检查清单

检查项	通过标准
角色明确	一句话能说清你是谁、帮谁、做什么
约束无冲突	例如“回答简明”与“必须给出 5 个例子”冲突
输出格式具体	给出至少一个正面范例
规则优先级清晰	若多条规则适用，哪条优先？
边界说明	遇到超出范围的问题时如何回应？

若有一项不通过，回到对应步骤修改。不要跳过此检查直接测试。跳过检查是新手导致系统提示词“看似运行但始终不符合预期”的首要原因。

常见错误与排查

错误1：先复制粘贴，后适配版本

许多人从别人的 PoC 中直接复制系统提示词放入自己的 API 调用。问题在于：同一系统提示词在不同模型版本（如 Claude 3.5 Sonnet 与 Claude 3 Opus）上的行为可能完全不同。查阅官方文档，了解对应版本的系统提示最佳实践——永远不要假设你使用的版本与原始 PoC 一致。

错误2：以为一次就能写好

系统提示词是迭代的，而非一次性完成。最理想情况下，你可能需要 3–5 轮修改才能获得可接受的输出质量。最差情况（尤其需要结构化输出时）可能需要 10 轮以上。若一轮测试后完全未发现问题，说明测试用例过于简单——请加入边缘用例。

错误3：只在完美输入上测试

大多数新手仅在“典型用户输入”上测试。系统提示词最容易出问题的场景是边界输入——例如用户发送空白消息、极端简短的问句或连续追问。在测试集中至少加入以下三个边界用例：

用户直接输入“你好”
用户反复追问同一个问题
用户请求你被明确禁止的行为

调试检查：如何确认问题在系统提示词上

发现输出不稳定时，先进行隔离测试。将系统提示词完全移除，仅用一个简单的用户提示请求相同输出。如果模型仍然输出相同错误，说明问题不在系统提示词设计，而在模型本身的能力上限或用户提示有误。

完整操作示例

场景： 创建一个内部工具助手，为运维团队快速生成服务器故障排查指令。

初版系统提示词：

你是服务器运维助手。回答所有问题需包含四个部分：故障可能性列表（按可能性从高到低排序）、完整的排查命令（每条命令前加#注释）、安全备注、以及一条“如果以上都不奏效”的备用方案。如果用户未提供具体日志或错误信息，先引导用户收集所需信息，不要直接猜测故障原因。

第一次测试输入：

数据库连接失败，怎么办？

观察到的输出： 模型给出了很长的可能性列表，但没有命令，也未引导收集信息。

调整： 检查后发现，问题在于“按可能性从高到低排序”与“引导用户收集信息”存在冲突——用户未提供日志，模型无法判断可能性依据，于是跳过输出格式。

第二版修改： 在规则中明确优先级——先判断用户输入是否包含足够的故障信息（错误码、日志片段）。若不包含，仅输出信息收集引导段落；若包含，才输出四段结构。并在规则末尾补充一个引导段落范例。

第二次测试输入（同上）输出： 模型现在先输出“请提供以下信息：数据库类型、连接代码中的错误码、最近10分钟的系统日志片段”，不再猜测原因。验证通过。

常见问题（FAQ）