我要投稿

普遍适用的提示方法：对齐

发布日期：2025-06-23 09:15:10 浏览次数： 1944

作者：诺特扬

微信搜一搜，关注“诺特扬”

普遍适用的提示方法：对齐

在提示词工程发展的初期，为了能让大语言模型更好的输出，提示工程师设计了很多提示方法：角色定义、多范例提示、规范化提示、组合提示、思维链提示、零样本思维链等等。无论哪种提示方法其实都在做一件事，那就是对齐双方的信息。

随着大语言模型越来越“聪明”，简单提示也变得越来越有效。提示工程中角色扮演的方法现在也并非必须，但对齐这件事变得更加普遍。比如我们不用角色扮演来定义输出，而是让大语言模型知道输入者的背景，让大语言模型输出符合输入者真实需求的内容。

在提示词工程中，“对齐”并不是简单地让大语言模型（LLM）按照你的指令输出，而是让模型真正理解你的意图、背景和需求。这种理解就像一场对话中的默契：你不需要把每件事都说得清清楚楚，模型却能“心领神会”。以编写 Python 脚本为例，我们可以通过对齐输入者的背景和目标，引导模型生成更贴合实际需求的代码，而不是泛泛而谈的通用答案。

这里用一个编写python脚本的案例来说明“对齐”这种提示方法。

案例：从模糊需求到精准脚本

假设你是一个数据分析师，日常工作涉及处理 CSV 文件、生成统计报表。你需要一个 Python 脚本，用于从一个包含销售数据的 CSV 文件中提取特定列，并计算每月的总销售额。传统的提示方法可能会直接说：

写一个 Python 脚本，读取 CSV 文件，计算每月的总销售额。

这样的提示虽然直白，但缺乏背景信息，模型可能生成一个过于通用的脚本，比如只处理固定的列名，或者假设数据格式非常理想化。这时候，“对齐”提示方法的核心在于提供足够的上下文，让模型明白你的真实需求。

一个更好的提示可能是：

我是一个数据分析师，每天需要处理销售数据的 CSV 文件，文件通常包含“日期”、“产品”、“销售额”等列，但列名和格式可能因供应商不同而变化。我需要一个 Python 脚本，能让我指定输入文件路径和“日期”“销售额”列名，自动解析日期（格式可能为 YYYY-MM-DD 或 MM/DD/YYYY），并按月汇总销售额，输出为新的 CSV 文件。最好能处理缺失值和异常数据，比如销售额为负数的情况。

这个提示通过描述使用者的背景（数据分析师）、数据特点（列名和格式不固定、可能有缺失值或异常值）以及具体目标（按月汇总、输出 CSV），实现了与模型的“对齐”。模型不仅知道要做什么，还知道为什么要这样做，以及在什么场景下做。

对齐的核心在于减少模型的“猜想”。大语言模型本质上是一个概率机器，它会根据输入猜测最可能的输出。如果你的提示过于模糊，模型可能会基于自己的“假设”生成答案，而这些假设可能与你的需求不符。比如，在上面的例子中，如果不说明“列名可能变化”或“日期格式不统一”，模型可能默认所有 CSV 文件都有固定的列名和格式，导致生成的脚本在实际使用中报错。

通过对齐，你在提示中主动提供关键信息：

背景：你是谁？你的工作场景是什么？
约束：数据有什么特点？有哪些潜在问题？
目标：你希望模型输出什么？格式、功能、甚至语气？

这些信息就像给模型画了一张“需求地图”，让它在生成答案时更精准地命中目标。

实现对齐的技巧1

明确你的身份和场景告诉模型你是谁（比如“初学者”或“专业开发者”），以及你的工作环境（比如“在 Jupyter Notebook 上运行”或“部署到服务器”）。这能帮助模型调整输出的复杂度和风格。
描述数据的细节如果涉及数据处理，说明数据的格式、可能的异常情况（如缺失值、乱码）、以及你希望如何处理这些问题。模型会据此生成更健壮的代码。
定义输出格式明确你想要的输出形式，比如“返回一个 Python 函数”“生成带注释的代码”或“输出 JSON 格式的结果”。这能让模型直接命中你的期望。
提供“假设”边界如果你的需求有特殊限制（比如“不能使用某个库”或“代码需要在 Python 3.6 运行”），提前说明，避免模型生成不适用的答案。

一个具体的 Python 脚本示例

基于上面的提示，我们可以进一步细化，得到一个更贴合实际需求的脚本。以下是一个可能的提示和对应的输出：

提示：

我是一个数据分析师，经常处理供应商提供的销售数据 CSV 文件，文件包含“日期”和“销售额”列，但列名可能不同（如“Date”或“Sale_Amount”），日期格式可能是 YYYY-MM-DD 或 MM/DD/YYYY。我需要一个 Python 脚本，接受文件路径和列名作为输入，解析日期，按月汇总销售额，并将结果保存为新的 CSV 文件。脚本需要处理缺失值（填充为 0）和异常值（比如销售额为负，忽略这些行）。代码要简洁，带注释，适合在 Jupyter Notebook 中运行。

实现对齐的技巧2

深化对齐：通过反问明确需求边界

在提示词工程中，“对齐”不仅是通过提供背景和约束来减少模型的“猜想”，还可以通过主动让模型反问来挖掘潜在的模糊点：

在提示词最后加入一句：“以上是我的需求，你为了完成这个需求，你会向我提问哪些内容以便于你更好地完成这个任务，你可以每次提一个问题，直至你觉得信息对齐，可以输出再开始执行任务”

这种方法让模型有机会“主动”澄清需求，确保输出的结果更贴合实际场景。

反问如何助力对齐？

反问的核心在于将模型从“被动执行者”转变为“主动探索者”。当模型提出问题时，它实际上在梳理你的需求边界，识别可能被忽略的细节。比如，在编写 Python 脚本的场景中，模型可能会注意到你没有提到某些关键信息，比如文件的编码格式、输出文件的命名规则，或者是否需要可视化结果。通过反问，模型可以补全这些信息，避免生成不符合预期的代码。

这种方法尤其适用于复杂任务或模糊需求。例如，你可能只说了“写一个处理 CSV 文件的脚本”，但没有说明文件大小、数据量级，或者是否需要并行处理。模型通过反问，可以逐步明确这些细节，从而生成更健壮、更实用的代码。

反问的实践：一个具体的例子

让我们回到之前的案例：你是一个数据分析师，需要一个 Python 脚本处理销售数据的 CSV 文件，汇总每月销售额。假设你提供了以下提示：

我是一个数据分析师，经常处理供应商提供的销售数据 CSV 文件，文件包含“日期”和“销售额”列，但列名可能不同（如“Date”或“Sale_Amount”），日期格式可能是 YYYY-MM-DD 或 MM/DD/YYYY。我需要一个 Python 脚本，接受文件路径和列名作为输入，解析日期，按月汇总销售额，并将结果保存为新的 CSV 文件。脚本需要处理缺失值（填充为 0）和异常值（比如销售额为负，忽略这些行）。代码要简洁，带注释，适合在 Jupyter Notebook 中运行。以上是我的需求，你为了完成这个需求，你会向我提问哪些内容以便于你更好地完成这个任务，你可以每次提一个问题，直至你觉得信息对齐，可以输出再开始执行任务。

模型的第一次反问：