支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


AI 时代的提示工程:打造高效智能代理的系统指南

发布日期:2025-08-05 20:30:32 浏览次数: 1533
作者:二进制杂货铺

微信搜一搜,关注“二进制杂货铺”

推荐语

AI时代的提示工程已成为构建高效智能代理的核心技能,本文揭秘如何通过结构化提示设计打造可控AI系统。

核心内容:
1. 提示结构的四大关键要素:角色定义、任务分解、输出格式控制与Markdown优化
2. 系统提示与开发者提示的协同设计方法论
3. Parahelp实战案例展示企业级提示工程最佳实践

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

       曾几何时,Prompt(提示词)被视为与大型语言模型(LLM)交互的一种“临时方案”。但随着 AI 技术的迅猛发展,它已经跃升为 AI 系统能否高质量输出的核心变量。

       本文将结合 Y Combinator 旗下 S24 孵化项目 Parahelp 的实践经验,以及 YC YouTube 视频《State-Of-The-Art Prompting For AI Agents》的精彩内容,带你深入理解:如何通过提示工程(Prompt Engineering),构建真正智能、可控的 AI 代理(Agent)系统。

  • 视频参考
  •  -- 来源:Y Combinator(YouTube)
  •  -- 标题:State-Of-The-Art Prompting For AI Agents 
  •  -- 正如视频简介所说: “提示起初看似只是临时变通,目的是最大限度发挥 LLM 能力。但如今,它已成为我们与 AI 交互方式的关键。”

一、提示结构要素:Prompt ≠ 文本,而是逻辑代码

01、角色定义

给模型明确身份,让它知道“我是谁”。

如Parahelp 的 Manager Prompt——“你是一个客服代理的经理,职责包括监督工具调用、评估任务执行、提供反馈等。”这种角色设定为模型提供了行为边界与判断准则。

Parahelp 是一家专注于 AI 客服与代理系统的科技公司,其 官方Prompt设计博客 公开了核心设计理念: 提示链接如下:https://parahelp.com/blog/prompt-design

Parahelp开源了其部分核心Prompt,包括“manager”Prompt和部分“planning”Prompt

Planning Prompt(规划提示词):

Manager Prompt(经理提示词):

02、任务分解

将复杂任务拆解为可执行步骤。

 如 Parahelp 工具调用审批流程的五步法:

    1.分析调用目标

    2.检查上下文完整性

    3.比对业务政策

    4.判断风险边界

    5.给出批准/拒绝+理由

通过结构化步骤,引导模型“逐步推理”。

03、输出格式控制

用 XML 风格标签强化结构,比如:
    <accept_tool_call>
    Reason: Tool meets business policy.
    </accept_tool_call>
这使模型响应便于自动解析、测试与部署,适用于 API 场景。

04、Markdown结构清晰

用清晰标题、列表、缩进提升提示语的“可编程性”,增强 LLM 的语义理解能力。

二、提示的三种类型

01、系统提示(System Prompt)

定义公司范围逻辑的核心“API”(例如,Parahelp 的 6 页提示)。

02、开发者提示(Developer Prompt)

嵌入客户/业务特定规则,在系统提示基础上动态注入。

03、用户提示(User Prompt)

面向终端用户,常见于 Web 工具或 B2C 产品,例如,Replit 的“使用这些按钮生成网站”

三、元提示技巧

01、自我优化

让LLM批改自己的提示。 例如:

  • 输入:“你是一位专业的提示工程师。请批评此提示:[原始提示]。”
  • 输出:增强提示,提供更清晰的指示

02、提示折叠

动态生成专属子提示,如 Trope 用分类器自动匹配不同意图的子提示模板。

03、逃生口机制

让LLM可以说“不知道”或请求澄清。如YC 的“debug_info”参数,其中 LLM 报告令人困惑的要求。

04、模型蒸馏

使用更大的模型(GPT-4、Gemini 1.5)来设计更小、更快的模型(例如 Mistral)的提示。如:需要低延迟响应的语音 AI 代理。

四、提示工程配套工具

01、示例注入

用经典难题样例训练推理路径。 例如:Jasperberry 通过注入专家级示例(例如,N+1 查询错误)来自动查找代码错误。

02、Evals测试

Parahelp 认为评估是他们的“皇冠上的宝石”(而不是提示本身)。 好的提示 = 多轮测试驱动出来的。

03、推理链分析

①将模型“思维过程”+“原始Prompt”一起送入Gemini Pro,并要求他对提示提出一系列编辑建议,以便将他们很好地结合起来。 

②在Gemini 2.5 Pro中显示 step-by-step 的思考过程,用于复盘失败原因并优化提示。

五、创始人视角:FDE模型

01、什么是FDE(Forward-Deployed Engineer)?

创始人 / 工程师亲自下场,深入用户流程、嵌入产品逻辑,持续迭代提示与功能。

例如:

  • Giger ML:工程师与支持团队一起优化语音响应延迟。
  • 快乐机器人:创始人通过为经纪人定制提示达成了 7 位数的物流交易。

02、典型打法

用户需求 → 快速修改 Prompt → 在线演示 → 锁定合同

六、模型个性化与评分机制

01、GPT-4

严守评分机制的“士兵型”。

02、Gemini 1.5

灵活处理边界情况的“高自主员工型”。

03、评分提示建议

例如“打分0-100,边界情况请单独说明”。

核心总结

① Prompt ≈ Code:要像写程序一样优化它。
②Evals胜于Prompt:质量测试胜过提示设计。
③创始人作为 FDE:最懂用户的人写最强Prompt。
④Metaprompting是Kaizen(持续改进):使用 LLM 不断自我改进提示。

原提示的入门模板

“你是专家级提示工程师。请从歧义性、结构问题、遗漏边界情况三个角度评估以下提示,并重写为更可靠版本: [你的提示语]”

        本文灵感来自 YC 的经典分享。未来的 AI 系统,不再是“堆算力”就能赢的游戏,而是“拼提示+拼评估+拼流程理解”的综合战场。提示工程师在白板前写公式的画面


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询